Soluzioni Esercizi Capitolo 3 Esercizio 1 a. In un mazzo di carte francesi lo spazio campionario è costituito da 52 elementi. Nel caso dell'estrazione di un fante, il numero di eventi favorevoli è 4, per cui la probabilità di estrarre un fante è 4 / 52 = .08. b. In questo caso il numero di eventi favorevoli è 3, per cui la probabilità del successo è 3 / 52 = .06 c. In questa situazione ci troviamo di fronte al caso di eventi disgiunti (congiunzione "o"), per cui utilizzeremo il principio della somma. Prima, però, occorre valutare se gli eventi siano o meno mutuamente escludentisi, ossia, se vi siano elementi dello spazio campionario che li soddisfano entrambi. In questo caso non ve ne sono, dato che nessun fante è anche un asso o viceversa, per cui possiamo scrivere: p(J∪A) = p(J) + p(A) = 4/52 + 4/52 = ,15 d. Anche in questa situazione ci troviamo di fronte al caso di eventi disgiunti (congiunzione "o"), ma differentemente dal punto (c) vi è una carta che soddisfa sia la condizione "fante" sia quella "figura di cuori", che è il fante di cuori. Per questo motivo, oltre a sommare le probabilità dei due eventi (4/52 e 3/52) dovremo sottrarre la probabilità che i due eventi si verifichino congiuntamente (1/52). Per cui: p(J∪Figura♥) = p(J) + p(Figura♥) − p(J∩Figura♥) = 4/52 + 3/52 − 1/52 = ,12 e. In questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"), per cui utilizzeremo il principio del prodotto. Prima, però, occorre valutare se gli eventi siano o meno dipendenti fra loro, ossia, se il verificarsi dell'uno modifica la probabilità di verificarsi dell'altro. Poiché le estrazioni sono con reinserimento non è questo il caso, per cui la soluzione è: p(J∩A) = p(J) × p(A) = 4/52 × 4/52 = ,0059 f. Anche questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"), ma poiché l'estrazione è senza reinserimento i due eventi sono dipendenti, in quanto il verificarsi dell'uno modifica lo spazio campionario dell'altro. La soluzione è quindi: p(J∩A) = p(J∩A|J) = p(J) × p(A|J) = 4/52 × 4/51 = ,0060 Esercizio 2 a. Ottenere sei volte consecutive la faccia 5 significa ottenerla al primo lancio e al secondo lancio e al terzo lancio … e al sesto lancio. La congiunzione "e" suggerisce che dobbiamo utilizzare il principio del prodotto, in quanto si tratta di eventi congiunti. Poiché la Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia probabilità che esca una certa faccia non è modificata dagli esiti dei lanci precedenti, la soluzione è: Successo = faccia 5; p(successo) = 1/6; p(6 successi) = 1/6 × 1/6 × 1/6 × 1/6 × 1/6 × 1/6 = (1/6)6 = ,000021 b. Un numero pari, nel caso del lancio di un dado, è un evento composto, dato che il successo è rappresentato dalle facce 2, 4 e 6. La probabilità del successo è quindi 3 / 6 = ,50. p(3 successi) = ,50 × ,50 × ,50 = (,50)3 = ,125 c. Se il successo è rappresentato dall'ottenere esattamente 8 volte la faccia 1 in 10 lanci, sono sequenze favorevoli tutte quelle che, indipendentemente dall'ordine, presentano esattamente 8 volte la faccia 1. In questo caso dobbiamo avvalerci della distribuzione binomiale e utilizzare la formula: n p(k ) = p k q n − k k dove k = numero successi, n = numero prove, p = probabilità a priori del successo, q = 1 – p, ovvero probabilità a priori dell’insuccesso. Ricordiamo che: n n! = = n Ck k k!(n − k )! In questo caso la probabilità del successo è 1/6, per cui quella dell'insuccesso sarà 1 − 1/6 = 5/6. Il numero di prove n è 10, quello di successi k 8, per cui: 10 p(5) = ×1 / 68 × 5 / 610−8 8 Svolgiamo prima il coefficiente binomiale: Il risultato è quindi: p(5 successi) = 252 × ,000129 × ,401878 = ,013 d. Se il successo è rappresentato dall'ottenere almeno 8 volte la faccia 1 in 10 lanci, significa che il successo è rappresentato non solo dall'ottenerla 8 volte, ma anche dall'ottenerla 9 e 10 volte. Questo significa che per rispondere alla domanda non basterà calcolare la probabilità relativa ad 8 successi, ma dovremo calcolare anche quella relativa a 9 e 10, per cui avremo che: p(almeno 8 successi) = p(8 successi) + p(9 successi) + p(10 successi) ossia 10 10 10 ×1 / 68 × 5 / 610−8 + ×1 / 6 9 × 5 / 610−9 + ×1 / 68 × 5 / 610−10 10 9 8 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Risolviamo i coefficienti binomiali: n = n e mentre sappiamo già che gli altri due sono uguali a 10 e 1 perché −1 n cui avremo che: n = 1 , per n p(almeno 8 successi) = [45 × ,00000060 × ,02777778] + [10 × ,00000010 ×,16666667] + + [1 × ,00000002 × 1] = ,000019 Esercizio 3 Per risolvere questo esercizio dobbiamo innanzitutto costruire la tabella di contingenza richiesta in base alle informazioni fornite. Le femmine sono il 70% di 150, quindi ,70 × 150 = 105 Genere Licenza Media Femmina Maschio Totale Titolo di studio Diploma Laurea 26 50 12 60 150 Titolo di studio Diploma 24 26 50 Laurea 48 12 60 Totale 105 45 150 Totale 105 Completiamo la tabella: Genere Femmina Maschio Totale Licenza Media 33 7 40 a. I maschi sono 45 su 150, per cui p(Maschio) = 45 / 150 = ,30 b. I laureati sono 60 su 150, per cui p(Laureato) ) = 60 / 150 = ,40 c. In questa situazione ci troviamo di fronte al caso di eventi disgiunti (congiunzione "o"), per cui utilizzeremo il principio della somma. Prima, però, occorre valutare se gli eventi siano o meno mutuamente escludentisi, ossia, se vi siano elementi dello spazio campionario che li soddisfano entrambi. In effetti vi sono 12 maschi che sono anche laureati, la cui probabilità di essere estratti è 12 / 150 = ,08. La soluzione quindi è: p(M∪Laureato) = p(Maschio) + p(Laureato) − p(Maschio∩Laureato) = = ,30 + ,40 − ,08 = ,62 d. La condizione "almeno diplomato" indica che possiamo considerare come successo sia i diplomati che i laureati, per cui il numero di casi favorevoli è 50 + 60 = 110. La soluzione quindi è: p(almeno diplomato) = p(Diplomato) + p(Laureato) = (50 / 150) + (60 / 150) = ,73 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia e. In questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"), per cui utilizzeremo il principio del prodotto. Poiché l'estrazione è con reinserimento, gli eventi sono indipendenti fra loro, e dunque lo spazio campionario rimane invariato ad ogni estrazione. p(1a = M ∩ 2a = F) = p(M) × p(F) = (45 / 150) × (105 / 150) = ,21 f. In questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"), per cui utilizzeremo il principio del prodotto. Poiché l'estrazione è senza reinserimento, gli eventi non sono indipendenti fra loro, e dunque lo spazio campionario cambia ad ogni estrazione. In questo caso particolare, però, oltre allo spazio campionario ad ogni estrazione successiva cambia anche il numero di eventi favorevoli, dato che se si è estratto un maschio alla prima estrazione, alla seconda estrazione ci sarà un soggetto in meno ma anche un maschio in meno, per cui: p(1a = M ∩ 2a = M) = p(1a = M ∩ [2a = M|1a = M]) = (45 / 150) × (44 / 149) = ,09 g. Il modo più semplice è quello di considerare che la condizione "né maschio né laureato" nel caso in questione identifica come successi le sole femmine diplomate e con licenza media, che sono 33 + 24 = 57. p(né Maschio né Laureato) = 57 / 150 = ,38 Oppure potremmo considerare che: p(Non Maschio) = 1 − p(Maschio) = 1 − ,30 = ,70; p(Non Laureato) = 1 − p(Laureato) = 1 − ,40 = ,60; Poiché gli eventi non sono mutuamente escludentisi, calcoliamo anche la probabilità: p(Non Maschio∩Laureato) = 1 − ,08 = ,92 Per cui: p(Non Maschio ∪ Non laureato) = = p(Non Maschio) + p(Non Laureato) − p(Non Maschio∩Laureato) = = ,70 + ,60 − ,92 = ,38 Esercizio 4 a. Poiché utilizziamo tutti i test a disposizione, la soluzione si ottiene col calcolo della permutazioni (nPn), ossia n!. In questo caso n = 8, per cui: 8P8 = 8! = 8 × 7 × 6 × 5 × 4 × 3 × 2 × 1 = 40320 b. Come riportato nell'Approfondimento 3.1, il quadrato latino bilanciato viene costruito a partire dal seguente algoritmo: 1 n 2 n−1 3 n−2 4 n−3 5 n−4 etc. Le sequenze successive vengono ottenute sommando 1 ad ogni cifra della prima riga. Poiché in questo caso n = 8 avremo che la prima sequenza è: Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia 1 8 2 7 3 6 4 5 A partire da questa prima sequenza aggiungiamo altre sette righe, e il numero in ogni cella è uguale a quello superiore nella stessa colonna più uno. Naturalmente, ogni volta che la cifra nella cella superiore nella colonna è 8, il conteggio riparte da 1: 1 2 3 4 5 6 7 8 8 1 2 3 4 5 6 7 2 3 4 5 6 7 8 1 7 8 1 2 3 4 5 6 3 4 5 6 7 8 1 2 6 7 8 1 2 3 4 5 4 5 6 7 8 1 2 3 5 6 7 8 1 2 3 4 In questo modo di soddisfa la condizione che ogni test è preceduto e seguito da ognuno degli altri lo stesso numero di volte c. Per gruppi distinti si intende il numero di gruppi distinti per la presenza di almeno un elemento, ossia le combinazioni. Essendo i test 8, avremo che: d. Per categorie ordinate si intende il numero di gruppi distinti per la presenza di almeno un elemento e per l'ordine degli elementi, ossia le disposizioni. Essendo i test 8, avremo che: e. In questo caso dobbiamo tenere conto del fatto che i quattro test per la validità di costrutto convergente possono essere disposti in 4! modi, e che a loro volta i quattro test per la validità di costrutto discriminante possono essere disposti in 4! modi. A questo punto basta moltiplicare i due risultati per ottenere la soluzione al quesito: 4! × 4! = 576. f. In questo caso possono andare bene i seguenti ordini (NB: C = convergente; D = discriminante): C D C D C D C D D C D C D C D C g. Ora, i quattro test per la validità convergente possono essere disposti nelle rispettive caselle in 4! modi, e lo stesso vale per i quattro test per la validità discriminante. Quindi, avremo che per ognuna delle due sequenze illustrate i modi possibili sono 4! × 4! = 576. Poiché le sequenze sono due: 576 × 2 = 1152. Esercizio 5 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia a. Per campioni distinti per almeno un elemento si intendono le combinazioni. Poiché siamo nel caso senza ripetizione, dobbiamo utilizzare la seguente formula: n Ck = n! k! (n − k )! Per cui, dato che n = 30 e k = 10, avremo: b. Per campioni distinti per almeno un elemento si intendono le combinazioni. Poiché siamo nel caso con ripetizione, dobbiamo utilizzare la seguente formula: n n + k − 1 (n + k − 1)! (n + k − 1)! = = Ck = k k![(n + k − 1) − k ]! k!(n − 1)! Per cui, dato che n = 30 e k = 10, avremo: c. Per campioni distinti per almeno un elemento e per l'ordine degli elementi si intendono le disposizioni. Poiché siamo nel caso senza ripetizione, dobbiamo utilizzare la seguente formula: n! n Dk = (n − k )! Per cui, dato che n = 30 e k = 20, avremo: d. Per campioni distinti per almeno un elemento e per l'ordine degli elementi si intendono le disposizioni. Poiché siamo nel caso con ripetizione, dobbiamo utilizzare la seguente formula: k n Dk = n Per cui, dato che n = 30 e k = 20, avremo: n Dk = 30 20 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia e. I modi che hanno gli studenti di disporsi tutti attorno ad un tavolo rappresentano le permutazioni circolari, la cui formula è: n Pcircolati n = (n − 1)!= (30 − 1)!= 29! f. Se vogliamo calcolare in quanti modi gli studenti possono disporsi negli otto posti della prima fila dell'aula, dobbiamo considerare che occorre fare gruppi di 8 studenti da un insieme di 30 che siano distinti sia da almeno un elemento che dall'ordine di questi elementi. Per cui, si tratta di disposizioni: Esercizio 6 Avendo quattro alternative di risposta, delle quali solo una corretta, la probabilità che ha lo studente di rispondere correttamente solo per caso è 1/4 = ,25, che costituirà la probabilità del successo. Conseguentemente, la probabilità dell'insuccesso, ossia della risposta errata, sarà 1 − ,25 = ,75. a. La probabilità di rispondere correttamente alle prime sei domande corrisponde a rispondere correttamente alla prima domanda, e alla seconda, e alla terza, e alla quarta, e alla quinta, e alla sesta domanda, e non rispondere correttamente e alla settima, e all'ottava, e alla nona e alla decima domanda. Trattandosi di eventi congiunti e indipendenti, dobbiamo utilizzare il principio del prodotto. Non c'è bisogno di fare riferimento alla distribuzione binomiale perché vi è una sola sequenza "vincente". p(risposta corretta alle prime dodici domande) = = ,25 × ,25 ×,25 × ,25 ×,25 × ,25 ×,75 ×,75 ×,75 ×,75 = (,25)6 × (,75)4 = ,000077 b. Determinare la probabilità di rispondere correttamente a sei domande ci obbliga a fare riferimento alla distribuzione binomiale, dato sono varie le sequenze "vincenti". Considerando che C = corretta, e E = errata potremmo avere: CCECECECEC, CCECEEECCC, CCCCECECEE, etc. Il numero di queste sequenze è dato dal coefficiente binomiale (ossia, le combinazioni). Considerando poi che p = ,25 e q = ,75, avremo che: 10 n p(6 risposte corrette) = p(k ) = p k q n−k = p(6) = ,256 ,7510−6 6 k dove Quindi avremo che 10 n p(k ) = p k q n−k = p(6) = ,256 ,7510−6 = 210×,000244×,316406 =,016222 6 k Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia c. Rispondere correttamente ad almeno 6 domande significa che possiamo considerare un successo o il risultato 6, o il risultato 7, o il risultato 8 o il risultato 9 o il risultato 10, per cui possiamo utilizzare il principio della somma, dato che si tratta di eventi disgiunti. Abbiamo già calcolato la probabilità di sei risposte corrette al punto (b), per cui calcoliamo p(7), p(8), p(9) e p(10), ossia le barre scure nella figura: ,30 Probabilità ,25 ,20 ,15 ,10 ,05 ,00 0 1 2 3 4 5 6 7 8 9 10 Numero risposte corrette 10 p(6) = ,256 ,7510−6 = 210×,000244×,316406 =,016222 6 10 p(7) = ,257 ,7510−7 , dove 7 per cui p(7) = 120 × ,000061 × ,421875 = ,003090 10 p(8) = ,258 ,7510−8 , dove 8 per cui p(8) = 45 × ,000015 × ,562500 = ,000386 10 n 10 = n , per cui p(9) = 10 × ,000004 × p(9) = ,259 ,7510−9 , dove = 10 , poiché 9 n −1 9 ,750000 = ,000029 10 10 n p(10) = ,2510 ,7510−10 , dove = 1 , poiché = 1 , per cui p(10) = 1 × ,000001 × 1 = 10 10 n ,000001 Avremo quindi che: p(almeno sei risposte corrette) = p(6) + p(7) + p(8) + p(9) + p(10) = ,016222 + ,003090 + ,000386 + ,000029 + ,000001 = ,019728 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia d. Rispondere correttamente a meno di 3 domande significa che possiamo considerare un successo o il risultato 2, o il risultato 1, o il risultato 0, per cui possiamo nuovamente utilizzare il principio della somma, dato che si tratta di eventi disgiunti. In questo caso, poiché p ≠ q la distribuzione non è simmetrica, per cui non possiamo sfruttare le probabilità già calcolate al punto (c) per l'altra coda della distribuzione. ,30 Probabilità ,25 ,20 ,15 ,10 ,05 ,00 0 1 2 3 4 5 6 7 8 9 10 Numero risposte corrette 10 p(2) = ,252 ,7510−2 , dove 2 per cui p(2) = 45 × ,062500 × ,100113 = ,281568 10 p(1) = ,251 ,7510−1 , dove 1 ,075085 = ,187712 10 = 10 , poiché 1 n = n , per cui p(1) = 10 × ,250000 × 1 10 p(0) = ,250 ,7510−0 , dove 0 ,056314 10 = 1 , poiché 0 n = 1 , per cui p(0) = 1 × 1 × ,056314 = 0 Avremo quindi che: p(meno di tre risposte corrette) = p(2) + p(1) + p(0) = ,281568 + ,187712 + ,056314 = ,525593 Esercizio 7 a. In primo luogo dobbiamo risalire alla tabella di contingenza Punteggio Sopra/Sotto Cut-off × Diagnosi in base ai dati a disposizione. Ricordiamo che la sensibilità è la proporzione di soggetti con punteggi al test al di sopra del cut-off che hanno il disturbo (nella tabella Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia a ), mentre la specificità è la proporzione di soggetti con punteggi al di sotto del cut-off a+c d ). che non hanno il disturbo (nella tabella b+d Diagnosi effettiva Cut-off Sì No Sopra a = ?? b = ?? Sotto c = ?? d = ?? Totale dei malati a + c = 50 Totale dei non malati b + d = 350 Totale sopra cut-off a + b = ?? Totale sotto cut-off c + d = ?? 400 a =,84 e che a + c = 50, otteniamo a come a = ,84 × (a + c) = ,84 × a+c d =,80 e b + d = 350, d = ,79 × (b + d) = 50 = 42. Allo stesso modo ricaviamo d, poiché b+d ,80 × 350 = 280. Per differenza dai totali di colonna ricaviamo c e b, e i totali marginali di riga: Poiché sappiamo che Diagnosi effettiva Cut-off Sì No Sopra a = 42 b = 70 Sotto c=8 d = 280 Totale dei malati a + c = 50 Totale dei non malati b + d = 350 Totale sopra cut-off a + b = 112 Totale sotto cut-off c + d = 288 400 Per calcolare il potere predittivo positivo (PPP) e il potere predittivo negativo (PPN), ossia la proporzione di soggetti con disturbo sul totale di quelli con punteggio superiore al cut-off e ossia la proporzione di soggetti senza disturbo sul totale di quelli con punteggio inferiore al cut-off, rispettivamente, utilizziamo le formule: PPP = a 42 = =,38 a + b 112 PPN = d 80 = =,97 c + d 100 b. Per rispondere a questa domanda dobbiamo utilizzare il teorema di Bayes: p ( Disturbo |> cutoff ) = p ( Disturbo ) × p (> cutoff | Disturbo ) p ( Disturbo ) × p (> cutoff | Disturbo ) + p ( NonDisturb o) × p ( > cutoff | NonDisturbo) Poiché il testo riferisce che la probabilità di osservare un soggetto con disturbo nella popolazione generale è il 9%, abbiamo p(Disturbo), e p(NonDisturbo) = 91%. Sappiamo poi che p(>cutoff|Disturbo) = Sensibilità = ,84 e p(>cutoff|NonDisturbo) = 1 − Specificità = 1 − ,80 = ,20, avremo che: p ( Disturbo |> cutoff ) = ,09×,84 =,29 ,09×,84+,91×,20 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia Esercizio 8 a. In questo caso utilizziamo la distribuzione binomiale, e calcoliamo la probabilità di ottenere almeno 10 successi in 12 prove, il che equivale a dire la probabilità di estrarre 10, 11 e 12 studenti che svolgono attività sportiva. ,30 Probabilità ,25 ,20 ,15 ,10 ,05 ,00 0 1 2 3 4 5 6 7 8 9 10 11 12 Numero studenti che svolgono attività sportiva Sommeremo quindi p(10), p(11) e p(12). In questo caso, poiché p = ,54, avremo che q = 1 − ,54 = ,46. 12 p(10) = ,5410 ,4612−10 , dove 10 per cui p(10) = 66 × ,002108 × ,211600 = ,029444 12 p(11) = ,5411 ,4612−11 , dove 11 × ,460000 = ,006284 12 = 12 , poiché 11 12 p(12) = ,5412 ,4612−12 , dove 12 ,000615. 12 = 1 , poiché 12 n = n , per cui p(11) = 12 × ,001138 n −1 n = 1 , per cui p(12) = 1 × ,000615 × 1 = n Avremo quindi che: p(almeno 10 studenti che svolgono attività sportiva) = p(10) + p(11) + p(12) = ,029444 + ,006284 + ,000615 = ,036343 b. In questo caso utilizziamo sempre la distribuzione binomiale, ma dato l'ampio campione a disposizione sfruttiamo la possibilità di approssimare la distribuzione binomiale alla distribuzione normale standardizzata. Per fare questo dobbiamo calcolare media e deviazione standard della distribuzione binomiale, che sono: Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia µ = n × p = 1200 × ,54 = 648 e σ = n × p × q = 1200×,54×,46 = 17,26 A questo punto basta convertire in punti z il valore 680 ricordando di sottrarre 0,5 per la correzione di continuità (vedi Approfondimento 3.3): X −µ 675,5 − 648 = 1,59 17,26 σ La risposta al quesito la troviamo sulle tavole di z determinando l'area al di là di z (vedi Figura 3.34 nel testo) per z = 1,59, che è ,0559. z= = c. I successi relativamente a questa domanda sono rappresentati da 4, 5 e 6 studenti su 8, per cui dovremo sommare le probabilità p(4), p(5) e p(6). ,30 Probabilità ,25 ,20 ,15 ,10 ,05 ,00 0 1 2 3 4 5 6 7 8 Numero studenti che svolgono attività sportiva 8 p(4) = ,54 4 ,468−4 , dove 4 per cui p(4) = 70 × ,085031 × ,044757 = ,266504 8 p(5) = ,545 ,468−5 , dove 5 , per cui p(5) = 56 × ,045917 × ,097336 = ,250282 8 p(6) = ,546 ,468−6 , dove 6 per cui p(6) = 28 × ,024795 × ,146905 = ,146905 Avremo quindi che: Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia p(fra i 4 e i 6 studenti che svolgono attività sportiva) = p(4) + p(5) + p(6) = ,266504 + ,250282 + ,146905 = ,663692 d. Anche in questo caso utilizziamo l'approssimazione della distribuzione binomiale alla distribuzione normale standardizzata. Per fare questo dobbiamo calcolare media e deviazione standard della distribuzione binomiale per 800 studenti, che sono: µ = n × p = 800 × ,54 = 432 e σ = n × p × q = 800×,54×,46 = 14,10 A questo punto basta convertire in punti z i valori 400 e 450 ricordando di sottrarre 0,5 al valore inferiore a aggiungere 0,5 a quello superiore: X − µ 450,5 − 432 399,5 − 432 = −2,30 z 2 = = = 1,31 14,10 14,10 σ σ Poiché un valore è negativo e uno è positivo, siamo nella situazione di Figura 3.37, per cui dovremo sommare le aree comprese fra z e la media per i due valori: z1 = X −µ = p(400 < S < 450) → p(−2,30 < z < 1,31) = p(−2,30 < z < 0) + p(0 < z < 1,31) = ,4893 + ,4049 = ,8942 e. In questo caso siamo in una situazione diversa dai precedenti, perché prima si "lavorava" sul numero di eventi, adesso sulla proporzione. Questo implica che per poter sfruttare l'approssimazione alla distribuzione normale standardizzata z dobbiamo calcolare l'errore standard della proporzione, in base alla formula: n × π × (1 − π ) π × (1 − π ) = n n dove π = ,54. Per cui nel nostro caso avremo che: n × π × (1 − π ) π × (1 − π ) ,54 × (1−,54) σP = = = =,05 100 n n Ora, per trasformare la proporzione ,60 in probabilità dobbiamo utilizzare la formula: σP = z= P −π ,60−,54 = 1,2 = ,05 π (1 − π ) n La risposta al quesito è data dall'area al di là di z = 1,20, che è ,1151. f. La situazione è analoga alla precedente, salvo la necessità di trasformare in punti z due proporzioni. Poiché l'ampiezza campionaria è diversa dal punto (e), dobbiamo ricalcolare l'errore standard della proporzione: n × π × (1 − π ) ,54 × (1−,54) π × (1 − π ) = = =,035 200 n n Ora, per trasformare le proporzioni in probabilità dobbiamo utilizzare la formula: σP = z1 = ,58−,54 = 1,14 ,035 z2 = ,62−,54 = 2,29 ,035 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia La situazione è analoga a quella della Figura 3.38 in quanto entrambi i valori di z sono positivi: p(,58 < P < ,62) → p(1,14 < z < 2,29) = p(0 < z < 2,29) − p(0< z < 1,14) = ,4890 − ,3729 = ,1161 g. La formula per calcolare l'intervallo di fiducia di una proporzione campionaria è la seguente: π − z× π (1 − π ) n < P <π + z× π (1 − π ) n Sappiamo che per un intervallo di fiducia al 95% il valore di z da utilizzare è 1,96 (valore di z che lascia al di là di sé (1−,95)/2 = ,025), mentre per un intervallo di fiducia al 99% il valor di z è 2,58 (valore di z che lascia al di là di sé (1−,99)/2 = ,005) (vedi Figura 3.49). A questo punto basta sostituire i dati nella formula: Campione di 20 soggetti ,54 − 1,96 × ,54(1−,54) ,54(1−,54) < P <,54 + 1,96 × 20 20 = IF95% = ,32 < P <,76 ,54 − 2,58 × ,54(1−,54) ,54(1−,54) < P <,54 + 2,58 × 20 20 = IF99% = ,25 < P <,83 Campione di 200 soggetti ,54 − 2,58 × ,54(1−,54) ,54(1−,54) < P <,54 + 2,58 × 200 200 = IF99% = ,45 < P <,63 ,54 − 1,96 × ,54(1−,54) ,54(1−,54) < P <,54 + 1,96 × 200 200 = IF95% = ,47 < P <,61 h. La formula per calcolare l'intervallo di fiducia della proporzione della popolazione a partire da quella campionaria è la seguente: P − z× P(1 − P) P(1 − P) < π < P + z× n −1 n −1 Per trovare l'intervallo di fiducia al 98% abbiamo bisogno di trovare quel valore di z di là del quale l'area di probabilità vale ,01, dato che (1 − ,98) / 2= ,01. Tale valore è z = ± 2,33. Dato che P = ,54 e n = 150, avremo che: ,54 − 2,33 × ,54(1−,54) ,54(1−,54) < π <,54 + 2,33 × 150 − 1 150 − 1 ,44 < π <,64 Esercizio 9 a. Poiché la variabile è misurata su scala ad intervalli equivalenti e la distribuzione dei punteggi è normale, possiamo fare riferimento alla distribuzione normale standardizzata z. Per cui, il primo passo è trasformare in punti z i punteggi 38 e 42: Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia z1 = 39 − 50 = −1,1 10 z2 = 42 − 50 = −0,8 10 La situazione è la stessa della Figura 3.39, in cui entrambi i valori di z sono negativi. La soluzione, quindi è rappresentata da: p(39 < SE < 42) → p(−1,1 < z < −0,8) = p(0 < z < 1,1) − p(0 < z < 0,8) = ,3643 − ,2881 = ,0762 33 − 50 = −1,7 10 Dobbiamo trovare l'area di probabilità al di là di z = 1,7, come nel caso della Figura 3.35. L'area che cerchiamo è ,0446. b. Trasformiamo 33 in punti z: z = 77 − 50 = 2,7 10 Dobbiamo trovare l'area di probabilità al di là di z = 2,7, come nel caso della Figura 3.34. L'area che cerchiamo è ,0035. c. Trasformiamo 77 in punti z: z = 47 − 50 55 − 50 = −0,3 , z 2 = = 0,5 10 10 Come nel caso della Figura 3.37, dobbiamo sommare le aree comprese fra z e la media per i due valori: d. Trasformiamo 47 e 55 in punti z: z1 = p(47 < SE < 55) → p(−0,3 < z < 0,5) = p(−0,3 < z < 0) + p(0 < z < 0,5) = ,1179 + ,1915 = ,3094 e. In questo caso non dobbiamo farci ingannare dal fatto che ci venga indicato che sono stati estratti 50 soggetti: vogliamo innanzitutto sapere la probabilità che un soggetto abbia un punteggio medio compreso fra 51 e 53. Quindi, basta calcolare questa probabilità e moltiplicarla poi per 50 per rispondere al quesito. Trasformiamo 51 e 53 in punti z: z1 = 51 − 50 53 − 50 = 0,1 , z 2 = = 0,3 10 10 La situazione è analoga a quella della Figura 3.38 in quanto entrambi i valori di z sono positivi: p(51 < SE < 53) → p(0,1 < z < 0,3) = p(0 < z < 0,3) − p(0< z < 0,1) = ,1179 − ,0398 = ,0781 A questo punto per rispondere alla domanda basta moltiplicare 50 × ,0781 = 3,91 ≈ 4. Circa 4 soggetti su 50 avranno un punteggio di SE compreso fra 51 e 53. f. In questa situazione, invece, abbiamo effettivamente a che fare con una media campionaria, per cui facciamo riferimento alla distribuzione delle medie campionarie. Questo significa che per trasformare a punti z una media dovremo utilizzare la formula: Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia z= M − µM σM = M − µM σ n dove µM e σM sono rispettivamente la media e la deviazione standard della distribuzione delle medie campionarie. Nel primo caso il valore è uguale a quello della popolazione (quindi µM = µ = 50), nel secondo caso di tratta dell'errore standard, che è uguale ala deviazione standard della popolazione diviso la radice quadrata dell'ampiezza campionaria. Poiché M1 = 51 e M2 = 53: 51 − 50 53 − 50 = 0,71 , z 2 = = 2,12 10 10 50 50 p(51 < M < 53) → p(0,71 < z < 2,12) = p(0 < z < 2,12) − p(0< z < 0,71) = ,4830 − ,2611 = ,2219 z1 = g. In questo caso sapere che vengono estratti 500 campioni non ci interessa inizialmente. La situazione è simile a quella del punto (e). Innanzitutto dobbiamo calcolare la probabilità di estrarre un campione di 30 soggetti con media compresa fra 49 e 52: 51 − 50 53 − 50 z1 = = 0,55 , z 2 = = 1,64 10 10 30 50 p(51 < M < 53) → p(0,55 < z < 1,64) = p(0 < z < 1,64) − p(0< z < 0,55) = ,4495 − ,2088 = ,2407 Poiché la probabilità di estrarre un campione di 30 elementi con media compresa fra 51 e 53 è ,2407, su 500 campioni possiamo aspettarcene con la stessa caratteristica 500 × ,2407 = 120,35 ≈ 120. h. Il rango percentile di un punteggio è la percentuale di valori al di sotto di esso in una distribuzione di punteggi. Per calcolare quanti punteggi sono inferiori a 75, trasformiamo questo valore in punti z e calcoliamo l'area sottostante la distribuzione normale standardizzata da meno infinito a quel valore di z: 75 − 50 = 2,55 z= 10 In questo caso dobbiamo trovare l'area compresa fra 0 e z = 2,55 e aggiungervi l'area compresa fra 0 e meno infinito (vedi Figura 3.34). Nel secondo caso conosciamo già la risposta, perché è la metà dell'area sottostante la distribuzione normale, ossia ,5000. Nel primo caso basta trovare sulle tavole di z l'area compresa fra 0 e 2,55, che è ,4946, per cui avremo che la proporzione di punteggi inferiori a 75 è ,4946 + ,5000 = ,9946. Il valore ,9946 rappresenta la proporzione di punteggi inferiori a 75. Il rango percentile viene calcolato moltiplicando questa proporzione per 100: ,9946 × 100 = 99,46, che è la risposta al quesito. Nel caso del punteggio 23, invece, ci basta calcolare l'area al di là di z perché 23 è sotto alla media (vedi per esempio la Figura 3.35) z= 23 − 50 = −2,7 10 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia L'area al di là di z = 2,7 è ,0035, che moltiplicato per 100 è uguale a ,0035 × 100 = 0,35, che la soluzione al quesito. i. Il punteggio che rappresenta il primo quartile (Q1) della distribuzione di valori è quello che lascia dietro di sé il 25% di tutti gli altri. Dobbiamo quindi trovare quale valore di z ha un'area al di là di esso uguale a ,2500, e dal punto z risalire al punteggio di SE. Dalle tavole di z vediamo che è il valore z = 0,67 ad avere un'area di (circa) ,2500 fra sé e più infinito. In questo caso, però, siamo nella parte della distribuzione normale standardizzata in cui i valori sono negativi, in quanto p < ,5000, e quindi z < 0. Il valore va quindi preso col segno meno (situazione simile all'esempio in Figura 3.35). Se quindi: z= X −µ σ , avremo che X = z × σ + µ , per cui X = −0,67 × 10 + 50 = 43,3 Il punteggio 43,3 è quindi il primo quartile della distribuzione dei punteggi di SE. Un ragionamento analogo ci permette di ottenere il punteggio che rappresenta il 90° percentile. Il 90° percentile è quel punteggio che lascia dietro di sé il 90% degli altri punteggi. Questo significa che dobbiamo trovare il punto z che possiede la caratteristica di avere prima di sé un'area uguale a ,9000. Poiché ,9000 > ,5000, sarà un valore di z positivo, e ci basterà trovare quel valore per cui l'area compresa fra 0 e il valore è ,4000, dato che l'area compresa fra 0 e meno infinito è ,5000 (Figura 3.34). Il valore di z con queste caratteristiche è 1,28, per cui: X = z × σ + µ → X = 1,28 × 10 + 50 = 62,8 Il punteggio di SE 6,28 rappresenta dunque il 90° percentile. j. In questo caso dobbiamo utilizzare la formula: µM − z × σ n < M < µM + z × σ n I valori di z da inserire nella formula sono quelli che lasciano al di là di sé (1 − ,96) / 2 = ,02 e (1 − ,98) /2 = ,01, ossia 2,05 e 2,33, per cui: 10 < M < 50 + 2,05 × 15 10 IF al 98% : 50 − 2,33 × < M < 50 + 2,33 × 15 IF al 96% : 50 − 2,05 × 10 → 44,71 < M < 55,29 15 10 → 43,98 < M < 56,02 15 Se la popolazione fosse stata finita con N = 300 avremmo dovuto applicare la correzione popolazioni finite, per cui: µM − z × IF al 96% : 50 − 2,05 × 44,83 < M < 55,17 σ n N −n σ < M < µM + z × N −1 n N −n N −1 10 300 − 15 10 300 − 15 < M < 50 + 2,05 × → 15 300 − 1 15 300 − 1 Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia IF al 98% : 50 − 2,33 × 44,13 < M < 55,87 10 300 − 15 10 300 − 15 → < M < 50 + 2,33 × 15 300 − 1 15 300 − 1 k. Poiché n > 30, la formula per il calcolo dell'intervallo di fiducia della media della popolazione a partire da quella campionaria è: s s M − z× < µM < M + z × n −1 n −1 L'intervallo di fiducia è al 94%, per cui il valore di z di cui abbiamo bisogno è quello che lascia al di là di sé un'area di probabilità uguale a (1 − ,94) / 2 = ,03, ossia z = ±1,88. L'intervallo di fiducia per la media della popolazione è dunque: 10 10 < µ M < 50 + 1,88 × → 51,45 < µ M < 48,55 200 − 1 200 − 1 Si noti che in realtà abbiamo trovato l'intervallo di fiducia della media della distribuzione campionaria delle medie per campioni di ampiezza 200 (µM), ma poiché sappiamo che questo coincide con la media della popolazione, possiamo sostituire µ nella soluzione: 51,45 < µ < 48,55 50 − 1,88 × Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia