Soluzioni Esercizi Capitolo 3_corretto

annuncio pubblicitario
Soluzioni Esercizi Capitolo 3
Esercizio 1
a. In un mazzo di carte francesi lo spazio campionario è costituito da 52 elementi. Nel caso
dell'estrazione di un fante, il numero di eventi favorevoli è 4, per cui la probabilità di estrarre
un fante è 4 / 52 = .08.
b. In questo caso il numero di eventi favorevoli è 3, per cui la probabilità del successo è 3 / 52
= .06
c. In questa situazione ci troviamo di fronte al caso di eventi disgiunti (congiunzione "o"), per
cui utilizzeremo il principio della somma. Prima, però, occorre valutare se gli eventi siano o
meno mutuamente escludentisi, ossia, se vi siano elementi dello spazio campionario che li
soddisfano entrambi. In questo caso non ve ne sono, dato che nessun fante è anche un asso o
viceversa, per cui possiamo scrivere:
p(J∪A) = p(J) + p(A) = 4/52 + 4/52 = ,15
d. Anche in questa situazione ci troviamo di fronte al caso di eventi disgiunti (congiunzione
"o"), ma differentemente dal punto (c) vi è una carta che soddisfa sia la condizione "fante"
sia quella "figura di cuori", che è il fante di cuori. Per questo motivo, oltre a sommare le
probabilità dei due eventi (4/52 e 3/52) dovremo sottrarre la probabilità che i due eventi si
verifichino congiuntamente (1/52). Per cui:
p(J∪Figura♥) = p(J) + p(Figura♥) − p(J∩Figura♥) = 4/52 + 3/52 − 1/52 = ,12
e. In questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"), per
cui utilizzeremo il principio del prodotto. Prima, però, occorre valutare se gli eventi siano o
meno dipendenti fra loro, ossia, se il verificarsi dell'uno modifica la probabilità di verificarsi
dell'altro. Poiché le estrazioni sono con reinserimento non è questo il caso, per cui la
soluzione è:
p(J∩A) = p(J) × p(A) = 4/52 × 4/52 = ,0059
f. Anche questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"),
ma poiché l'estrazione è senza reinserimento i due eventi sono dipendenti, in quanto il
verificarsi dell'uno modifica lo spazio campionario dell'altro. La soluzione è quindi:
p(J∩A) = p(J∩A|J) = p(J) × p(A|J) = 4/52 × 4/51 = ,0060
Esercizio 2
a. Ottenere sei volte consecutive la faccia 5 significa ottenerla al primo lancio e al secondo
lancio e al terzo lancio … e al sesto lancio. La congiunzione "e" suggerisce che dobbiamo
utilizzare il principio del prodotto, in quanto si tratta di eventi congiunti. Poiché la
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
probabilità che esca una certa faccia non è modificata dagli esiti dei lanci precedenti, la
soluzione è:
Successo = faccia 5; p(successo) = 1/6;
p(6 successi) = 1/6 × 1/6 × 1/6 × 1/6 × 1/6 × 1/6 = (1/6)6 = ,000021
b. Un numero pari, nel caso del lancio di un dado, è un evento composto, dato che il successo è
rappresentato dalle facce 2, 4 e 6. La probabilità del successo è quindi 3 / 6 = ,50.
p(3 successi) = ,50 × ,50 × ,50 = (,50)3 = ,125
c. Se il successo è rappresentato dall'ottenere esattamente 8 volte la faccia 1 in 10 lanci, sono
sequenze favorevoli tutte quelle che, indipendentemente dall'ordine, presentano esattamente
8 volte la faccia 1. In questo caso dobbiamo avvalerci della distribuzione binomiale e
utilizzare la formula:
n
p(k ) =   p k q n − k
k 
dove k = numero successi, n = numero prove, p = probabilità a priori del successo, q = 1 – p,
ovvero probabilità a priori dell’insuccesso. Ricordiamo che:
n
n!
  =
= n Ck
 k  k!(n − k )!
In questo caso la probabilità del successo è 1/6, per cui quella dell'insuccesso sarà 1 − 1/6 =
5/6. Il numero di prove n è 10, quello di successi k 8, per cui:
10 
p(5) =   ×1 / 68 × 5 / 610−8
8 
Svolgiamo prima il coefficiente binomiale:
Il risultato è quindi:
p(5 successi) = 252 × ,000129 × ,401878 = ,013
d. Se il successo è rappresentato dall'ottenere almeno 8 volte la faccia 1 in 10 lanci, significa
che il successo è rappresentato non solo dall'ottenerla 8 volte, ma anche dall'ottenerla 9 e 10
volte. Questo significa che per rispondere alla domanda non basterà calcolare la probabilità
relativa ad 8 successi, ma dovremo calcolare anche quella relativa a 9 e 10, per cui avremo
che:
p(almeno 8 successi) = p(8 successi) + p(9 successi) + p(10 successi)
ossia
10 
10 
10 
  ×1 / 68 × 5 / 610−8 +   ×1 / 6 9 × 5 / 610−9 +   ×1 / 68 × 5 / 610−10
10 
9 
8 
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Risolviamo i coefficienti binomiali:
n 
 = n e
mentre sappiamo già che gli altri due sono uguali a 10 e 1 perché 
−1
n


cui avremo che:
n
  = 1 , per
n
p(almeno 8 successi) = [45 × ,00000060 × ,02777778] + [10 × ,00000010 ×,16666667] +
+ [1 × ,00000002 × 1] = ,000019
Esercizio 3
Per risolvere questo esercizio dobbiamo innanzitutto costruire la tabella di contingenza richiesta in
base alle informazioni fornite. Le femmine sono il 70% di 150, quindi ,70 × 150 = 105
Genere
Licenza Media
Femmina
Maschio
Totale
Titolo di studio
Diploma
Laurea
26
50
12
60
150
Titolo di studio
Diploma
24
26
50
Laurea
48
12
60
Totale
105
45
150
Totale
105
Completiamo la tabella:
Genere
Femmina
Maschio
Totale
Licenza Media
33
7
40
a. I maschi sono 45 su 150, per cui p(Maschio) = 45 / 150 = ,30
b. I laureati sono 60 su 150, per cui p(Laureato) ) = 60 / 150 = ,40
c. In questa situazione ci troviamo di fronte al caso di eventi disgiunti (congiunzione "o"), per
cui utilizzeremo il principio della somma. Prima, però, occorre valutare se gli eventi siano o
meno mutuamente escludentisi, ossia, se vi siano elementi dello spazio campionario che li
soddisfano entrambi. In effetti vi sono 12 maschi che sono anche laureati, la cui probabilità
di essere estratti è 12 / 150 = ,08. La soluzione quindi è:
p(M∪Laureato) = p(Maschio) + p(Laureato) − p(Maschio∩Laureato) =
= ,30 + ,40 − ,08 = ,62
d. La condizione "almeno diplomato" indica che possiamo considerare come successo sia i
diplomati che i laureati, per cui il numero di casi favorevoli è 50 + 60 = 110. La soluzione
quindi è:
p(almeno diplomato) = p(Diplomato) + p(Laureato) = (50 / 150) + (60 / 150) = ,73
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
e. In questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"), per
cui utilizzeremo il principio del prodotto. Poiché l'estrazione è con reinserimento, gli eventi
sono indipendenti fra loro, e dunque lo spazio campionario rimane invariato ad ogni
estrazione.
p(1a = M ∩ 2a = F) = p(M) × p(F) = (45 / 150) × (105 / 150) = ,21
f. In questa situazione ci troviamo di fronte al caso di eventi congiunti (congiunzione "e"), per
cui utilizzeremo il principio del prodotto. Poiché l'estrazione è senza reinserimento, gli
eventi non sono indipendenti fra loro, e dunque lo spazio campionario cambia ad ogni
estrazione. In questo caso particolare, però, oltre allo spazio campionario ad ogni estrazione
successiva cambia anche il numero di eventi favorevoli, dato che se si è estratto un maschio
alla prima estrazione, alla seconda estrazione ci sarà un soggetto in meno ma anche un
maschio in meno, per cui:
p(1a = M ∩ 2a = M) = p(1a = M ∩ [2a = M|1a = M]) = (45 / 150) × (44 / 149) = ,09
g. Il modo più semplice è quello di considerare che la condizione "né maschio né laureato" nel
caso in questione identifica come successi le sole femmine diplomate e con licenza media,
che sono 33 + 24 = 57.
p(né Maschio né Laureato) = 57 / 150 = ,38
Oppure potremmo considerare che:
p(Non Maschio) = 1 − p(Maschio) = 1 − ,30 = ,70;
p(Non Laureato) = 1 − p(Laureato) = 1 − ,40 = ,60;
Poiché gli eventi non sono mutuamente escludentisi, calcoliamo anche la probabilità:
p(Non Maschio∩Laureato) = 1 − ,08 = ,92
Per cui:
p(Non Maschio ∪ Non laureato) =
= p(Non Maschio) + p(Non Laureato) − p(Non Maschio∩Laureato) =
= ,70 + ,60 − ,92 = ,38
Esercizio 4
a. Poiché utilizziamo tutti i test a disposizione, la soluzione si ottiene col calcolo della
permutazioni (nPn), ossia n!. In questo caso n = 8, per cui:
8P8
= 8! = 8 × 7 × 6 × 5 × 4 × 3 × 2 × 1 = 40320
b. Come riportato nell'Approfondimento 3.1, il quadrato latino bilanciato viene costruito a
partire dal seguente algoritmo:
1 n 2 n−1 3 n−2 4 n−3 5 n−4 etc.
Le sequenze successive vengono ottenute sommando 1 ad ogni cifra della prima riga. Poiché
in questo caso n = 8 avremo che la prima sequenza è:
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
1
8
2
7
3
6
4
5
A partire da questa prima sequenza aggiungiamo altre sette righe, e il numero in ogni cella è
uguale a quello superiore nella stessa colonna più uno. Naturalmente, ogni volta che la cifra
nella cella superiore nella colonna è 8, il conteggio riparte da 1:
1
2
3
4
5
6
7
8
8
1
2
3
4
5
6
7
2
3
4
5
6
7
8
1
7
8
1
2
3
4
5
6
3
4
5
6
7
8
1
2
6
7
8
1
2
3
4
5
4
5
6
7
8
1
2
3
5
6
7
8
1
2
3
4
In questo modo di soddisfa la condizione che ogni test è preceduto e seguito da ognuno degli
altri lo stesso numero di volte
c. Per gruppi distinti si intende il numero di gruppi distinti per la presenza di almeno un
elemento, ossia le combinazioni. Essendo i test 8, avremo che:
d. Per categorie ordinate si intende il numero di gruppi distinti per la presenza di almeno un
elemento e per l'ordine degli elementi, ossia le disposizioni. Essendo i test 8, avremo che:
e. In questo caso dobbiamo tenere conto del fatto che i quattro test per la validità di costrutto
convergente possono essere disposti in 4! modi, e che a loro volta i quattro test per la
validità di costrutto discriminante possono essere disposti in 4! modi. A questo punto basta
moltiplicare i due risultati per ottenere la soluzione al quesito: 4! × 4! = 576.
f. In questo caso possono andare bene i seguenti ordini (NB: C = convergente; D =
discriminante):
C
D
C
D
C
D
C
D
D
C
D
C
D
C
D
C
g. Ora, i quattro test per la validità convergente possono essere disposti nelle rispettive caselle
in 4! modi, e lo stesso vale per i quattro test per la validità discriminante. Quindi, avremo
che per ognuna delle due sequenze illustrate i modi possibili sono 4! × 4! = 576. Poiché le
sequenze sono due: 576 × 2 = 1152.
Esercizio 5
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
a. Per campioni distinti per almeno un elemento si intendono le combinazioni. Poiché siamo
nel caso senza ripetizione, dobbiamo utilizzare la seguente formula:
n
Ck =
n!
k! (n − k )!
Per cui, dato che n = 30 e k = 10, avremo:
b. Per campioni distinti per almeno un elemento si intendono le combinazioni. Poiché siamo
nel caso con ripetizione, dobbiamo utilizzare la seguente formula:
n
 n + k − 1
(n + k − 1)!
(n + k − 1)!
 =
=
Ck = 
 k  k![(n + k − 1) − k ]! k!(n − 1)!
Per cui, dato che n = 30 e k = 10, avremo:
c. Per campioni distinti per almeno un elemento e per l'ordine degli elementi si intendono le
disposizioni. Poiché siamo nel caso senza ripetizione, dobbiamo utilizzare la seguente
formula:
n!
n Dk =
(n − k )!
Per cui, dato che n = 30 e k = 20, avremo:
d. Per campioni distinti per almeno un elemento e per l'ordine degli elementi si intendono le
disposizioni. Poiché siamo nel caso con ripetizione, dobbiamo utilizzare la seguente
formula:
k
n Dk = n
Per cui, dato che n = 30 e k = 20, avremo:
n
Dk = 30 20
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
e. I modi che hanno gli studenti di disporsi tutti attorno ad un tavolo rappresentano le
permutazioni circolari, la cui formula è:
n
Pcircolati n = (n − 1)!= (30 − 1)!= 29!
f. Se vogliamo calcolare in quanti modi gli studenti possono disporsi negli otto posti della
prima fila dell'aula, dobbiamo considerare che occorre fare gruppi di 8 studenti da un
insieme di 30 che siano distinti sia da almeno un elemento che dall'ordine di questi elementi.
Per cui, si tratta di disposizioni:
Esercizio 6
Avendo quattro alternative di risposta, delle quali solo una corretta, la probabilità che ha lo studente
di rispondere correttamente solo per caso è 1/4 = ,25, che costituirà la probabilità del successo.
Conseguentemente, la probabilità dell'insuccesso, ossia della risposta errata, sarà 1 − ,25 = ,75.
a. La probabilità di rispondere correttamente alle prime sei domande corrisponde a rispondere
correttamente alla prima domanda, e alla seconda, e alla terza, e alla quarta, e alla quinta, e
alla sesta domanda, e non rispondere correttamente e alla settima, e all'ottava, e alla nona e
alla decima domanda. Trattandosi di eventi congiunti e indipendenti, dobbiamo utilizzare il
principio del prodotto. Non c'è bisogno di fare riferimento alla distribuzione binomiale
perché vi è una sola sequenza "vincente".
p(risposta corretta alle prime dodici domande) =
= ,25 × ,25 ×,25 × ,25 ×,25 × ,25 ×,75 ×,75 ×,75 ×,75 = (,25)6 × (,75)4 = ,000077
b. Determinare la probabilità di rispondere correttamente a sei domande ci obbliga a fare
riferimento alla distribuzione binomiale, dato sono varie le sequenze "vincenti".
Considerando che C = corretta, e E = errata potremmo avere: CCECECECEC,
CCECEEECCC, CCCCECECEE, etc. Il numero di queste sequenze è dato dal coefficiente
binomiale (ossia, le combinazioni). Considerando poi che p = ,25 e q = ,75, avremo che:
10 
n
p(6 risposte corrette) = p(k ) =   p k q n−k = p(6) =  ,256 ,7510−6
6 
k 
dove
Quindi avremo che
10 
n
p(k ) =   p k q n−k = p(6) =  ,256 ,7510−6 = 210×,000244×,316406 =,016222
6 
k 
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
c. Rispondere correttamente ad almeno 6 domande significa che possiamo considerare un
successo o il risultato 6, o il risultato 7, o il risultato 8 o il risultato 9 o il risultato 10, per cui
possiamo utilizzare il principio della somma, dato che si tratta di eventi disgiunti. Abbiamo
già calcolato la probabilità di sei risposte corrette al punto (b), per cui calcoliamo p(7), p(8),
p(9) e p(10), ossia le barre scure nella figura:
,30
Probabilità
,25
,20
,15
,10
,05
,00
0
1
2
3
4
5
6
7
8
9
10
Numero risposte corrette
10 
p(6) =  ,256 ,7510−6 = 210×,000244×,316406 =,016222
6 
10 
p(7) =  ,257 ,7510−7 , dove
7 
per cui p(7) = 120 × ,000061 × ,421875 = ,003090
10 
p(8) =  ,258 ,7510−8 , dove
8 
per cui p(8) = 45 × ,000015 × ,562500 = ,000386
10 
n 
10 
 = n , per cui p(9) = 10 × ,000004 ×
p(9) =  ,259 ,7510−9 , dove   = 10 , poiché 
9 
 n −1
9 
,750000 = ,000029
10 
10 
n
p(10) =  ,2510 ,7510−10 , dove   = 1 , poiché   = 1 , per cui p(10) = 1 × ,000001 × 1 =
10 
10 
n
,000001
Avremo quindi che:
p(almeno sei risposte corrette) = p(6) + p(7) + p(8) + p(9) + p(10) = ,016222 + ,003090 +
,000386 + ,000029 + ,000001 = ,019728
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
d. Rispondere correttamente a meno di 3 domande significa che possiamo considerare un
successo o il risultato 2, o il risultato 1, o il risultato 0, per cui possiamo nuovamente
utilizzare il principio della somma, dato che si tratta di eventi disgiunti. In questo caso,
poiché p ≠ q la distribuzione non è simmetrica, per cui non possiamo sfruttare le probabilità
già calcolate al punto (c) per l'altra coda della distribuzione.
,30
Probabilità
,25
,20
,15
,10
,05
,00
0
1
2
3
4
5
6
7
8
9
10
Numero risposte corrette
10 
p(2) =  ,252 ,7510−2 , dove
2 
per cui p(2) = 45 × ,062500 × ,100113 = ,281568
10 
p(1) =  ,251 ,7510−1 , dove
1 
,075085 = ,187712
10 
  = 10 , poiché
1 
n
  = n , per cui p(1) = 10 × ,250000 ×
1 
10 
p(0) =  ,250 ,7510−0 , dove
0 
,056314
10 
  = 1 , poiché
0 
n
  = 1 , per cui p(0) = 1 × 1 × ,056314 =
0
Avremo quindi che:
p(meno di tre risposte corrette) = p(2) + p(1) + p(0) = ,281568 + ,187712 + ,056314 =
,525593
Esercizio 7
a. In primo luogo dobbiamo risalire alla tabella di contingenza Punteggio Sopra/Sotto Cut-off
× Diagnosi in base ai dati a disposizione. Ricordiamo che la sensibilità è la proporzione di
soggetti con punteggi al test al di sopra del cut-off che hanno il disturbo (nella tabella
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
a
), mentre la specificità è la proporzione di soggetti con punteggi al di sotto del cut-off
a+c
d
).
che non hanno il disturbo (nella tabella
b+d
Diagnosi effettiva
Cut-off
Sì
No
Sopra
a = ??
b = ??
Sotto
c = ??
d = ??
Totale dei malati
a + c = 50
Totale dei non malati
b + d = 350
Totale sopra cut-off
a + b = ??
Totale sotto cut-off
c + d = ??
400
a
=,84 e che a + c = 50, otteniamo a come a = ,84 × (a + c) = ,84 ×
a+c
d
=,80 e b + d = 350, d = ,79 × (b + d) =
50 = 42. Allo stesso modo ricaviamo d, poiché
b+d
,80 × 350 = 280. Per differenza dai totali di colonna ricaviamo c e b, e i totali marginali di
riga:
Poiché sappiamo che
Diagnosi effettiva
Cut-off
Sì
No
Sopra
a = 42
b = 70
Sotto
c=8
d = 280
Totale dei malati
a + c = 50
Totale dei non malati
b + d = 350
Totale sopra cut-off
a + b = 112
Totale sotto cut-off
c + d = 288
400
Per calcolare il potere predittivo positivo (PPP) e il potere predittivo negativo (PPN), ossia
la proporzione di soggetti con disturbo sul totale di quelli con punteggio superiore al cut-off
e ossia la proporzione di soggetti senza disturbo sul totale di quelli con punteggio inferiore
al cut-off, rispettivamente, utilizziamo le formule:
PPP =
a
42
=
=,38
a + b 112
PPN =
d
80
=
=,97
c + d 100
b. Per rispondere a questa domanda dobbiamo utilizzare il teorema di Bayes:
p ( Disturbo |> cutoff ) =
p ( Disturbo ) × p (> cutoff | Disturbo )
p ( Disturbo ) × p (> cutoff | Disturbo ) + p ( NonDisturb o) × p ( > cutoff | NonDisturbo)
Poiché il testo riferisce che la probabilità di osservare un soggetto con disturbo nella
popolazione generale è il 9%, abbiamo p(Disturbo), e p(NonDisturbo) = 91%. Sappiamo poi
che p(>cutoff|Disturbo) = Sensibilità = ,84 e p(>cutoff|NonDisturbo) = 1 − Specificità = 1 −
,80 = ,20, avremo che:
p ( Disturbo |> cutoff ) =
,09×,84
=,29
,09×,84+,91×,20
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Esercizio 8
a. In questo caso utilizziamo la distribuzione binomiale, e calcoliamo la probabilità di ottenere
almeno 10 successi in 12 prove, il che equivale a dire la probabilità di estrarre 10, 11 e 12
studenti che svolgono attività sportiva.
,30
Probabilità
,25
,20
,15
,10
,05
,00
0
1
2
3
4
5
6
7
8
9
10
11
12
Numero studenti che svolgono attività sportiva
Sommeremo quindi p(10), p(11) e p(12). In questo caso, poiché p = ,54, avremo che q = 1 −
,54 = ,46.
12 
p(10) =  ,5410 ,4612−10 , dove
10 
per cui p(10) = 66 × ,002108 × ,211600 = ,029444
12 
p(11) =  ,5411 ,4612−11 , dove
11 
× ,460000 = ,006284
12 
  = 12 , poiché
11 
12 
p(12) =  ,5412 ,4612−12 , dove
12 
,000615.
12 
  = 1 , poiché
12 
n 
 = n , per cui p(11) = 12 × ,001138

 n −1
n
  = 1 , per cui p(12) = 1 × ,000615 × 1 =
n
Avremo quindi che:
p(almeno 10 studenti che svolgono attività sportiva) = p(10) + p(11) + p(12) = ,029444 +
,006284 + ,000615 = ,036343
b. In questo caso utilizziamo sempre la distribuzione binomiale, ma dato l'ampio campione a
disposizione sfruttiamo la possibilità di approssimare la distribuzione binomiale alla
distribuzione normale standardizzata. Per fare questo dobbiamo calcolare media e
deviazione standard della distribuzione binomiale, che sono:
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
µ = n × p = 1200 × ,54 = 648 e σ = n × p × q = 1200×,54×,46 = 17,26
A questo punto basta convertire in punti z il valore 680 ricordando di sottrarre 0,5 per la
correzione di continuità (vedi Approfondimento 3.3):
X −µ
675,5 − 648
= 1,59
17,26
σ
La risposta al quesito la troviamo sulle tavole di z determinando l'area al di là di z (vedi
Figura 3.34 nel testo) per z = 1,59, che è ,0559.
z=
=
c. I successi relativamente a questa domanda sono rappresentati da 4, 5 e 6 studenti su 8, per
cui dovremo sommare le probabilità p(4), p(5) e p(6).
,30
Probabilità
,25
,20
,15
,10
,05
,00
0
1
2
3
4
5
6
7
8
Numero studenti che svolgono attività sportiva
8 
p(4) =  ,54 4 ,468−4 , dove
 4
per cui p(4) = 70 × ,085031 × ,044757 = ,266504
8
p(5) =  ,545 ,468−5 , dove
 5
, per cui p(5) = 56 × ,045917 × ,097336 = ,250282
8 
p(6) =  ,546 ,468−6 , dove
6
per cui p(6) = 28 × ,024795 × ,146905 = ,146905
Avremo quindi che:
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
p(fra i 4 e i 6 studenti che svolgono attività sportiva) = p(4) + p(5) + p(6) = ,266504 +
,250282 + ,146905 = ,663692
d. Anche in questo caso utilizziamo l'approssimazione della distribuzione binomiale alla
distribuzione normale standardizzata. Per fare questo dobbiamo calcolare media e
deviazione standard della distribuzione binomiale per 800 studenti, che sono:
µ = n × p = 800 × ,54 = 432 e σ = n × p × q = 800×,54×,46 = 14,10
A questo punto basta convertire in punti z i valori 400 e 450 ricordando di sottrarre 0,5 al
valore inferiore a aggiungere 0,5 a quello superiore:
X − µ 450,5 − 432
399,5 − 432
= −2,30 z 2 =
=
= 1,31
14,10
14,10
σ
σ
Poiché un valore è negativo e uno è positivo, siamo nella situazione di Figura 3.37, per cui
dovremo sommare le aree comprese fra z e la media per i due valori:
z1 =
X −µ
=
p(400 < S < 450) → p(−2,30 < z < 1,31) = p(−2,30 < z < 0) + p(0 < z < 1,31) = ,4893 +
,4049 = ,8942
e. In questo caso siamo in una situazione diversa dai precedenti, perché prima si "lavorava" sul
numero di eventi, adesso sulla proporzione. Questo implica che per poter sfruttare
l'approssimazione alla distribuzione normale standardizzata z dobbiamo calcolare l'errore
standard della proporzione, in base alla formula:
n × π × (1 − π )
π × (1 − π )
=
n
n
dove π = ,54. Per cui nel nostro caso avremo che:
n × π × (1 − π )
π × (1 − π )
,54 × (1−,54)
σP =
=
=
=,05
100
n
n
Ora, per trasformare la proporzione ,60 in probabilità dobbiamo utilizzare la formula:
σP =
z=
P −π
,60−,54
= 1,2
=
,05
π (1 − π )
n
La risposta al quesito è data dall'area al di là di z = 1,20, che è ,1151.
f. La situazione è analoga alla precedente, salvo la necessità di trasformare in punti z due
proporzioni. Poiché l'ampiezza campionaria è diversa dal punto (e), dobbiamo ricalcolare
l'errore standard della proporzione:
n × π × (1 − π )
,54 × (1−,54)
π × (1 − π )
=
=
=,035
200
n
n
Ora, per trasformare le proporzioni in probabilità dobbiamo utilizzare la formula:
σP =
z1 =
,58−,54
= 1,14
,035
z2 =
,62−,54
= 2,29
,035
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
La situazione è analoga a quella della Figura 3.38 in quanto entrambi i valori di z sono
positivi:
p(,58 < P < ,62) → p(1,14 < z < 2,29) = p(0 < z < 2,29) − p(0< z < 1,14) = ,4890 − ,3729 =
,1161
g. La formula per calcolare l'intervallo di fiducia di una proporzione campionaria è la seguente:
π − z×
π (1 − π )
n
< P <π + z×
π (1 − π )
n
Sappiamo che per un intervallo di fiducia al 95% il valore di z da utilizzare è 1,96 (valore di
z che lascia al di là di sé (1−,95)/2 = ,025), mentre per un intervallo di fiducia al 99% il valor
di z è 2,58 (valore di z che lascia al di là di sé (1−,99)/2 = ,005) (vedi Figura 3.49). A questo
punto basta sostituire i dati nella formula:
Campione di 20 soggetti
,54 − 1,96 ×
,54(1−,54)
,54(1−,54)
< P <,54 + 1,96 ×
20
20
= IF95% = ,32 < P <,76
,54 − 2,58 ×
,54(1−,54)
,54(1−,54)
< P <,54 + 2,58 ×
20
20
= IF99% = ,25 < P <,83
Campione di 200 soggetti
,54 − 2,58 ×
,54(1−,54)
,54(1−,54)
< P <,54 + 2,58 ×
200
200
= IF99% = ,45 < P <,63
,54 − 1,96 ×
,54(1−,54)
,54(1−,54)
< P <,54 + 1,96 ×
200
200
= IF95% = ,47 < P <,61
h. La formula per calcolare l'intervallo di fiducia della proporzione della popolazione a partire
da quella campionaria è la seguente:
P − z×
P(1 − P)
P(1 − P)
< π < P + z×
n −1
n −1
Per trovare l'intervallo di fiducia al 98% abbiamo bisogno di trovare quel valore di z di là del
quale l'area di probabilità vale ,01, dato che (1 − ,98) / 2= ,01. Tale valore è z = ± 2,33. Dato
che P = ,54 e n = 150, avremo che:
,54 − 2,33 ×
,54(1−,54)
,54(1−,54)
< π <,54 + 2,33 ×
150 − 1
150 − 1
,44 < π <,64
Esercizio 9
a. Poiché la variabile è misurata su scala ad intervalli equivalenti e la distribuzione dei
punteggi è normale, possiamo fare riferimento alla distribuzione normale standardizzata z.
Per cui, il primo passo è trasformare in punti z i punteggi 38 e 42:
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
z1 =
39 − 50
= −1,1
10
z2 =
42 − 50
= −0,8
10
La situazione è la stessa della Figura 3.39, in cui entrambi i valori di z sono negativi. La
soluzione, quindi è rappresentata da:
p(39 < SE < 42) → p(−1,1 < z < −0,8) = p(0 < z < 1,1) − p(0 < z < 0,8) = ,3643 − ,2881 =
,0762
33 − 50
= −1,7
10
Dobbiamo trovare l'area di probabilità al di là di z = 1,7, come nel caso della Figura 3.35.
L'area che cerchiamo è ,0446.
b. Trasformiamo 33 in punti z: z =
77 − 50
= 2,7
10
Dobbiamo trovare l'area di probabilità al di là di z = 2,7, come nel caso della Figura 3.34.
L'area che cerchiamo è ,0035.
c. Trasformiamo 77 in punti z: z =
47 − 50
55 − 50
= −0,3 , z 2 =
= 0,5
10
10
Come nel caso della Figura 3.37, dobbiamo sommare le aree comprese fra z e la media per i
due valori:
d. Trasformiamo 47 e 55 in punti z: z1 =
p(47 < SE < 55) → p(−0,3 < z < 0,5) = p(−0,3 < z < 0) + p(0 < z < 0,5) = ,1179 + ,1915 =
,3094
e. In questo caso non dobbiamo farci ingannare dal fatto che ci venga indicato che sono stati
estratti 50 soggetti: vogliamo innanzitutto sapere la probabilità che un soggetto abbia un
punteggio medio compreso fra 51 e 53. Quindi, basta calcolare questa probabilità e
moltiplicarla poi per 50 per rispondere al quesito.
Trasformiamo 51 e 53 in punti z:
z1 =
51 − 50
53 − 50
= 0,1 , z 2 =
= 0,3
10
10
La situazione è analoga a quella della Figura 3.38 in quanto entrambi i valori di z sono
positivi:
p(51 < SE < 53) → p(0,1 < z < 0,3) = p(0 < z < 0,3) − p(0< z < 0,1) = ,1179 − ,0398 = ,0781
A questo punto per rispondere alla domanda basta moltiplicare 50 × ,0781 = 3,91 ≈ 4. Circa
4 soggetti su 50 avranno un punteggio di SE compreso fra 51 e 53.
f. In questa situazione, invece, abbiamo effettivamente a che fare con una media campionaria,
per cui facciamo riferimento alla distribuzione delle medie campionarie. Questo significa
che per trasformare a punti z una media dovremo utilizzare la formula:
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
z=
M − µM
σM
=
M − µM
σ
n
dove µM e σM sono rispettivamente la media e la deviazione standard della distribuzione
delle medie campionarie. Nel primo caso il valore è uguale a quello della popolazione
(quindi µM = µ = 50), nel secondo caso di tratta dell'errore standard, che è uguale ala
deviazione standard della popolazione diviso la radice quadrata dell'ampiezza campionaria.
Poiché M1 = 51 e M2 = 53:
51 − 50
53 − 50
= 0,71 , z 2 =
= 2,12
10
10
50
50
p(51 < M < 53) → p(0,71 < z < 2,12) = p(0 < z < 2,12) − p(0< z < 0,71) = ,4830 − ,2611 =
,2219
z1 =
g. In questo caso sapere che vengono estratti 500 campioni non ci interessa inizialmente. La
situazione è simile a quella del punto (e). Innanzitutto dobbiamo calcolare la probabilità di
estrarre un campione di 30 soggetti con media compresa fra 49 e 52:
51 − 50
53 − 50
z1 =
= 0,55 , z 2 =
= 1,64
10
10
30
50
p(51 < M < 53) → p(0,55 < z < 1,64) = p(0 < z < 1,64) − p(0< z < 0,55) = ,4495 − ,2088 =
,2407
Poiché la probabilità di estrarre un campione di 30 elementi con media compresa fra 51 e 53
è ,2407, su 500 campioni possiamo aspettarcene con la stessa caratteristica 500 × ,2407 =
120,35 ≈ 120.
h. Il rango percentile di un punteggio è la percentuale di valori al di sotto di esso in una
distribuzione di punteggi. Per calcolare quanti punteggi sono inferiori a 75, trasformiamo
questo valore in punti z e calcoliamo l'area sottostante la distribuzione normale
standardizzata da meno infinito a quel valore di z:
75 − 50
= 2,55
z=
10
In questo caso dobbiamo trovare l'area compresa fra 0 e z = 2,55 e aggiungervi l'area
compresa fra 0 e meno infinito (vedi Figura 3.34). Nel secondo caso conosciamo già la
risposta, perché è la metà dell'area sottostante la distribuzione normale, ossia ,5000. Nel
primo caso basta trovare sulle tavole di z l'area compresa fra 0 e 2,55, che è ,4946, per cui
avremo che la proporzione di punteggi inferiori a 75 è ,4946 + ,5000 = ,9946.
Il valore ,9946 rappresenta la proporzione di punteggi inferiori a 75. Il rango
percentile viene calcolato moltiplicando questa proporzione per 100: ,9946 × 100 = 99,46,
che è la risposta al quesito.
Nel caso del punteggio 23, invece, ci basta calcolare l'area al di là di z perché 23 è sotto alla
media (vedi per esempio la Figura 3.35)
z=
23 − 50
= −2,7
10
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
L'area al di là di z = 2,7 è ,0035, che moltiplicato per 100 è uguale a ,0035 × 100 = 0,35, che
la soluzione al quesito.
i. Il punteggio che rappresenta il primo quartile (Q1) della distribuzione di valori è quello che
lascia dietro di sé il 25% di tutti gli altri. Dobbiamo quindi trovare quale valore di z ha
un'area al di là di esso uguale a ,2500, e dal punto z risalire al punteggio di SE. Dalle tavole
di z vediamo che è il valore z = 0,67 ad avere un'area di (circa) ,2500 fra sé e più infinito. In
questo caso, però, siamo nella parte della distribuzione normale standardizzata in cui i valori
sono negativi, in quanto p < ,5000, e quindi z < 0. Il valore va quindi preso col segno meno
(situazione simile all'esempio in Figura 3.35). Se quindi:
z=
X −µ
σ
, avremo che X = z × σ + µ , per cui X = −0,67 × 10 + 50 = 43,3
Il punteggio 43,3 è quindi il primo quartile della distribuzione dei punteggi di SE.
Un ragionamento analogo ci permette di ottenere il punteggio che rappresenta il 90°
percentile. Il 90° percentile è quel punteggio che lascia dietro di sé il 90% degli altri
punteggi. Questo significa che dobbiamo trovare il punto z che possiede la caratteristica di
avere prima di sé un'area uguale a ,9000. Poiché ,9000 > ,5000, sarà un valore di z positivo,
e ci basterà trovare quel valore per cui l'area compresa fra 0 e il valore è ,4000, dato che
l'area compresa fra 0 e meno infinito è ,5000 (Figura 3.34). Il valore di z con queste
caratteristiche è 1,28, per cui:
X = z × σ + µ → X = 1,28 × 10 + 50 = 62,8
Il punteggio di SE 6,28 rappresenta dunque il 90° percentile.
j. In questo caso dobbiamo utilizzare la formula:
µM − z ×
σ
n
< M < µM + z ×
σ
n
I valori di z da inserire nella formula sono quelli che lasciano al di là di sé (1 − ,96) / 2 = ,02
e (1 − ,98) /2 = ,01, ossia 2,05 e 2,33, per cui:
10
< M < 50 + 2,05 ×
15
10
IF al 98% : 50 − 2,33 ×
< M < 50 + 2,33 ×
15
IF al 96% : 50 − 2,05 ×
10
→ 44,71 < M < 55,29
15
10
→ 43,98 < M < 56,02
15
Se la popolazione fosse stata finita con N = 300 avremmo dovuto applicare la correzione
popolazioni finite, per cui:
µM − z ×
IF al 96% : 50 − 2,05 ×
44,83 < M < 55,17
σ
n
N −n
σ
< M < µM + z ×
N −1
n
N −n
N −1
10 300 − 15
10 300 − 15
< M < 50 + 2,05 ×
→
15 300 − 1
15 300 − 1
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
IF al 98% : 50 − 2,33 ×
44,13 < M < 55,87
10 300 − 15
10 300 − 15
→
< M < 50 + 2,33 ×
15 300 − 1
15 300 − 1
k. Poiché n > 30, la formula per il calcolo dell'intervallo di fiducia della media della
popolazione a partire da quella campionaria è:
s
s
M − z×
< µM < M + z ×
n −1
n −1
L'intervallo di fiducia è al 94%, per cui il valore di z di cui abbiamo bisogno è quello che
lascia al di là di sé un'area di probabilità uguale a (1 − ,94) / 2 = ,03, ossia z = ±1,88.
L'intervallo di fiducia per la media della popolazione è dunque:
10
10
< µ M < 50 + 1,88 ×
→ 51,45 < µ M < 48,55
200 − 1
200 − 1
Si noti che in realtà abbiamo trovato l'intervallo di fiducia della media della distribuzione
campionaria delle medie per campioni di ampiezza 200 (µM), ma poiché sappiamo che
questo coincide con la media della popolazione, possiamo sostituire µ nella soluzione:
51,45 < µ < 48,55
50 − 1,88 ×
Carlo Chiorri, Fondamenti di psicometria – Copyright © 2010 The McGraw-Hill Companies S.r.l., Publishing Group Italia
Scarica