1
2
LE TECNICHE CHE VEDREMO OGGI
3
4
5
6
7
Pi<1/2
8
9
10
11
La variabile ausiliaria usata per definire le probabilità variabili potrebbe essere,
12
non la dimensione dei grappoli, M, ma una generica X, positivamente correlata
con la Y.
13
14
Identità tra devianze
 y
ij
i
j
 y   y
2
ij
i
 y    M y  y 
2
2
i
j
i
i
Devianza totale=devianza within+devianza beetween
1
2
2
2




NM  1
S 
y

y

y

y

S


ij
ij
NM  1 i j
i
j
2
Sw
2
SB
2
1
2
2
2





y

y

y

y

S


ij
i
ij
i
w  N ( M  1) 
N ( M  1) i j
i
j
1

M  yi  y

N 1 i j
  M y  y 
2
2
i
i
S B  N  1
2
j
Mi=M, PER OGNI i
15
S12=MSB2
Mi=M, PER OGNI i
16
STIMA PROPORZIONE IN GR
Mi=M, per ogni i
pˆ gr 
p
i
c
n
corretto
 N 1

p  pˆ 
1 f
v pˆ  
 n 1
n
c
2
c
c
distorto
c
 pi  Pi 
gr
pˆ gr
i
2
i
a

m
i
ai
1
 
n c Mi
1 f
V  pˆ gr  
n
Mi diverso per ogni i
gr
1 f
V  pˆ gr  
nM 2
1 f
v pˆ gr  
nMˆ 2
ai  M i P 2 , M
M0
N
 N 1
a  M pˆ  , Mˆ  1 M
 n 1

n
c

2
i
c
i
gr
c
17
i
18
SOLUZIONE ES. 1
19
SOLUZIONE ES. 1
20
Calcolare le probabilità di inclusione del primo e del
secondo ordine.
21
SOLUZIONE ES. 2
CAMPIONE ESTRATTO: C=(2,9)
2 
9 
 2,9 
22
0,219
0,274
0,035
ESERCIZIO 3
In una strada del centro storico di una certa città ci sono 8
palazzi costruiti prima del 1920. Allo scopo di valutare le
condizioni di stabilità dei palazzi ne vengono scelti 2 a
caso con probabilità variabili, impiegando come variabile
ausiliaria il numero di famiglie residenti in ciascun
palazzo.
Palazzi 1 2 3 4 5 6 7 8
Famiglie 25 15 40 12 50 28 16 20
residenti
a)Si estragga il campione con il metodo di Yates-Grundy.
b)Si definiscano le probabilità di inclusione del primo e
secondo ordine e si calcolino tali probabilità per il
campione estratto in a).
23
SOLUZIONE ES. 3
a)Le probabilità di estrazione per la prima unità (palazzo), definite in
base alla variabile ausiliaria "numero di famiglie residenti"; quindi
sono
8
7
6
5
4
3
2
1
Palazzi
20
16
28
50
12
40
15
25
Famiglie res.
0,121 0,073 0,194 0,058 0,243 0,136 0,078 0,097
Pi
Ipotizzando di estrarre la i-esima unità occorre ricalcolare le misure
di ampiezza normalizzate per l’estrazione della seconda unità:
Pi 1  Pi 
b)Definire le probabilità di inclusione (par.2.6). Per le probabilità di
inclusione del primo e secondo ordine, utilizzando il metodo di YatesGrundy, vedi libro (par. 3.4.2.1). Le probabilità di inclusione del
primo ordine risultano
8
7
6
5
4
3
2
Palazzi 1
0,249 0,154 0,378 0,124 0,454 0,276 0,163 0,202
i
24
ESERCIZIO 4
ospedali
n_posti
letto
1
2
3
4
5
6
7
8
9
10
470 210 350 960 235 550 125 210 425 232
(
,
)
25
SOLUZIONE ES. 4
P'j=Pj/(1-Pi)
Tj'
0,16747182 0,167472
0,074745035 0,242217
0,12466452 0,366881
0,08373591
0,195920558
0,044551798
0,074745035
0,15136876
0,082662373
0,450617
0,646538
0,69109
0,765835
0,917203
0,999866
26
SOLUZIONE ES. 4
27
SOLUZIONE ES. 4
28
SOLUZIONE ES. 4
29
ESERCIZIO 5
(
,
,
)
30
SOLUZIONE ES. 5
,
31
SOLUZIONE ES. 5
^
=
^
=
32
ESERCIZIO 6
Si consideri una popolazione di N=4 catene di supermercati di una
città italiana; ognuna di esse è presente nella città con tre negozi.
L'entrata mensile di ogni negozio è indicata in milioni di euro nella
tabella che segue:
catena1 catena2 catena3 catena4
3
2,7
5,3
4,7
2,5
4
3,6
3,9
3,8
7
2,8
5,8
a) Verificare l’identità sulle devianze e calcolare il coefficiente di
omogeneità nei grappoli.
b) Verificare l’espressione di S12 in funzione del coefficiente di
omogeneità nei grappoli.
c) Si estragga un campione di 2 catene , si stimino il ricavo mensile
totale per negozio e per catena con le relative varianze.
33
SOLUZIONE ES. 6
a)
catena1 catena2 catena3 catena4
3
2,7
5,3
4,7
2,5
4
3,6
3,9
3,8
7
2,8
5,8
_ Yi
9,3
13,7
11,7
14,4
Yi
3,1 4,566667
3,9
4,8
2
Si
0,43 4,863333
1,63
0,91
34
SOLUZIONE ES. 6
b)

=5,2425
1-S2w/S2= -0,03024989
c)
catene
Ricavo
totale
mensile
2
4
(mil.
Euro)
13,7
y
i.

4,683333
c
14,4
1 ˆ
N2
ˆ 
v Ygr   v(
Ygr ) 
(1  f ) s12  0,007
2
M0
nM 0
 
S12=0,245
Yˆgr
N
ˆ
Ygr 

N n* N
Yˆgr
ˆ
N
Ygr 

M0 n* M0
 yi . 
c
14,05
 
1 ˆ
N2
ˆ
v Ygr  v( Ygr ) 
(1  f ) s12 
2
N
nN
0,06125
35
^
ESERCIZIO 7
Una impresa con 10 unità locali (U.L.) distribuite nella regione vuole introdurre
l'orario flessibile. Allo scopo effettua un sondaggio scegliendo casualmente n=3 U.L
tenendo conto del numero di addetti per U.L..
U.L.
addetti
1
8
2
12
3
23
4
15
5
50
6
75
7
115
8
43
9
19
10
25
Supponendo che, per le tre U.L. scelte, la proporzione di favorevoli all'orario
flessibile sia rispettivamente pari a p1=0,4, p2=0,6, p3=0,2
1. si estragga il campione di n=3 U.L., impiegando il "cumulative total method"
ed indicando come sono state scelte le U.L. dalle tavole dei numeri casuali;
2. si stimi la proporzione di addetti che sono favorevoli all'orario flessibile
3. si stimi la varianza dello stimatore e si definiscano le proprietà dello stimatore
impiegato.
36
SOLUZIONE ES. 7
u.l.
addetti
1
2
3
4
5
6
7
8
9
10
Ti
8
12
23
15
50
75
115
43
19
25
385
pi
ai=pi*mi
8
20
43
58
108
183
298
341
360
385
(ai-Mi*p^gr)^2
0,4
0,2
30
23
39,42671714
178,8128718
0,6
15
50,31097891
268,5505679
Per utilizzare il metodo dei totali cumulati si considerano i seguenti valori cumulati: 820-43-58-108-183-298-341-360-385.
Seleziono i numeri casuali126-367-213 compresi nell'intervallo [1;385], cui
corrispondono rispettivamente le U.L. 6-10-7.
Poiché i grappoli hanno dimensioni differenti si considera lo stimatore
0,316279
71,66667
1 f
v pˆ gr  
nMˆ 2

c
a  M pˆ  , Mˆ  1
2
i
i
n 1
gr
n
Lo stimatore impiegato è asintoticamente corretto.
M
i
v(p^gr)= 0,006100121
c
37
ESERCIZIO 8
Si vuole condurre un’indagine campionaria sulle ore di assenza dal lavoro da parte degli
addetti nelle 870 imprese manifatturiere di un dato settore della regione Lombardia.
Supponiamo che venga estratto in blocco un campione di 10 imprese e si considerano
tutti gli addetti di ciascuna impresa giungendo ai dati esposti nella seguente tabella,
relativi ad una settimana lavorativa.
Imprese
N. addetti
Tot ore assenza
1
7
8
2
29
24
3
64
49
4
52
32
5
85
48
6
12
16
7
47
51
8
34
24
9
72
56
10
21
16
A) Che tipo di campionamento è stato utilizzato?
B) Si stimi il totale delle ore di assenza degli addetti nelle 870 aziende e il
corrispondente scarto quadratico medio
C) Si dica, motivando la risposta, se i dati a disposizione avrebbero consentito la stima
della media delle ore di assenza.
D) Se non fossero stati considerati tutti gli addetti di ciascuna impresa ma solo 6 per
ognuna estratti casualmente, che tipo di campionamento sarebbe stato utilizzato?
38
SOLUZIONE ES. 8
A) Che tipo di campionamento è stato utilizzato?
Si è utilizzato un campionamento a grappoli, in quanto si ha una popolazione
“addetti nelle imprese manifatturiere di un dato settore della Regione
Lombardia” suddivisa in 870 grappoli “le aziende”. Si sono estratti in blocco 10
grappoli e si sono esaminati completamente.
Dunque:
•è noto N=870 numero totale di grappoli
•è noto n=10 numero grappoli costituenti il campione
•sono note le Mi=numero di unità elementari che formano il grappolo i
•sono note le yi=ore di assenza per ciascun grappolo i
•non è noto M0=numero di unità elementari che formano la popolazione (totale
addetti nelle imprese manifatturiere di un dato settore nella Regione Lombardia)
Imprese
1
N. addetti
7
Tot ore assenza y8
2
29
24
3
64
49
4
52
32
5
85
48
6
12
16
7
47
51
8
34
24
9
72
56
10
21
16
39
SOLUZIONE ES. 8
40