Esame di Statistica – corso base (canale NZ)

Prove d’esame di Statistica - corso base a.a. 2015-16
Esame del 12/1/2016
Esercizio 1 (punti 14) - Su un campione di 543 case, si rilevano il prezzo (in euro) e la dimensione
(in m2).
Prezzo / Dimensione
(16-30]
(30-50]
(50-170]
(25000-66000]
59
187
63
309
(66000-100000]
6
49
115
170
(100000-150000]
0
6
52
58
(150000-200000]
0
0
6
6
65
242
236
543
a) Calcolare la media aritmetica, la mediana, la varianza e il coefficiente di variazione della
variabile Dimensione;
b) Disegnare l'istogramma della variabile Dimensione;
c) Calcolare un opportuno indice di associazione tra la dimensione e il prezzo delle case e
commentare il risultato;
d) Supponendo che il prezzo delle case si distribuisca normalmente, verificare se il prezzo
medio delle case è significativamente inferiore al prezzo medio pre-crisi pari a 75000 euro
(si usi un livello di significatività pari a 0.05).
R: a) Media aritmetica 68,389
Classe mediana 30-50 mediana 47,025
Varianza 1358,3309 sqm 36,8555 CV 0,5369
b) Ordinate istogramma (ni/di)
4,642 12,1 1,96227
c) Chi-quadro
166,0519
forte grado di associazione
d) Statistica test = - 6,3278
si rifiuta H0
Esercizio 2 (punti 6) - Alice e Irene confrontano cosa hanno trovato nelle rispettive calze della
Befana. Alice ha trovato 10 caramelle, 5 cioccolatini e 3 pezzi di carbone zuccherato mentre Irene
ha trovato 13 caramelle, 6 cioccolatini e 5 pezzi di carbone zuccherato.
Qual è la probabilità che Alice estragga una caramella?
Alice fa 10 estrazioni indipendenti dalla sua calza. Quale è la probabilità che Alice estragga
7 caramelle?
• Alice estrae una caramella e la mangia. Quale è la probabilità che nell’estrazione successiva
esca un cioccolatino?
Prima che le due bambine tocchino le calze, il fratellino di Alice ruba le due calze.
• Qual è la probabilità che il bambino estragga un pezzettino di carbone?
• Avendo estratto un pezzettino di carbone, quale è la probabilità che lo abbia estratto dalla
calza della sorellina?
•
•
R:
a) 10/18 = 0,55
b) v.c. binomiale, 7 successi in 10 prove 0,168
c) 5/17 = 0,294
d) 0,1905
e) teorema di Bayes 0,4445
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
Esercizio 3 (punti 6) - Di una variabile casuale X con distribuzione Normale si sa che il terzo
quartile è pari a 5 e il primo decile è pari a -0.84. Calcolare la media e la varianza di X e calcolare le
seguenti probabilità:
a) P(X>3);
b) P(X<-3);
c) P(1<X<2).
R:
µ = 2,9876
σ2 = 8,9143
a) P(z>0,004)
≈ 0,5
b) P(z<-2,01) 0,0222
c) P(-0,67<z<-0,33) 0,1193
Esercizio 4 (punti 6) - Si rilevano il numero medio di incidenti stradali e il numero medio di multe
nello stesso anno nelle 20 regioni italiane.
Incidenti 3.6
Multe
4.2
22.7 21.5
12.9 10.6 7.1
4.2
8.8
9.35 14.2 10.4 10.6 5.5
15.7 11.3 1.5
9.2
8.8
7.7
7.7
9.7
10.5 8.1
19.0 14.5 14.6 10.5 9.0
7.6
10.8 5.5
13.7 14.7 8.4
7.1
7.2
19.0 15.9 15.7
Studiare mediante un opportuno modello statistico se il numero di incidenti è influenzato dal
numero di multe.
R:
Y = - 0,5 X + 14,99
debole influenza
Esame del 2/2/2016
Esercizio 1 (punti 10) – Da alcuni anni l’Opera San Francesco organizza a Milano “Il Natale in
mensa” per i poveri. Questi i pasti serviti il giorno di Natale negli anni dal 2010 al 2014:
Anno
2010
2011
2012
2013
2014
Pasti serviti a pranzo
935
1185
1276
1341
1430
Pasti serviti a cena
538
682
592
647
846
Interpolare linearmente in funzione del tempo il numero complessivo di pasti serviti, misurare la
bontà di adattamento del modello e commentare il significato ‘sociale’ del coefficiente angolare
della retta.
Ipotizzando che il modello mantenga la sua validità nel tempo, stimare il numero di pasti che
verranno serviti a Natale 2016.
Misurare la correlazione tra il numero di pasti serviti a pranzo e quelli serviti a cena.
R: Assumendo come origine dei tempi (t=0) il 2012:
t
Y
0
1894,4 media
2
66681,04 varianza
correlazione p/c
345,4 covarianza 0,762966
1894,4 B0
172,7 B1
0,9458149 r
0,89456583 R2
commento "sociale": aumento delle situazioni di povertà
2016 t = 4
2585
Esercizio 2 (punti 3) – Un dado viene lanciato 5 volte, e tutte e 5 le volte esce la faccia “1”. Quale è
la probabilità che il dado sia perfetto? E quale è la probabilità che in 5 lanci di un dado perfetto esca
sempre la stessa faccia?
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
R: cinque volte 1
cinque volte stessa faccia
0,000129
0,000772
Esercizio 3 (punti 16) – In un palazzo abitano 10 famiglie, i cui redditi annui (in migliaia di €) nel
2014 sono stati:
32
24
60
45
18
24
30
22
38
47
Calcolare media aritmetica, mediana, coefficiente di variazione.
Disegnare la curva di concentrazione dei redditi e calcolare il rapporto di concentrazione.
La famiglia che nel 2014 ha avuto un reddito di 47000 euro, nel 2005 aveva avuto un reddito di
40500 euro. Sapendo che il coefficiente di rivalutazione ISTAT per esprimere valori monetari del
2005 in euro 2014 è pari a 1,175, di quanto è variato il potere di acquisto reale di quella famiglia, in
termini assoluti e in termini percentuali?
Ipotizzando che quelle 10 famiglie rappresentino un campione casuale delle famiglie di un Comune
italiano e che la distribuzione dei redditi sia normale, costruire gli intervalli di confidenza per la
media e per la varianza (livello di significatività α = 0,05).
Si vuole ripetere l’indagine, mirando ad ottenere un intervallo di confidenza per la media di
ampiezza complessiva non superiore a 6000 euro (sempre al livello di significatività α = 0,05);
quale dovrà essere la numerosità del nuovo campione?
X
18
22
24
24
30
32
38
45
47
60
Fi
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1
Pi
0,0529
0,1176
0,1882
0,2588
0,3471
0,4412
0,5529
0,6853
0,8235
1
media
34
mediana
30 e 32
CV
0,37226511
rivalutaz
I=6
R conc.
47587,5 variaz ass
variaz rel
var corr
178
s
13,3416641
int conf media
int conf varianza
nuovo n
diff
0,0471
0,0824
0,1118
0,1412
0,1529
0,1588
0,1471
0,1147
0,0765
0,229412
-587,5
-0,01235
24,45577 43,54423
84,21473 593,2454
76
Esercizio 4 (punti 3) – Un’area di 100 m2 è stata suddivisa in 10000 quadratini di 10 cm di lato
ciascuno, e su di essa viene sparso un sacchetto che contiene 2000 semi. Quale è la probabilità che
in un quadratino cadano almeno due semi?
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
R: v.c. di Poisson
P(0) = 0,818731
P(1) = 0,163746
prob(x>=2) 0,017523
Appello straordinario del 12/4/2016
Esercizio 1 (punti 5) – Su un collettivo di n = 20 osservazioni, si sono calcolate la media aritmetica,
pari a 10, e la mediana, pari a 8. Sapendo che la somma dei quadrati degli scarti dalla mediana vale
800, calcolare la varianza della distribuzione.
R: var = 36
Esercizio 2 (punti 2) - Dati due caratteri X e Y, se vale la relazione b y;x = bx;y, spiegare perché il
valore assoluto di tali coefficienti non può essere superiore a 1.
R: Il prodotto dei due coefficienti angolari è r 2, valore compreso tra 0 e 1; se sono uguali, sono anche
uguali a r e quindi compresi tra -1 e +1.
Esercizio 3 (punti 2) – Dato un campione casuale di n = 100 osservazioni, si è sottoposta a verifica
l’ipotesi H0: µ = 30, contro l’alternativa H1: µ ≠ 30 e si è calcolato un p-value pari a 0,3147. A quale
conclusione giungereste?
R: Il p-value fornito è elevato, superiore a qualsiasi usuale soglia; quindi, si accetta H0.
Esercizio 4 (punti 4) – E’ data una tabella a doppia entrata di dimensione 3x3. Spiegare perché su
una siffatta tabella il valore massimo del χ 2 non può essere pari a 81. Ipotizzando che su quella
tabella sia stato calcolato un valore effettivo del χ 2 pari a 6,72, sottoporre a verifica l’ipotesi di
indipendenza tra i due caratteri, al livello α = 0,05.
R: max χ2 = [min(k;c) – 1] n.. , quindi 2 n.. , che è necessariamente pari.
6,72 < χ42 = 9,4877 Si accetta l’ipotesi di indipendenza.
Esercizio 5 (punti 4) – Un’azienda di elettrodomestici intende testare, su un campione casuale
semplice di frequentatori di un punto vendita di una grande catena che si occupa di vendita di
elettrodomestici, la frazione di quanti visitano il reparto “frigoriferi”. Per ottenere un intervallo di
fiducia di tale frazione di ampiezza complessiva pari a 0,04 (al livello α = 0,05), quale dovrà essere
il numero di frequentatori da intervistare, sotto l’ipotesi di massima prudenza? E ipotizzando invece
che l’80% dei visitatori si rechi in quel reparto?
R: a) 2401
b) 1537
Esercizio 6 (punti 7) – E’ data la seguente distribuzione di un campione di 200 cartoni che
contengono ciascuno 1000 pezzi di un prodotto secondo il numero pezzi difettosi presenti in ciascun
cartone:
N. pezzi difettosi
0
1-3
4-7
8 - 14
15 o più
N. cartoni
51
43
52
49
5
Si sa inoltre che il numero medio di pezzi difettosi per i 5 cartoni con il maggior numero di pezzi
difettosi è pari a 18.
Determinare la media aritmetica, la mediana, il coefficiente di variazione e misurare l’asimmetria
della distribuzione.
Determinare gli estremi dell’intervallo di confidenza per la media, al livello α = 0,05.
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
R:
x
0
2
5,5
11
18
tot
media
mediana
varianza
CV
asimmetria
sqm corr
estremi int.
n
51
43
52
49
5
200
M1-Me
xn
x^2 n
0
0
86
172
286
1573
539
5929
90
1620
1001
9294
5,005
4
21,41998
0,92471
1,005 positiva
4,639786
4,3620
5,6480
Esercizio 7 (punti 8) – Negli ultimi giorni, un titolo azionario ha fatto registrare le seguenti
quotazioni di chiusura:
Data
21/3
24/3
30/3
1/4
6/4
Quotazione
3,51
3,43
3,52
3,59
3,65
Ricordando che marzo ha 31 giorni, interpolare linearmente l’andamento delle quotazioni, misurare
la bontà di adattamento del modello e, sulla base del modello stimato, prevedere la quotazione di
chiusura di quel titolo al 12 aprile, argomentando brevemente sui limiti di tale previsione.
R: Assumendo come origine (t=0) il 20 marzo
t
Y
1
3,51 b0
3,4427
4
3,43 b1
0,0111
10
3,52
r
0,8431
12
3,59 r2
0,7108
17
3,65
prev t=23
3,6970
I corsi azionari sono troppo volatili per essere
ragionevolmente prevedibili per estrapolazione.
Esame del 07/06/2016
Esercizio 1 (punti 10) - Su un collettivo di n=100 soggetti è stato rilevato il numero di volte in cui
si recano al cinema nell’arco della settimana (X) e il numero di volte in cui si recano a cena al
ristorante (Y). Nella tabella seguente si riportano le frequenze relative della distribuzione congiunta
(X,Y):
X\Y
0
1
2
0
0
0.1
0.5
1
0.2
0.2
0
a) Calcolare la media aritmetica, la varianza e il coefficiente di variazione del numero di volte
in cui i soggetti si recano a cena al ristorante;
b) Valutare l’associazione tra i due caratteri;
c) A ciascun soggetto, viene chiesto quanto spende in media per andare a cena al ristorante. La
spesa media complessiva è risultata pari a 45 euro con una deviazione standard pari a 12. Si
verifichi se la spesa media è significativamente diversa da 30 euro (α = 0,05).
X \ Y
0
1
2
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
0
1
media Y
varianza Y
CV
0
20
10
20
50
0
12
8
18
12
30
20
-12
12
72,222
-8
8
20
-20
12,5
rifiuto H0
1,3
0,61
60,08
Frequenze teoriche
contingenze
chi quadro
test
Esercizio 2 (punti 6) - Il numero medio di chiamate all’ora ad un centralino ha distribuzione di
Poisson con media pari a 180.
a) Calcolare la probabilità che in un determinato minuto non arrivi nessuna chiamata;
b) Supponendo che il centralino sia in grado di soddisfare non più di 3 chiamate al minuto,
calcolare la probabilità di trovarlo occupato.
P(X=0)
P(X>3)
0,049787
0,352768
0,149361
0,224042
0,224042
P(X=1)
P(X=2)
P(X=3)
Esercizio 3 (punti 6) - Il 46% degli elettori di un Comune si ritiene politicamente di centro, il 30%
di sinistra e il 24% di destra. In un’elezione recente sono andati a votare il 35% degli elettori di
centro, il 62% degli elettori di sinistra e il 58% di quelli di destra. Un elettore è scelto a caso.
a) Sapendo che l’elettore ha votato alle scorse elezioni, quale è la probabilità che si tratti di un
elettore di centro?
b) Quale è la percentuale di elettori che ha partecipato alla scorsa elezione?
Centro
votanti
0,3311
0,4862
Esercizio 4 (punti 5) - Dati due caratteri X e Y si vuole valutare, mediante modello di regressione
lineare, l’effetto di X su Y.
Sapendo che la covarianza è pari a 5, la varianza di y è pari a 5 e il coefficiente di correlazione
lineare è pari 0.7, calcolare il coefficiente angolare della retta e l’indice di determinazione.
Interpretare i parametri della retta e il significato dell’indice di determinazione.
B1
0,49
2
r
0,49
La retta è inclinata positivamente, quindi vi è una relazione diretta tra le due variabili; il modello
spiega circa il 50% della variabilità.
Esercizio 5 (punti 6) - Si consideri una variabile aleatoria X con distribuzione Normale con media
pari a 4 e coefficiente di variazione pari a 0.5. Si calcoli
a) P (X>3)
b) P (X<0)
c) il quantile di X a livello 0.05.
Sia Y=2*X - 6. Che distribuzione di probabilità ha la variabile Y? Si calcolino E[Y] e Var[Y].
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
N (4;4)
P(z>-0,5)
P(z<-2)
quantile
Y normale (2;16)
0,69146
0,02275
0,71
Esame del 4/7/2016
Esercizio 1 (punti 10) - Sia data la seguente distribuzione di frequenze cumulate relativa a un
campione di 80 redditieri:
Reddito annuo (.000 euro)
Ni
fino 10
5
fino 20
25
fino 50
67
fino 100
80
- Calcolare la media aritmetica, la mediana e il coefficiente di variazione.
- Disegnare la curva di concentrazione
- Costruire gli intervalli di confidenza (al livello α = 0,05) per la media e per la varianza.
x centr
5
15
35
75
n
xn
Fi
Pi
5
25
0,0625 0,009025
20
300
0,3125 0,117329
42
1470
0,8375 0,648014
13
975
1
1
80
2770
media
34,625
mediana 30,71429
varianza 416,1094 corretta 421,3766 sqm
20,5275
cv
0,589134
int conf media
30,12672 39,12328
(usando l'approssimazione con la normale)
int conf var
312,1937 582,4477
Esercizio 2 (punti 2) - Trasmissione televisiva “Il malloppo” del 19/8/2005: il malloppo è contenuto
in una tra sei casseforti e i concorrenti possono, pagando un certo prezzo, eliminare una cassaforte
vuota e così – secondo il conduttore – “ridurre a un quinto” la probabilità di individuare la
cassaforte con il malloppo. Quale errore è contenuto nell’affermazione del conduttore?
R: Non "si riduce" ma "aumenta"
Esercizio 3 (punti 6) - Relativamente a 10 imprese commerciali si dispone dei seguenti dati, relativi
al risultato (utile o perdita) dell’esercizio 2014 e al fatturato, sempre nel 2014 (milioni di euro):
Utile
0,1
0,16
0,28
-0,5
-0,12
0,22
0,13
0,11
0,3
0,2
Fatt.
2,8
3,0
5,3
7,6
2,7
4,4
2,9
2,1
4,4
8,8
Misurare la correlazione lineare tra i due caratteri e determinare i parametri della retta di
regressione dell’utile in funzione del fatturato.
0,194314 B0
-0,02416 B1
-0,22824 r
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
Esercizio 4 (punti 5) - Su un campione di 12 imprese è risultato che il fatturato annuo medio è pari
a 2,5 milioni di euro. Supponendo che la variabile considerata si distribuisca come una normale con
varianza pari a 1,21, determinare l’intervallo di confidenza per la media, al livello di significatività
del 10%.
Nel caso si volesse ripetere l’indagine, quale dovrà essere la numerosità del campione, ad un livello
di attendibilità del 95%, con ampiezza pari a 500 mila euro?
int conf
nuovo n
1,977642 3,022358
75
Esercizio 5 (punti 6) - Tre signore vanno a fare la spesa al supermercato: al momento di passare alla
cassa, nel carrello della prima vi sono 24 articoli, tra i quali 6 confezioni di biscotti, in quello della
seconda 6 articoli, tra i quali 3 confezioni di biscotti e in quello della terza 20 articoli, tra i quali 6
confezioni di biscotti. Si estrae a caso un carrello, con probabilità di estrazione proporzionale al
numero di articoli contenuti in ciascuno di essi e, tra gli articoli presenti in quel carrello, se ne
sorteggia uno. Sapendo che l’articolo sorteggiato è una confezioni di biscotti, determinare la
probabilità che il carrello sorteggiato sia quello della prima signora.
Pa
0,48
biscotti
0,25
prod
0,12
probabilità carrello A
Pb
0,12
0,50
0,06
Pc
tot
0,40
0,30
0,30
0,12
0,40
Esercizio 6 (punti 1 per ciascuna risposta esatta, -0,5 per ciascuna risposta errata) - Per ciascuno dei
seguenti quesiti individuare la risposta esatta (di seguito evidenziata in grassetto):
1) La variabile “tempo effettivamente trascorso tra l’inizio e la fine del primo tempo di una partita
di calcio” è una variabile:
A) continua
B) discreta
C) dicotomica
2) La media geometrica di 10 osservazioni, non tutte uguali fra loro, vale 5; considerata una
ulteriore osservazione x11 > 5, si confrontino la media aritmetica calcolata sulle prime 10
osservazioni (Ma) e quella calcolata sulle 11 osservazioni (Mb). Risulterà:
A) Ma > Mb
B) Ma < Mb
C) dipende dai valori di Ma e di x11
3) In un decennio il prezzo di un bene è aumentato del 50%. Il potere d’acquisto della moneta, in
termini di quel bene, risulta:
A) dimezzato
B) ridotto di un terzo
C) ridotto a un terzo
4) Se per tre eventi E1, E2, E3 (per ciascuno dei quali P(Ei) > 0) vale la relazione:
P(E1 U E2 U E3) = P(E1)+P(E2)+P(E3), allora gli eventi:
A) sono dipendenti
B) sono indipendenti
C) sono necessariamente esaustivi
Esame del 6/9/2016
Esercizio 1 (punti 4) – Secondo un recente studio coordinato a livello mondiale dall’Imperial
College, in Italia la statura media dei giovani diciottenni in un secolo è passata dai 164,7 cm del
1914 ai 177,8 cm del 2014. Calcolare l’incremento medio annuo composto della statura.
Ipotizzando che la statura media continui a crescere allo stesso ritmo nei prossimi anni, quanto
saranno mediamente alti a 18 anni i bambini italiani che sono nati o nasceranno durante il 2016?
incremento complessivo 13,1 cm
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
incremento medio annuo (media geometrica)
previsione al 2034
0,000766
180,54
Esercizio 2 (punti 8) – Il Corriere della Sera del 26 luglio scorso ha lanciato un sondaggio on line
per raccogliere l’opinione dei lettori circa questa affermazione di V. Sgarbi: “Gli uomini che
portano il marsupio sono un oltraggio al decoro urbano”. Su 1255 rispondenti, il 54,2% si è
dichiarato d’accordo, il restante 45,8% contrario.
a) Misurare l’eterogeneità della distribuzione delle risposte.
b) Ipotizzando che i rispondenti rappresentino un campione casuale di lettori, si vuole
verificare l’ipotesi che, nell’universo, favorevoli e contrari si equivalgano, contro quella che
invece vi sia una maggioranza che condivide l’affermazione di Sgarbi. Si calcoli il p-value e
si giunga ad una conclusione, sulla base del risultato ottenuto.
c) Il Corriere della Sera, in una nota, correttamente precisa però che sondaggi on line di questo
tipo “non hanno valore statistico”. Spiegare perché.
a) eterogeneità
ass
rel
0,4965
0,9929
b) H0: π = 0,5
H1: π > 0,5
test
2,98
p-value
0,00144
ai livelli α usuali, si respinge H0
c) Non ha valore statistico perché non si tratta di un campione (probabilistico o ragionato), ma di un insieme
di persone autoselezionate che, per i motivi più vari, hanno deciso di votare. Potrebbe essere profondamente distorto.
Esercizio 3 (punti 3) – In una distribuzione statistica, il 50° percentile vale 0 e il 75° percentile vale
1. Si consideri un valore pari a 3; relativamente a tale valore si può affermare che:
• potrebbe non appartenere alla distribuzione
• potrebbe corrispondere al 90° percentile
• le affermazioni a) e b) sono entrambe plausibili
• almeno una tra le affermazioni a) e b) è certamente falsa.
Motivare la risposta fornita.
[R: risposta esatta c. Le informazioni fornite ci dicono che il 90° percentile non può essere inferiore a 1,
quindi potrebbe essere 3. Non conosciamo il valore più grande osservato, che potrebbe anche essere inferiore a 3, quindi in questo caso 3 non apparterrebbe alla distribuzione].
Esercizio 4 (punti 3) - Sia X una variabile aleatoria con distribuzione Normale di media pari a 4 e
coefficiente di variazione pari a 0,4. Calcolare:
a) P(X>1)
b) P(X< -1)
c) Il quantile a livello 0,25.
var (X)
2,56
p(X>1) = P(z>-1,875) = 0,9695
p(X<-1)=P(z<-3,125) = 0,00089
X0,25 =
2,92
Esercizio 5 (punti 8) - Sia X una variabile che indica se un soggetto di nazionalità britannica è
favorevole o meno all'uscita del proprio paese dall'Unione Europea. La variabile X è definita come
segue: P(X=”no”) = k
P(X=”si”) = 0.3
a) Per quale valore di k la precedente distribuzione definisce una distribuzione di probabilità?
b) Fissato tale valore di k, determinare il valore atteso della variabile aleatoria X e la sua varianza;
c) Sia Y una variabile aleatoria definita come somma di 10000 variabili aleatorie X. Quale è la
distribuzione di probabilità di Y? Si determinino il valore atteso di Y e la sua varianza.
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
a) k = 0,7
b) posto "no"=0 e "sì"=1
media
0,3
varianza
0,21
c) binomiale, approssimabile con la normale
media
3000 varianza
2100
Esercizio 6 (punti 7) - Il peso (in grammi) di un lotto di confezioni di pasta, del peso nominale di
250 grammi, è la seguente:
Peso 245 245 247 238 245 250 249 245 246 242 247 246 242 244 246
a) Si calcoli il peso medio del lotto e la deviazione standard;
b) Si disegni il diagramma a scatola e baffi;
c) Si supponga di valutare il peso medio di 100 confezioni di pasta estratte a caso, sulle quali si
sono rilevati un peso medio pari a 247 e una varianza pari a 7. E' possibile denunciare il produttore
per frode?
a) media
245,133
SD
2,8253
b) per box plot
238
244
245
247
250
min
q1
mediana
q3
max
c) H0: π = 250
H1: π < 250
test
-11,34
A qualunque usuale livello di sgnificatività,
SI, è possibile denunciare il produttore.
Appello straordinario del 4/11/2016
Esercizio 1 (punti 10 – N.B. Qualora l’esercizio venga impostato su una base dati errata NON
verrà valutato) – Nello scorso mese di agosto in Sapienza è uscito un bando per 48 posti da
ricercatore a tempo determinato, così ripartiti per area CUN:
Area CUN* 01 02 03 04 05 06 07 08 09 10 11 12 13 14
N. posti
5
3
2
1
3
13
0
1
5
4
5
1
2
3
* le aree CUN sono designate da un codice (numerico), che rappresenta però solo una semplice
etichetta.
Calcolare media aritmetica, mediana, varianza e un indice di asimmetria della distribuzione dei
posti assegnati per area.
Disegnare la curva di concentrazione e calcolare il rapporto di concentrazione.
X
0
1
1
1
2
2
3
3
3
4
Fi
0,0714
0,1429
0,2143
0,2857
0,3571
0,4286
0,5000
0,5714
0,6429
0,7143
Qi
0
0,0208
0,0417
0,0625
0,1042
0,1458
0,2083
0,2708
0,3333
0,4167
Fi-Qi
0,0714
0,1220
0,1726
0,2232
0,2530
0,2827
0,2917
0,3006
0,3095
0,2976
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
5
5
5
13
0,7857
0,8571
0,9286
1
6,5000
0,5208
0,6250
0,7292
1
0,2649
0,2321
0,1994
3,0208
media
3,4286
mediana
3
varianza
9,5306
asimmetria positiva M1- Me = 0,4286
R
0,4647
Esercizio 2 (punti 6) – Secondo i dati della Conferenza Episcopale Italiana, nell’ultimo
quinquennio la percentuale di alunni delle scuole medie superiori statali italiane che hanno deciso di
non avvalersi dell’insegnamento della religione cattolica è così variata:
Anno scolastico
%
2014/15
18,4
2013/14
18,0
2012/13
17,9
2011/12
17,0
2010/11
16,2
Interpolare linearmente tale andamento in funzione del tempo e, utilizzando i risultati ottenuti,
stimare la percentuale di studenti che non si avvalgono dell’insegnamento della religione cattolica
nell’a.s. in corso (2016-17).
Nell’a.s. 2000-01 la percentuale di studenti non avvalentisi era dell’11,9%. Valutare se il trend del
fenomeno negli ultimi anni (quelli dei dati riportati in tabella) ha subito una accelerazione rispetto
al decennio precedente.
t
Y
-2
16,2
-1
17
0
17,9
1
18
2
18,4
increm decennio prec.
increm ultimi anni
sostanzialmente stabile
B0
B1
17,50
0,54
t=4
19,66
3,13 geom
3,23 geom
3,61 aritm
3,40 aritm
Esercizio 3 (punti 6) – Un quiz consta di 5 domande con tre possibili risposte. Una persona
risponde a caso a tutte e 5. Determinare la probabilità che azzecchi: 1) 2 risposte esatte;
2) 3 risposte esatte; 3) il numero medio di risposte esatte.
p=0,333
Pr(X=2)
Pr(X=3)
n.medio
0,3292
0,1646
1,6667
Esercizio 4 (punti 6) – Sia X una variabile aleatoria con distribuzione normale di media pari a 4 e
deviazione standard pari a 2. Si determini:
1) Pr(X>5)
2) Pr(4.5<X<5.5)
3) il quantile a livello 0,25.
Pr(X>5) = Pr(z>0,5) =
Pr(4,5<X<5,5) = Pr(0,25<z<0,75) =
z0,25 =
-0,675 da cui x0,25 =
0,3085
0,1747
2,65
Esercizio 5 (punti 6) - Una compagnia di assicurazioni vuole valutare l’entita media delle richieste
di risarcimento danni per incidenti automobilistici. Un’indagine svolta su di un campione di 25
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.
richieste ha dato i seguenti risultati (con X si indica la variabile “richiesta di risarcimento in
migliaia di euro”): Σxi = 112,12 e Σxi2 = 629,89.
1) Stimare l’entita media delle richieste e la varianza delle richieste di risarcimento;
2) Ipotizzando che X abbia distribuzione gaussiana, calcolare l’intervallo di confidenza al 95% per
la richiesta media di risarcimento e saggiare, ad un livello di significatività α = 0,05, l’ipotesi
H0: µ = 3 contro l’alternativa H1: µ > 3.
media
4,485
var
5,0822
var corr
5,2939
estremi int conf media (t24)
test (unilaterale)
€ 3,2266
Si respinge H0
3,535
5,435
t24 =
1,7109
Materiale ad esclusivo uso interno del corso. E’ autorizzata la riproduzione da supporto informatico, ad uso personale. E’ vietato qualsiasi utilizzo commerciale del presente materiale.