Facoltà di Scienze Politiche
Università “La Sapienza” di Roma
CORSO DI STATISTICA
Cattedra (I –O) – Prof. Giuseppe Arbia
(30 gennaio 2004)
Riconsegnare questo foglio compilato insieme al vostro elaborato:
Nome
Cognome
N. matricola
Sono già esonerato La prima parte
La seconda parte
da (barrare)
Nessuna parte (esame
completo)
I parte (corrispondente alla 1 prova intermedia)
Quesito n. 1
E’ data la seguente tabella individui modalità nella quale alcuni dati sono andati persi:
Individui 1
2
3
4
5
6
7
8
9
10 11 12
X
1
2
4
?
1
3
9
3
6
?
1
3
Y
7
3
2
1
7
3
8
4
2
9
1
2
a) Sapendo che la media di X è pari a 4 e la sua varianza é pari a 7,333, ricostruire i dati
mancanti
b) Calcolare la media, la moda, la mediana e la varianza di Y
c) Calcolare il coefficiente di correlazione tra X ed Y
d) Calcolare i parametri della retta di regressione di Y su X
Quesito n.2
E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y
X Y
2
4
6
0
1
72
16
40
44
16
112
a) Calcolare media e varianza di X
b) Calcolare la correlazione tra X ed Y
Quesito n.3
Sono state rilevate due variabili statistiche X ed Y per le quali si dispone delle seguenti statistiche
sommario:
X
Y
Media
1
100
Moda
2
90
Mediana
1,5
95
Minimo
0
2
Massimo
4
300
Primo
quartile
1,4
50
Terzo
quartile
3
110
Varianza
1
3600
a) Cosa si può dire circa la tendenza centrale delle 2 variabili?
b) Quale delle due variabili presenta maggiore variabilità?
c) Che conclusioni possiamo trarre circa la asimmetria delle 2 distribuzioni?
Quesito n 4
Osservare le seguenti 2 distribuzioni di frequenza
0,25
1
0,2
0,8
0,15
0,6
0,1
0,4
0,05
0,2
0
0
1
2
3
4
5
6
(a)
7
1
8
2
3
4
5
6
7
8
(b)
a) Quale delle due distribuzioni presenta la maggiore variabilità? Perché?
II parte (corrispondente alla 2 prova) intermedia
Quesito n. 1 Si consideri il seguente gioco d’azzardo Si lancia un dado a 6 facce per due volte. Se
esce per 2 volte un numero pari si vince 2 volte la scommessa, se esce per 2 volte un numero dispari
si perde 2 volte la scommessa, se escono un numero pari ed un numero dispari si riprende la posta.
a) Il gioco è equo?
b) Qual è il risultato più probabile?
c) Qual’è la varianza della variabile vincita?
Quesito n. 2 Dire se le seguenti variabili casuali doppie sono indipendenti:
X Y
0
1
2
(a)
1
2
0,03
0,12
0,25
0,05
0,3
0,25
X Y
-1
0
1
(b)
-1
1
0
0,25
0,25
0,25
0
0,25
Quesito n.3 Data una variabile X distribuita in forma normale con media 2 e varianza 1, calcolare
le seguenti probabilità:
a) P(X>1)
b) P(X > 0,75)
c) P(X<3,55)
d) P(2,55<X<2,75)
Quesito n. 4 L’ISAE (Istituto Studi per l’Analisi Economica) rileva mensilmente su un campione
di circa 4000 imprese il grado di fiducia delle imprese in Italia. Se si legge che nell’ultima indagine
il 12,5% registra una fiducia crescente, in che intervallo cadrà con probabilità pari a 0,95 il vero
valore della percentuale incognita?
Tempo a disposizione 2 ore. Chi è esonerato da una parte ha a disposizione 1 ora.
Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!!
Facoltà di Scienze Politiche
Università “La Sapienza” di Roma
CORSO DI STATISTICA
Cattedra (I –O) – Prof. Giuseppe Arbia
(5 febbraio 2004)
Riconsegnare questo foglio compilato insieme al vostro elaborato:
Nome
Cognome
N. matricola
Intendo sostenere
La sola prima
La sola seconda
(barrare)
parte
parte
Entrambe le parti
I parte
Quesito n. 1 Uno studente della facoltà di Scienze Politiche ha sostenuto finora 11 esami con le
seguenti votazioni:
27, 30, 21, 25, 27, 27, 19, 25, 28, 30, 27. Deve ora sostenere l’esame di Statistica.
a) calcolare la media, la mediana e la moda dei voti.
b) Calcolare la varianza dei voti.
c) La distribuzione dei voti presenta asimmetria positiva, negativa o nulla?
d) Che voto dovrebbe prendere lo studente all’esame di Statistica per mantenere invariata la
propria media?
e) Che voto minimo dovrebbe prendere all’esame di Statistica per mantenere la media al di
sopra del 24?
f) Escludendo il caso della bocciatura, quali limiti minimo e massimo presenterà la nuova
media dopo aver sostenuto l’esame di Statistica?
Quesito n. 2 E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y
X Y
0
1
2
3
4
5
c)
d)
e)
f)
0
1
2
4
5
16
11
2
3
5
7
12
26
7
Calcolare media, la moda e la mediana di X
Calcolare il range interquartilico e la varianza di X
Calcolare la correlazione tra X ed Y
Calcolare la media di X quando Y è uguale a 0.
Quesito n.3
Di una variabile X osservata su 20 individui si conosce la somma (100) e la somma dei quadrati
(3000). Si sa, inoltre, che 11 individui assumono il valore 4. Se ne calcoli la media, la moda, la
mediana, la varianza ed un indice di asimmetria.
Quesito n 4
Il seguente diagramma a dispersione rappresenta la distribuzione congiunta di due variabili
statistiche X ed Y. Quale dei seguenti tre valori rappresenta meglio la correlazione tra le due
variabili?
a) r = 0,56
b) r = 0,07
c) r = –0,12
-4
-2
0
2
4
6
8
II parte
Quesito n. 1 Si prenda in considerazione una variabile casuale X la quale può assumere tre soli
valori (0, 1 e 2). La variabile è costruita a partire dall’estrazione (con reimmissione) di 2 carte da un
mazzo di 52 carte da poker e rappresenta il numero di figure estratte. Essa, pertanto, assumerà il
valore X=2 se entrambe le carte sono delle figure, X=1 se una delle 2 carte è una figura e X = 0 se
nessuna delle 2 carte è una figura.
Calcolare il valore atteso e la varianza di X.
Quesito n. 2. Sono date le seguenti 2 distribuzioni di variabili casuali doppie:
2
Totale
X Y 1
0
0,2
1
0,05
2
0,03
Totale
0,90
(a)
Completare le distribuzioni nell’ipotesi d’indipendenza
X Y
-1
0
totale
0
1
totale
0,5
0.7
(b)
Quesito n.3 Calcolare le seguenti probabilità di una variabile casuale normale di media = 1 e
varianza = 1:
e) P(X>1,5)
f) P(0,5<X<1,25)
g) P(X<0,75)
Quesito n. 4 In una recente indagine condotta su 9 individui estratti da una popolazione normale di
media incognita e varianza pari ad 1 si sono osservati i seguenti valori:
Individui 1
X
3
2
2
3
2
4
4
5
3
6
6
7
12
8
1
9
3
Costruire l’intervallo di confidenza al livello (1   ) = 0,99 per la media della popolazione
Tempo a disposizione 1.30 minuti. Documentazione libera. Arrotondare i numeri alla terza
cifra decimale. Buon lavoro!!!!!
Facoltà di Scienze Politiche
Università “La Sapienza” di Roma
CORSO DI STATISTICA
Cattedra (I –O) – Prof. Giuseppe Arbia
(28 febbraio 2004)
Riconsegnare questo foglio compilato insieme al vostro elaborato:
Nome
Cognome
N. matricola
Intendo sostenere
La sola prima
La sola seconda
(barrare)
parte
parte
Entrambe le parti
I parte
Quesito n. 1 Su n unità si è rilevato congiuntamente la variabile X ed Y:
Y\X
2
6
10
A
B
K
5
90
5
50
40
10
a) fissando le marginali di X,Y ricavare la tabella di indipendenza .
b) fissando le marginali di X ricavare la tabella di massima dipendenza
g) calcolare la media, la moda, la mediana di Y
Quesito n. 2 E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y
X Y
0
1
2
3
4
5
g)
h)
i)
j)
0
1
2
4
5
16
11
2
3
5
7
12
26
7
Calcolare media, la moda e la mediana di X
Calcolare il range interquartilico e la varianza di X
Calcolare la correlazione tra X ed Y
Calcolare la media di X quando Y è uguale a 0.
Quesito n.3
Di una variabile X osservata su 20 individui si conosce la somma (100) e la somma dei quadrati
(3000). Si sa, inoltre, che 11 individui assumono il valore 4. Se ne calcoli la media, la moda, la
mediana, la varianza ed un indice di asimmetria.
Quesito n 4
Il seguente diagramma a dispersione rappresenta la distribuzione congiunta di due variabili
statistiche X ed Y. Quale dei seguenti tre valori rappresenta meglio la correlazione tra le due
variabili?
a) r = 0,56
b) r = 0,07
c) r = –0,12
-4
-2
0
2
4
6
8
II parte
Quesito n.1
Dire, senza utilizzare le tavole, se le seguenti affermazioni sono vere o false:
a) P(Z>0,5) < P(Z>1,5)
b) P(Z > 0) = 0,55
c) P(Z<-0,3) = P(Z>0,3)
(con Z la normale standardizzata).
Quesito n. 2
E’ data la seguente variabile casuale doppia (X,Y)
X
1
4
5
Y
2
2b
2b
b
4
b
4b
2b
a) Si ricavi b
b) Si trovi la distribuzione di probabilità marginale di X ed il suo valore atteso
c) X ed Y sono dipendenti?
Quesito n. 3
Si definisca la proprietà della correttezza di uno stimatore.
A titolo esemplificativo si consideri il caso di una V.C. Normale che ha media  e varianza 2=1
Per stimare  si estrae un campione (X1, X2) di ampiezza 2 e si propone lo stimatore T =
(X1+2X2)/3. Tale stimatore è corretto ?
Tempo a disposizione 1.30 minuti. 45’ per ogni parte da svolgere. Documentazione libera.
Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!!
Facoltà di Scienze Politiche
Università “La Sapienza” di Roma
CORSO DI STATISTICA
Cattedra (I –O) – Prof. Giuseppe Arbia
(11 giugno 2004)
Riconsegnare questo foglio compilato insieme al vostro elaborato:
Nome
Cognome
N. matricola
Sono già esonerato La prima parte
La seconda parte
da (barrare)
Nessuna parte (esame
completo)
I parte (corrispondente alla 1 prova intermedia)
Quesito n. 1
E’ data la seguente tabella individui modalità
Individui 1
2
3
4
5
6
7
8
9
10 11 12
X
5
6
9
11
7
6
5
4
3
2
5
9
Y
3
2
1
5
6
3
4
9
8
6
5
8
a)
b)
c)
d)
e)
Calcolare la media, la moda, la mediana e la varianza di X
Calcolare il coefficiente di correlazione tra X e Y.
Calcolare i parametri della retta di regressione di Y su X
Di quanto cresce mediamente la Y se X passa da 5 a 7 ?
Calcolare il coefficiente di determinazione.
Quesito n.2
E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y
X Y
-1
0
1
0
1
16
24
9
27
12
14
k) Calcolare media e varianza di X
l) Calcolare la correlazione tra X ed Y
Quesito n.3
Sono state rilevate due variabili statistiche X ed Y per le quali si dispone delle seguenti statistiche
sommario:
X
Y
Media
35
10
Moda
75
9
Mediana
38
11,6
Minimo
3
0
Massimo
90
19
Primo
quartile
13,4
5
Terzo
quartile
74,6
13,7
Varianza
13
124
d) Cosa si può dire circa la tendenza centrale delle 2 variabili?
e) Quale delle due variabili presenta maggiore variabilità in termini di varianza? E’ possibile
effettuare il confronto utilizzando un altro indice? E cosa può/potrebbe essere concluso
utilizzandolo?
Quesito n.4
Osservare le seguenti 2 distribuzioni di frequenza
14
12
10
8
Serie1
6
4
2
19
17
15
13
11
9
7
5
3
1
0
14
12
10
8
Serie1
6
4
2
a)
19
17
15
13
11
9
7
5
3
1
0
Quale delle due distribuzioni presenta la maggiore variabilità? Perché?
II parte (corrispondente alla 2 prova) intermedia
Quesito n. 1 Un’urna contiene due palline bianche, tre rosse e due nere.
a) Qual è la probabilità che estraendo una pallina essa sia bianca?
Si ipotizzi che sia stata estratta una pallina e che questa sia rossa.
b) Si ipotizzi di reimmetterla nell’urna. Qual è la probabilità che estraendo una nuova pallina sia
nera?
c) Calcolare la stessa probabilità nel caso in cui non si effettui la reimmisione.
Quesito n. 2 Dire se le seguenti variabili casuali doppie sono indipendenti:
X Y
0
1
10
(a)
0
X Y
2
2
0,04
0,21
0,20
0,20
0,04
0,31
6
X Y
-1
0
1
(b)
0
X Y
4
1
0,2
0,2
0,3
0,1
0,1
0,1
5
0
1
3
(c)
0,12
0,3
0,18
0,08
0,2
0,12
1
2
0
0,8
0,2
0
(d)
Quesito n.3 Dire, senza utilizzare le tavole, se le seguenti affermazioni sono plausibili:
h) P(Z>0.5) < P(Z>1)
i) P(Z > 3) < P(Z <3)
j) P(Z>0) = 0,5
con Z la normale standardizzata.
Quesito n. 4 In un controllo statistico di qualità eseguit0 su 15000 televisori prodotti da una nota
ditta, il 13% di essi ha mostrato un difetto nella luminosità dell’immagine. Costruire l’intervallo di
confidenza al livello (1   ) = 0,95 per tale percentuale.
Tempo a disposizione 2 ore. Chi è esonerato da una parte ha a disposizione 1 ora.
Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!!
Facoltà di Scienze Politiche
Università “La Sapienza” di Roma
CORSO DI STATISTICA
Cattedra (I –O) – Prof. Giuseppe Arbia
(30 settembre 2004)
Riconsegnare questo foglio compilato insieme al vostro elaborato:
Nome
Cognome
N. matricola
Sono già esonerato La prima parte
La seconda parte
da (barrare)
Nessuna parte (esame
completo)
I parte (corrispondente alla 1 prova intermedia)
Quesito n. 1
E’ data la seguente tabella che riporta l’altezza in cm e la taglia di otto individui:
Altezza in
(X-M(X)) (Y-M(Y)) (X-M(X))2 (Y-M(Y))2
Taglia (Y)
(1)*(2)
cm (X)
(1)
(2)
(3)
(4)
70
100
65
100
65
110
70
105
45
120
55
110
60
125
65
120
f) Calcolare la media, la moda, la mediana di X
g) Calcolare la varianza delle due variabili. Che indicatore usereste per confrontare le due
distribuzioni in termini di variabilità? Perché?
h) Calcolare i parametri della retta di regressione di Y su X.
i) Di quanto cresce mediamente la taglia se l’altezza passa da 150 a 160 cm.?
j) Calcolare il coefficiente di correlazione e il coefficiente di determinazione.
Quesito n.2
E’ data la seguente distribuzione doppia di frequenze per i caratteri X ed Y
X Y
-1
0
1
0
1
25
5
3
30
21
15
m) Calcolare media e varianza di X
n) Calcolare la correlazione tra X ed Y
Quesito n.3
E’ data la seguente tabella individui modalità nella quale alcuni dati sono andati persi:
Individui 1
2
3
4
5
6
7
8
9
10 11 12
X
1
2
4
?
1
3
9
3
6
?
1
3
Y
7
3
2
1
7
3
8
4
2
9
1
2
e) Sapendo che la media di X è pari a 4 e la sua varianza é pari a 7,333, ricostruire i dati
mancanti
f) Calcolare la media, la moda, la mediana e la varianza di Y
g) Calcolare il coefficiente di correlazione tra X ed Y
h) Calcolare i parametri della retta di regressione di Y su X
Quesito n.4
Osservare i tre seguenti grafici a dispersione:
-4
-3
-2
-1
0
1
2
3
4
5
6
7
Siete in grado di associare a ciascun grafico un valore del coefficiente di correlazione ?
II parte (corrispondente alla 2 prova) intermedia
Quesito n. 1 Da un’urna che contiene palline rosse (con frequenza relativa p=0,4) e di altri
colori, si fanno estrazioni con ripetizione.
a) Calcolare la probabilità degli eventi:
A=(pallina rossa esce per la prima volta alla quarta estrazione)
B=(fra le prime sei palline estratte esattamente 4 non sono rosse)
b) Sareste in grado di calcolare le stesse probabilità nel caso di estrazione senza ripetizione?
Quesito n. 2 Dire se le seguenti variabili casuali doppie sono indipendenti:
X Y
0
1
10
(a)
0
X Y
0
1
3
(c)
2
2
0,05
0,20
0,20
0,15
0,20
0,20
6
0,10
0,30
0,10
0,20
0,18
0,12
X Y
-1
0
1
(b)
0
X Y
1
2
4
1
0,30
0,10
0,30
0,00
0,00
0,30
5
0
0,75
0,25
0
(d)
Quesito n.3 Dire, senza utilizzare le tavole, se le seguenti affermazioni sono plausibili:
k) P(Z<0.5) < P(Z>1)
l) P(Z > 3) = P(Z <3)
m) P(Z>2) = 1-P(Z<2)
con Z la normale standardizzata.
Quesito n. 4 Un campione casuale di tre studenti estratti tra i partecipanti di un corso di statistica
ha fatto registrare i seguenti voti: 25, 23, 27. Costruire l’intervallo di confidenza al livello (1   ) =
0,95 per la media della popolazione.
Tempo a disposizione 2 ore. Chi è esonerato da una parte ha a disposizione 1 ora.
Documentazione libera. Arrotondare i numeri alla terza cifra decimale. Buon lavoro!!!!!