statistica,VO,tracce03-04 - Dipartimento di Scienze Politiche e

Scienze Politiche, Vecchio Ordinamento
Programma dell'Insegnamento di Statistica
PARTE I: STATISTICA DESCRITTIVA UNIVARIATA
DISTRIBUZIONI DI FREQUENZE
La statistica e i suoi campi di applicazione – Concetti elementari: unità statistica, popolazione statistica,
campione, collettivo statistico, censimento, indagine campionaria, carattere statistico – Tipologie di caratteri
statistici: qualitativi nominali, qualitativi ordinabili, quantitativi discreti, quantitativi continui – Distribuzioni di
frequenze: frequenze assolute, relative e percentuali – Distribuzioni di frequenze di classi di modalità: frequenze
assolute specifiche, frequenze relative specifiche – Frequenze assolute cumulate, frequenze relative cumulate,
frequenze percentuali cumulate – Rappresentazioni grafiche: istogramma per caratteri qualitativi, diagramma ad
aste, istogramma di frequenze, ogiva di frequenze.
LE MEDIE
Moda e classe modale – Mediana: definizione e procedura di calcolo per un elenco di modalità – La mediana per
le distribuzioni di frequenze – La mediana per le distribuzioni di frequenze di classi di modalità(*) – Mediana:
proprietà di minimo – Altri indici di posizione: primo e terzo quartile – Media aritmetica: definizione e procedura
di calcolo per un elenco di modalità – La media aritmetica per le distribuzioni di frequenze – La media aritmetica
per le distribuzioni di frequenze di classi di modalità – Proprietà della media aritmetica: invarianza(*),
internalità, scarti semplici(*), quadrati degli scarti – Media geometrica: definizione ed esempi di applicazione.
MISURE DI VARIABILITA’
Campo di variazione e distanza interquartilica – Varianza: definizione e formula di calcolo (*) per un elenco di
modalità – Varianza: definizione e formula di calcolo (*) per le distribuzioni di frequenze – La varianza per le
distribuzioni di frequenze di classi di modalità – Scarto quadratico medio e coefficiente di variazione - Media
aritmetica, varianza e scarto quadratico medio per: cambiamenti di scala, traslazioni, trasformazioni lineari.
PARTE II: STATISTICA DESCRITTIVA BIVARIATA
TABELLE A DOPPIA ENTRATA
Distribuzione congiunta di due caratteri: frequenze congiunte in una tabella a doppia entrata – Distribuzioni
marginali – Distribuzioni condizionate – Medie e misure di variabilità per le distribuzioni marginali e condizionate
- Rappresentazioni grafiche: stereogramma e diagramma scatter.
MISURE DI DIPENDENZA STATISTICA
Concetto di indipendenza statistica: similitudine delle distribuzioni condizionate – Distribuzione marginale simile
alle distribuzioni condizionate (*) – Condizione di indipendenza in una tabella a doppia entrata – Le contingenze –
Proprietà delle contingenze: somma per righe e per colonne (*) – Indice chi-quadrato di dipendenza statistica:
definizione e formula di calcolo (*) – Massima dipendenza in una tabella a doppia entrata – Indice di Cramer:
misura del grado relativo di dipendenza statistica.
CORRELAZIONE E REGRESSIONE
Definizione di covarianza per un elenco di coppie di modalità: concordanza e discordanza tra due caratteri –
Formula di calcolo della covarianza per un elenco di coppie di modalità (*) – La covarianza in una tabella a
doppia entrata: definizione e formula di calcolo (*) – Diseguaglianza di Cauchy-Schwartz – Uguaglianza nella
diseguaglianza di Cauchy-Schwartz (*) – Coefficiente di correlazione per la misura del grado relativo di
dipendenza lineare – Indipendenza statistica e correlazione (*) – Retta di regressione: determinazione dei
parametri e indice di determinazione per la misura della bontà di adattamento.
(*): degli argomenti contrassegnati da asterisco è richiesta la dimostrazione.
UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica
19 novembre 2003
Esercizio 1
1) Un gruppo di studenti universitari è stato classificato in base al voto di maturità (X) ed
al numero di esami superati (Y). I dati dell'indagine sono riportati nella seguente tabella
delle frequenze assolute congiunte:
Y
0

4
4

8

8
12
X
60
76
84



76
84
100
12
6
4
2
18
10
5
0
3
a) Si calcoli il numero medio di esami superati.
b) Si calcoli il voto di maturità mediano degli studenti che hanno superato al massimo 8
esami.
c) Si valuti, tramite un indice confrontabile, il grado della dipendenza statistica tra i due
caratteri considerati.
d) Si calcoli e si commenti un indice relativo di dipendenza lineare.
==========================
Esercizio 2
La seguente tabella riporta il voto conseguito da 10 studenti all'esame di diritto (X) e
quello conseguito all'esame di economia (Y).
X
Y
25
18
27
20
25
24
25
27
30
26
30
27
25
20
30
18
22
29
30
18
a) Stabilire, tramite un indice adeguato, quale delle due distribuzioni è più variabile.
Esercizio 3
Si dimostri, nel caso di distribuzione doppia di frequenze assolute, che se X e Y sono
statisticamente indipendenti, allora la Cov(X,Y)=0.
UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica
19 febbraio 2004
Esercizio 1
1) Un gruppo di imprese manifatturiere è stato classificato in base al fatturato annuo (X),
espresso in milioni di euro, ed al numero di dipendenti (Y), espresso in centinaia. I dati
dell'indagine sono riportati nella seguente tabella delle frequenze assolute congiunte:
Y
0

3
3

8
8

16
X
1  3
3  7
7  10
10  20
12
6
4
0
0
18
5
2
5
0
3
10
a) Si valuti il numero mediano di dipendenti occupati nelle imprese che fatturano più di 3
milioni di euro.
b) Si valuti, tramite un indice confrontabile, il grado della interdipendenza statistica tra i
due caratteri considerati.
c) Supponendo che tra i due caratteri considerati valga la seguente dipendenza funzionale
Y=a+bX, si determini una stima dei parametri del modello proposto.
Esercizio 2
La seguente tabella riporta il voto conseguito da 8 studenti all' esame di maturità (X) e
quello conseguito all'esame di laurea (Y).
X
Y
75
95
85
98
90
96
90
107
95
100
100
95
92
99
80
94
a) Stabilire, tramite un indice adeguato, quale delle due distribuzioni è più variabile.
Esercizio 3
Si dimostri, nel caso di distribuzione doppia di frequenze assolute, che se X e Y sono
statisticamente indipendenti, allora la Cov(X,Y)=0.
UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica
27 febbraio 2004
Esercizio 1
Un gruppo di individui è stato classificato in base al peso (Y), espresso in kg, ed all’altezza (X) , espressa
in cm. I dati della rilevazione sono i seguenti:
Y
X
80
160
75
168
80
175
90
180
85
170
70
175
70
160
90
185
90
180
75
180
a) determinare l’altezza che bipartisce la distribuzione ordinata delle altezze;
b) stabilire, tramite un indice confrontabile, quale delle due distribuzioni considerate risulta essere più
variabile;
c) supponendo che il peso sia funzione lineare dell'altezza, allora, prevedere il peso di una persona alta
200 cm;
d) supponendo che il peso di ogni individuo diminuisca di 10 kg, determinare, utilizzando opportune
proprietà, media e varianza per la nuova distribuzione dei pesi.
Esercizio 2
Un insieme di alberghi non di lusso è stato classificato secondo la categoria (X) e il numero di presenze
(Y) in un dato periodo dell’anno :
0  50
50  150
150  300
I
5
8
4
II
8
5
4
III
7
5
12
Y
X
a) determinare il numero mediano di presenze negli alberghi di prima categoria;
b) determinare la distribuzione doppia delle frequenze relative percentuali;
c) valutare, tramite una misura relativa, il grado della eventuale dipendenza tra i due caratteri.
Esercizio 3
Dimostrare, nel caso di distribuzione doppia unitaria, che
1 k

Cov(X, Y)    Xi Yi   M X M Y 
 n i 1

UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica 23 aprile 2004
Esercizio n. 1
Un gruppo di imprese industriali ed un gruppo di imprese di servizi sono state classificate in base al
numero di dipendenti. I dati della rilevazione sono stati i seguenti:
Imprese industriali
Classi
Freq. assolute
( numero di
dipendenti)
20
0 ⊣ 40
40
40 ⊣ 100
80
100 ⊣ 140
10
140 ⊣ 200
Imprese di servizi
Classi
Freq. Assolute
( numero di
dipendenti)
80
0 ⊣ 40
60
40 ⊣ 100
70
100 ⊣ 140
50
140 ⊣ 200
a) Utilizzando un indice di variabilità confrontabile, basato sugli scarti dalla media presi al quadrato, si
stabilisca quale delle due distribuzioni presenta la maggiore variabilità.
Esercizio n. 2
Un campione di piccoli e medi comuni è stato classificato in base al numero di residenti (X), espresso in
migliaia, ed al numero di immobili sfitti(Y), espresso in decine. I dati sono riportati nella tabella
seguente:
0 ⊣ 50
50 ⊣ 100
100 ⊣ 200
0⊣4
60
16
4
4 ⊣ 16
15
40
20
16 ⊣ 24
0
40
25
Y
X
a) Valutare il numero mediano di immobili sfitti.
b) Stabilire se i due caratteri sono statisticamente indipendenti; in caso di risposta negativa misurare il
grado di dipendenza statistica mediante un indice relativo.
Esercizio n. 3
Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla RENDITA
CATASTALE (Y), espressa in migliaia di euro. I dati della rilevazione sono riportati nella seguente
tabella delle frequenze assolute congiunte:
Y
X
2
3
4
0 ⊣ 0.6
0.6 ⊣ 1
1 ⊣ 1.8
74
12
0
8
25
16
3
0
15
a) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare.
UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica
26 giugno 2004
Esercizio 1
Un gruppo di giovani è stato classificato in base al tipo di maturità scolastica conseguita (X) ed al numero
di libri che leggono in un anno (Y). I dati dell'indagine sono riportati nella seguente tabella delle
frequenze assolute congiunte:
Y
X
scientifica
classica
magistrale
0 ---l 2
2 ---l 4
4 ---l 8
8 ---l 16
22
6
4
6
8
10
5
6
12
4
0
6
a) Si calcoli il numero medio di libri letti dai giovani con licenza classica.
b) Si calcoli il numero mediano di libri letti dai giovani intervistati.
c) Si valuti, tramite un indice confrontabile, il grado della dipendenza statistica.
Esercizio 2
Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla RENDITA
CATASTALE (Y), espressa in centinaia di euro. I dati della rilevazione sono riportati nella seguente
tabella delle frequenze assolute congiunte:
Y
0 ---- 0.5
0.5 ---- 1
1 ---- 1.5
64
12
5
8
35
16
9
4
15
X
1
2
3
a) Si stabilista tramite un indice confrontabile quale delle due distribuzioni (X e Y) risulta essere
maggiormente variabile.
b) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare.
Esercizio 3
a) Si dimostri, nel caso di distribuzione doppia di frequenze relative, che se X e Y sono statisticamente
indipendenti, allora la Cov(X,Y)=0.
UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica 17 luglio 2004
Esercizio n. 1
Si considerino le due seguenti distribuzioni di frequenza:
Distribuzione X
Modalità
Freq. assolute
4
36
8
74
16
38
30
10
Distribuzione Y
Modalità
Freq. Assolute
4
50
8
70
16
34
30
8
a) Utilizzando un indice di variabilità confrontabile, basato sugli scarti dalla media presi al quadrato, si
stabilisca quale delle due distribuzioni presenta la maggiore variabilità.
Esercizio n. 2
Un gruppo di aziende è stato classificato in base al numero di dipendenti (X) ed al fatturato(Y). I dati
sono riportati nella tabella seguente:
0 ⊣ 50
50 ⊣ 100
100 ⊣ 200
0⊣4
70
16
4
4 ⊣ 16
40
60
20
16 ⊣ 24
0
40
50
Y
X
a) Valutare ed interpretare il fatturato mediano.
b) Stabilire se i due caratteri sono statisticamente indipendenti; in caso di risposta negativa misurare il
grado di dipendenza statistica mediante un indice relativo.
Esercizio n. 3
Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla RENDITA
CATASTALE (Y), espressa in migliaia di euro. I dati della rilevazione sono riportati nella seguente
tabella delle frequenze assolute congiunte:
Y
X
1
2
3
4
0 ⊣ 0.5
0.5 ⊣ 1
1 ⊣ 1.5
74
12
0
5
8
25
16
8
3
0
15
40
a) Si valuti la rendita media delle abitazioni con un vano.
b) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare.
c) Assumendo che la rendita catastale sia funzione lineare del numero di vani, valutare la rendita
catastale di una abitazione con 5.
UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica
4 settembre 2004
Esercizio 1
Un gruppo di giovani è stato classificato in base al tipo di maturità scolastica conseguita
(X) ed al numero di libri che leggono in un anno (Y). I dati dell'indagine sono riportati
nella seguente tabella delle frequenze assolute congiunte:
Y
X
scientifica
classica
magistrale
linguistica
a)
b)
c)
d)
0
---l
42
6
4
0
4
4
---l
6
60
10
5
8
8
---l
12
5
6
9
18
Si calcoli il numero medio di libri letti dai giovani con licenza classica.
Si calcoli il numero mediano di libri letti dai giovani intervistati.
Si valuti, tramite un indice confrontabile, il grado della dipendenza statistica.
Si dica quale è la percentuale di giovani che leggono almeno 5 libri.
Esercizio 2
Un gruppo di abitazioni è stato classificato in base alla NUMERO DI VANI (X) ed alla
RENDITA CATASTALE (Y), espressa in centinaia di euro. I dati della rilevazione sono
riportati nella seguente tabella delle frequenze assolute congiunte:
Y 0 ---- 0.5 0.5 ---- 1 1 ---- 1.5
X
1
2
3
24
12
5
8
65
16
9
4
55
a) Si dica, calcolando un indice relativo, se tra i due caratteri esiste dipendenza lineare.
Esercizio 3
a) Si dimostri, nel caso di distribuzione doppia di frequenze relative, che se X e Y sono
statisticamente indipendenti, allora la Cov(X,Y)=0.
UNICAL
Facoltà di Scienze Politiche
Corso di Laurea in Scienze Politiche
VECCHIO ORDINAMENTO
A.A. 2003-2004
Esame di Statistica
14 settembre 2004
Esercizio n. 1
Un gruppo di aziende è stato classificato in base al numero di dipendenti (X) ed al fatturato(Y). I dati
sono riportati nella tabella seguente:
Y
0 ⊣ 50
50 ⊣ 100
100 ⊣ 200
X
20
26
4
0⊣4
4 ⊣ 16
40
40
20
16 ⊣ 24
0
40
70
d) Valutare il numero medio di dipendenti.
e) Valutare il fatturato mediano.
f) Stabilire se i due caratteri sono statisticamente indipendenti; in caso di risposta negativa misurare il
grado di dipendenza statistica mediante un indice relativo.
g) Si dica quale è la percentuale di aziende che hanno almeno 5 dipendenti
Esercizio n. 2
Nella tabella seguente sono riportate le serie storiche dei prezzi medi, espressi in euro, della benzina (X) e del pane
(Y).
Anno
prezzo
prezzo
pane
benzina
Y
X
1995
1996
1997
1998
1999
2000
2001
2002
0.8
1.4
1.6
1.8
1.7
1.9
1.8
2.0
0.85
1.15
1.10
1.14
1.10
1.12
1.5
1.9
a) Valutare il prezzo medio della benzina e del pane.
b) Determinare i parametri della retta di regressione di Y a X.
c) Valutare la bontà di adattamento della retta di regressione.
d) Se il prezzo del pane aumenta di 0.5 euro, determinare, utilizzando opportune proprietà, media e
varianza per la serie del prezzo del pane.
e) Valutare la mediana della distribuzione del prezzo della benzina.
Esercizio n. 3
 k h n 2  
ij
2
  1 n
Si dimostri che     
 i 1 j1 n i  n  j  