Esercizi riepilogativi
Analisi Univariata e Bivariata
Metodi Quantitativi per Economia,
Finanza e Management
Esercitazione n°6
Metodi Quantitativi per Economia,
Finanza e Management
Obiettivi di questa esercitazione:
1
2
Breve ripasso
teorico
Esercizi
Analisi Univariata: Procedure SAS
Studio della distribuzione di ogni variabile, singolarmente
considerata, all’interno della popolazione
PROC SAS
PROC FREQ
PROC UNIVARIATE
TIPO VARIABILE
FUNZIONE
Distribuzione di frequenze
Variabili qualitative o
(frequenze assolute,
quantitative discrete
relative e cumulate)
Variabili quantitative
Calcolo misure di sintesi di
tipo univariato:
- Misure di posizione
- Misure di dispersione
- Misure di forma della
distribuzione
NB: possibilità di analizzare la distribuzione della variabile rispetto ad
una variabile di classificazione
Analisi Bivariata: Riepilogo
Studio della distribuzione di due variabili congiuntamente
considerate e delle relazioni esistenti tra esse
TIPO DI
VARIABILI
TIPO DI
RELAZIONE
INDAGATA
INDICI DI
DIPENDENZA
Due Variabili
Qualitative
Indipendenza
Statistica
Chi Quadro,
Cramer V
Due Variabili
Quantitative
Indipendenza
Lineare
coeff. di
correlazione
lineare
PROC CORR
Una Qualitative e
Una Quantitativa
continua
Indipendenza
in media
indice eta-quadro
PROC ANOVA
PROCEDURA
SAS
PROC FREQ
Test d’Ipotesi
•
Formulazione ipotesi nulla e ipotesi
alternativa
•
Impostazione a priori del livello di
significatività α
2) Calcolo Statistica test
•
Calcolo del valore della statistica test
(specifica del test che si sta conducendo)
sulla base dei dati campionari
3) Calcolo P-value
•
Calcolo del livello di significatività osservato
1) Sistema di Ipotesi
• Se p-value < α 
sulla base dei dati campionari, la probabilità di rifiutare H0
quando H0 è vera è inferiore alla soglia scelta  rifiuto H0
• Se p-value ≥ α 
accetto H0
Test d’Ipotesi per l’Indipendenza
H0: X e Y sono indipendenti
H1: X e Y dipendenti
1) Sistema di Ipotesi
•
Fissiamo α = 0.05
2) Calcolo Statistica test
3) Calcolo P-value
• Se p-value < 0.05  rifiuto H0
 concludo che X e Y sono dipendenti
• Se p-value ≥ 0.05  accetto H0  concludo che X e Y sono indipendenti
Metodi Quantitativi per Economia,
Finanza e Management
Obiettivi di questa esercitazione:
1
2
Breve ripasso
teorico
Esercizi
Dataset
Il dataset Banca contiene informazioni
comportamenti di 1000 clienti di una banca.
relative
Le variabili presenti nel dataset riguardano informazioni sullo
stato economico del cliente (es. saldo CC, importi vari) e
informazioni contrattuali (es. utilizzo plastic card, accredito
stipendio).
ai
Variabili (1)
#
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
Variable
UTE
NUTE
CARBCM
NCARBCM
STICONV
NSTICONV
TIT
NTIT
RIMBAFF
NRIMBAFF
LEAS
NLEAS
ASS
NASS
TASSE
NTASSE
ASSIC
NASSIC
CD
NCD
Type
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Num
Len
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
Label
IMPORTO TOTALE UTENZE DOMICILIATE
NUM. OPERAZIONI UTENZE DOMICILIATE
IMPORTO TOTALE PLASTIC CARDS
NUM. OPERAZIONI PLASTIC CARDS
IMPORTO TOTALE ACCREDITO STIPENDIO
NUM. OPERAZIONI ACCREDITO STIPENDIO
IMPORTO TOTALE CAUSALE TITOLI
NUM. OPERAZIONI CAUSALE TITOLI
IMPORTO TOTALE RIMBORSI AFFIDAMENTI
NUM. OPERAZIONI RIMBORSI AFFIDAMENTI
IMPORTO TOTALE CAUSALE LEASING
NUM. OPERAZIONI CAUSALE LEASING
IMPORTO TOTALE ASSEGNI
NUM. OPERAZIONI ASSEGNI
IMPORTO TOTALE CAUSALE TASSE
NUM. OPERAZIONI CAUSALE TASSE
IMPORTO TOTALE POLIZZE ASSICURATIVE
NUM. OPERAZIONI POLIZZE ASSICURATIVE
IMPORTO TOTALE CERTIFICATI DI DEPOSITO
NUM. OPERAZIONI CERTIFICATI DI DEPOSIT
Variabili (2)
#
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
Variable
CUSTODIA
NCUST
IMPA
IMPAP
IMPD
IMPDP
NAVEP
NAVERE
NDARE
NDARP
SMEDIO
S_UTENZE
S_PLASTI
S_STIPEN
S_TITOLI
S_RIMBOR
S_LEASIN
S_ASSICU
S_CERTIF
S_CUSTOD
CLIENTE
sesso
Type Len
Label
Num
8 IMPORTO COMMISSIONI TITOLI A CUSTODIA
Num
8 NUM. OPER. COMMISSIONI TITOLI A CUSTODIA
Num
8 IMPORTO OPERAZIONI AVERE
Num
8 IMPORTO OPERAZIONI AVERE ANNO PRECEDENTE
Num
8 IMPORTO OPERAZIONI DARE
Num
8 IMPORTO OPERAZIONI DARE ANNO PRECEDENTE
Num
8 NUM. OPERAZIONI AVERE ANNO PRECEDENTE
Num
8 NUM. OPERAZIONI AVERE
Num
8 NUM. OPERAZIONI DARE
Num
8 NUM. OPERAZIONI DARE ANNO PRECEDENTE
Num
8 SALDO MEDIO DI CONTO CORRENTE
Num
8 DOMICILIAZIONE UTENZE SI/NO
Num
8 UTILIZZO PLASTIC CARD SI/NO
Num
8 ACCREDITO AUTOMATICO STIPENDIO SI/NO
Num
8 POSSESSO TITOLI SI/NO
Num
8 UTILIZZO AFFIDAMENTI
Num
8 LEASING SI/NO
Num
8 POLIZZE ASSICURATIVE SI/NO
Num
8 POSSESSO CERTIFICATI DI DEPOSITO
Num
8 POSSESSO TITOLI A CUSTODIA
Num
8 CODICE PROGRESSIVO CLIENTE
Char
1 SESSO DEL CLIENTE
Modalità di svolgimento
 Allocare la libreria ‘corso’ che punti al percorso fisico
‘C:\corso’
 Importare il file banca.xls, salvarlo nella libreria ‘corso’ e
attribuire il nome banca
 Svolgere gli esercizi utilizzando il dataset banca.
 Riportare i risultati delle analisi svolte (copiando gli output
SAS necessari e commentando adeguatamente) nel file
Esercitazione6.docx contenuto nella cartella C:\corso
Esercizi (1)
1. Qual è la media del saldo medio del conto corrente
[smedio]?
2. Si può affermare che la maggior parte dei clienti utilizza la
plastic card [s_plasti]?
3. E’ corretto affermare che il 66.67% dei clienti non possiede
titoli [s_titoli]?
4. E’ corretto affermare che il saldo medio del conto corrente è
una variabile con asimmetria positiva [smedio]?
5. Tra coloro che hanno una polizza assicurativa, qual è
l’importo medio delle polizze assicurative [assic][s_assicu]?
Esercizi (2)
6. Chi ha effettuato molte ‘operazioni dare’ l’anno precedente
ha effettuato molte ‘operazioni dare’ nell’anno analizzato
[ndare][ndarp]?
7. Si può affermare che esiste una relazione tra il numero di
‘operazioni dare’ e ‘operazioni avere’ [ndare][navere]?
8. C’è una relazione tra la domiciliazione delle utenze e
l’utilizzo della plastic card [s_utenze][s_plasti]? E tra il
possesso di certificati di deposito e il possesso di titoli a
custodia [s_certif][s_custod]?
9. Si può affermare che esiste una relazione tra il sesso e
l'accredito stipendio [sesso][sticonv]?