INDICAZIONI GENERALI
Presentazione del laboratorio
Condivisione
27/11
4/12
11/12
18/12
Calendario
14.00 -18.00
14.00 - 18.00
14.00 - 18.00
14.00 - 18.00
Suddivisione in Gruppi
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
0
INDICE DELL’INCONTRO
Introduzione a SAS ENTERPRISE GUIDE
 SAS EG
 Il Progetto
 Natura e caratteristiche dei data set
 Dati mancanti
 Importazione dei dati: SAS e non SAS
 Il Processo: analisi e “manipolazione” dei dati

Modifica dati: Costruttore di query
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
1
SAS ENTERPRISE GUIDE
Il software SAS_EG è un’applicazione Statistica di facile utilizzo che offre:
• un’interfaccia visiva intuitiva
• accesso alla potenza elaborativa di SAS
• accesso trasparente ai dati
• processi pronti per essere utilizzati per l’analisi e il reporting
• semplice esportazione di dati e risultati in altre applicazioni
• funzionalità di script e automazione
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
2
Interfaccia SAS EG: il Progetto
La parte principale di SAS_EG
è rappresentata dal progetto
caratterizzato da:
origini dati
programmi e log SAS
processi e query
risultati
note informative per la
documentazione.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
3
SAS ENTERPRISE GUIDE
Apriamo il programma …….
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
4
Interfaccia SAS EG: il Progetto
Le attività per sviluppare un Progetto con SAS EG
possono essere così riassunte:
1. Creare un nuovo Progetto
2. Aggiungere dati al Progetto
3. Analizzare i dati.
È, inoltre, possibile
4. Personalizzare i risultati
5. Automatizzare il processo.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
5
Interfaccia SAS EG: il Progetto
Selezionando “Nuovo Progetto”
Si osservi che le
finestre sono denominate:
• Struttura del progetto
• Flusso dei processi
• Elenco dei server
Cosa contengono?
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
6
Interfaccia SAS EG: Creazione di un Progetto
1. Denominazione del progetto
2. Assegnazione libreria libreria (ATTENZIONE libreria WORK)
La libreria può essere specificata anche da
Strumenti
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
7
Interfaccia SAS EG:Natura e caratteristiche dataset
SAS_EG è in grado di leggere e utilizzare dati con formati diversi
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
8
Interfaccia SAS EG:Natura e caratteristiche dataset
Una data set SAS è una tabella rettangolare di righe e colonne
Tutte le colonne devono avere un nome,
un tipo e una lunghezza.
I nomi possono avere una
Lunghezza da 1 a 32 caratteri.
Si consiglia di utilizzare sempre una
lettera o un carattere di sottolineatura
come iniziale del nome cosicché il file
possa essere gestito anche in altre
applicazioni (SAS/SPSS…).
Le etichette delle colonne possono avere
una lunghezza massima di 256 caratteri
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
9
Interfaccia SAS EG:Natura e caratteristiche dataset
Il Tipo di una colonna può essere stringa o numerico
Un Formato viene utilizzato per controllare il modo in cui i valori sono visualizzati senza
influire sul modo in cui sono memorizzati (ATTENZIONE AL TIPO DI ANALISI!!!)
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
10
Interfaccia SAS EG:Natura e caratteristiche dataset
Gli Attributi di un data set SAS
sono memorizzati nelle Proprietà e
includono:
• il nome del data set
• il percorso di memorizzazione
• la data dell’ultima modifica
• tutti gli attributi delle colonne
(come nome, tipo e lunghezza)
• il numero di righe e colonne
• il server su cui risiedono i dati.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
11
Interfaccia SAS EG:modifica caratteristiche Variabile
Per poter modificare le caratteristiche come il
formato di una variabile, è necessario prima
togliere la protezione ai dati che SAS EG
applica per default
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
12
Interfaccia SAS EG: i Dati Mancanti
Un valore non presente per una colonna in una specifica riga viene considerato come
mancante.
 Un valore alfanumerico mancante è visualizzato come spazio
 Un valore numerico mancante è visualizzato come punto
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
13
Interfaccia SAS EG: Importazione dati NON Sas
La procedura guidata Importa dati consente di creare data set SAS da file di testo,
HTML o PC (inclusi Microsoft Excel e Microsoft Access).
Il campo Libreria indica un percorso definito da SAS in cui scrivere il data set SAS
importato. Importare il file nella Libreria di lavoro o nella libreria precedentemente definita
NB PER LE ESERCITAZIONI SEMPRE NELLA LIBRERIA CREATA
ALL’APERTURA DEL PROGETTO
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
14
DATI: importazione dati NON Sas
Selezionare nella tabella il campo contenente gli attributi che si desidera modificare. Per cambiare gli
attributi di più variabili, tenere premuto il tasto CTRL e selezionare le righe da modificare. Dopo aver
selezionato le righe, fare clic su Modifica; viene visualizzata la finestra di dialogo Attributi di campo per
selezioni multiple. Specificare in questa finestra di dialogo gli attributi da modificare. È possibile specificare
un solo valore per ogni attributo. Dopo avere selezionato OK, il valore di tale attributo viene visualizzato in
tutti i campi selezionati.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
15
DATI: importazione file di testo
l’importazione di un file i testo richiede la specifica della tipologia: delimitato-lunghezza fissa
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
16
DATI: importazione file di testo - esercitazione
 Creiamo un nuovo progetto: Stat_2015
 Creiamo la libreria: LAB_2015
 Creiamo un nuovo flusso: Farmacie
 Importare il file INFO_FARMACIE.txt con nome INFO_FARMA
 Assegnare i nomi delle colonne in base alla prima riga del file di testo.
 Escludere la colonna kohone_concorrenza e tipo_farm
 Formattare tutte le variabili, come numero, eccetto REG_AMP_AREA
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
17
Analisi dei dati: il Processo
In generale un Processo è uno specifico tipo di
analisi/report/modifica dati, eseguibile sul db di
un Progetto.
È possibile accedere ai processi anche tramite la
finestra Elenco dei processi. Tale finestra può
essere visualizzata selezionando VisualizzaElenco dei processi. Per vedere i nomi dei
processi e le procedure SAS corrispondenti,
selezionare Processi per nome dall’elenco a
discesa.
È anche possibile ordinare l’elenco in sequenza
alfabetica per nome di procedura facendo clic
Selezionato un database è possibile
effettuare un qualunque processo
selezionandolo dall’elenco
sull’intestazione Procedure SAS.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
18
Analisi dei dati: il Processo
Le finestre di dialogo dei processi includono un riquadro di selezione con le opzioni
disponibili per uno specifico processo.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
19
Analisi dei dati: il Processo
Alcuni processi sono eseguibili seguendo delle procedure guidate: Statistiche di riepilogo,
Tabelle di riepilogo, Grafico a barre, Grafico a torta e Grafico a linee
Le procedure guidate e i processi tradizionali sono elencati separatamente nei menu dei
processi.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
20
DATI: Modifica dati
Dalla Libreria LAB_2015 consideriamo il DB_FARMACIE_1
Le prime 8 variabili riportano il
numero di individui residenti nel
bacino della farmacia per fascia
di età.
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
21
DATI: modifica dati – Costruttore di Query
Per operare sul data base abbiamo due possibilità:
Dalla finestra del dataset, tasto destro,
inserisci variabile (necessità di sproteggere
Con il comando Costruttore di Query
il file)
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
22
DATI: modifica dati – Costruttore di Query
Il costruttore di query permette una serie di
operazioni sul database:
filtraggio
selezione variabili
accorpamento
e/o sulle variabili
riclassificazione
costruzione ex novo (è possibile
utilizzare funzioni simili a quelle di
excell)
al termine delle quali si ha un nuovo database
Prima operazione è quella di inserire nella parte destra della finestra le
variabili che si vuole che vengano inserite nel data set nuovo. Per esempio
trasciniamo tutte le variabili
Secondariamente sono possibili a questo punto una serie di opzioni:
a)
Creare nuove variabili
b)
Inserire variabili attraverso il comando joint presenti in altre tabelle
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
23
DATI: modifica dati – Costruttore di Query
Nome e
libreria del
nuovo file
Quali variabili
voglio
inserire nel
nuovo file?
Voglio che i
dati siano
ordinati in un
certo modo
nel nuovo
file?
Voglio selezionare dei
CASI nel nuovo file?
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
24
DATI: modifica dati – Costruttore di Query
Creazione / Modifica
variabili
Creo una nuova variabile che somma i valori
di una determinata variabile: esempio
somma fatturato del DB Clienti
Posso riclassificare una variabile in una
nuova variabile secondo determinati criteri
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
25
DATI: modifica dati – Costruttore di Query
Creazione / Modifica
variabili
Costruisco nuove variabili come funzione di
altre variabili
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
26
DATI: modifica dati – Costruttore di Query
Colonna “Sommarizzata”: inserisce
una nuova variabile che è la somma dei
valori di una specifica variabile
Colonna Ricodificata: permette di
ricodificare una variabile in una nuova
variabile secondo determinati criteri
Espressione avanzata: si possono
effettuare qualunque modifica sulle
variabili sia numeriche che stringa
presenti nel dataset
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
27
DATI: modifica dati – Costruttore di Query
Colonna Sommarizzata: Costruiamo una variabile che ci fornisca il numero totale di individui sopra i
65 anni nel dataset.
Generalmente le variabili create con tale funzione non vengono aggiunte al dataset ma sono
memorizzate in data set separati, per averle nel nuovo DB DEVONO essere selezionate
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
28
DATI: modifica dati – Costruttore di Query
Colonna Ricodificata: ricodifichiamo la variabile spesa per personale care in 5 fasce
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
29
DATI: modifica dati – Costruttore di Query “join”
Espressione avanzata: costruiamo una nuova variabile che identifichi la regione della farmacia,
l’informazione però NON è contenuta nel database, va presa dal file “INFO_FARMACIE”, quindi
importiamo (“id” del file info deve essere testo, perchè???) il file e uniamolo “join”:
1) con quale variabile i due db si parlano
2) chi “comanda” (left/right/full)
3) quali variabili seleziono
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
30
DATI: modifica dati – Costruttore di Query
Uniamo le due tabelle specificando il campo ID attraverso cui legarle
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
31
DATI: modifica dati – Costruttore di Query
Potendo operare sulla nuova variabile Regione, creiamo la variabile Piemonte
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
32
DATI: modifica dati – Costruttore di Query
ESERCITAZIONE
Creare la variabile popolazione totale
Creare delle nuove variabili che esprimano la percentuale per fasce di età
Creare una variabile, dummy (0-1) che indichi se la farmacia è in Piemonte
Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC
33