INDICAZIONI GENERALI Presentazione del laboratorio Condivisione 27/11 4/12 11/12 18/12 Calendario 14.00 -18.00 14.00 - 18.00 14.00 - 18.00 14.00 - 18.00 Suddivisione in Gruppi Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 0 INDICE DELL’INCONTRO Introduzione a SAS ENTERPRISE GUIDE SAS EG Il Progetto Natura e caratteristiche dei data set Dati mancanti Importazione dei dati: SAS e non SAS Il Processo: analisi e “manipolazione” dei dati Modifica dati: Costruttore di query Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 1 SAS ENTERPRISE GUIDE Il software SAS_EG è un’applicazione Statistica di facile utilizzo che offre: • un’interfaccia visiva intuitiva • accesso alla potenza elaborativa di SAS • accesso trasparente ai dati • processi pronti per essere utilizzati per l’analisi e il reporting • semplice esportazione di dati e risultati in altre applicazioni • funzionalità di script e automazione Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 2 Interfaccia SAS EG: il Progetto La parte principale di SAS_EG è rappresentata dal progetto caratterizzato da: origini dati programmi e log SAS processi e query risultati note informative per la documentazione. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 3 SAS ENTERPRISE GUIDE Apriamo il programma ……. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 4 Interfaccia SAS EG: il Progetto Le attività per sviluppare un Progetto con SAS EG possono essere così riassunte: 1. Creare un nuovo Progetto 2. Aggiungere dati al Progetto 3. Analizzare i dati. È, inoltre, possibile 4. Personalizzare i risultati 5. Automatizzare il processo. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 5 Interfaccia SAS EG: il Progetto Selezionando “Nuovo Progetto” Si osservi che le finestre sono denominate: • Struttura del progetto • Flusso dei processi • Elenco dei server Cosa contengono? Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 6 Interfaccia SAS EG: Creazione di un Progetto 1. Denominazione del progetto 2. Assegnazione libreria libreria (ATTENZIONE libreria WORK) La libreria può essere specificata anche da Strumenti Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 7 Interfaccia SAS EG:Natura e caratteristiche dataset SAS_EG è in grado di leggere e utilizzare dati con formati diversi Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 8 Interfaccia SAS EG:Natura e caratteristiche dataset Una data set SAS è una tabella rettangolare di righe e colonne Tutte le colonne devono avere un nome, un tipo e una lunghezza. I nomi possono avere una Lunghezza da 1 a 32 caratteri. Si consiglia di utilizzare sempre una lettera o un carattere di sottolineatura come iniziale del nome cosicché il file possa essere gestito anche in altre applicazioni (SAS/SPSS…). Le etichette delle colonne possono avere una lunghezza massima di 256 caratteri Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 9 Interfaccia SAS EG:Natura e caratteristiche dataset Il Tipo di una colonna può essere stringa o numerico Un Formato viene utilizzato per controllare il modo in cui i valori sono visualizzati senza influire sul modo in cui sono memorizzati (ATTENZIONE AL TIPO DI ANALISI!!!) Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 10 Interfaccia SAS EG:Natura e caratteristiche dataset Gli Attributi di un data set SAS sono memorizzati nelle Proprietà e includono: • il nome del data set • il percorso di memorizzazione • la data dell’ultima modifica • tutti gli attributi delle colonne (come nome, tipo e lunghezza) • il numero di righe e colonne • il server su cui risiedono i dati. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 11 Interfaccia SAS EG:modifica caratteristiche Variabile Per poter modificare le caratteristiche come il formato di una variabile, è necessario prima togliere la protezione ai dati che SAS EG applica per default Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 12 Interfaccia SAS EG: i Dati Mancanti Un valore non presente per una colonna in una specifica riga viene considerato come mancante. Un valore alfanumerico mancante è visualizzato come spazio Un valore numerico mancante è visualizzato come punto Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 13 Interfaccia SAS EG: Importazione dati NON Sas La procedura guidata Importa dati consente di creare data set SAS da file di testo, HTML o PC (inclusi Microsoft Excel e Microsoft Access). Il campo Libreria indica un percorso definito da SAS in cui scrivere il data set SAS importato. Importare il file nella Libreria di lavoro o nella libreria precedentemente definita NB PER LE ESERCITAZIONI SEMPRE NELLA LIBRERIA CREATA ALL’APERTURA DEL PROGETTO Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 14 DATI: importazione dati NON Sas Selezionare nella tabella il campo contenente gli attributi che si desidera modificare. Per cambiare gli attributi di più variabili, tenere premuto il tasto CTRL e selezionare le righe da modificare. Dopo aver selezionato le righe, fare clic su Modifica; viene visualizzata la finestra di dialogo Attributi di campo per selezioni multiple. Specificare in questa finestra di dialogo gli attributi da modificare. È possibile specificare un solo valore per ogni attributo. Dopo avere selezionato OK, il valore di tale attributo viene visualizzato in tutti i campi selezionati. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 15 DATI: importazione file di testo l’importazione di un file i testo richiede la specifica della tipologia: delimitato-lunghezza fissa Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 16 DATI: importazione file di testo - esercitazione Creiamo un nuovo progetto: Stat_2015 Creiamo la libreria: LAB_2015 Creiamo un nuovo flusso: Farmacie Importare il file INFO_FARMACIE.txt con nome INFO_FARMA Assegnare i nomi delle colonne in base alla prima riga del file di testo. Escludere la colonna kohone_concorrenza e tipo_farm Formattare tutte le variabili, come numero, eccetto REG_AMP_AREA Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 17 Analisi dei dati: il Processo In generale un Processo è uno specifico tipo di analisi/report/modifica dati, eseguibile sul db di un Progetto. È possibile accedere ai processi anche tramite la finestra Elenco dei processi. Tale finestra può essere visualizzata selezionando VisualizzaElenco dei processi. Per vedere i nomi dei processi e le procedure SAS corrispondenti, selezionare Processi per nome dall’elenco a discesa. È anche possibile ordinare l’elenco in sequenza alfabetica per nome di procedura facendo clic Selezionato un database è possibile effettuare un qualunque processo selezionandolo dall’elenco sull’intestazione Procedure SAS. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 18 Analisi dei dati: il Processo Le finestre di dialogo dei processi includono un riquadro di selezione con le opzioni disponibili per uno specifico processo. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 19 Analisi dei dati: il Processo Alcuni processi sono eseguibili seguendo delle procedure guidate: Statistiche di riepilogo, Tabelle di riepilogo, Grafico a barre, Grafico a torta e Grafico a linee Le procedure guidate e i processi tradizionali sono elencati separatamente nei menu dei processi. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 20 DATI: Modifica dati Dalla Libreria LAB_2015 consideriamo il DB_FARMACIE_1 Le prime 8 variabili riportano il numero di individui residenti nel bacino della farmacia per fascia di età. Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 21 DATI: modifica dati – Costruttore di Query Per operare sul data base abbiamo due possibilità: Dalla finestra del dataset, tasto destro, inserisci variabile (necessità di sproteggere Con il comando Costruttore di Query il file) Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 22 DATI: modifica dati – Costruttore di Query Il costruttore di query permette una serie di operazioni sul database: filtraggio selezione variabili accorpamento e/o sulle variabili riclassificazione costruzione ex novo (è possibile utilizzare funzioni simili a quelle di excell) al termine delle quali si ha un nuovo database Prima operazione è quella di inserire nella parte destra della finestra le variabili che si vuole che vengano inserite nel data set nuovo. Per esempio trasciniamo tutte le variabili Secondariamente sono possibili a questo punto una serie di opzioni: a) Creare nuove variabili b) Inserire variabili attraverso il comando joint presenti in altre tabelle Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 23 DATI: modifica dati – Costruttore di Query Nome e libreria del nuovo file Quali variabili voglio inserire nel nuovo file? Voglio che i dati siano ordinati in un certo modo nel nuovo file? Voglio selezionare dei CASI nel nuovo file? Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 24 DATI: modifica dati – Costruttore di Query Creazione / Modifica variabili Creo una nuova variabile che somma i valori di una determinata variabile: esempio somma fatturato del DB Clienti Posso riclassificare una variabile in una nuova variabile secondo determinati criteri Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 25 DATI: modifica dati – Costruttore di Query Creazione / Modifica variabili Costruisco nuove variabili come funzione di altre variabili Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 26 DATI: modifica dati – Costruttore di Query Colonna “Sommarizzata”: inserisce una nuova variabile che è la somma dei valori di una specifica variabile Colonna Ricodificata: permette di ricodificare una variabile in una nuova variabile secondo determinati criteri Espressione avanzata: si possono effettuare qualunque modifica sulle variabili sia numeriche che stringa presenti nel dataset Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 27 DATI: modifica dati – Costruttore di Query Colonna Sommarizzata: Costruiamo una variabile che ci fornisca il numero totale di individui sopra i 65 anni nel dataset. Generalmente le variabili create con tale funzione non vengono aggiunte al dataset ma sono memorizzate in data set separati, per averle nel nuovo DB DEVONO essere selezionate Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 28 DATI: modifica dati – Costruttore di Query Colonna Ricodificata: ricodifichiamo la variabile spesa per personale care in 5 fasce Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 29 DATI: modifica dati – Costruttore di Query “join” Espressione avanzata: costruiamo una nuova variabile che identifichi la regione della farmacia, l’informazione però NON è contenuta nel database, va presa dal file “INFO_FARMACIE”, quindi importiamo (“id” del file info deve essere testo, perchè???) il file e uniamolo “join”: 1) con quale variabile i due db si parlano 2) chi “comanda” (left/right/full) 3) quali variabili seleziono Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 30 DATI: modifica dati – Costruttore di Query Uniamo le due tabelle specificando il campo ID attraverso cui legarle Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 31 DATI: modifica dati – Costruttore di Query Potendo operare sulla nuova variabile Regione, creiamo la variabile Piemonte Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 32 DATI: modifica dati – Costruttore di Query ESERCITAZIONE Creare la variabile popolazione totale Creare delle nuove variabili che esprimano la percentuale per fasce di età Creare una variabile, dummy (0-1) che indichi se la farmacia è in Piemonte Metodi quantitativi per il marketing – Anno Accademico 2015 - 2016 LIUC 33