Università degli Studi Mediterranea di Reggio Calabria Dipartimento di Ingegneria dell’Informazione, delle Infrastrutture e dell’Energia Sostenibile Corso di Laurea Magistrale in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni Tesi di Laurea Progettazione e realizzazione di cruscotti e report relativi ai contributi, alle immatricolazioni e alle lauree a partire dai dati dell’Osservatorio Studenti Didattica del MIUR Relatore Candidato Prof. Domenico Ursino Franco Gangemi Anno Accademico 2014-2015 Ai miei genitori Indice Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1 L’Osservatorio Studenti Didattica del MIUR . . . . . . . . . . . . . . . . . . . 5 1.1 L’Osservatorio Studenti Didattica del MIUR . . . . . . . . . . . . . . . . . . . . . 5 1.2 Cruscotto Ateneo: Organizzazione e Funzionalità . . . . . . . . . . . . . . . . . 6 1.2.1 Analisi Multidimensionale OLAP: Cubi, Dimensioni e Misure 8 1.3 Spedizioni ed Eventi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3.1 Modalità di invio dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.3.2 Modalità di caricamento dei dati nel sistema . . . . . . . . . . . . . . . 18 2 La Business Intelligence e Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Cos’è la Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Introduzione dei concetti e illustrazione di un sistema di BI . . 2.1.2 Data Warehouse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Analisi degli strumenti e delle funzionalità di BI . . . . . . . . . . . . 2.2.2 Creazione dei report . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Creazione di analisi dei report . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Creare dashboard con Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.5 Il valore di Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 21 22 23 25 27 28 29 29 31 31 3 Estrazione di conoscenza sui contributi, le immatricolazioni e le lauree relativa al nostro Ateneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 MQ1: Residenza di provenienza immatricolati . . . . . . . . . . . . . . . . . . . . 3.2.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 3.2.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 MQ2: Scuola di provenienza degli immatricolati . . . . . . . . . . . . . . . . . . 3.3.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 3.3.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 MQ3: Livello di internazionalizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 33 33 34 34 35 37 37 40 41 43 IV 4 Indice 3.4.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5 MQ4: Situazione relativa agli immatricolati . . . . . . . . . . . . . . . . . . . . . . 3.5.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 3.5.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 MQ5: Situazione relativa ai laureati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 3.6.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 MQ6: Situazione relativa alle rinunce . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 3.7.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8 MQ7: Situazione relativa ai contributi . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.8.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 3.8.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.9 Cruscotti realizzati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 44 45 45 49 49 50 55 56 58 67 69 69 73 Estrazione di conoscenza sul immatricolazioni e lauree relativa al contesto italiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 MQ1: Confronto tra Calabria e Sicilia . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Estrazione di conoscenza relativa agli immatricolati . . . . . . . . . 4.2.2 Estrazione di conoscenza relativa agli usciti . . . . . . . . . . . . . . . . 4.3 MQ2: Confronto in base all’area geografica . . . . . . . . . . . . . . . . . . . . . . 4.3.1 Estrazione di conoscenza relativa agli immatricolati . . . . . . . . . 4.3.2 Estrazione di conoscenza relativa agli usciti . . . . . . . . . . . . . . . . 4.4 MQ3: Confronto tra università tradizionale e telematica . . . . . . . . . . . 4.4.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . . 4.4.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5 Cruscotti realizzati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 77 78 78 81 86 86 92 95 95 96 98 5 Discussione in merito all’attività svolta . . . . . . . . . . . . . . . . . . . . . . . . . 107 5.1 Lessons Learned and Best Practices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 5.2 Generalizzabilità dell’approccio proposto . . . . . . . . . . . . . . . . . . . . . . . . 109 5.3 Punti di forza e di debolezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 5.4 Approcci correlati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 6 Conclusioni e uno sguardo al futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Riferimenti bibliografici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Elenco delle figure 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 Schermata di accesso dell’Osservatorio Studenti Didattica . . . . . . . . . . 6 Sezione Tool dell’Osservatorio Studenti Didattica . . . . . . . . . . . . . . . . . . 7 Schermata di accesso del Cruscotto Ateneo . . . . . . . . . . . . . . . . . . . . . . . 7 Schermata principale del Cruscotto Ateneo . . . . . . . . . . . . . . . . . . . . . . . 8 Creazione dei report di analisi OLAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Testata delle schede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 Variabili presenti all’inizio del record . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Flusso dei dati ed elaborazioni cui sono soggetti . . . . . . . . . . . . . . . . . . . 19 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 Architettura di un sistema di BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Data Warehouse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esportazione dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Architettura del software Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Interfaccia per la creazione dei report . . . . . . . . . . . . . . . . . . . . . . . . . . . . Creazione di nuove analisi o dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . Costruzione dei report . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Visualizzazione dei dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 24 26 28 30 30 31 31 Schema a stella relativo al cubo Immatricolati usato per la MQ1 . . . . Immatricolati provenienti dal Comune di Reggio Calabria o da altri Comuni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Classifica dei Comuni esterni di provenienza . . . . . . . . . . . . . . . . . . . . . . 3.4 Andamento del numero di immatricolati dall’anno 2001 . . . . . . . . . . . . 3.5 Immatricolati provenienti dalla Provincia di Reggio Calabria o da altre Province . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.6 Classifica delle Province esterne di provenienza in base al numero di immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.7 Andamento del numero di immatricolati a partire dall’anno 2001 . . . . 3.8 Provincia degli immatricolati per Dipartimento relativa all’anno 2013 3.9 Immatricolati residenti in sede e fuori sede per ogni dipartimento . . . . 3.10 Immatricolati residenti in sede e fuori sede per ogni Corso di Studi . . 3.11 Schema a stella relativo al cubo Immatricolati usato per la MQ2 . . . . 3.12 Andamento degli immatricolati con maturità liceale e tecnica . . . . . . . 34 3.1 3.2 35 35 36 37 37 38 38 39 39 40 40 VI Elenco delle figure 3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20 3.21 3.22 3.23 3.24 3.25 3.26 3.27 3.28 3.29 3.30 3.31 3.32 3.33 3.34 3.35 3.36 3.37 3.38 3.39 3.40 3.41 3.42 3.43 3.44 3.45 3.46 3.47 3.48 Andamento degli immatricolati con maturità professionale e magistrale Andamento degli immatricolati con maturità liceale e classica . . . . . . . Andamento degli immatricolati con maturità non liceali . . . . . . . . . . . . Attrattiva Corso di Studi in base al macrotipo di diploma . . . . . . . . . . Schema a stella relativo al cubo Immatricolati usato per la MQ3 . . . . Andamento degli immatricolati con diploma estero . . . . . . . . . . . . . . . . Classifica dei Corsi di Studio in base al numero di immatricolati con diploma estero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schema a stella relativo al cubo Immatricolati usato per la MQ4 . . . . Andamento del numero di immatricolazioni per ogni Area . . . . . . . . . . Andamento del numero di immatricolazioni per ogni Corso di Studio . Andamento del numero di immatricolazioni per i corsi del DIIES . . . . Andamento del numero di immatricolazioni in base al macrotipo di laurea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Confronto tra immatricolati, iscritti ed iscritti regolari . . . . . . . . . . . . . Attrattività dei Corsi di Studio biennali di Ingegneria . . . . . . . . . . . . . . Schema a stella relativo al cubo Usciti usato per la MQ5 . . . . . . . . . . . Andamento del numero di laureati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andamento del voto di laurea, fasce 66-90 e 91-100 . . . . . . . . . . . . . . . . Andamento del voto di laurea, fasce 101-105, 106-110 e 110 con lode . Andamento del voto di laurea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numero medio di anni per il conseguimento del titolo in base alla fascia di voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numero di laureati in base alla fascia di voto . . . . . . . . . . . . . . . . . . . . . Numero medio di anni per il conseguimento del titolo in base al macrotipo di laurea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andamento del numero di laureati in base al macrotipo di laurea . . . . Numero medio di anni per conseguimento titolo triennale in Ingegneria Numero medio di anni per conseguimento titolo biennale in Ingegneria Numero di laureati nei Corsi di Studio triennali dell’Area di Ingegneria Numero di laureati nei corsi di Studio biennali dell’Area di Ingegneria Numero di laureati per ogni Area della Mediterranea a partire dal 2005 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Numero medio di anni per il conseguimento di un titolo di studio biennale presso l’Università Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . Numero medio di anni per il conseguimento di un titolo di studio triennale presso l’Università Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . Numero medio di anni per il conseguimento di un titolo di studio biennale presso l’Università Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . Numero di laureati per ciascun corso biennale della Mediterranea . . . . Numero di laureati meo Corsi di Studi triennali della Mediterranea . . Numero di laureati nei Corsi di Studio a ciclo unico della Mediterranea Andamento del numero di laureati, suddivisi per fasce di voto, per l’Area di Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso di Studi in Ingegneria Elettronica . . . . . . . . . . . . . . . . . . . . . . . . 41 41 42 42 43 43 44 45 46 47 48 48 49 49 50 50 51 51 51 52 52 53 53 54 54 55 55 56 56 57 57 58 59 59 60 60 Elenco delle figure 3.49 Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso di Studi in Ingegneria dell’Informazione . . . . . . . . . . . . . . . . . . . 3.50 Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso di Studi in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.51 Confronto tra i Corsi di Studio in Ingegneria delle Telecomunicazioni DM509 e DM270 per ciò che riguarda la durata media degli studi . . . 3.52 Schema a stella relativo al cubo Usciti usato per la MQ6 . . . . . . . . . . . 3.53 Andamento delle rinunce nel corso degli anni . . . . . . . . . . . . . . . . . . . . . 3.54 Andamento delle rinunce in base al macrotipo di diploma . . . . . . . . . . . 3.55 Andamento delle rinunce in base al macrotipo di laurea . . . . . . . . . . . . 3.56 Andamento delle rinunce in base alle Aree . . . . . . . . . . . . . . . . . . . . . . . . 3.57 Rinunce degli iscritti dell’anno 2011 dopo n+1 anni . . . . . . . . . . . . . . . . 3.58 Numero totale di rinunce, dopo n+1 anni, per ogni Corso di Studi dell’Area di Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.59 Rinunce per ogni Corso di Studio dell’Area di Ingegneria a partire dal 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.60 Numero di rinunce in base all’anno di immatricolazione per gli studenti della Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.61 Rinunce da parte degli immatricolati negli A.A. 2010/2011, 2011/2012 e 2012/2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.62 Rinunce da parte degli immatricolati negli A.A. 2010/2011, 2011/2012 e 2012/2013 nei Corsi di Studio triennali dell’Area di Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.63 Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del Corso di Studi in Ingegneria dell’Informazione . . . . . . . . . . . . . . . . . . . . 3.64 Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del Corso di Studi in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.65 Schema a stella relativo al cubo Contributi usato per la MQ7 . . . . . . . 3.66 Confronto tra importoDovuto e importoPagato negli anni . . . . . . . . . . 3.67 Confronto tra importoDovuto e importoPagato per le Aree della Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.68 Confronto tra importoDovuto ed importoPagato per i Corsi di Studio dell’Area Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.69 Informazioni relative al Comune di residenza associato alle richieste di borse di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.70 Informazioni relative alla Provincia di residenza associato alle richieste di borse di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.71 Informazioni relative al macrotipo di laurea associato alle richieste di borse di studio (anno 2014) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.72 Informazioni relative al macrotipo di laurea associato alle richieste di borse di studio (anno 2015) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.73 Cruscotto relativo agli immatricolati, iscritti, usciti e laureati della Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.74 Cruscotto relativo al numero di laureati e di rinunce esplicite della Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VII 61 61 61 62 62 63 64 64 65 65 66 67 67 68 68 68 69 69 70 71 71 72 72 72 73 74 VIII Elenco delle figure 3.75 Cruscotto relativo al numero di usciti e di laureati della Mediterranea 74 3.76 Cruscotto relativo ai corsi di Ingegneria dell’Informazione e di Ingegneria Informatica e dei Sistemi per le Telecomunicazioni della Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 4.15 4.16 4.17 4.18 4.19 4.20 4.21 4.22 4.23 4.24 4.25 4.26 Schema a stella del cubo usato per la MQ1 relativa agli immatricolati Confronto tra gli andamenti relativi al numero totale di immatricolati in Calabria e in Sicilia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Confronto tra il numero totale di immatricolati alle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Classifica degli atenei calabresi e siciliani in base al numero di immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andamento delle immatricolazioni presso gli atenei calabresi e siciliani Informazioni sull’andamento delle immatricolazioni e dei rispettivi trend ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . . Andamento delle immatricolazioni con diploma estero . . . . . . . . . . . . . . Andamento delle immatricolazioni con diploma estero per ogni ateneo calabrese e siciliano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Immatricolazioni alle Classi di Laurea L-8 e LM-27 calabresi e siciliane Andamento delle immatricolazioni alle Classi di Laurea L-8 e LM-27 calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schema a stella del cubo usato per la MQ1 relativa agli usciti . . . . . . . Andamento del numero di usciti delle università calabresi e siciliane . Informazioni sull’andamento degli usciti e dei rispettivi trend ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . Andamento del numero di laureati delle università calabresi e siciliane Informazioni sull’andamento dei laureati e dei rispettivi trend ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . Andamento del numero di rinunce esplicite delle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Informazioni sull’andamento delle rinunce esplicite e dei rispettivi trend ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . . Schema a stella del cubo usato per la MQ2 relativa agli immatricolati Andamento delle immatricolazioni relativo alle università presenti in Italia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andamento delle immatricolazioni in base all’area geografica degli atenei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andamento delle immatricolazioni alla Classe di Laurea L-8 . . . . . . . . Andamento delle immatricolazioni alla Classe di Laurea L-8 per ogni area geografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Andamento delle immatricolazioni alla Classe di Laurea LM-27 . . . . . . Andamento delle immatricolazioni alla Classe di Laurea LM-27 per ogni area geografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Classifica degli atenei italiani in base al numero di immatricolati alla Classe di Laurea L-8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Classifica degli atenei italiani in base al numero di immatricolati alla Classe di Laurea LM-27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 79 79 80 81 82 83 83 84 84 84 85 85 86 87 88 89 90 90 90 91 91 91 92 93 94 Elenco delle figure IX 4.27 Schema a stella del cubo usato per la MQ2 relativa agli usciti . . . . . . . 94 4.28 Andamento del numero di rinunce esplicite in base all’area geografica 95 4.29 Informazioni sull’andamento delle rinunce esplicite e dei rispettivi trend ottenuti per ogni area geografica . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 4.30 Andamento del numero di rinunce esplicite relativo al Corso di Laurea L-8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.31 Andamento del numero di rinunce esplicite relativo al Corso di Laurea LM-27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 4.32 Numero medio di anni necessario per conseguire la laurea relativo alle Classi di Laurea L-8 e LM-27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 4.33 Numero medio di anni necessario per conseguire la laurea relativo alle Classi di Laurea L-8 e LM-27 in base all’area geografica . . . . . . . . 98 4.34 Classifica atenei italiani in base al numero medio di anni necessario per conseguire la laurea (Classi di Laurea L-8) . . . . . . . . . . . . . . . . . . . . 99 4.35 Classifica atenei italiani in base al numero medio di anni necessario per conseguire la laurea (Classi di Laurea LM-27) . . . . . . . . . . . . . . . . . 99 4.36 Schema a stella del cubo usato per la MQ3 . . . . . . . . . . . . . . . . . . . . . . . 100 4.37 Confronto sull’andamento delle immatricolazioni relativo alle università tradizionali e telematiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.38 Classifica dei Corsi di Studio delle università telematiche sulla base del numero di immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 4.39 Classifica delle università telematiche sulla base del numero di immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 4.40 Andamento delle immatricolazioni relative alla Classe di Laurea L-8 per le università telematiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 4.41 Cruscotto relativo al numero di immatricolati e laureati delle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102 4.42 Cruscotto relativo al numero di laureati e di rinunce esplicite delle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 4.43 Cruscotto relativo al numero di immatricolati delle università calabresi e siciliane considerando la Classe di Laurea L-8 . . . . . . . . . . . 104 4.44 Cruscotto relativo al numero di immatricolazioni in base al contesto italiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 Elenco delle tabelle 1.1 1.2 Mapping tra dimensioni e cubi (prima parte) . . . . . . . . . . . . . . . . . . . . . 12 Mapping tra dimensioni e cubi (seconda parte) . . . . . . . . . . . . . . . . . . . . 13 Introduzione Una delle esigenze fondamentali di ogni organizzazione è quella di trasformare i dati raccolti in informazioni messe a supporto delle decisioni e delle strategie aziendali. Negli ultimi anni la Business Intelligence ricopre un ruolo rilevante negli investimenti fatti dalle aziende al fine di ottimizzare i processi di business. Per una gestione corretta e vincente dell’organizzazione, ogni manager dovrebbe valutare la performance attuale individuando le cause di tale andamento e, infine, indicare le azioni che andrebbero intraprese per migliorarla. La Business Intelligence si pone, quindi, l’obbiettivo di offrire un insieme di tecnologie di ausilio per i processi decisionali. L’insieme di prodotti e soluzioni offerti dalla Business Intelligence permette, infatti, la gestione, la bonifica, la manipolazione e il controllo dei dati presenti in un’organizzazione al fine di trasformarli, mediante report e cruscotti, in informazioni certe, affidabili, puntuali ed uniche per tutta l’organizzazione aziendale. I dati vengono memorizzati interamente nel Data Warehouse il cui accesso è consentito in sola lettura. Tali dati hanno una dimensione storica e possono essere memorizzati in una serie di Data Mart, specializzati per le varie aree di attività. Se, inizialmente, la Business Intelligence veniva adoperata nel privato, al giorno d’oggi lo scenario applicativo di tali tecnologie si è allargato in molteplici organizzazioni come la Pubblica Amministrazione e l’Università. In questi anni si è fatto uno sforzo di ammodernamento tecnologico significativo, in quanto le amministrazioni sono state dotate di una struttura informatica di assoluto rilievo, a fronte di investimenti importanti. Le istituzioni hanno scelto, quindi, di intraprendere un percorso di informatizzazione e di integrare tecnologie di Business Intelligence a valle di una consolidata base di beni e servizi di ICT. Il DM 509, contestualmente alla riforma della didattica, ha previsto la costituzione dell’Anagrafe Nazionale degli Studenti del nuovo ordinamento. Nell’A.A. 2004/2005, il Consorzio Universitario Cineca ha iniziato a costruire tale anagrafe su richiesta del MIUR. Grazie alle competenze acquisite nell’ambito della gestione delle informazioni, il Cineca ha dato via alla nuova sfida del knowledge management. L’Osservatorio Studenti Didattica è il sistema, accessibile tramite browser web, messo a disposizione dal Cineca. Per il presente elaborato di tesi è stato possibile avere accesso ai dati raccolti sul sistema distribuito relativi a tutti gli atenei italiani. Questi dati vengono periodicamente aggiornati da ogni ateneo attraverso un meccanismo di spedizioni a cadenza 2 Introduzione settimanale. I dati raccolti forniscono una serie di informazioni su immatricolati, iscritti, usciti, contributi e crediti relativi a tutti gli atenei italiani. La ricerca effettuata nella presente tesi ha visto l’applicazione di tecniche di Data Warehousing su questi dati, mediante il software di Business Intelligence Pentaho, al fine di estrarre conoscenza a supporto dei processi decisionali. Pentaho è una piattaforma open source fondata nel 2004 che offre una serie di tool alcuni dei quali sono stati da noi adoperati durante la seguente tesi. A partire dal livello dei dati riconciliati è stato possibile progettare degli schemi a stella e, quindi, realizzare una serie di cubi di interesse per la governance riguardanti le misure di riferimento. Ogni cubo si sofferma, in particolare, su un determinato aspetto di analisi. La conoscenza di interesse è stata specifica dalla governance di Ateneo (Prorettore delegato alla Didattica, Dirigente Segreteria, Prorettore delegato all’Informatica). Prima di procedere alla fase di estrazione della conoscenza, è stato necessario documentarsi sulla realtà del mondo universitario, consultando documenti ufficiali e confrontandosi con gli addetti ai lavori per risolvere eventuali incongruenze nell’interpretazione di alcune definizioni. Questa fase è stata fondamentale per cercare di garantire una certa consistenza alle analisi successive. Inoltre, è stata anche determinante per l’individuazione dei Key Performance Indicator, ovvero gli indici che monitorano l’andamento dei processi aziendali concentrandosi su quegli aspetti della performance di un’organizzazione che sono i più critici per il suo successo corrente e futuro. Una volta progettati i cubi, è stato impiegato il tool di Pentaho per eseguire una serie di operazioni OLAP come, ad esempio, pivoting, slice and dice, drill-down e roll-up, per la scelta e il processing delle dimensioni e delle misure necessarie per la creazione dei report. Inizialmente, ci siamo occupati della situazione generale relativa all’Università Mediterranea di Reggio Calabria e, in un secondo momento, abbiamo spostato la nostra attenzione dalla realtà locale a quella nazionale. I risultati ottenuti sono stati organizzati in una serie di macro-questioni di interesse. La fase successiva ha visto la creazione di cruscotti contenenti i report più significativi per un determinato contesto. I cruscotti delle prestazioni costituiscono l’interfaccia utente che fornisce la sintesi delle informazioni più importanti in termini di Business Intelligence. Il presente lavoro di tesi è strutturato come di seguito specificato: • • • Il primo capitolo descrive nel dettaglio l’Osservatorio Studenti Didattica (OSD) del MIUR ed il tool denominato Cruscotto Ateneo, che è stato utilizzato per le analisi multidimensionali sui dati dell’Anagrafe Nazionali Studenti (ANS). Vengono specificate, inoltre, le informazioni relative a cubi, dimensioni e misure impiegati per le operazioni OLAP. In seguito, vengono descritte le modalità di caricamento dei dati, effettuato per costruire l’ANS, le spedizioni ed i relativi eventi. Nel secondo capitolo parleremo, inizialmente, di Business Intelligence, illustrando le caratteristiche principali dei sistemi di Data Warehousing e Data Mining e, successivamente, del tool Pentaho, adoperato per l’analisi dei dati. Nel terzo capitolo metteremo in evidenza la conoscenza estratta, relativa all’Università Mediterranea di Reggio Calabria, grazie al lavoro svolto a partire dai dati dell’OSD. Verranno descritti gli schemi a stella a partire dai quali è Introduzione 3 stato progettato il cubo, e i Key Performance Indicator individuati per ogni macro-questione. • Il quarto capitolo illustra la conoscenza estratta su immatricolazioni e lauree, relativa ai vari atenei italiani, individuando i Key Performance Indicator a partire dai quali sono stati ricavati i report e i cruscotti di interesse. • Nel quinto capitolo forniremo una descrizione in merito all’attività svolta, indicando le best practices suggerite in modo da migliorare la gestione della conoscenza, per una serie di ostacoli incontrati durante la fase di analisi. Descriveremo, inoltre, i punti di forza e di debolezza del lavoro effettuato. • Nel sesto capitolo trarremo le conclusioni sul lavoro svolto e analizzeremo alcuni possibili sviluppi futuri. 1 L’Osservatorio Studenti Didattica del MIUR Questo capitolo fornisce una descrizione dell’Osservatorio Studenti Didattica del MIUR e del tool denominato Cruscotto Ateneo che è stato impiegato per l’analisi multidimensionale sui dati dell’Anagrafe Nazionale Studenti. Vengono, quindi, specificate le informazioni relative a cubi, dimensioni e misure impiegate per le operazioni OLAP. Successivamente, vengono descritti il caricamento dei dati effettuato per costruire l’ANS, le spedizioni ed i relativi eventi. Infine, vengono specificate le modalità di invio dei dati e quelle di caricamento degli stessi nel sistema. 1.1 L’Osservatorio Studenti Didattica del MIUR Il DM 509, contestualmente alla riforma della didattica, ha previsto la costituzione dell’Anagrafe Nazionale degli Studenti (nel seguito, ANS) del nuovo ordinamento; nell’Anno accademico 2004/2005, il Consorzio Interuniversitario Cineca ha iniziato a costruire tale anagrafe su richiesta del Ministero dell’Istruzione, dell’Università e della Ricerca (nel seguito, MIUR). Grazie alle competenze acquisite nell’ambito della gestione delle informazioni, il Consorzio ha dato via alla nuova sfida del knowledge management, disegnando un approccio originale basato sulle ontologie. Il Cineca è il maggiore centro di supercalcolo italiano e uno dei più importanti in Europa, ed occupa una posizione di grande rilievo anche a livello mondiale. È, infatti, dotato dei più avanzati sistemi per il calcolo ad alte prestazioni e di risorse hardware per l’elaborazione e il trattamento dell’informazione che hanno consentito ad esso di diventare un punto di riferimento nell’ambito dell’ICT. Inoltre, la profonda conoscenza del mondo accademico consente al Cineca di offrire soluzioni efficaci, orientate alla governance, oltre che alla gestione ordinaria degli Atenei, promuovendo il reciproco trasferimento di conoscenze per migliorare continuamente la qualità dei loro servizi. L’Osservatorio Studenti Didattica è il sistema messo a disposizione dal Cineca ed è accessibile tramite browser web digitando l’url http://osservatorio.cineca.it ed inserendo le credenziali. La schermata di accesso è riportata in Figura 1.1. Attraverso la fase di autenticazione si accede al sito riservato, realizzato con protocollo SSL, che garantisce la sicurezza delle transazioni effettuate mediante la crittografia dei dati. L’Osservatorio si compone di un’area riservata agli atenei per fornire 6 1 L’Osservatorio Studenti Didattica del MIUR Figura 1.1. Schermata di accesso dell’Osservatorio Studenti Didattica le informazioni che confluiranno nell’anagrafe dopo aver superato le verifiche di congruità, ed un’area pubblica, dove, in modo aggregato, tutte le informazioni vengono pubblicate con l’ausilio di un’interfaccia di navigazione che consente una immediata aggregazione a livello geografico. Il sistema è progettato in modo da registrare gli eventi di carriera di ogni studente del sistema accademico nazionale iscritto ad un corso di laurea del nuovo ordinamento, in modo da poter seguire i loro percorsi di studi in conformità alle norme previste dal DM 509, in materia di classi, insegnamenti (di base, caratterizzanti ed affini), crediti formativi conseguiti nei diversi settori scientifico-disciplinari fino al conseguimento del titolo o, eventualmente, all’abbandono. Ogni Ateneo ha l’obbligo di fornire periodicamente al MIUR precisi indicatori di qualità relativi ai corsi di studio, i quali forniscono informazioni utili per l’approvazione dei corsi e ai fini della ripartizione delle risorse annualmente assegnate. La procedura viene reiterata ad ogni apertura e chiusura del corso di laurea. Secondo il sistema AVA (Autovalutazione, Valutazione, Accreditamento), nel caso in cui l’Ateneo non dovesse superare determinate soglie minime di valutazione, quest’ultimo non verrà accreditato. 1.2 Cruscotto Ateneo: Organizzazione e Funzionalità Nell’ottica di fornire uno strumento per l’analisi delle informazioni dell’ANS è stata progettata e realizzata una piattaforma di Business Intelligence con tecnologia Pentaho EE denominata Cruscotto Ateneo. Il Cruscotto è accessibile tramite la sezione Tool del sito dell’Osservatorio (Figura 1.2), o tramite browser web digitando l’url: http://cruscottoateneo.cineca.it/pentaho/Login (Figura 1.3). Il Cruscotto è a disposizione del MIUR e di tutti gli atenei che contribuiscono alla raccolta dei dati ANS, ed espone agli utenti tutti i dati spediti dagli atenei e raccolti periodicamente dal Cineca secondo le vigenti norme di legge. I dati raccolti 1.2 Cruscotto Ateneo: Organizzazione e Funzionalità 7 Figura 1.2. Sezione Tool dell’Osservatorio Studenti Didattica Figura 1.3. Schermata di accesso del Cruscotto Ateneo sono elaborati ed armonizzati per essere analizzabili nella loro totalità, ad un livello di aggregazione tale da rendere possibili sia analisi di sistema che di singolo ateneo. In Figura 1.4 è possibile visualizzare la schermata principale del Cruscotto. Come possiamo notare, esso prevede la fruizione delle informazioni dell’ANS attraverso tre modalità: analisi multidimensionali OLAP su un insieme di cubi tematici, report ad-hoc su particolari fenomeni o indicatori di interesse generale, composizione di questi in dashboard o cruscotti di riepilogo. Gli utenti hanno la possibilità di consultare i contenuti messi a disposizione dall’ufficio di statistica, esportarli nei vari formati disponibili, o salvarli in una cartella online personale che, eventualmente, può essere condivisa. 8 1 L’Osservatorio Studenti Didattica del MIUR Figura 1.4. Schermata principale del Cruscotto Ateneo 1.2.1 Analisi Multidimensionale OLAP: Cubi, Dimensioni e Misure Per quanto riguarda l’Analisi Multidimensionale OLAP il sistema mette a disposizione i seguenti cubi: • • • • • Cubo Cubo Cubo Cubo Cubo Contributi; Crediti; Immatricolati; Iscritti; Usciti. Le analisi OLAP effettuate su questi cubi consentono all’utente di vedere soltanto i dati del proprio ateneo di afferenza. Per dare la possibilità agli utenti di poter fare analisi di sistema e di confronto con gli altri atenei c’è la possibilità di utilizzare i cubi pubblici: per ogni cubo illustrato precedentemente vi è una versione pubblica che contiene i dati di tutti gli atenei italiani. L’unica limitazione riscontrata nell’utilizzo di questi cubi è la mancanza delle dimensioni didattiche “Corso” e “Nome Corso”. In Figura 1.5 è riportato l’ambiente di creazione dei report di analisi. Nel ventaglio di selezione situato sulla sinistra, l’utente può selezionare, in modalità drag and drop, dimensioni e misure, usufruendo, poi, di una serie di funzionalità aggiuntive, come filtri e tool grafici, per la creazione di report personalizzati. I cubi possono essere navigati attraverso una serie di dimensioni organizzate nelle seguenti categorie: • Ateneo. In questo gruppo troviamo tutte le dimensioni riguardanti l’ateneo associato alle informazioni che stiamo visualizzando. Le dimensioni Ateneo sono: – Ateneo Corto: il nome dell’ateneo senza caratteri speciali (da usare nelle dashboard); – Ateneo USTAT : la denominazione dell’ateneo usata dall’ufficio di statistica USTAT; 1.2 Cruscotto Ateneo: Organizzazione e Funzionalità 9 Figura 1.5. Creazione dei report di analisi OLAP – – – Ateneo: la denominazione dell’ateneo; Modalità Ateneo: la modalità didattica dell’ateneo, tradizionale oppure telematica; Tipo Ateneo: distinzione tra atenei statali e non statali. • Carriera. In questo gruppo troviamo tutte le dimensioni riguardanti la carriera di uno studente. Tra queste dimensioni troviamo: – Stato Carriera: lo stato attuale della carriera dello studente, ad esempio attiva, multipla, chiusa, sospesa; – Prima Immatricolazione: prima carriera, nel caso di prima immatricolazione al sistema universitario, carriera successiva, altrimenti; – Tipo Iscrizione: distinzione tra iscrizione normale oppure multipla; – Studente Regolare: distinzione tra studente regolare e fuoricorso; – Fascia Voto Laurea: classificazione del voto laurea per fasce di voto; – Voto Laurea: voto di laurea; – Motivo Uscita: il motivo di chiusura della carriera, ad esempio laurea, rinuncia, decadenza, etc. • Contributi. In questo gruppo troviamo tutte le dimensioni riguardanti il diritto allo studio e le agevolazioni sui contributi pagati dagli studenti. In particolare, troviamo: – Borsa: informazioni sulla richiesta di borsa di studio, come, ad esempio, idoneo, non idoneo, beneficiario; – Esensione: informazioni in merito alla richiesta di esenzione dei contributi universitari ottenuta dallo studente; – Esonero: informazioni in merito al tipo di esonero ottenuto sui contributi universitari; – Lavoratore: informazioni relative allo status di studente/lavoratore. • Crediti. In questo gruppo troviamo tutte le dimensioni riguardanti i crediti ottenuti dallo studente. In particolare, troviamo: 10 1 L’Osservatorio Studenti Didattica del MIUR – Ambito Univoco: ambito univoco specifico, associato ai crediti conseguiti; – Attività Formativa: tipo di attività formativa associata ai crediti conseguiti; – Crediti Carriera: distinzione tra crediti validi per carriera corso correnti e crediti non più validi per carriera corso correnti; – Area SSD : area relativa al Settore Scientifico Disciplinare; – Codice SSD : codice del Settore Scientifico Disciplinare; – Settore SSD : Settore Scientifico Disciplinare; – Tipo Attività: tipo di attività che ha portato all’ottenimento dei CFU; – Tipo Crediti: tipologia dei crediti (sostenuti, convalidati, etc). • Didattica. In questo gruppo troviamo tutte le dimensioni di analisi che rappresentano il percorso di studi, attraverso vari livelli di aggregazione. In particolare, troviamo: – Anno di Iscrizione: l’anno di iscrizione al corso di studio; – Area CUN : l’area del Consiglio Universitario Nazionale; – Area: l’area didattica di appartenenza del corso di studio; – Classe: la classe del corso di studio, nel formato codice classe - nome classe; – Corso: il corso di studio nel formato chiave corso - nome corso; – Dipartimento: il dipartimento o l’eventuale struttura di raccordo, secondo la legge 240/10; – Facoltà: la facoltà del corso di laurea; – Field of Education: classificazione del corso di studio per Field of Education1 ; – Gruppo ISTAT : classificazione del corso di studio secondo un raggruppamento ISTAT; – Nome Corso Pubblico: la denominazione del corso di studi in base al suo codicione, come sul sito pubblico anagrafe.miur.it; – Nome Corso: il nome del corso di studio; – Ordinamento: l’ordinamento didattico del corso di studio: D.M. 509/99 D.M. 270/04; – Tipo Laurea: la tipologia del corso di laurea. • Geografia - Italia. In questo gruppo troviamo tutte le dimensioni geografiche italiane: – Ateneo Area: l’area italiana dell’ateneo; – Ateneo Regione: la regione della sede dell’ateneo; – Ateneo Provincia: la provincia della sede dell’ateneo; – Area Comune: il comune della sede dell’ateneo; – Corso Area: l’area italiana del corso di studio; – Corso Regione: la regione del corso di studio; – Corso Provincia: la provincia del corso di studio; – Corso Comune: il comune del corso di studio; – Nascita Area: l’area italiana di nascita dello studente; – Nascita Regione: la regione di nascita dello studente; – Nascita Provincia: la provincia di nascita dello studente; – Nascita Comune: il comune di nascita dello studente; – Residenza Area: l’area italiana di residenza dello studente; – Residenza Regione: la regione italiana di residenza dello studente; 1 Settore di studi. 1.2 Cruscotto Ateneo: Organizzazione e Funzionalità – – 11 Residenza Provincia: la provincia italiana di residenza dello studente; Residenza Comune: il comune italiano di residenza dello studente. • Geografia - Nazioni. In questo gruppo troviamo tutte le dimensioni geografiche nazionali; in particolare, sono presenti i seguenti campi: – Cittadinanza Continente ISTAT : il continente cui fa riferimento la cittadinanza dello studente (codifica ISTAT); – Cittadinanza Nazione ISTAT : la nazione cui fa riferimento la cittadinanza dello studente (codifica ISTAT); – Nascita Continente ISTAT : il continente di nascita dello studente (codifica ISTAT); – Nascita Nazione ISTAT : la nazione di nascita dello studente (codifica ISTAT). • Studente. In questo gruppo troviamo tutte le dimensioni che riguardano lo studente. In particolare, sono presenti i seguenti campi: – Fascia Anno Nascita: la fascia dell’anno di nascita dello studente; – Anno Nascita: l’anno di nascita dello studente; – Sesso: il sesso dello studente; – Macrotipo Diploma: il macrotipo del diploma dello studente; – Tipo Diploma: il tipo del diploma dello studente; – Fascia Voto Diploma: la classificazione del voto diploma per fasce di voto; – Voto Diploma: il voto di diploma dello studente. • Tempo. In questo gruppo troviamo tutte le dimensioni che riguardano il tempo. In particolare, troviamo i seguenti campi: – A.A. Immatricolazione: l’anno accademico di immatricolazione della carriera dello studente, nel formato yyyy/yyyy+1; – A.A. Prima Immatricolazione: l’anno accademico di prima immatricolazione dello studente, nel formato yyyy/yyyy+1; – Anno Corto: l’anno accademico nel formato yyyy; – Anno Accademico: l’anno accademico nel formato yyyy/yyyy+1; – Anno Diploma: l’anno di diploma dello studente; – Anno Uscita: l’anno solare di chiusura della carriera, nel formato yyyy; – Anno Solare: l’anno solare, nel formato yyyy. • Titolo Univ. Precedente. In questo gruppo troviamo tutte le dimensioni relative a titoli di studio precedentemente acquisiti dallo studente. In particolare, troviamo i seguenti campi: – Anno Accademico Titolo UN : l’anno accademico del titolo universitario precedente; – Statale UN : la tipologia dell’ateneo del titolo universitario precedente; – Telematica UN : la tipologia didattica del titolo universitario precedente; – Ateneo UN : l’ateneo del titolo universitario precedente; – Tipo Laurea UN : il tipo laurea del titolo universitario precedente; – Field of Education UN : Field of Education del titolo universitario precedente; – Classe UN : la classe del titolo universitario precedente; – Nazione Titolo UN IT : indica se il titolo universitario precedente è stato conseguito in Italia, all’estero, o non è stato fornito il dato; 12 1 L’Osservatorio Studenti Didattica del MIUR Categ./Sottocateg. Ateneo Ateneo Corto Ateneo USTAT Ateneo Tipo Ateneo Modalità Ateneo Carriera Stato Carriera Tipo Immatricolazione Tipo Iscrizione Studente Regolare Fascia Voto Laurea Voto Laurea Motivo Uscita Contributi Borsa Esenzione Esonero Lavoratore Crediti Ambito Univoco Attività Formativa Crediti Carriera Area SSD Codice SSD Settore SSD Tipo Attività Tipo Crediti Didattica Anno di Iscrizione Area CUN Area Classe Corso Dipartimento Facoltà Field of Education Gruppo ISTAT Nome Corso Pubblico Nome Corso Ordinamento Tipo Laurea Cubo Contributi Cubo Crediti Cubo Immatricolati Cubo Iscritti Cubo Usciti x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x Tabella 1.1. Mapping tra dimensioni e cubi (prima parte) – Nazione Titolo UN UE : indica se il titolo universitario precedente è stato conseguito in un paese dell’Unione Europea, all’esterno, o non è stato fornito il dato; – Nazione Titolo UN : la nazione del titolo universitario precedente. Nella Tabelle 1.1 e 1.2 viene mostrato il mapping tra dimensioni e cubi. Ciascun cubo ha le seguenti misure, che l’utente può scegliere per effettuare le analisi: • Cubo Contributi – Importo Dovuto: somma in euro dei contributi che gli studenti devono versare; – Importo Pagato: somma in euro dei contributi che gli studenti hanno effettivamente versato. • Cubo Crediti – CFU Corso: crediti ottenuti nel corso attuale dello studente; – CFU Altro Corso: crediti ottenuti in corsi diversi da quello attuale dello studente; – CFU Altro Ateneo: crediti ottenuti in altri atenei; 1.2 Cruscotto Ateneo: Organizzazione e Funzionalità Categ./Sottocateg. Geografia-Italia Ateneo Area Ateneo Regione Ateneo Provincia Ateneo Comune Corso Area Corso Regione Corso Provincia Corso Comune Nascita Area Nascita Regione Nascita Provincia Nascita Comune Residenza Area Residenza Regione Residenza Provincia Residenza Comune Geografia-Nazioni Cittadinanza Continente ISTAT Cittadinanza Nazione ISTAT Nascita Continente ISTAT Nascita Nazione ISTAT Studente Fascia Anno Nascita Anno Nascita Sesso Macrotipo Diploma Tipo Diploma Fascia Voto Diploma Voto Diploma Tempo A.A. Immatricolazione A.A. Prima Immatricolazione A.A. Corto Anno Accademico Anno Diploma Anno Uscita Anno Solare Titolo Univ. Precedente Anno Accademico Titolo UN Statale UN Telematica UN Ateneo UN Tipo Laurea UN Field Of Education UN Classe UN Nazione Titolo UN IT Nazione Titolo UN UE Nazione Titolo UN 13 Cubo Contributi Cubo Crediti Cubo Immatricolati Cubo Iscritti Cubo Usciti x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x x Tabella 1.2. Mapping tra dimensioni e cubi (seconda parte) – – – – – CFU CFU CFU CFU CFU Atenei Stranieri: crediti ottenuti all’estero; Stage: crediti ottenuti da attività di stage; Validi: crediti validi per la carriera attuale; Totali: crediti totali ottenuti dallo studente; Totali Validi: crediti totali validi ottenuti dallo studente. • Cubo Immatricolati – Immatricolati: numero di immatricolazioni; – CFU ingresso: crediti riconosciuti al momento dell’immatricolazione; – Importo Dovuto: somma in euro dei contributi che gli studenti devono versare; – Importo Pagato: somma in euro dei contributi che gli studenti hanno effettivamente versato; – CFU Corso: crediti ottenuti nel corso attuale dello studente; – CFU Altro Corso: crediti ottenuti in corsi diversi da quello attuale dello studente; 14 1 L’Osservatorio Studenti Didattica del MIUR – – – – – – CFU CFU CFU CFU CFU CFU Altro Ateneo: crediti ottenuti in altri atenei; Atenei Stranieri: crediti ottenuti all’estero; Stage: crediti ottenuti da attività di stage; Validi: crediti validi per la carriera attuale; Totali: crediti totali ottenuti dallo studente; Totali Validi: crediti totali validi ottenuti dallo studente. • Cubo Iscritti – Iscritti: numero di iscrizioni; – Media CFU : misura calcolata come CFU totali / Iscritti; – Importo Dovuto: somma in euro dei contributi che gli studenti devono versare; – Importo Pagato: somma in euro dei contributi che gli studenti hanno effettivamente versato; – CFU Corso: crediti ottenuti nel corso attuale dello studente; – CFU Altro Corso: crediti ottenuti in corsi diversi da quello attuale dello studente; – CFU Altro Ateneo: crediti ottenuti in altri atenei; – CFU Atenei Stranieri: crediti ottenuti all’estero; – CFU Stage: crediti ottenuti da attività di stage; – CFU Validi: crediti validi per la carriera attuale; – CFU Totali: crediti totali ottenuti dallo studente; – CFU Totali Validi: crediti totali validi ottenuti dallo studente. • Cubo Usciti – Laureati: numero di laureati; – Media A.A. Uscita: crediti totali validi ottenuti dallo studente; – Usciti: numero di usciti. 1.3 Spedizioni ed Eventi La carriera di una persona all’interno del Sistema Universitario Italiano è soggetta ad un insieme di eventi raccolti all’interno di gruppi omogenei, indicati come tipo spedizione. I file inviati per una particolare tipologia di spedizione dichiarata nella testata, possono contenere più tipologie di evento tra quelli associati alla spedizione. • Avvio carriere – Ingresso (evento IN): una persona entra per la prima volta nel sistema universitario italiano post 509/99. I possibili eventi di accesso a tale sistema sono: · conseguimento del titolo di diploma di scuola superiore italiano o straniero (immatricolati puri); · conseguimento di un titolo di studio di livello universitario estero; · conclusione, per conseguimento di titolo o per rinuncia o per decadenza, di una carriera ante 509/99; · passaggio da un corso di laurea ante 509/99 a un corso post 509/99. 1.3 Spedizioni ed Eventi – – 15 Avvio nuova carriera (evento AC): una persona che accede nuovamente a un corso di laurea post 509/99 avendo concluso una carriera i cui dati sono già presenti nel Sistema Anagrafe Nazionale Studenti. Un caso tipico sarebbe l’evoluzione di una laurea triennale in una laurea specialistica. Avvio nuova carriera con anagrafica (evento IS): una persona che accede nuovamente a un corso di laurea post 509/99 avendo concluso una carriera nel sistema universitario italiano post 509/99 con decadenza, rinuncia o conseguimento titolo. Se per questa persona non è stata ancora caricata la carriera post 509/99, si possono spedire i dati anagrafici legandoli a questo evento. • Eventi di carriera – Iscrizione annuale (evento IA): iscrizione che NON va effettuata all’immatricolazione o all’avvio di una nuova carriera, né in seguito ad un passaggio o trasferimento in ingresso. – Passaggio di corso: modifica del codice identificativo del corso di studio, cui è legata la carriera attiva di una persona. Tale variazione deve essere distinta secondo quattro tipologie: · Passaggio di corso vero e proprio (evento PC): lo studente cambia il corso di studio cui è iscritto (ad esempio, da Scienze Giuridiche passa a Scienze Economiche). · Passaggio di ordinamento (evento PO): uno studente cambia l’ordinamento (ID RAD) cui è associato (ad esempio passa dall’ordinamento del 2009/2010 all’ordinamento del 2014/2015, perché ha perso alcuni anni di iscrizione a causa di una sospensione per malattia), il corso (codicione) rimane invariato. I CFU sostenuti prima del passaggio NON vengono considerati validi ai fini della carriera (sarà necessario comunicare i CFU convalidati tramite la spedizione 3). NB: Nel caso di invio di un evento PO senza cambio ID RAD, i CFU sostenuti prima del passaggio rimangono validi. · Passaggio di regolamento o Anno validità offerta formativa annuale (evento PP): uno studente cambia l’anno di validità dell’offerta formativa annuale, l’ordinamento (ID RAD) cui è associato non cambia, il corso (codicione) rimane invariato. I CFU sostenuti prima del passaggio restano validi. NB: È possibile utilizzare questo evento anche per casi particolari di passaggio di ordinamento in cui rimangono validi i crediti sostenuti prima del passaggio. · Variazione del curriculum (evento VC): uno studente entra nel sistema ANS e gli viene assegnato un curriculum generico, se non diversamente indicato. Questo comporta che la prima scelta di curriculum (ed eventuali scelte successive) debba essere comunicata mediante un evento VC. Il codicione e l’anno di riferimento per la chiave anagrafe del curriculum scelto rimangono inalterati. Nel caso in cui il corso sia senza curricula non è possibile legare lo studente ad una chiave anagrafe diversa da quella del corso generico. · Variazione di sede (evento VS): uno studente chiede di spostarsi presso una sede diversa dello stesso corso di studio. Oltre ai dati amministra- 16 1 L’Osservatorio Studenti Didattica del MIUR – – – – tivi non sono richieste le informazioni correlate ad un eventuale test di ingresso, perché lo studente è già associato al corso in esame, né viene domandata la situazione debiti/crediti, perché lo studente non ha cambiato corso. · Variazione di classe (evento VI): nel caso di un corso interclasse D.M. 270/04 uno studente chiede di cambiare la classe di afferenza del proprio corso di studio. Oltre ai dati amministrativi non sono richieste le informazioni correlate ad un eventuale test di ingresso, perché lo studente è già associato al corso in esame, né viene domandata la situazione debiti/crediti, perché lo studente non ha cambiato corso. Trasferimento in uscita (evento TU): abbandono di un ateneo, per proseguire la carriera presso un altro ateneo (partecipante all’Anagrafe Nazionale Studenti). Trasferimento in ingresso (evento TI): arrivo di uno studente in Ateneo che prosegue una carriera attivata presso un altro (partecipante all’Anagrafe Nazionale Studenti). Sospensione (evento SO): uno studente sospende la propria carriera. La richiesta di sospensione deve essere sostenuta con certificati opportuni ed ammessa dal Regolamento Didattico dell’ateneo. È necessario l’invio della spedizione 5 soltanto per le sospensioni che terminano durante l’anno, cioè per la sospensione infrannuale. Ricognizione (evento RI): ricostruzione di Anni di Iscrizione mancanti, dovuti al mancato rinnovo dell’iscrizione. • Crediti/Debiti – Ottenimento CFU o diminuzione debiti (evento CD): verbalizzazione di: · attività didattiche superate che hanno portato ad ottenere nuovi CFU; · registrazione di certificazione operata da altro ente (Università Straniera, Struttura di Stage o Tirocinio, etc.); · debito colmato legato all’iscrizione ad un certo corso di studio. – Annullamento CFU o reintroduzione debiti (evento AN): a causa dell’annullamento di un esame superato, ad esempio, è possibile che vengano annullati parte dei crediti che lo studente ha acquisito, oppure che vengano reintrodotti dei debiti che risultavano colmati. – Certificazione CFU o debiti in ingresso ad un corso di studio (evento DC): si ha un invio di debiti e crediti anche all’ingresso di uno studente in un corso di studio, perché, ad ogni accesso ad un nuovo corso devono essere certificati eventuali debiti che lo studente può avere, il cui ammontare dipende dal corso, ed eventuali crediti, che ai fini del nuovo corso gli vengono riconosciuti. • Chiusura carriera – Conseguimento titolo (evento CC): conclusione attesa di una carriera, ovvero ottenimento del titolo di studio. – Conseguimento senza titolo (evento CC): fine di una carriera dovuta a: · decadenza; · decesso; · rinuncia esplicita; · rinuncia implicita; 1.3 Spedizioni ed Eventi · · · · 17 prosecuzione all’estero; passaggio a corso ante riforma; prosecuzione in struttura non gestita; chiusura per irregolarità amministrative. Tutti questi eventi si possono riassumere nell’unico evento di chiusura carriera ma con tipologia diversa. • Variazione dati da storicizzare – Modifica dati anagrafici variabili (evento DA), in seguito a richiesta dello studente (ad esempio variazione del comune di residenza). – Integrazione dati titolo (evento DS e UN), di scuola superiore oppure di livello universitario o post-universitario. – Variazioni delle informazioni di natura amministrativa (evento PA) dovute a: · ricalcolo tasse, ad esempio in seguito all’attribuzione di un esonero; · cambiamento degli addebiti, perché sono state aggiunte ulteriori tasse da pagare; · registrazione di avvenuti pagamenti; · modifica dell’impegno; · variazione dell’anno di iscrizione. 1.3.1 Modalità di invio dei dati Un Ateneo, prima di spedire i primi dati, deve dichiarare esplicitamente se intende spedire le informazioni tramite la modalità ad eventi o tramite la modalità del rinvio totale dei dati. La scelta effettuata varrà per tutte le schede spedite e sarà modificabile solo dietro richiesta scritta da parte dell’Ateneo stesso. In funzione della modalità di invio adottata da un Ateneo, cambiano anche le tipologie di invio ammesse. Invio ad eventi La modalità di invio ad eventi garantisce spedizioni di dati incrementali (le informazioni già inviate non devono essere rispedite) ed un’immagine istantanea di ciò che è accaduto ad una carriera. Ad esempio, non sono persi i passaggi multipli nel corso di un anno accademico, vengono registrati con esattezza i flussi delle tasse per i singoli studenti e si ha l’immagine esatta del ritmo con cui le persone procedono nel sostenere i propri esami di profitto. Rinvio totale Nel caso si adotti la modalità di rinvio totale dei dati, le informazioni sono spedite fornendo l’immagine della carriera nel momento in cui la fotografia viene scattata per l’invio. In Figura 1.6 è possibile vedere la struttura della testata delle schede. In Figura 1.7 viene mostrato l’inizio di ogni record, che contiene le indicazioni dell’evento, la data dell’evento stesso e il codice fiscale cui esso fa riferimento (tale codice non è presente nel sistema informativo soltanto se l’evento è un Ingresso, altrimenti deve essere già stato caricato). 18 1 L’Osservatorio Studenti Didattica del MIUR Figura 1.6. Testata delle schede 1.3.2 Modalità di caricamento dei dati nel sistema Tramite la sezione Upload del sito dell’Osservatorio, gli atenei possono procedere alla trasmissione dei file (txt o XML) secondo le diverse tipologie di spedizione, in cui sono stati raggruppati gli eventi omogenei, che scandiscono la carriera di uno studente. Una volta inviato un file, gli atenei vedranno visualizzato un resoconto che ha lo scopo di evidenziare lo stato del file inviato ed eventuali problemi riscontrati. Il sistema, una volta che ha accettato il file, procede all’analisi del medesimo ed al caricamento delle informazioni in esso contenute. In Figura 1.8 vengono schematizzati il flusso dei dati e le elaborazioni cui sono soggetti. 1.3 Spedizioni ed Eventi Figura 1.7. Variabili presenti all’inizio del record Figura 1.8. Flusso dei dati ed elaborazioni cui sono soggetti 19 20 1 L’Osservatorio Studenti Didattica del MIUR Come possiamo notare, il primo passaggio consiste nel caricare i dati nella Staging Area; tale operazione viene effettuata operando dei controlli formali, analizzando la correttezza delle codifiche da inserire, validando il codice fiscale e verificando la presenza dei corsi di studio dichiarati nel sistema OFF.F. I dati vengono, poi, processati per essere inseriti nelle strutture dati del Data Mart. Al termine del caricamento, l’ateneo può accedere nell’area Riepilogo File dove è possibile verificare lo stato di caricamento del file ed effettuare il download di un file in formato testo, contenente l’elenco degli errori riscontrati. 2 La Business Intelligence e Pentaho Questo secondo capitolo descrive la Business Intelligence e il software Pentaho. Nel seguito della trattazione verranno illustrate le caratteristiche principali dei sistemi di Data Warehouse e Data Mining, insieme alle altre funzionalità offerte dai processi di BI. Saranno delineati, in maniera accurata, le modalità di conduzione di analisi dei report e dei dashboard ottenibili tramite Pentaho. 2.1 Cos’è la Business Intelligence Il sistema informativo di un’azienda può essere diviso in due categorie, ovvero sistema direzionale e sistema operazionale, che interagiscono tra di loro in modo continuo e attivo. Il sistema decisionale comprende le attività relative alla definizione degli obiettivi da raggiungere, al controllo dei risultati ottenuti e alla definizione delle azioni correttive. Il sistema operazionale comprende, invece, le attività esecutive. Vi è, quindi, un continuo passaggio di dati e informazioni tra queste due macrocategorie. Per “dato” si intende l’informazione ad un livello atomico, elementare, mentre con il termine “informazione”, si indica l’elaborazione (che deve essere chiara e accessibile) di dati al fine di ottenere conoscenza sull’oggetto e sull’evento indagati. I dati elementari messi in relazione tra loro o aggregati generano nuove informazioni. Essi non sono stabili ma variabili nel tempo, in funzione dei soggetti e della loro capacità d’uso; ecco perchè nel passaggio di informazioni e di dati vi sono parecchie difficoltà. A titolo di esempio, alcune possibili difficoltà sono le seguenti: • si ottengono risultati diversi oppure contradditori; • aumentano i dati ma le aziende (e, di conseguenza, il management corrispondente), continuano ad essere povere di informazioni. Per cercare di ovviare a questo problema entra in gioco la Business Intelligence (nel seguito, BI). Quest’ultima è, infatti, la capacità di un’organizzazione di capire il proprio business (processi, clienti, risorse, sistemi, contesto competitivo) per intervenire su di esso in modo consapevole, tempestivo ed efficiente. La BI indica, cioè, un insieme di metodi e strumenti atti alla raccolta e all’analisi dei dati. Il suo scopo è quello di estrarre informazioni utili dai dati stessi in maniera tale da decidere i processi decisionali di un’organizzazione. Inoltre, il successo di una qualsiasi 22 2 La Business Intelligence e Pentaho attività, specie nel business, dipende in massima parte dalla capacità di prevedere il futuro, cogliendone i segni anticipatori. Lo sviluppo delle applicazioni di Business Intelligence è stato il primo, grande, risultato verso l’individuazione e lo studio dei segnali nascosti. La BI è, a conti fatti, un insieme di metodologie, processi, architetture e tecnologie che trasformano dati grezzi in informazioni significative e utili, attraverso l’ utilizzo di Data Warehouse e Data Mining per l’ estrazione e l’ analisi dei dati. Le applicazioni di Business Intelligence, se progettate bene e se basate su dati aggiornati, offrono una visione approfondita del passato o anche del presente, identificando gli schemi che determinano comportamento e prestazioni delle funzioni progettistiche e aziendali. 2.1.1 Introduzione dei concetti e illustrazione di un sistema di BI Un sistema di Business Intelligence fornisce un’immediata capacità di visione delle “informazioni principali” e si occupa dell’analisi dettagliata dei dati di interesse per comprendere andamenti, eccezioni e anomalie. Esso rende facile e intuitivo focalizzare l’attenzione sui KPI (Key Performance Indicators), indici identificati come fattori critici per il monitoraggio dello stato di avanzamento degli obiettivi dell’organizzazione. I sistemi di BI, in genere, supportano in dettaglio strumenti di statistica, previsioni, analisi predittiva e correlazioni. Essi aiutano a definire e verificare gli scenari di business che possono, quindi, essere assunti come input per il cambiamento dei processi. Ogni attività di business è diversa e ciascuna possiede una propria strategia per la crescita e il successo. Una piattaforma di BI ben progettata può fornire un notevole valore aggiunto a ogni organizzazione rendendola competitiva nel mercato globale. Essa fornisce, infatti, differenti viste di business e si adatta alle necessità dei singoli utenti. L’architettura delle applicazioni di Business Intelligence, illustrato in Figura2.1, comprende diversi componenti: Figura 2.1. Architettura di un sistema di BI • • Strumenti ETL, che consentono di estrarre dati da fonti eterogenee (database transazionali, risorse web, file XML o file flat, sensori), e di trasformarli (mediante integrazione, data cleaning, data structure) secondo una struttura dati o uno schema scelto per la rappresentazione, e di caricarli in un data warehouse. Data Warehouse (DW) che memorizza i dati storici dell’organizzazione per scopi di analisi; 2.1 Cos’è la Business Intelligence 23 • Server OLAP (On-Line Analytical Processing), che permette l’esplorazione rapida e flessibile di grandi quantità di dati, salvati nel Data Warehouse, con tecniche di analisi multidimensionale. • Strumenti di reporting, dashboard e differenti client OLAP, che visualizzano le informazioni in modo grafico e in forma riassuntiva (tabelle, grafici) a beneficio dei decision-maker e dei manager. • Strumenti di Data-Mining, per recuperare automaticamente pattern e individuare correlazioni nascoste nei dati. Inoltre, un sistema di BI deve avere le seguenti caratteristiche: • Facilità d’uso: esso deve rappresentare i dati in un formato che sia facile da leggere e da interpretare. • Velocità: esso deve consentire di trattare grandi moli di dati con tempi di risposta quasi istantanei, grazie alle tecniche orientate all’analisi, piuttosto che all’aggiornamento. • Integrazione: esso deve integrare tra loro dati provenienti da fonti differenti. Se i dati non sono puliti e affidabili, prima di inserirli nel database devono passare attraverso un processo di ETL (Extract, con Transformation and Loading). • Sicurezza: esso deve consentire di controllare in maniera sicura,e allo stesso tempo accurata e flessibile, l’accesso ai dati. 2.1.2 Data Warehouse Tra i sistemi di supporto alle decisioni, i sistemi di Data Warehousing sono quelli più comuni. Il Data Warehousing è una collezione di metodi, tecnologie e strumenti di ausilio al knowledge worker (dirigente, amministratore, gestore, analista) per condurre analisi dei dati finalizzate all’attuazione di processi decisionali e al miglioramento del patrimonio informativo. Le possibili aree di utilizzo possono essere: • commercio per l’analisi delle vendite e dei reclami, il controllo di spedizioni e la questione degli inventari. • manifattura per il controllo dei costi di produzione, dei fornitori e degli ordini. • servizi finanziari per l’analisi del rischio e delle carte di credito. • trasporti per la gestione dei mezzi. • telecomunicazioni per l’analisi del flusso delle chiamate e del profilo dei clienti. • sanità per l’analisi dei ricoveri e delle dimissioni. Il “Data Warehouse”(nel seguito DW) è una collezione di dati (Figura2.2) di supporto per il processo decisionale che presenta le seguenti caratteristiche: è orientata ai soggetti di interesse. è integrata e consistente, poichè si appoggia a più fonti di dati eterogenee, restituendo una visione unificata. • è rappresentativa dell’evoluzione temporale. • è non volatile; infatti, non sono necessarie tecniche sofisticate di gestione delle transazioni. • • 24 2 La Business Intelligence e Pentaho Figura 2.2. Data Warehouse In questo processo vi sono, inoltre, le interrogazioni “OLTP (On-Line Transactional Processing)” e “OLAP (On-Line Analytical Processing)”. Le prime riguardano le transazioni nell’ambito dei database relazionali, le relative metodologie e i corrispettivi concetti che consentono lettura e la scrittura, garantendo atomicità, consistenza, isolamento e non volatilità dei dati. Le seconde, invece, designano un insieme di tecniche software per l’analisi interattiva e veloce di grandi quantità di dati, che è possibile esaminare in modalità piuttosto complesse. Gli strumenti OLAP si differenziano da quelli OLTP per il fatto che i primi hanno come obiettivo la performance nella ricerca e l’esecuzione di interrogazioni quanto più articolate sia possibile; i secondi, invece, mirano ad una garanzia di integrità e sicurezza delle transazioni. L’idea alla base del Data Warehousing è quella di separare l’elaborazione di tipo analitico da quella legata alle transazioni. Infatti, mescolare tali interrogazioni potrebbe portare a inevitabili rallentamenti che renderebbero insoddisfatti gli utenti. Esistono varie architetture di Data Warehouse. Le principali tra queste sono le seguenti: • • architettura ad un livello; in questo caso è presente soltanto il database operazionale, il Data Warehouse è, invece, soltanto virtuale. architettura a due livelli; in questo caso son presenti sia il database operazionale che il Data Warehouse; quest’ultimo è alimentato proprio dal database operazionale. 2.1 Cos’è la Business Intelligence 25 • architettura a tre livelli; in questo caso è presente il database operazionale che alimenta il livello dei dati riconciliati che, a sua volta, alimenta il Data Warehouse. Un’ architettura per Data Warehouse dovrebbe avere i seguenti requisiti: • separazione: l’elaborazione analitica e quella transazionale devono essere mantenute il più possibile separate. • scalabilità: l’architettura hardware e software deve poter essere facilmente ridimensionata a fronte della crescita nel tempo dei volumi di dati da gestire ed elaborare e del numero di utenti da soddisfare. • estendibilità: deve essere possibile accogliere nuove applicazioni e tecnologie senza riprogettare integralmente il sistema. • sicurezza: il controllo sugli accessi è essenziale a causa della natura strategica dei dati memorizzati. • amministrabilità: la complessità dell’attività di amministrazione non deve risultare eccessiva. Per essere “alimentato” il DW ha bisogno di strumenti di ETL (Extraction, Transformation and Loading). Il loro scopo è alimentare il DW dopo, però, aver effettuato la “pulizia” dei dati a disposizione. 2.1.3 Data Mining Il Data Mining, a differenza del DW visto in precedenza, è un processo di “estrazione di conoscenza” da banche dati di grandi dimensioni tramite l’applicazione di algoritmi che individuano le associazioni “nascoste” tra le informazioni e le rendono visibili. Il software consente agli utenti di analizzare i dati di molte dimensioni o diversi punti di vista, categorizzare e riassumere le relazioni individuate. Tecnicamente, il data mining è il processo di ricerca di correlazioni o modelli tra decine di campi in grandi basi di dati relazionali. Mentre la tecnologia dell’informazione su larga scala si è evoluta in sistemi di transazione separati da quelli analitici, il data mining fornisce il collegamento tra i due. I software di data mining analizzano i rapporti e i modelli in dati delle transazioni memorizzati basati su query degli utenti a tempo indeterminato. Strettamente collegato al concetto di Data Mining vi è quello di Pattern. I pattern, per definizione, sono una rappresentazione sintetica e ricca di semantica di un insieme di dati. Un pattern dovrebbere essere: • valido sui dati con un certo grado di confidenza. • comprensibile dal punto di vista sintattico e semantico, affinchè un utente lo possa interpretare. • precedentemente sconosciuto e potenzialmente utile, affinchè un utente possa intraprendere azioni di conseguenza. Esistono diverse tecniche di Data Mining; le più importanti sono: • regole associative: consentono di determinare le regole di implicazione logica presenti in una base di dati e quindi, di individuare i gruppi di affinità tra oggetti. 26 • • • • 2 La Business Intelligence e Pentaho classificatori: consentono di derivare un modello per la classificazione di dati secondo un insieme di classi assegnate a priori. alberi decisionali: sono particolari classificatori che permettono di identificare, in ordine di importanza, le cause che portano al verificarsi di un evento. clustering: consentono di raggruppare gli elementi di un insieme, a seconda delle loro caratteristiche, in classi non assegnate a priori. serie temporali: permettono l’individuazione di pattern ricorrenti o atipici in sequenze di dati complesse. Un processo di data mining si compone di “cinque fasi” principali: • • • • • estrarre, trasformare e caricare i dati delle transazioni nel Data Warehouse. memorizzare e gestire i dati in un sistema di database multidimensionale. fornire l’accesso ai dati. Analizzare i dati per il software applicativo. Presentare i dati in un formato utile, ad esempio un grafico o una tabella, come mostrato in figura 2.3 . Figura 2.3. Esportazione dei dati Prima di parlare delle attività principali legate al Data Mining, è necessario effettuare una distinzione tra due tipi di sistemi: • • sistemi predittivi, che utilizzano alcune variabili per predire il valore incognito o futuro di altre variabili; sistemi descrittivi, che devono trovare dei pattern interpretabili dall’uomo che descrivano i dati. 2.2 Pentaho 27 2.2 Pentaho In rete oramai spopola il marchio Pentaho come uno dei leader tra le suite di Business Intelligence, soprattutto riguardo l’ambito open source. Ma che cosa è Pentaho? Pentaho è una piattaforma di Business Intelligence (BI) open source fondata nel 2004 da un team di professionisti della Business Intelligence provenienti da aziende di successo come Business Objects, Cognos, Hyperion, IBM, Oracle Corporation, e SAS Institute. L’obiettivo perseguito da questo software non è quello di fornire un’alternativa open source, ma di proporre una soluzione migliore rispetto alle offerte commerciali in termini di caratteristiche, funzioni e benefici, attraverso l’integrazione, in un’unica piattaforma, di popolari progetti open source come JFreeReport, Kettle, Mondrian e Weka. Pentaho vanta di un’ottima interfaccia grafica, che serve per creare report, effettuare analisi e generare dashboard. Tutto questo utilizzando i principi della Business Analytics e tutti i vantaggi che essa comporta. Viene anche visto come un oggetto pensato appositamente per collegare molti “raggi” tra loro. Questi oggetti, nella BI, a volte, sono simili, altre volte diversissimi, e Pentaho li collega attraverso numerosi strumenti. Di seguito vediamo le quattro caratteristiche più importanti di Pentaho: • Versatilità; infatti l’insieme dei prodotti offerti da Pentaho comprende strumenti completi per aiutare lo sviluppatore nell’implementazione dell’intero processo di BI. • Community e Supporto; Pentaho vanta una nutrita community di sviluppatori. Questo si traduce in diversi vantaggi per gli utenti. • Collaborazione; utilizzare Pentaho significa soprattutto imparare un nuovo modo di far “collaborare” i linguaggi già conosciuti. • Scalabilità e personabilità. L’utilizzo di Pentaho consente di effettuare un processo di BI assolutamente “modulare” che può crescere ed adattarsi ai cambiamenti repentini della situazione aziendale che deve essere analizzata. Il framework messo a disposizione da Pentaho permette di sviluppare soluzioni complete per la BI. Più specificatamente: • La piattaforma è process-centric perchè il controllore centrale è il Workflow engine. Quest’ultimo usa le definizioni dei processi per costruire il processo di Business Intelligence che esegue nella piattaforma. Il processo può essere facilmente personalizzato ed è possibile aggiungere nuovi processi. • La piattaforma è solution-oriented perchè le sue operazioni sono specificate nel processo di definizione e nei documenti che ne specificano ogni attività. La piattaforma è composta da: • un framework di BI, che fornisce procedure per logging, auditing, security, scheduling, ETL, web service e attribute repository. • alcuni componenti di BI, che consentono di gestire il reporting, l’analisi, il workflow e i dashboard e processi di data mining. 28 • 2 La Business Intelligence e Pentaho alcuni workbench di BI, che si tratta di un insieme di strumenti di progettazione e di amministrazione che permettono agli analisti e ai progettisti di creare report, dashboard, modelli di analisi e processi di Business Intelligence. 2.2.1 Analisi degli strumenti e delle funzionalità di BI In Figura2.4 viene mostrata l’architettura del software Pentaho. Figura 2.4. Architettura del software Pentaho • Thin Client : Pentaho User Console è la principale interfaccia web-based che permette all’utente finale di visualizzare, creare e pianificare report, report interattivi e dashboard. Le sue componenti sono: – Interactive Reporting: fornisce un reporting altamente interattivo e facile da usare, per creare semplici report; consente, inoltre, di accedere alle fonti di dati e metadati di Pentaho. – Analyzer : fornisce un reporting analitico intuitivo e interattivo per far comprendere rapidamente le informazioni, effettuando un ordinamento e filtraggio. – Dashboard Designer : consente agli utenti aziendali di creare ricchi cruscotti interattivi. • Power Tools: Si tratta applicazioni desktop che permettono di creare un ricco reporting dell’ambiente. Le principali componenti di questa area sono: – Schema Workbench: costruisce fonti di dati di analisi per facilitare l’esplorazione e l’analisi dei dati per gli utenti business. – Aggregation Designer : è un ambiente grafico usato per aumentare le prestazioni delle query di analisi, attraverso la creazione di tabelle aggregate. 2.2 Pentaho 29 – Metadata Editor : costruisce fonti di dati e metadati; è una rappresentazione del modello dei dati di un database relazionale in cui si possono creare query senza dover conoscere il linguaggio SQL. – Report Designer : è un ambiente di progettazione visuale che rende facile creare rapidamente report graficamente perfetti, per affrontare le esigenze di tipo operativo, di reporting finanziario e della produzione. – Data Integration: è un ambiente di progettazione intuitivo che fornisce delle potenti facility di estrazione, trasformazione e caricamento dei dati. – Design Studio: viene utilizzato per creare sequenze di azioni; consente la completa personalizzazione e integrazione tra tutti i componenti all’interno di Pentaho. • Server Applications; supporta la Pentaho User Console e soddisfa gli utenti consentendo loro il reporting, analisi e la realizzazione di dashboard e comprende servizi per la sicurezza, la programmazione e l’analisi dei dati. • Server Enterprise Console; supporta la Enterprise Console; include i servizi per la gestione della sicurezza, della programmazione, del repository; consente, oltresı̀, la configurazione del server. • Data Intergration Server ; viene utilizzato per eseguire i lavori di integrazione e trasformazione dei dati e per offrire servizi quali la pianificazione e la gestione gestione dei contenuti. 2.2.2 Creazione dei report Utilizzando Pentaho è possibile creare un semplice report includendo anche grafici che si autogenerano in base ai dati inseriti. Il modulo di Pentaho per il reporting consente: • di accedere direttamente alle fonti di dati; • un’interazione facile e immediata con i report,qualunque sia la tipologia di utenti interessati; • di aggiungere, spostare ed eliminare i campi direttamente all’interno del report; • la formattazione in riga, il filtraggio, l’ordinamento, il raggruppamento, le aggregazioni e i calcoli sommari. La Figura 2.5 mostra l’interfaccia principale per la creazione dei report. Dopo aver scelto i dati, dopo averli raggruppati, e dopo aver seguito tutte le impostazioni viene creato il report. Quest’ultimo può essere modificato in ogni momento, attraverso l’inserimento del titolo o delle immagini, e queste modifiche sono visibili immediatamente. Accanto al report è prevista la presenza di un grafico. Nella prossima sezione, vedremo i vari passaggi da eseguire per effettuare analisi sui report. 2.2.3 Creazione di analisi dei report Uno strumento importante di questo software riguarda la creazione di nuove analisi o dashboard (Figura2.5) visibili sia in forma tabellare sia attraverso vari tipi di grafici. Le principali funzionalità fornite da questo software sono: 30 2 La Business Intelligence e Pentaho Figura 2.5. Interfaccia per la creazione dei report • • • la creazione di analisi dei dati scelti dall’utente. ordinamento e filtraggio avanzato. visualizzazione delle analisi attraverso vari tipi di grafici. Figura 2.6. Creazione di nuove analisi o dashboard Come mostra la Figura 2.7 , in quest’area sono elencati i dati di interesse, raggruppati secondo le dimensioni. Questi dati serviranno per la creazione di analisi; infatti, basta trascinare il nome del dato interessato nell’area centrale e immediatamente si crea una tabella con i dati stessi. Inoltre, è possibile trascinare e combinare i dati a piacere per creare tutte le analisi possibili desiderate. 2.2 Pentaho 31 Figura 2.7. Costruzione dei report 2.2.4 Creare dashboard con Pentaho Un’altra funzione importante del software è la creazione dei “dashboard ”, uno strumento di gestione che consente di misurare determinati valori in modo rapido ed efficiente. Invece di basarsi su rapporti cartacei per prendere decisioni importanti, un cruscotto fornisce informazioni aggiornate e pertinenti attraverso l’utilizzo di una combinazione di grafici e componenti di report. Questi cruscotti, visivi, sono facili da leggere e interpretare e forniscono un accesso rapido alle informazioni che aiutano a rispondere a domande in merito alle prestazioni dei servizi specifici. Il vantaggio sta, ovviamente, nel fatto che essi possono accedere a questo tipo di informazioni facilmente e da qualsiasi luogo attraverso il web. Per creare tali cruscotti interattivi basta semplicemente selezionare il layout, il tema e il contenuto che si desidera visualizzare. Tale contenuto può includere report e grafici e fornisce, anche, la possibilità di aggiungere controlli dinamici per filtrare l’intero contenuto usando un semplice elenco di selezione, come mostrato in Figura 2.8. Figura 2.8. Visualizzazione dei dashboard 2.2.5 Il valore di Pentaho In conclusione, Pentaho Business Analytics è considerato il “best-of-breed ” in soluzioni open source per la gestione e l’analisi dei dati; uno rappresenta, nel campo 32 2 La Business Intelligence e Pentaho dell’open source, la soluzione più innovativa nel settore della Business Intelligence e Analytics. La piattaforma semplifica la raccolta di informazioni e consente agli utenti di analizzare, visualizzare, esplorare i dati e prevedere eventi futuri, trasformando i dati in valore concreto. L’architettura basata su standard aperti permette di estendere le sue numerose funzioni e di incorporare le analisi di business nelle applicazioni aziendali esistenti. In definitiva, grazie a Pentaho, le aziende possono avere analisi, amichevole e, al contempo, sicure, di tutti i dati. 3 Estrazione di conoscenza sui contributi, le immatricolazioni e le lauree relativa al nostro Ateneo Questo terzo capitolo mette in evidenza la conoscenza estratta grazie al lavoro di progettazione svolto a partire dai dati dell’OSD. Nel seguito della trattazione verranno descritte le macro-questioni (nel seguito, MQ) approfondite, rappresentandone gli schemi a stella dei relativi cubi progettati, i Key Performance Indicator (nel seguito, KPI) e la conoscenza estratta. Infine, verranno mostrati i cruscotti creati grazie al tool di Pentaho. 3.1 Premessa La conoscenza di interesse è stata specificata dalla governance di Ateneo (Prorettore delegato alla Didattica, Dirigente Segreteria, Prorettore delegato all’Informatica). È stato, inoltre, possibile usufruire di documenti relativi agli indicatori sulle carriere accademiche degli studenti elaborati dalla commissione didattica della CRUI, e dei documenti dell’Agenzia Nazionale di Valutazione del Sistema Universitario e della Ricerca (ANVUR). Tali documenti hanno l’obiettivo di analizzare e dare evidenza a elementi di criticità al fine di proporre soluzioni relative, principalmente, all’implementazione delle recenti e future disposizioni di legge che comportano ricadute nella progettazione, gestione ed erogazione dell’offerta formativa degli Atenei. I dati fondamentali sono stati quelli dell’Osservatorio Studenti Didattica, a partire dai quali è stato possibile realizzare i cubi e, quindi, i report ed i cruscotti di interesse grazie alla piattaforma di Business Intelligence Pentaho. Inoltre, per meglio comprendere la conoscenza di interesse, abbiamo utilizzato i dati presenti sul sito www.anvur.it, che fornisce elementi interessanti relativi agli indicatori di Ateneo (aggiornati fino al 2014), da cui abbiamo preso spunto per la realizzazione di una serie di report di interesse per la governance. Per approfondire meglio determinate questioni, abbiamo consultato i dati di GOMP, applicazione web-based che utilizza sistemi di collaborazione applicativa (web service) e standard di open data (XML). GOMP offre una serie di moduli che coprono specifiche esigenze degli atenei italiani tra cui una sezione per il Data Warehousing. Le analisi effettuate, riguardanti l’Università Mediterranea di Reggio Calabria, sono state classificate in sette macro-questioni (nel seguito, MQ). Le prime due MQ analizzano, rispettivamente, la provenienza degli immatricolati, in base al Comune 34 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.1. Schema a stella relativo al cubo Immatricolati usato per la MQ1 e alla Provincia di residenza, e la scuola di provenienza degli immatricolati. La terza MQ evidenzia la situazione relativa al livello di internazionalizzazione, un indicatore espressamente richiesto dalla governance. La quarta MQ riguarda la situazione generale degli immatricolati. La quinta e la sesta MQ si soffermano sui laureati e sulle rinunce, informazioni richieste da alcuni indicatori evidenziati dalla governance. La settima MQ analizza la situazione dei contributi, ed integra alcuni risultati ricavati da GOMP, in quanto i dati dell’ODS non erano completi o non erano sufficienti per evidenziare alcuni aspetti riguardanti le richieste delle borse di studio degli ultimi due anni. 3.2 MQ1: Residenza di provenienza immatricolati Per quanto riguarda le analisi relative alla prima macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report. Le dimensioni scelte sono: ResidenzaComune, ResidenzaProvincia, NomeCorsoPubblico, A.A.Corto e Dipartimento. La misura di interesse riguarda il numero di immatricolati. In Figura 3.1 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 3.2.1 Definizione dei KPI e della loro presentazione I Key Performance Indicator sono indici che monitorano l’andamento di processi aziendali; essi si concentrano su quegli aspetti della performance di un’organizzazione che sono i più critici per il suo successo corrente e futuro. Le aziende dovrebbero rivedere regolarmente i loro obiettivi e le loro strategie, e apportare le modifiche appropriate ai loro KPI. Risulta, quindi, comprensibile la scelta di tale approccio per la presentazione dei report di interesse per l’Ateneo, soprattutto in relazione ai cruscotti che vedremo a fine capitolo. Per quanto riguarda la MQ1, è stato scelto di effettuare una valutazione sul numero di immatricolati in base al comune e alla provincia di residenza, misurando, in un secondo momento, l’andamento negli anni o la situazione all’interno dei singoli dipartimenti. 3.2 MQ1: Residenza di provenienza immatricolati 35 Figura 3.2. Immatricolati provenienti dal Comune di Reggio Calabria o da altri Comuni Figura 3.3. Classifica dei Comuni esterni di provenienza 3.2.2 Conoscenza estratta Il primo obiettivo che ci siamo posti è stato quello di identificare il bacino d’utenza della Mediterranea. Nelle Figure 3.2 e 3.3 è possibile vedere, rispettivamente, la percentuale di immatricolati residenti a Reggio Calabria o in altri Comuni, ed i Comuni ordinati secondo il numero di immatricolati. Dai report effettuati si può evincere, come era prevedibile, che la maggior parte degli immatricolati provengono da residenti in altri Comuni, e che la maggior parte dei residenti esterni proviene dai Comuni di Villa San Giovanni, Palmi, Messina, Melito di Porto Salvo, Gioia Tauro, Motta San Giovanni, Lamezia Terme, Rosarno e Taurianova. In Figura 3.4 è possibile osservare l’andamento del numero di immatricolati relativo ai Comuni limitrofi evidenziati in precedenza, a partire dall’anno 2001. Tale report mette in risalto la progressiva diminuizione degli immatricolati vista nel corso degli anni. Nelle Figure 3.5 e 3.6 è possibile vedere, grazie ad un’attività di roll-up effettuata, la percentuale di immatricolati residenti nella Provincia di Reggio Calabria o in altre Province, nonchè le Province ordinate secondo il numero di immatricolati. Questi 36 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.4. Andamento del numero di immatricolati dall’anno 2001 report mettono in risalto il fatto che solo il 20% degli immatricolati provengono da altre Province, in particolare, Catanzaro, Vibo Valentia e Messina. In Figura 3.7 viene mostrato l’andamento del numero di immatricolati per le otto Province principali. È possibile notare un sensibile miglioramento, a partire dall’anno 2013, per quanto riguarda gli immatricolati provenienti da Messina e Cosenza. In Figura 3.8 è possibile osservare, per ogni dipartimento della Mediterranea, una classifica delle principali Province di provenienza degli immatricolati del 2013. Ciò equivale ad effettuare un’operazione di drill-down rispetto ai dipartimenti. Possiamo notare che per il Dipartimento di Giurisprudenza ed Economia vi è un discreto numero di immatricolati provenienti dalla provincia di Vibo Valentia. Gli ultimi due report che riportiamo, hanno l’obiettivo di confrontare il numero di immatricolati residenti in sede e fuori sede per ogni dipartimento (Figura 3.9) e per ogni Corso di Studi della Mediterranea (Figura 3.10) nell’anno 2014. 3.3 MQ2: Scuola di provenienza degli immatricolati 37 Figura 3.5. Immatricolati provenienti dalla Provincia di Reggio Calabria o da altre Province Figura 3.6. Classifica delle Province esterne di provenienza in base al numero di immatricolati Si può notare come, per quanto riguarda le Facoltà di Agraria ed Architettura, la maggior parte degli immatricolati sia fuori sede. 3.3 MQ2: Scuola di provenienza degli immatricolati Per le analisi relative alla seconda macro-questione è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report relativi alla scuola di provenienza degli immatricolati. Le dimensioni scelte sono: TipoDiploma, MacroTipoDiploma, NomeCorsoPubblico ed A.A.Corto. La misura di interesse riguarda, ancora, il numero di immatricolati. In Figura 3.11 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 3.3.1 Definizione dei KPI e della loro presentazione I KPI individuati per la seconda macro-questione hanno l’obiettivo di mettere in luce aspetti relativi agli studi scolastici degli immatricolati, considerando il ma- 38 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.7. Andamento del numero di immatricolati a partire dall’anno 2001 Figura 3.8. Provincia degli immatricolati per Dipartimento relativa all’anno 2013 3.3 MQ2: Scuola di provenienza degli immatricolati 39 Figura 3.9. Immatricolati residenti in sede e fuori sede per ogni dipartimento Figura 3.10. Immatricolati residenti in sede e fuori sede per ogni Corso di Studi crotipo ed il tipo diploma. Questa valutazione è di particolare importanza per la governance in quanto è interessante osservare eventuali differenze sull’andamento delle immatricolazioni, oppure valutare l’attrattività di un Corso di Studi in base agli studi pre-universitari effettuati. Sulla base di questi report è facile intuire il grado di interesse per un determinato Corso di Studi, oppure osservare possibili riscontri in seguito ad eventuali corsi di orientamento scolastici. 40 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.11. Schema a stella relativo al cubo Immatricolati usato per la MQ2 Figura 3.12. Andamento degli immatricolati con maturità liceale e tecnica 3.3.2 Conoscenza estratta Nelle Figure 3.12 e 3.13 è possibile visualizzare l’andamento degli immatricolati a partire dall’anno 2005 in base al macrotipo di diploma, considerando la maturità liceale, la maturità tecnica, la maturità professionale e la magistrale. Come si evince dalle figure, la maggior parte degli immatricolati proviene da un percorso di studi liceale e tecnico. In entrambi i report è riscontrabile un notevole calo del numero di immatricolati dal 2012 che, però, sta lievemente risalendo negli ultimi anni. I successivi report mostrano l’andamento in base al tipo di diploma a partire dall’anno 2005. Nelle Figure 3.14 e 3.15 è possibile osservare che la maggior parte degli immatricolati proviene dal liceo scientifico mentre la maturità classica è riuscita a tornare in seconda posizione solo negli ultimi due anni. In Figura 3.16 vediamo l’andamento delle immatricolazioni ai corsi di Ingegneria in base al macrotipo di diploma (maturità liceale e maturità tecnica) a partire dall’anno 2008. In particolare, soffermandosi sui corsi triennali di Ingegneria dell’Informazione e di Ingegneria Civile-Ambientale, è possibile constatare una ripresa 3.4 MQ3: Livello di internazionalizzazione 41 Figura 3.13. Andamento degli immatricolati con maturità professionale e magistrale Figura 3.14. Andamento degli immatricolati con maturità liceale e classica delle immatricolazioni a partire dal 2013. In Ingegneria dell’Informazione, inoltre, vediamo che la maggior parte degli immatricolati degli ultimi anni proviene dai licei. 3.4 MQ3: Livello di internazionalizzazione Per quanto riguarda le analisi relative alla terza macro-questione è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di 42 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.15. Andamento degli immatricolati con maturità non liceali Figura 3.16. Attrattiva Corso di Studi in base al macrotipo di diploma report per fornire un quadro generale sul livello di internazionalizzazione presente nella Mediterranea. Le dimensioni scelte sono: TipoDiploma, NomeCorsoPubblico e A.A.Corto. La misura di interesse riguarda il numero di immatricolati. In Figura 3.4 MQ3: Livello di internazionalizzazione 43 Figura 3.17. Schema a stella relativo al cubo Immatricolati usato per la MQ3 Figura 3.18. Andamento degli immatricolati con diploma estero 3.17 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 3.4.1 Definizione dei KPI e della loro presentazione Per livello di internazionalizzazione si intende il numero di immatricolati che hanno conseguito il diploma di maturità all’estero. I KPI individuati per questa macroquestione si soffermano sull’andamento temporale delle immatricolazioni, mettendo, poi, in risalto i corsi con più immatricolati con diploma conseguito all’estero. 3.4.2 Conoscenza estratta In Figura 3.18 è possibile osservare l’andamento degli immatricolati con diploma conseguito all’estero dal 2001 in poi. Possiamo constatare, come era prevedibile, che il numero di immatricolati è particolarmente basso, e presenta un andamento altalenante che si sta gradualmente abbassando. 44 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.19. Classifica dei Corsi di Studio in base al numero di immatricolati con diploma estero In Figura 3.19, invece, è possibile osservare i Corsi di Studio ordinati secondo il numero di immatricolati con diploma estero. Nelle prime quattro posizioni vi sono i Corsi delle Facoltà di Giurisprudenza ed Architettura, un risultato sicuramente condizionato dal fatto che queste Facoltà, soprattutto Giurisprudenza, presentano un alto numero di immatricolati rispetto alle altre Facoltà della Mediterranea. 3.5 MQ4: Situazione relativa agli immatricolati Per quanto riguarda le analisi relative alla quarta macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report per fornire un quadro generale sugli immatricolati della Mediterranea. Le dimensioni scelte sono: MacroTipoLaurea, AnnoAccademico, NomeCorsoPubblico, Facoltà, Dipartimento, Ateneo e A.A.Corto. La misura di interesse riguarda il nu- 3.5 MQ4: Situazione relativa agli immatricolati 45 Figura 3.20. Schema a stella relativo al cubo Immatricolati usato per la MQ4 mero di immatricolati. In Figura 3.20 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 3.5.1 Definizione dei KPI e della loro presentazione Dai report presentati finora si è riscontrato un discreto calo del numero di immatricolati nel corso degli anni. In questa sezione, quindi, inizialmente ci soffermeremo su questo aspetto, presentando KPI che valutano la situazione nel corso del tempo sotto diversi punti di vista. In seguito integreremo un report che rappresenta un aspetto critico riguardante l’attrattività dei Corsi di Studio biennali, in particolare, dei Corsi di Studio del Dipartimento di Ingegneria dell’Informazione, delle Infrastrutture e dell’Energia Sostenibile (nel seguito, DIIES). 3.5.2 Conoscenza estratta Nelle Figure 3.21 e 3.22 viene evidenziato l’andamento del numero di immatricolazioni dal 2010 al 2014, rispettivamente, in base all’Area ed in base al Corso di Studio. Possiamo notare che l’Area che ha perso più immatricolati dal 2010 al 2014 è quella di Giurisprudenza. Essa, infatti, dal 2010 al 2014 ha perso quasi la metà delle immatricolazioni. L’Area di Agraria, invece, non manifesta un andamento problematico rispetto alle altre. È interessante notare come l’Area di Architettura ha visto il più basso numero di immatricolati, rispetto alle altre Aree, negli anni 2012 e 2013, ma ha avuto una ripresa importante nell’anno 2014. Per quanto riguarda il report riguardante i Corsi di Studio è possibile vedere nel dettaglio l’andamento per ogni Corso di Studio della Mediterranea. In Figura 3.23 ci si sofferma sui corsi del DIIES monitorando l’andamento delle immatricolazioni dal 2008 al 2015. Dal grafico si evince come sussista un lento decremento delle immatricolazioni per quanto riguarda i corsi biennali, mentre la situazione relativa ad Ingegne- 46 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.21. Andamento del numero di immatricolazioni per ogni Area ria dell’Informazione risulta essere migliore, manifestando un calo nel 2014, subito recuperato l’anno successivo. La situazione generale relativa al macrotipo di Laurea della Mediterranea, come possiamo notare in Figura 3.24, manifesta una situazione duale rispetto alla precedente. Dal 2006, infatti, i corsi triennali hanno manifestato un progressivo calo fino al 2015. I corsi biennali, al contrario, vedono un lento incremento del numero di immatricolati a partire dal 2013. Il report seguente, riportato in Figura 3.25, vede messi a confronto, per ogni anno a partire dal 2010, il numero di immatricolati, il numero di iscritti ed il numero di iscritti regolari1. Un altro dato di interesse per la governance riguarda l’attrattività dei Corsi di Studio biennali. Questa analisi fornisce informazioni relative agli immatricolati nei Corsi di Studio biennali che hanno conseguito una laurea di primo livello presso altri Atenei. I dati ottenuti sottolineano una condizione poco incoraggiante rispetto ad altre realtà. In Figura 3.26 riportiamo i risultati relativi ai singoli Corsi di Studio biennali dell’Area di Ingegneria. 1 Con il termine studenti regolari si intendono quegli studenti iscritti al sistema da un numero di anni inferiore o uguale alla durata legale del corso di riferimento. Fonte: elaborazione su dati MIUR-URST e AFAM-Ufficio di Statistica. 3.5 MQ4: Situazione relativa agli immatricolati Figura 3.22. Andamento del numero di immatricolazioni per ogni Corso di Studio 47 48 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.23. Andamento del numero di immatricolazioni per i corsi del DIIES Figura 3.24. Andamento del numero di immatricolazioni in base al macrotipo di laurea 3.6 MQ5: Situazione relativa ai laureati 49 Figura 3.25. Confronto tra immatricolati, iscritti ed iscritti regolari Figura 3.26. Attrattività dei Corsi di Studio biennali di Ingegneria 3.6 MQ5: Situazione relativa ai laureati Per quanto riguarda le analisi relative alla quinta macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report per fornire un quadro generale sui laureati. Le dimensioni scelte sono: MacroTipoLaurea, FasciaVotoLaurea, Facoltà, NomeCorsoPubblico e A.A.Corto. Le misure di interesse riguardano il numero di laureati e la media A.A. uscita, ovvero il numero medio di anni necessario per ottenere la laurea. In Figura 3.27 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 3.6.1 Definizione dei KPI e della loro presentazione I KPI individuati per la MQ5 hanno considerato l’andamento del numero di laureati e del numero medio di anni per conseguire la laurea, sotto diversi punti di vista. In particolare, è stato messo in evidenza l’evolversi dei valori di tali misure, in base alla fascia del voto di laurea. Inoltre, ci siamo soffermati sull’evoluzione di tali aspetti all’interno dell’Area di Ingegneria. 50 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.27. Schema a stella relativo al cubo Usciti usato per la MQ5 Figura 3.28. Andamento del numero di laureati 3.6.2 Conoscenza estratta In Figura 3.28 è possibile osservare come il numero di laureati sia linearmente aumentato a partire dal 2001, invertendo tale comportamento a partire dal 2012, quando il numero di laureati è cominciato a scendere progressivamente. Per le analisi successive abbiamo cercato di individuare un qualche tipo di relazione sull’andamento del numero di laureati e del numero medio di anni impiegati per conseguire il titolo, in base al voto di laurea (classificato in cinque fasce) e al macrotipo di laurea. Per rendere più chiari i risultati, abbiamo espresso il numero di laureati con una determinata fascia di voto, in percentuale rispetto al numero complessivo di laureati del rispettivo anno di laurea. Nelle Figure 3.29 e 3.30, vengono rappresentate, anno per anno a partire dal 2001, le percentuali di conseguimento del titolo in base alla fascia di voto di laurea. Analizzando lo stesso report a partire dal 2010 (Figura 3.31), è possibile osservare che, generalmente, la maggior parte dei laureati ottengono una votazione nella fascia 3.6 MQ5: Situazione relativa ai laureati 51 Figura 3.29. Andamento del voto di laurea, fasce 66-90 e 91-100 Figura 3.30. Andamento del voto di laurea, fasce 101-105, 106-110 e 110 con lode Figura 3.31. Andamento del voto di laurea 91-100 e, inoltre, che esiste un leggero incremento di laureati con votazione nella fascia 66-90. Le due analisi successive (Figure 3.32 e 3.33) considerano, rispettivamente, il numero medio di anni di conseguimento titolo ed il numero di laureati, in base alla fascia di voto e per ogni macrotipo di laurea. In Figura 3.34 è possibile osservare l’andamento del numero medio di anni di conseguimento titolo a partire dall’anno 2006, in base al macrotipo di laurea. Possiamo notare che gli anni spesi per conseguire una laurea a ciclo unico stia linearmente aumentando. Per quanto riguarda le lauree triennali e biennali, invece, dopo aver toccato dei picchi, rispettivamente nel 2012 e nel 2010, si osserva una diminuizione generalmente lineare del numero di anni per il conseguimento del titolo. 52 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.32. Numero medio di anni per il conseguimento del titolo in base alla fascia di voto Figura 3.33. Numero di laureati in base alla fascia di voto In Figura 3.35 è possibile osservare l’andamento del numero di laureati, a partire dall’anno 2006, in base al macrotipo di laurea. In questo caso si osserva che, a partire dal 2013, i tre macrotipi di lauree hanno subito lo stesso calo del numero di laureati. Analizziamo, adesso, questi risultati, relativamente ai singoli corsi triennali e biennali dell’Area di Ingegneria. Le Figure 3.36 e 3.37 mostrano l’andamento del numero medio di anni per il conseguimento del titolo, rispettivamente, per i corsi triennali e per i corsi biennali della Facoltà di Ingegneria. Possiamo notare che il Corso di Studio triennale in Ingegneria per l’Ambiente e per il Territorio sia, apparentemente, il più problematico dei tre offerti dall’Area di Ingegneria. Le Figure 3.38 e 3.39 si soffermano, invece, sul numero di laureati. In Figura 3.40 possiamo confrontare l’andamento del numero di laureati, a partire dal 2005, per ogni Area della Mediterranea. È interessante notare come Architettura, nel corso degli anni, sia stata generalmente l’Area con più laureati. Dal 2013 al 2014,però, quest’Area ha visto abbassarsi notevolmente il numero di laureati, scendendo leggermente al di sotto del numero di laureati dell’Area di Ingegneria. 3.6 MQ5: Situazione relativa ai laureati 53 Figura 3.34. Numero medio di anni per il conseguimento del titolo in base al macrotipo di laurea Figura 3.35. Andamento del numero di laureati in base al macrotipo di laurea I tre report seguenti mettono a confronto il numero medio di anni per conseguire un titolo di un Corso di Studio biennale (Figura 3.41), triennale (Figura 3.42) e ciclo unico (Figura 3.43). Si noti che, in alcuni casi, la media della durata degli studi un Corso di Studi è inferiore al minimo valore teoricamente possibile (ad esempio, per il Corso di Studi biennali in Scienze e Tecnologie Alimentari, la media è pari a 1.73. Questo si può spiegare con il fatto che, in alcuni casi, ci sono state delle abbreviazioni di carriera con la convalida, ad esempio, di tutti i corsi sostenuti in un master erogato l’anno precedente sulle medesime tematiche. Le Figure 3.44, 3.45 e 3.46, si soffermano, invece, sul numero di laureati. In Figura 3.47 è possibile vedere un confronto tra i Corsi di Studio dell’Area di Ingegneria relativo al livello di uscita dei laureati espresso nelle cinque fasce di voto. Le Figure 3.48, 3.49 e 3.50 mettono in risalto l’andamento del numero di laureati in base alle cinque fasce di voto, rispettivamente, per i Corsi di Studio in Ingegneria 54 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.36. Numero medio di anni per conseguimento titolo triennale in Ingegneria Figura 3.37. Numero medio di anni per conseguimento titolo biennale in Ingegneria dell’Informazione, Ingegneria Informatica e dei Sistemi per le Telecomunicazioni, e Ingegneria Elettronica. Un ultimo report che consideriamo in Figura 3.51 mostra un confronto tra i corsi di Ingegneria delle Telecomunicazioni DM509 e DM270 in base al numero di anni spesi per conseguire il titolo. La media di anni necessari per ottenere la laurea in Ingegneria delle Telecomunicazioni è notevolmente aumentata nel corso degli anni. Il Corso di Studi in Ingegneria dell’Informazione, attivato negli ultimi anni, ha ottenuto risultati decisamente migliori. 3.7 MQ6: Situazione relativa alle rinunce 55 Figura 3.38. Numero di laureati nei Corsi di Studio triennali dell’Area di Ingegneria Figura 3.39. Numero di laureati nei corsi di Studio biennali dell’Area di Ingegneria 3.7 MQ6: Situazione relativa alle rinunce Per quanto riguarda le analisi relative alla sesta macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report per fornire un quadro generale sulle rinunce agli studi universitari. Le dimensioni scelte sono: MotivoUscita, MacroTipoDiploma, MacroTipoLaurea, A.A.Immatricolazione, NomeCorsoPubblico, A.A.Corto e AnnoUscita. Le misure 56 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.40. Numero di laureati per ogni Area della Mediterranea a partire dal 2005 Figura 3.41. Numero medio di anni per il conseguimento di un titolo di studio biennale presso l’Università Mediterranea di interesse riguardano il numero usciti e di laureati. Per quanto riguarda la dimensione MotivoUscita è stata selezionata la rinuncia esplicita per rendere più specifici i risultati ricavati. In Figura 3.52 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 3.7.1 Definizione dei KPI e della loro presentazione Le rinunce rappresentano un aspetto molto importante per la governance, in quanto, mediante l’analisi di tale dato, è possibile capire se lo studente sia stato in qualche 3.7 MQ6: Situazione relativa alle rinunce 57 Figura 3.42. Numero medio di anni per il conseguimento di un titolo di studio triennale presso l’Università Mediterranea Figura 3.43. Numero medio di anni per il conseguimento di un titolo di studio biennale presso l’Università Mediterranea modo condizionato dal tipo di percorso di studi effettuato precedentemente, o dalla pesantezza del corso di laurea scelto. I KPI presentati per la MQ6 hanno l’obiettivo di evidenziare quanti più aspetti possibili riguardanti le rinunce da parte degli studenti. 58 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.44. Numero di laureati per ciascun corso biennale della Mediterranea 3.7.2 Conoscenza estratta In Figura 3.53 viene mostrato l’andamento delle rinunce da parte degli studenti della Mediterranea a partire dall’anno 2001. È possibile notare come, dopo un aumento lineare, le rinunce siano diminuite a partire dall’anno 2010. Nelle Figure 3.54 e 3.55 vogliamo evidenziare l’andamento delle rinunce, rispettivamente, in base al macrotipo di diploma ed al macrotipo di laurea. 3.7 MQ6: Situazione relativa alle rinunce 59 Figura 3.45. Numero di laureati meo Corsi di Studi triennali della Mediterranea Figura 3.46. Numero di laureati nei Corsi di Studio a ciclo unico della Mediterranea 60 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.47. Andamento del numero di laureati, suddivisi per fasce di voto, per l’Area di Ingegneria Figura 3.48. Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso di Studi in Ingegneria Elettronica 3.7 MQ6: Situazione relativa alle rinunce 61 Figura 3.49. Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso di Studi in Ingegneria dell’Informazione Figura 3.50. Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso di Studi in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni Figura 3.51. Confronto tra i Corsi di Studio in Ingegneria delle Telecomunicazioni DM509 e DM270 per ciò che riguarda la durata media degli studi 62 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.52. Schema a stella relativo al cubo Usciti usato per la MQ6 Figura 3.53. Andamento delle rinunce nel corso degli anni 3.7 MQ6: Situazione relativa alle rinunce 63 Figura 3.54. Andamento delle rinunce in base al macrotipo di diploma Per quanto riguarda l’andamento in base al macrotipo di diploma, per offrire un risultato quanto più accurato possibile, è stato rapportato il numero delle rinunce in base al numero di scritti anno per anno e per ogni macrotipo di diploma. Dal grafico non si notano cambiamenti significativi, a parte una leggera diminuzione delle rinunce a partire dal 2001. La situazione relativa al macrotipo di laurea mostra, invece, il numero di rinunce relative a corsi biennali, triennali e a ciclo unico, a partire dall’anno 2006. Osservando l’andamento delle rinunce ai corsi triennali è possibile notare un netto calo a partire dal 2012. In Figura 3.56 viene rappresentato 64 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.55. Andamento delle rinunce in base al macrotipo di laurea Figura 3.56. Andamento delle rinunce in base alle Aree l’andamento delle rinunce per ogni Area a partire dal 2005. In questo caso, si può notare che le rinunce siano uniformemente diminuite a partire dal 2013. In Figura 3.57 sono riportate le rinunce dopo n+1 anni (ovvero dopo un anno in più dopo la durata legale del Corso di Studi) dall’anno di iscrizione. Le analisi successive si soffermano sull’Area di Ingegneria. In Figura 3.58 riportiamo il numero totale di rinunce per ciascun corso di Ingegneria. In Figura 3.59 osserviamo l’andamento delle rinunce per i Corsi di Studio dell’Area di Ingegneria negli anni a partire dall’anno 2008. Per comprendere meglio le cause di questi risultati, le analisi successive cercano di individuare i momenti più critici della carriera universitaria di uno studente. In Figura 3.60, valutiamo le rinunce ai Corsi di Studi per gli immatricolati dal 2001 in poi. 3.7 MQ6: Situazione relativa alle rinunce 65 Figura 3.57. Rinunce degli iscritti dell’anno 2011 dopo n+1 anni Figura 3.58. Numero totale di rinunce, dopo n+1 anni, per ogni Corso di Studi dell’Area di Ingegneria In Figura 3.61 osserviamo il percorso degli immatricolati negli anni 2010/2011, 2011/2012 e 2012/2013 nella Mediterranea. Risulta chiaro come la maggior parte delle rinunce avvengano durante il secondo anno di studi universitari. Vediamo, adesso, i risultati ottenuti dai Corsi di Studio triennali dell’Area di Ingegneria. In Figura 3.62 osserviamo i risultati ottenuti dagli immatricolati 2010/2011, 2011/2012 e 2012/2013. Come possiamo notare, l’andamento ottenuto risulta conforme con i dati generali della Mediterranea. Per concludere, vediamo l’esito ottenuto dopo n+1 anni (durata legale del corso più un anno aggiuntivo) dall’immatricolazione. Nelle Figure 3.63 e 3.64 valutiamo l’esito degli immatricolati 2008, 2009, 2010 e 2011, confrontando la percentuale di laureati e di rinunce, rispetti- 66 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.59. Rinunce per ogni Corso di Studio dell’Area di Ingegneria a partire dal 2008 vamente, per il Corso di Studi triennale in Ingegneria dell’Informazione e per il Corso di Studi biennale in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni. Per quanto riguarda il Corso di Studi in Ingegneria dell’Informazione, è possibile notare che, trascorsi n+1 anni dall’immatricolazione, esiste un forte distacco tra le rinunce ed i laureati. La situazione risulta essere nettamente migliore per il Corso di Studi biennale in Ingegneria Informatica e de Sistemi per le Telecomunicazioni. In questo caso, infatti, il numero di rinunce si abbassa notevolmente, mentre il numero di laureati aumenta fino a distaccare di molto il numero di rinunce. 3.8 MQ7: Situazione relativa ai contributi 67 Figura 3.60. Numero di rinunce in base all’anno di immatricolazione per gli studenti della Mediterranea Figura 3.61. Rinunce da parte degli immatricolati negli A.A. 2010/2011, 2011/2012 e 2012/2013 3.8 MQ7: Situazione relativa ai contributi Per quanto riguarda le analisi relative alla settima macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report sulla situazione relativa ai contributi. Le dimensioni scelte sono: NomeCorsoPubblico, A.A.Corto e Facoltà. Le misure di interesse riguardano il numeroImmatricolati, importoDovuto e importoPagato. In questo caso, i dati dell’OSD sono risultati insufficienti. Per questo motivo ci è stato consentito di effettuare una serie report integrativi su alcuni dati presenti sulla piattaforma GOMP. In Figura 3.65 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 68 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.62. Rinunce da parte degli immatricolati negli A.A. 2010/2011, 2011/2012 e 2012/2013 nei Corsi di Studio triennali dell’Area di Ingegneria Figura 3.63. Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del Corso di Studi in Ingegneria dell’Informazione Figura 3.64. Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del Corso di Studi in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni 3.8 MQ7: Situazione relativa ai contributi 69 Figura 3.65. Schema a stella relativo al cubo Contributi usato per la MQ7 Figura 3.66. Confronto tra importoDovuto e importoPagato negli anni 3.8.1 Definizione dei KPI e della loro presentazione Le misure a disposizione per ottenere dei report sulla situazione relativa ai contributi hanno evidenziato alcuni limiti nei dati disponibili. Infatti, a causa di un’alta granularità e di alcuni dati non aggiornati relativi agli ultimi anni, abbiamo incontrato qualche difficoltà nel costruire una visione dettagliata sui contributi. I KPI proposti per la MQ7 hanno l’obiettivo di mettere in risalto la situazione generale relativa ai contributi. 3.8.2 Conoscenza estratta In Figura 3.66 abbiamo messo a confronto importoDovuto e importoPagato a partire dal 2001. Rapportando i risultati ottenuti si riscontrano situazioni di pendenza negli anni 2012, 2013 e 2014. Per questa ragione abbiamo scelto di approfondire questo aspetto. In Figura 3.67 osserviamo, nello specifico, la situazione relativa alle quattro Aree della Mediterranea. In Figura 3.68 è possibile osservare in dettaglio la situazione relativa ai singoli Corsi di Studio dell’Area di Ingegneria. Non avendo elementi sufficienti per dare 70 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.67. Confronto tra importoDovuto e importoPagato per le Aree della Mediterranea un’interpretazione riguardo ai risultati ottenuti, ci siamo limitati a mettere in risalto le percentuali di pendenze ricavate. Come già accennato, i dati dell’OSD riguardanti, nello specifico, le borse di studio, risultano ancora in aggiornamento. Per questa ragione abbiamo analizzato alcuni dati disponibili sulla piattaforma GOMP riguardanti le richieste di ottenimento delle borse di studio negli anni 2014 e 2015. I dati su cui abbiamo effettuato le analisi successive offrivano informazioni inerenti alle singole istanze di richiesta delle borse di studio. A partire da queste informazioni, abbiamo classificato le istanze in base al Comune ed alla Provincia di residenza. I risultati ottenuti sono rappresentati nelle Figure 3.69 e 3.70. Come possiamo facilmente notare, dall’analisi effettuata si riscontra un discreto calo di richieste quando si passa dall’anno 2014 all’anno 2015. I dati a disposizione presentavano, inoltre, informazioni relative al macrotipo di laurea. Mettendo a confronto i report delle Figure 3.71 e 3.72 è possibile notare come la maggior parte delle richieste di ottenimento delle borse di studio provengano da studenti del primo anno. Inoltre, si osserva che, nell’anno 2015, la maggior parte delle richieste proveniva da studenti di Corsi di Studio a ciclo unico, un cambiamento interessante rapportato all’anno precedente, dove il maggior numero di richieste 3.8 MQ7: Situazione relativa ai contributi 71 Figura 3.68. Confronto tra importoDovuto ed importoPagato per i Corsi di Studio dell’Area Ingegneria Figura 3.69. Informazioni relative al Comune di residenza associato alle richieste di borse di studio 72 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.70. Informazioni relative alla Provincia di residenza associato alle richieste di borse di studio Figura 3.71. Informazioni relative al macrotipo di laurea associato alle richieste di borse di studio (anno 2014) Figura 3.72. Informazioni relative al macrotipo di laurea associato alle richieste di borse di studio (anno 2015) proveniva da Corsi di Studio triennale. 3.9 Cruscotti realizzati 73 Figura 3.73. Cruscotto relativo agli immatricolati, iscritti, usciti e laureati della Mediterranea 3.9 Cruscotti realizzati I cruscotti delle prestazioni costituiscono l’interfaccia utente che fornisce la sintesi delle informazioni più importanti in termini di Business Intelligence. Un cruscotto, infatti, offre un reale valore di business grazie alla possibilità di rendere coerente l’informazione mediante i KPI, ovvero parametri critici associati a criteri operativi, tattici e strategici dell’azienda. L’efficienza di un cruscotto dipende dalla capacità di incrociare dinamicamente informazioni, rendendo possibile un’immediata capacità decisionale. Dopo aver catalogato i report effettuati in una serie di macro-questioni, abbiamo utilizzato il tool di Pentaho per la realizzazione di una serie di cruscotti che riportiamo a seguire. In Figura 3.73 viene riportato il primo cruscotto realizzato. Come possiamo notare, abbiamo scelto di offrire un quadro generale riguardo al numero di immatricolati, iscritti, usciti e laureati, dell’Università Mediterranea di Reggio Calabria. Tali misure, infatti, sono i principali indicatori che avevamo a disposizione. Per rendere più chiaro il contenuto offerto dal cruscotto, abbiamo utilizzato delle opzioni grafiche per quantificare le misure con barre di colorazione diversa. In aggiunta, abbiamo creato un’informazione supplementare, per ogni misura, denominata Trend. Ogni entry di tale colonna mostra la variazione in percentuale, calcolata in base alla misura di riferimento, rispetto al valore della entry precedente. Inoltre, è possibile osservare una freccia che indica l’andamento dell’indicatore. In Figura 3.74 riportiamo il secondo cruscotto realizzato. Esso offre un confronto sul numero di laureati e di rinunce esplicite della Mediterranea. In questo caso abbiamo associato alle misure una scala di gradazione dal verde al rosso in modo da offrire un chiara visione sui livelli di criticità del numero. In basso, si osserva la 74 3 Estrazione di conoscenza relativa al nostro Ateneo Figura 3.74. Cruscotto relativo al numero di laureati e di rinunce esplicite della Mediterranea Figura 3.75. Cruscotto relativo al numero di usciti e di laureati della Mediterranea rappresentazione degli andamenti delle due misure di riferimento a partire dall’anno 2001. In Figura 3.75 riportiamo un cruscotto, che mette a confronto il numero di usciti e di laureati. In aggiunta, è possibile osservare un grafico a barre che offre una valutazione sull’andamento delle percentuali associate alle fasce di voto di laurea negli anni. In Figura 3.76 è possibile osservare un cruscotto che mette a confronto i singoli corsi di Ingegneria dell’Informazione e di Ingegneria Informatica e dei Sistemi 3.9 Cruscotti realizzati 75 Figura 3.76. Cruscotto relativo ai corsi di Ingegneria dell’Informazione e di Ingegneria Informatica e dei Sistemi per le Telecomunicazioni della Mediterranea per le Telecomunicazioni della Mediterranea. In questo caso, l’arco temporale di riferimento riguarda gli anni dal 2010 al 2014. Nella parte superiore del grafico vengono mostrate informazioni riguardo al numero di immatricolati per entrambi i corsi di riferimento. Nella parte inferiore, invece, si osservano gli andamenti relativi ai laureati e alle rinunce esplicite. 4 Estrazione di conoscenza sul immatricolazioni e lauree relativa al contesto italiano Questo capitolo illustra la conoscenza su immatricolazioni e lauree, relative ai vari atenei italiani, introdotta utilizzando i dati e i tool del sito dell’OSD dopo un’attenta attività di progettazione. Nel capitolo verranno introdotte alcune macro-questioni (nel seguito, MQ); per ciascuna di esse verranno rappresentati gli schemi a stella dei relativi cubi progettati, i Key Performance Indicator e la conoscenza estratta. Infine, verranno mostrati una serie di cruscotti realizzati. 4.1 Premessa L’attività di analisi svolta finora ci ha consentito di raccogliere una serie di informazioni interessanti riguardo la situazione generale dell’Università Mediterranea di Reggio Calabria. Al fine di raggiungere una comprensione di più ampio respiro è stato, però, necessario spostare la nostra attenzione al di fuori del contesto locale. Questo, come vedremo, ci ha fornito ulteriori spunti di interpretazione della conoscenza precedentemente estratta. I dati fondamentali per l’attività svolta sono stati quelli dell’Osservatorio Studenti Didattica. A partire da tali dati è stato possibile realizzare i cubi e, quindi, i report ed i cruscotti di interesse, grazie alla piattaforma di Business Intelligence Pentaho. Le analisi effettuate, relative al contesto italiano, sono state classificate in tre macro-questioni (nel seguito, MQ), che spostano gradualmente la nostra attenzione dalla realtà locale del capitolo precedente alla realtà nazionale. La prima MQ evidenzia una serie di indagini relative al numero di immatricolati e di usciti, effettuate confrontando le realtà univesitarie di Calabria e Sicilia. La seconda MQ, invece, si sofferma sul contesto italiano, effettuando una serie di analisi sugli immatricolati e sugli usciti in base all’area geografica. La terza MQ mette a confronto l’università tradizionale con quella telematica, ovvero un’università che eroga corsi con modalità a distanza. 78 4 Estrazione di conoscenza relativa al contesto italiano 4.2 MQ1: Confronto tra Calabria e Sicilia 4.2.1 Estrazione di conoscenza relativa agli immatricolati Per quanto riguarda l’estrazione di conoscenza relativa agli immatricolati delle università calabresi e siciliane, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report. Le dimensioni scelte sono: AteneoRegione, AteneoCorto, CorsoRegione, Classe e A.A.Corto. La misura di interesse riguarda il numero di immatricolati. In Figura 4.1 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. Figura 4.1. Schema a stella del cubo usato per la MQ1 relativa agli immatricolati 4.2.1.1 Definizione dei KPI e della loro presentazione I Key Performance Indicator (nel seguito, KPI) scelti per la MQ1 relativa agli immatricolati vogliono mettere in evidenza una serie di valutazioni riguardo gli immatricolati delle università calabresi e siciliane. Mediante operazioni di roll-up e drill-down è stato possibile offrire molteplici report che considerano la situazione complessiva delle due regioni e dei rispettivi atenei. È stato poi effettuato un confronto riguardante gli immatricolati con diploma estero. Infine, si è proceduti con un confronto relativo alle Classi di Laurea L-8 ed LM-27 presenti nelle due regioni di riferimento. 4.2.1.2 Conoscenza estratta In Figura 4.2 è possibile osservare un confronto tra la Calabria e la Sicilia in base al numero di immatricolazioni. Dal grafico si evince come esista un discreto margine di distacco tra le due regioni che sembra, però, attenuarsi a partire dall’anno 2007. Effettuando un’operazione di drill-down sul cubo è stato possibile scendere nel dettaglio dei singoli atenei. In Figura 4.3 mettiamo a confronto il numero totale di immatricolati delle università calabresi e siciliane. Come possiamo notare, è possibile valutare le rispettive classifiche regionali degli atenei, in base al numero di immatricolati. 4.2 MQ1: Confronto tra Calabria e Sicilia 79 Figura 4.2. Confronto tra gli andamenti relativi al numero totale di immatricolati in Calabria e in Sicilia Figura 4.3. Confronto tra il numero totale di immatricolati alle università calabresi e siciliane In Figura 4.4 vengono classificati gli atenei in base al numero totale di immatricolati. Nelle prime tre posizioni si trovano, rispettivamente, l’Università di Catania, l’Università di Palermo e l’Università di Messina; l’Università Mediterranea si trova in terzultima posizione. Per valutare la classifica ricavata nel corso degli anni è stata aggiunta la dimensione temporale. In Figura 4.5 si può notare come l’Università Mediterranea sia passata dalla terzultima alla penultima posizione a partire dal 2010. La causa di questo risultato può essere collegata all’apertura dell’Università degli Studi di Enna Kore. Questa università, infatti, offre un Corso di Studio in Architettura che è riuscita ad attirare una parte delle immatricolazioni di studenti siciliani che precedentemente si iscrivevano presso l’Area di Architettura della Mediterranea. È interessante notare che, se nel complesso si evidenzia un calo generale delle immatricolazioni nel corso degli anni, gli atenei che hanno accusato maggiormente il fenomeno sono stati quelli di Catania, Palermo e Messina. A tal proposito, abbiamo effettuato un report (Figura 4.6) che offre informazioni molto dettagliate sugli andamenti relativi ai singoli atenei delle due regioni. Accanto 80 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.4. Classifica degli atenei calabresi e siciliani in base al numero di immatricolati ad ogni colonna relativa alla misura immatricolati, ne abbiamo calcolata un’altra, denominata Trend. Ogni entry di tale colonna mostra la variazione, in percentuale, calcolata in base alla misura di riferimento, rispetto al valore della entry precedente; in aggiunta è presente una freccia che, mediante una colorazione verde o rossa, sottolinea il tipo di andamento corrente. Queste informazioni sono molto utili in quanto ci consentono di comprendere facilmente i risultati ottenuti da un anno all’altro. Dal grafico si può notare come ogni ateneo abbia visto ridursi il numero di immatricolazioni nel corso degli ultimi anni. In Figura 4.7 vengono mostrati gli andamenti delle immatricolazioni con diploma conseguito all’estero presso le università calabresi e siciliane. Come possiamo notare, la Calabria ha avuto una ripresa importante nei confronti della Sicilia. Nel corso degli anni, infatti, ha manifestato un notevole incremento delle immatricolazioni con diploma estero, fino a distaccare completamente la Sicilia a partire dal 2010. Mediante un’operazione di drill-down sul cubo, è stato possibile osservare nel dettaglio la situazione per ciascun ateneo calabrese e siciliano. In Figura 4.8 riportiamo il risultato ottenuto. Come possiamo notare, il vantaggio raggiunto dalla Calabria è stato determinato dall’ottimo andamento dell’Università della Calabria. I report seguenti si soffermano sulle Classi di Laurea L-8 e LM-27 presenti nelle due regioni. In Figura 4.9 riportiamo il numero totale di immatricolazioni per ogni classe di laurea di riferimento presente nelle due regioni. Come possiamo notare, la maggior parte delle immatricolazioni alla Classe di Laurea L-8 è ottenuta dalla Sicilia. La situazione si ribalta per quanto riguarda le immatricolazioni alla Classe di Laurea LM-27, che vede un discreto vantaggio ottenuto dalla Calabria. Aggiungendo la dimensione temporale abbiamo potuto valutare la situazione nel corso degli anni. In Figura 4.10 sono riportati i risultati ottenuti. 4.2 MQ1: Confronto tra Calabria e Sicilia 81 Figura 4.5. Andamento delle immatricolazioni presso gli atenei calabresi e siciliani 4.2.2 Estrazione di conoscenza relativa agli usciti Per quanto riguarda l’estrazione di conoscenza relativa agli usciti delle università calabresi e siciliane, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report. Le dimensioni scelte sono: AteneoRegione, AteneoCorto, MotivoUscita e A.A.Corto. La misura di interesse riguarda 82 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.6. Informazioni sull’andamento delle immatricolazioni e dei rispettivi trend ottenuti dalle università calabresi e siciliane il numero di usciti. In Figura 4.11 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 4.2 MQ1: Confronto tra Calabria e Sicilia 83 Figura 4.7. Andamento delle immatricolazioni con diploma estero 4.2.2.1 Definizione dei KPI e della loro presentazione I KPI scelti per la MQ1 relativa agli usciti vogliono mettere in evidenza una serie di valutazioni riguardo agli usciti delle università calabresi e siciliane. Mediante operazioni di roll-up e drill-down è stato possibile offrire molteplici report che considerano la situazione complessiva delle due regioni e dei rispettivi atenei. Ci soffermeremo, in particolare, sul numero di usciti, di laureati e di rinunce esplicite totalizzato dalle due regioni. 4.2.2.2 Conoscenza estratta In Figura 4.12 viene rappresentato l’andamento degli usciti dalle università calabresi e siciliane. Possiamo notare che, in proporzione, gli andamenti manifestino una similitudine interessante. Figura 4.8. Andamento delle immatricolazioni con diploma estero per ogni ateneo calabrese e siciliano 84 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.9. Immatricolazioni alle Classi di Laurea L-8 e LM-27 calabresi e siciliane Figura 4.10. Andamento delle immatricolazioni alle Classi di Laurea L-8 e LM-27 calabresi e siciliane Figura 4.11. Schema a stella del cubo usato per la MQ1 relativa agli usciti 4.2 MQ1: Confronto tra Calabria e Sicilia 85 Figura 4.12. Andamento del numero di usciti delle università calabresi e siciliane Figura 4.13. Informazioni sull’andamento degli usciti e dei rispettivi trend ottenuti dalle università calabresi e siciliane 86 4 Estrazione di conoscenza relativa al contesto italiano Successivamente abbiamo effettuato un’operazione di drill-down considerando i singoli atenei delle due regioni, al fine di offrire un report il più dettagliato possibile. In Figura 4.13 sono riportati i dati ottenuti. Per ogni colonna relativa al numero di usciti ne abbiamo ricavata una, denominata Trend, che mostra la variazione in percentuale rispetto al valore associato alla entry precedente della colonna usciti. Anche in questo caso, abbiamo aggiunto una freccia di colorazione verde o rossa che sottolinea il tipo di andamento corrente. In Figura 4.14 è possibile osservare l’andamento associato al numero di laureati delle università calabresi e siciliane. In Figura 4.15, invece, riportiamo i dati ottenuti considerando i singoli atenei delle rispettive regioni. Figura 4.14. Andamento del numero di laureati delle università calabresi e siciliane In Figura 4.16 è rappresentato l’andamento associato al numero di rinunce esplicite delle università calabresi e siciliane. In Figura 4.17, invece, riportiamo i dati ottenuti considerando i singoli atenei delle rispettive regioni. In questo caso è possibile osservare dei risultati generalmente incoraggianti a partire dal 2010. 4.3 MQ2: Confronto in base all’area geografica 4.3.1 Estrazione di conoscenza relativa agli immatricolati Per quanto riguarda l’estrazione di conoscenza relativa agli immatricolati, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report relativi al contesto italiano. Le dimensioni scelte sono: AteneoArea, AteneoCorto, Classe e A.A.Corto. La misura di interesse riguarda il numero di immatricolati. In Figura 4.18 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 4.3.1.1 Definizione dei KPI e della loro presentazione I KPI scelti per la MQ2 relativa agli immatricolati vogliono mettere in evidenza una serie di valutazioni riguardo gli immatricolati in base all’area geografica di locazione degli atenei italiani. Mediante operazioni di roll-up e drill-down è stato 4.3 MQ2: Confronto in base all’area geografica 87 Figura 4.15. Informazioni sull’andamento dei laureati e dei rispettivi trend ottenuti dalle università calabresi e siciliane possibile offrire una serie report che considerano la situazione relativa al contesto italiano . Abbiamo, inoltre, scelto di soffermarci sulle Classi di Laurea L-8 e LM-27 in base all’area geografica. 4.3.1.2 Conoscenza estratta In Figura 4.19 osserviamo l’andamento del numero totale di immatricolazioni di tutte le università italiane nel corso degli anni. È possibile notare come vi sia stato 88 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.16. Andamento del numero di rinunce esplicite delle università calabresi e siciliane un brusco calo di immatricolazioni dal 2001 al 2002, recuperato in parte nel 2006; da quest’ultimo anno, invece, si osserva tendenzialmente una diminuzione del numero di immatricolati che tocca il punto più basso proprio nell’ultimo anno di analisi. Questo è un dato molto interessante in quanto riflette una condizione di crisi del sistema universitario italiano, probabilmente da collegare ad una situazione ancora più generale in cui versa il nostro paese. Aggiungendo la dimensione AteneoArea è stato possibile confrontare l’andamento ricavato precedentemente in base all’area geografica degli atenei italiani. In Figura 4.20 vengono rappresentati i risultati ottenuti. Osservando il grafico si evidenzia nel dettaglio il brusco calo individuato prima, verificatosi dal 2001 al 2002. In questo caso, però, si riescono a distinguere le aree geografiche dove tale fenomeno si è fatto sentire di più, ovvero il Centro, il Nord-Est ed il Nord-Ovest. Si noti, inoltre, come sussista una similitudine tra gli andamenti del Centro e del Sud. Soffermandosi sugli ultimi due anni dell’arco temporale di analisi, invece, si osserva come il Sud sia stata l’area geografica che ha perso più immatricolazioni. Le regioni del Nord-Est e del Nord-Ovest, invece, manifestano una situazione più stabile. Mediante un’operazione di roll-up sul cubo, abbiamo analizzato la situazione relativa alla Classe di Laurea L-8 nel contesto italiano. In Figura 4.21 è rappresentato l’andamento delle immatricolazioni alla Classe di Laurea di riferimento a partire dal 2008. Il risultato ricavato mette in risalto un andamento sempre crescente, specialmente negli ultimi quattro anni. Effettuando un’operazione di drill-down siamo scesi nel dettaglio delle singole aree geografiche. In Figura 4.22 sono riportati i risultati ottenuti. Osservando il grafico, si nota subito come le regioni del Nord-Ovest vedono un aumento importante del numero di immatricolazioni alla Classe di Laurea di riferimento. Il Sud, invece, mantiene comunque una situazione piuttosto stabile. Mediante un’operazione di roll-up sul cubo, abbiamo analizzato la situazione relativa alla Classe di Laurea LM-27 nel contesto italiano. In Figura 4.23 è rappresentato l’andamento delle immatricolazioni alla Classe di Laurea di riferimento a partire dal 2008. Il risultato ricavato mette in risalto un andamento molto promettente nei primi tre anni. A partire dal 2010, invece, le immatricolazioni alla Classe di Laurea LM-27 sono lentamente diminuite. Si nota, inoltre, un vistoso calo degli 4.3 MQ2: Confronto in base all’area geografica 89 Figura 4.17. Informazioni sull’andamento delle rinunce esplicite e dei rispettivi trend ottenuti dalle università calabresi e siciliane iscritti nel 2015. Effettuando un’operazione di drill-down siamo scesi nel dettaglio delle singole aree geografiche. In Figura 4.24 vengono riportati i risultati ottenuti. Osservando il grafico, è possibile notare come le regioni del Nord-Est abbiano una situazione generalmente più stabile rispetto alle altre. Il calo relativo all’anno 2015, evidenziato precedentemente, è stato determinato, in gran parte, dalle regioni del Centro e del Sud Italia. Sulla base dei risultati ottenuti abbiamo scelto di valutare la posizione dell’Uni- 90 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.18. Schema a stella del cubo usato per la MQ2 relativa agli immatricolati Figura 4.19. Andamento delle immatricolazioni relativo alle università presenti in Italia Figura 4.20. Andamento delle immatricolazioni in base all’area geografica degli atenei versità Mediterranea di Reggio Calabria nei confronti degli altri atenei che offrono corsi di studio delle classi di laurea di riferimento. Nelle Figure 4.25 e 4.26 sono ri- 4.3 MQ2: Confronto in base all’area geografica 91 Figura 4.21. Andamento delle immatricolazioni alla Classe di Laurea L-8 Figura 4.22. Andamento delle immatricolazioni alla Classe di Laurea L-8 per ogni area geografica Figura 4.23. Andamento delle immatricolazioni alla Classe di Laurea LM-27 portate le classifiche ottenute, rispettivamente, per le Classi di Laurea L-8 e LM-27. Osservando la classifica relativa alla Classe di Laurea L-8, il Politecnico di Milano risulta essere in prima posizione con un distacco importante sul Politecnico di Torino. La Mediterranea, invece, è collocata nella posizione 26. La situazione risulta più 92 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.24. Andamento delle immatricolazioni alla Classe di Laurea LM-27 per ogni area geografica sorprendente osservando la classifica relativa alla Classe di Laurea LM-27. In questo caso, infatti, l’Università Mediterranea risulta essere in quinta posizione, superata soltanto dagli Atenei di Roma, Trento, Milano e Torino. 4.3.2 Estrazione di conoscenza relativa agli usciti Per quanto riguarda l’estrazione di conoscenza relativa agli usciti, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report relativi al contesto italiano. Le dimensioni scelte sono state: AteneoArea, MotivoUscita, Classe e A.A.Corto. La misura di interesse riguarda il numero di usciti. In Figura 4.27 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 4.3.2.1 Definizione dei KPI e della loro presentazione I KPI scelti per la MQ2 relativa agli usciti vogliono mettere in evidenza una serie di valutazioni sulla base dell’area geografica di locazione degli atenei italiani. Mediante operazioni di roll-up e drill-down è stato possibile offrire una serie report che considerano la situazione relativa al contesto italiano. Abbiamo, inoltre, scelto di soffermarci sulle Classi di Laurea L-8 e LM-27 in base all’area geografica. 4.3.2.2 Conoscenza estratta In Figura 4.28 è rappresentato l’andamento del numero di rinunce esplicite in base all’area geografica di riferimento. Dall’osservazione del grafico si può notare un sensibile miglioramento a partire dal 2013. I risultati relativi al 2015 sono molto probabilmente provvisori e, quindi, poco significativi. In Figura 4.29 riportiamo un quadro più completo sui dati relativi alle rinunce esplicite. Per ogni colonna relativa al numero di rinunce esplicite ne abbiamo ricavata un’altra denominata Trend che mostra la variazione in percentuale rispetto al valore 4.3 MQ2: Confronto in base all’area geografica 93 Figura 4.25. Classifica degli atenei italiani in base al numero di immatricolati alla Classe di Laurea L-8 associato alla entry precedente della colonna Rinuncia Esplicita. Abbiamo aggiunto una freccia di colorazione verde o rossa che sottolinea il tipo di andamento corrente. Nelle Figure 4.30 e 4.31 vengono riportati gli andamenti relativi alle rinunce esplicite in base all’area geografica, rispettivamente, per la Classe di Laurea L-8 e LM-27. Dall’osservazione dei grafici si nota come esista un andamento crescente delle rinunce per quanto riguarda la Classe di Laurea L-8. La situazione relativa alla Classe di Laurea LM-27, invece, mostra un andamento più variabile. Le analisi successive riguardano, invece, il numero medio di anni necessario per 94 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.26. Classifica degli atenei italiani in base al numero di immatricolati alla Classe di Laurea LM-27 Figura 4.27. Schema a stella del cubo usato per la MQ2 relativa agli usciti conseguire la laurea. In Figura 4.32 riportiamo la media nazionale relativa alle Classi di Laurea di riferimento. Effettuando un’operazione di drill-down è possibile ricavare i dati per ogni area geografica. Come possiamo notare in Figura 4.33, sussiste una certa similitudine per quanto riguarda le due classi di laurea di riferimento, che vede un discreto vantaggio delle regioni del Nord d’Italia. Le differenze sono leggermente meno marcate per quanto riguarda la Classe di Laurea LM-27. 4.4 MQ3: Confronto tra università tradizionale e telematica 95 Figura 4.28. Andamento del numero di rinunce esplicite in base all’area geografica Per valutare la posizione dell’Università Mediterranea di Reggio Calabria rispetto agli altri atenei italiani, è stata aggiunta la dimensione AteneoCorto. In Figura 4.34 viene riportata la classifica relativa alla Classe di Laurea L-8. Come possiamo notare, la Mediterranea si trova nelle ultime posizioni. In Figura 4.35, invece, possiamo vedere la classifica relativa alla Classe di Laurea LM-27. 4.4 MQ3: Confronto tra università tradizionale e telematica Per quanto riguarda le analisi relative alla terza macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report confrontando le università tradizionali con quelle telematiche. Le dimensioni scelte sono: AteneoCorto, ModalitaAteneo, NomeCorsoPubblico, Classe e A.A.Corto. La misura di interesse riguarda il numero di immatricolati. In Figura 4.36 è possibile vedere lo schema a stella a partire dal quale è stato progettato il cubo. 4.4.1 Definizione dei KPI e della loro presentazione Le università telematiche, istituite dal 2003, sono proliferate in Italia e vedono crescere il numero dei loro studenti. Il motivo di questo successo è legato ad una serie di ragioni. Un’università telematica non necessita l’individuazione del bacino potenziale di utenza complessiva o un numero minimo di studenti immatricolati e iscritti per poter esistere. Prendere parte ad un percorso di studio on-line consente agli studenti un notevole risparmio economico. Allo stesso tempo, le università telematiche non devono fornire un supporto agli studenti in termini di biblioteche, mense, o luoghi di riunioni e aule. I KPI individuati per la MQ3 hanno analizzato questo fenomeno confrontando i dati relativi alle università tradizionali con quelli delle università telematiche. 96 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.29. Informazioni sull’andamento delle rinunce esplicite e dei rispettivi trend ottenuti per ogni area geografica 4.4.2 Conoscenza estratta In Figura 4.37 viene mostrato l’andamento del numero di immatricolati, rispettivamente, delle università tradizionali e telematiche. Osservando l’andamento relativo alle università tradizionali si osserva una lenta diminuzione del numero di immatricolati a partire dall’anno 2005. L’andamento relativo alle università telematiche, invece, mette in evidenza un graduale incremento delle immatricolazioni dal 2007 al 2010. Successivamente si può osservare un declino per il 2011 e il 2012 a cui segue una ripresa nel 2013 e 2014. I dati del 2015, probabilmente, non sono ancora definitivi. 4.4 MQ3: Confronto tra università tradizionale e telematica 97 Figura 4.30. Andamento del numero di rinunce esplicite relativo al Corso di Laurea L-8 Figura 4.31. Andamento del numero di rinunce esplicite relativo al Corso di Laurea LM-27 L’analisi successiva si sofferma sui Corsi di Studio offerti dalle univeristà telematiche che totalizzano il maggior numero di immatricolati. In Figura 4.38 viene riportata la classifica dei principali Corsi di Studio. Possiamo notare come il Corso di Studio in Giurisprudenza abbia totalizzato un alto numero di immatricolati. In Figura 4.39 possiamo osservare la classifica delle università telematiche in base al numero totale di immatricolati. L’analisi successiva si sofferma sull’andamento delle immatricolazioni relative alla Classe di Laurea L-8 per le università telematiche. In Figura 4.40 è possibile osservare l’andamento delle università telematiche che offrono questo Corso di Studi a partire dall’anno 2008. 98 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.32. Numero medio di anni necessario per conseguire la laurea relativo alle Classi di Laurea L-8 e LM-27 Figura 4.33. Numero medio di anni necessario per conseguire la laurea relativo alle Classi di Laurea L-8 e LM-27 in base all’area geografica 4.5 Cruscotti realizzati I cruscotti realizzati mediante il tool di Pentaho si soffermano su una serie di elementi riguardanti il contesto universitario italiano. Il primo cruscotto realizzato, rappresentato in Figura 4.41, mette in risalto la situazione relativa agli immatricolati e ai laureati delle università calabresi e siciliane. 4.5 Cruscotti realizzati 99 Figura 4.34. Classifica atenei italiani in base al numero medio di anni necessario per conseguire la laurea (Classi di Laurea L-8) Figura 4.35. Classifica atenei italiani in base al numero medio di anni necessario per conseguire la laurea (Classi di Laurea LM-27) Il cruscotto presente in Figura 4.42 mette a confronto, invece, il numero dei laureati e di rinunce esplicite delle università calabresi e siciliane. In Figura 4.43 riportiamo il cruscotto che mette a confronto l’andamento del 100 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.36. Schema a stella del cubo usato per la MQ3 Figura 4.37. Confronto sull’andamento delle immatricolazioni relativo alle università tradizionali e telematiche Figura 4.38. Classifica dei Corsi di Studio delle università telematiche sulla base del numero di immatricolati 4.5 Cruscotti realizzati 101 Figura 4.39. Classifica delle università telematiche sulla base del numero di immatricolati Figura 4.40. Andamento delle immatricolazioni relative alla Classe di Laurea L-8 per le università telematiche numero di immatricolati delle università calabresi e siciliane considerando la Classe di Laurea L-8 a partire dal 2008. In Figura 4.44 è presente il cruscotto relativo alle immatricolazioni in base al contesto italiano. Nella parte superiore del cruscotto è presente l’andamento delle immatricolazioni per ogni area geografica. Nella parte inferiore, invece, viene riportato l’andamento complessivo delle immatricolazioni. Dall’osservazione del cruscotto si evince che le regioni del Centro, del Sud e delle Isole stiano avendo un progressivo decremento del numero di immatricolati. 102 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.41. Cruscotto relativo al numero di immatricolati e laureati delle università calabresi e siciliane 4.5 Cruscotti realizzati 103 Figura 4.42. Cruscotto relativo al numero di laureati e di rinunce esplicite delle università calabresi e siciliane 104 4 Estrazione di conoscenza relativa al contesto italiano Figura 4.43. Cruscotto relativo al numero di immatricolati delle università calabresi e siciliane considerando la Classe di Laurea L-8 4.5 Cruscotti realizzati 105 Figura 4.44. Cruscotto relativo al numero di immatricolazioni in base al contesto italiano 5 Discussione in merito all’attività svolta In questo quinto capitolo forniremo una discussione in merito all’attività svolta. Inizialmente ci soffermeremo su Lessons Learned and Best Practices, in modo da migliorare la gestione della conoscenza. Successivamente parleremo della generalizzabilità dell’approccio proposto, indicandone, anche, i suoi punti di forza e di debolezza. Infine, effettueremo una valutazione riguardo agli approcci correlati esistenti. 5.1 Lessons Learned and Best Practices Dopo aver utilizzato la piattaforma Pentaho per lo studio dei dati dell’OSD, abbiamo individuato elementi sufficienti riguardo alle difficoltà incontrate e, quindi, alle lezioni apprese dall’attività svolta. Questo ci ha consentito di determinare un insieme di best practices, ovvero l’insieme delle attività (procedure, comportamenti e abitudini) che, organizzate in modo sistematico, possono essere prese come riferimento e riprodotte per favorire il raggiungimento dei risultati migliori in ambito aziendale e ingegneristico. Basandosi su tecniche che si rilevano in grado di ottenere i migliori risultati, è possibile costruire un sistema di regole da rispettare per rendere più efficiente le modalità produttive. Con i processi adeguati, i giusti controlli e le corrette analisi, il risultato voluto può essere ottenuto evitando problemi e complicazioni impreviste. Le principali difficoltà incontrate relative alla progettazione e all’analisi di Data Warehousing effettuata sui dati dell’OSD riguardano i dati riconciliati, da cui sono stati progettati i cubi, e le definizioni relative al contesto applicativo di riferimento. Questi aspetti sono evidenziati nella metodologia denominata metodologia a nove passi di Kimball per la progettazione di un Data Warehouse. Tale metodologia è stata proposta alcuni anni fa da Kimball, uno dei fondatori del Data Warehousing. Il livello dei dati riconciliati (detto anche operational data store), su cui poggia l’attività di progettazione svolta per la realizzazione dei cubi, è il risultato di tecniche di Extraction Transformation and Loading (ETL) effettuate a livello dell’alimentazione, a partire dal livello delle sorgenti. Il ruolo ricoperto da questa fase, molto complessa e delicata, consiste nell’alimentare il livello dei dati riconciliati su cui poggia l’intero sistema di Data Warehouse. Per questo motivo, è fondamentale 108 5 Discussione in merito all’attività svolta che tale fase sia esauriente e di alta qualità in modo da ottenere un livello di analisi il più adeguato possibile operante su dati integrati, consistenti e dettagliati. Nel contesto dell’OSD, le spedizioni dei dati, effettuata da parte degli atenei, vengono eseguite con cadenza settimanale. Le spedizioni, inoltre, vanno a integrare, o addirittura riscrivere completamente, parte dei dati nel sistema distribuito. Per questa ragione, il sistema è dotato di un controllore che verifica la correttezza delle spedizioni effettuate e che può, quindi, determinare il mancato aggiornamento dei dati. Questi fattori hanno probabilmente reso molto complicata la fase di integrazione ed hanno avuto effetti sui risultati ottenuti relativi all’ultimo anno di analisi, in quanto risultavano verosimilmente incompleti e, quindi, inattendibili. Per questo motivo, riteniamo opportuno tenere sempre presente questo aspetto durante l’attività di analisi, scegliendo opportunamente l’arco temporale di riferimento per la presentazione dei report. Un altro problema individuato durante la fase di analisi riguarda una caratteristica molto nota in letteratura, legata alle slowly changing dimension. Il problema delle slowly changing dimension implica, per esempio, che per i vecchi dati sia necessario fare riferimento alla vecchia organizzazione e alla vecchia strutturazione degli stessi (ovvero all’organizzazione e alla strutturazione esistenti al tempo a cui essi si riferiscono). Nel contesto dell’OSD abbiamo incontrato un problema simile a quello appena descritto. La riforma Gelmini del 2010 ha soppresso le facoltà universitarie ed i relativi organi. In particolare, le facoltà e le loro attività sono state assegnate ai loro dipartimenti. Tra le dimensioni che abbiamo adoperato per la costruzione dei cubi figuravano sia i dipartimenti che le facoltà. Questo ci ha causato notevoli difficoltà nel costruire report volti ad analizzare andamenti relativi al corso degli anni pre e post riforma. Tali difficoltà sono state in parte superate effettuando opportune modifiche manuali sui dati estratti dalla piattaforma Pentaho per renderli uniformi e coerenti. In questo caso, sarebbe consigliabile un piano di lavoro sul livello delle sorgenti in modo da rendere più agevole ed estensibile la costruzione di report che interessano le dimensioni di riferimento. Un altro problema incontrato durante l’attività svolta riguarda le descrizioni delle dimensioni e delle misure messe a disposizione dalla piattaforma Pentaho. Spesso, le descrizioni e, quindi, le definizioni delle dimensioni e delle misure che avevamo a disposizione erano mancanti o poco esaurienti. Ad esempio, la descrizione dell’attributo studente regolare non era presente, ed è stato, pertanto, necessario avvalersi della definizione riportata dal MIUR. Altre definizioni, invece, erano presenti, ma non risultavano pienamente comprensibili per un non addetto ai lavori. Prima di iniziare l’attività di analisi, è stato necessario effettuare uno studio relativo alle leggi e, allo stesso tempo, parlare con gli addetti ai lavori per risolvere eventuali incongruenze nelle interpretazione dei risultati proposti. Questi aspetti sono risultati fondamentali per apprendere quanta più conoscenza possibile sul contesto di riferimento. Per queste ragioni si ritiene opportuno arricchire le descrizioni offerte dalla piattaforma di analisi per consentire un utilizzo più accessibile e, contemporaneamente, per essere certi e concordi sulle definizioni relative al contesto di riferimento, prendendo in esame documenti e fonti ufficiali. Un aspetto fondamentale indicato nella metodologia a nove passi di Kimball per la progettazione di un Data Warehouse riguarda la scelta della granularità. Sceglie- 5.3 Punti di forza e di debolezza 109 re la granularità comporta decidere esattamente cosa rappresenta una tupla della Fact Table. Questo fattore influisce notevolmente sul grado di aggregazione dei dati e, quindi, sul grado di dettaglio in cui è possibile scendere durante le operazioni OLAP. Per quanto riguarda il contesto applicativo di riferimento, abbiamo evidenziato un’alta granularità che ci ha impedito di approfondire una serie di aspetti di possibile interesse, come, per esempio, il calcolo dei crediti degli studenti, o informazioni riguardo ai contributi. Pertanto, le analisi relative a queste misure sono state effettuate su dati raccolti dalla piattaforma GOMP. Inoltre, sarebbe stato interessante poter accedere alle informazioni relative agli esami sostenuti per ogni corso di laurea. 5.2 Generalizzabilità dell’approccio proposto Uno dei punti di forza dell’approccio proposto consiste nella sua generalizzabilità, in quanto esso può essere applicato in diversi contesti di riferimento. L’Anagrafe Nazionale Studenti (ANS), ovvero la banca dati che raccoglie periodicamente le informazioni sugli studenti iscritti ai Corsi di Laurea attivati dall’A.A. 2001/2002, è generalizzabile. Le università italiane utilizzano, da svariati anni, diverse piattaforme web-based che hanno determinato l’informatizzazione e la modernizzazione dei vecchi sistemi di gestione precedentemente utilizzati. L’Università Mediterranea di Reggio Calabria adotta da diversi anni la piattaforma GOMP. GOMP è un servizio web-based offerto da Be Smart per gestire tutte le esigenze relative alle procedure amministrative, didattiche e di programmazione dell’offerta formativa in capo ad un ateneo. Le attività che abbiamo effettuato su GOMP sono generalizzabili direttamente per tutti gli atenei che utilizzano tale sistema. Molte università italiane utilizzano, invece, un’altra piattaforma, denominata Esse3, che offre un’analoga gamma di servizi online per la didattica. Essendo sia GOMP che Esse3 proprietari, qualora si volessero utilizzare sui dati di Esse3 le tecniche di analisi da noi progettate e realizzate per GOMP sarà necessario costruire un wrapper. Con questo termine, nei sistemi informativi, si intende un modulo che si occupa della traduzione dei dati da un formato all’altro. La progettazione di un wrapper da Esse3 a GOMP, che renderebbe generalizzabile quella parte delle nostre tecniche di analisi presentate per GOMP, è abbastanza agevole e potrebbe essere un utile spunto per sviluppi futuri. Totalmente generale è, già, invece quella parte delle tecniche del nostro approccio che agiscono direttamente sui dati OSD, dal momento che il MIUR ha definito uno standard di strutturazione dei dati a cui si devono uniformare tutti i sistemi informatici adottati dagli Atenei. 5.3 Punti di forza e di debolezza Il lavoro svolto dal CINECA, su richiesta del MIUR, per la costituzione dell’Anagrafe Nazionale Studenti mediante l’Osservatorio Studenti Didattica, ci ha permesso di usufruire di una banca dati in un sistema distribuito che raccoglie le informazioni 110 5 Discussione in merito all’attività svolta di tutte le università italiane. Uno dei punti di forza nell’avere a disposizione tale quantità di informazioni consiste nel poter offrire soluzioni efficaci, orientate alla governance, oltre che alla gestione ordinaria degli Atenei, in modo tale da promuovere il reciproco trasferimento di conoscenza e migliorare la qualità dei servizi. L’aver adoperato tecniche di Data Warehousing ci ha permesso di estrarre una notevole quantità di informazioni a partire dai dati di partenza. Lo scopo principale dell’attività svolta era, infatti, quella di dimostrare i vantaggi derivanti da tale approccio orientato alla Business Intelligence come sistema di supporto alle decisioni. L’obiettivo principale della Business Intelligence è quello di migliorare il processo decisionale, a tutti i livelli dell’organizzazione, per incrementare le performance dell’organizzazione stessa. Attraverso l’analisi e l’interpretazione dei risultati ottenuti sotto forma di report e cruscotti un Ateneo può, quindi, fare delle valutazioni mirate e apportare determinati cambiamenti basandosi sulla conoscenza estratta. Il livello di gerarchia delle dimensioni scelte per la progettazione dei cubi ci ha permesso, inoltre, attraverso svariate operazioni OLAP, di passare facilmente dal contesto locale relativo all’Università Mediterranea di Reggio Calabria ad un contesto regionale e nazionale. Questa caratteristica di estensibilità è un altro dei punti di forza del sistema. Inoltre, i tool a nostra disposizione ci hanno dato la possibilità di calcolare, tramite una serie di operazioni, nuove misure a partire da quelle messe a disposizione. Un altro punto di forza è dato dal tool di Pentaho relativo alla creazione dei grafici e dei cruscotti di interesse. Per quanto riguarda i cruscotti, essi consentono di ottenere il giusto equilibrio tra informazioni numeriche e pratiche (l’efficacia dei grafici, soprattutto nelle grandi organizzazioni, è fondamentale per la comprensione e la condivisione delle informazioni). Una delle caratteristiche più importanti dei cruscotti è, inoltre, l’interattività, che permette di trovare le risposte in modo personalizzato, consentendo la manipolazione di grafici e tabelle e, quindi, un’approfondita esplorazione dei dati. I cruscotti non sono, pertanto, solo uno strumento per la reportistica, ma diventano l’elemento centrale per il performance management, ovvero il controllo, attraverso KPI (Key Performance Indicator), di un insieme di obbiettivi strategici selezionati. Il sistema, però, ha manifestato, anche, qualche punto debolezza. Abbiamo, infatti, constatato che un utente non consapevole della realtà di interesse si trova ad avere a che fare con un insieme di definizioni di cui si hanno poche informazioni. Questo problema poteva essere sicuramente ridotto attraverso una più completa descrizione delle dimensioni disponibili. Un limite di Pentaho è stato l’incapacità di effettuare l’operazione di drill-across, tecnica OLAP che consente di fondere due cubi. 5.4 Approcci correlati L’Italia non è l’unico paese ad aver adottato un sistema informativo distribuito che raccoglie e amministra i dati delle università del territorio nazionale. In Francia, ad esempio, viene utilizzato l’APB (Admission Post Bac) che riguarda, però, le immatricolazioni e le iscrizioni all’anno successivo al primo. Nel Regno Unito si utilizza il portale UCAS (Undergraduate Courses At Universiry And Collage) come 5.4 Approcci correlati 111 principale punto di accesso per facilitare la ricerca dei corsi di laurea triennali e magistrali di tutto il paese. Negli ultimi anni, inoltre, sono nati una serie di progetti dell’Unione Europea, come EUMIDA (European University Data Collection) ed ETER (European Tertiary Education Register). Quest’ultimo è un progetto di ricerca, lungo ormai un decennio, che mira a costruire e mantenere un database contenente informazioni sulle dimensioni degli atenei, sul numero di studenti, sulle lauree, sui corsi e le materie, sui docenti e il personale, sui programmi, la ricerca e l’internazionalizzazione di 2.673 atenei di trentasei stati, tra cui i paesi europei e alcuni extra-europei. Un risultato segnalato da questa ricerca indica che, tra i ventinove paesi che hanno fornito dati completi, la Germania conta il maggior numero di istituzioni di istruzione superiore (374), seguita dalla Polonia (286), dalla Francia (283), dall’Italia (176) e dal Regno Unito (152). 6 Conclusioni e uno sguardo al futuro Il presente elaborato di tesi ha avuto come oggetto l’analisi dei dati relativi a tutte le università italiane presenti nel Cruscotto Ateneo dell’Osservatorio Studenti Didattica del MIUR. Le informazioni a disposizione riguardavano diversi aspetti di interesse per la governance di ateneo. Mediante un opportuno sistema di Data Warehousing offerto dal tool di Business Intelligence di Penthao, è stato possibile progettare e realizzare una serie di cubi multidimensionali per estrarre conoscenza sui contributi, sulle immatricolazioni e sulle lauree relativi, dapprima, all’Università Mediterranea di Reggio Calabria e, successivamente, alle restanti realtà nazionali. L’attività svolta ha voluto dimostrare l’efficacia delle tecniche adoperate nel supportare i processi decisionali degli Atenei per migliorare la loro organizzazione. Mediante una serie di operazioni OLAP sui cubi tematici, abbiamo realizzato molteplici report e cruscotti, organizzandoli in modo tale da rispondere ad alcune macro-questioni di interesse per la governance. È stato, inoltre, possibile usufruire di documenti relativi agli indicatori sulle carriere accademiche degli studenti elaborati dalla commissione didattica della CRUI, e dei documenti dell’Agenzia Nazionale di Valutazione del Sistema Universitario e della Ricerca (ANVUR). Questo ha consentito di dare maggiore consistenza alla ricerca ed ai risultati proposti. Un vantaggio derivante dall’aver avuto a disposizione i dati di tutte le università italiane è stato quello di aver potuto effettuare un confronto tra i risultati relativi al contesto locale e a quello nazionale. In conclusione riteniamo che l’approccio orientato alla tecnica di Data Warehousing consenta di mettere facilmente in risalto una serie di dati oggettivi relativi alla realtà universitaria e, quindi, la validità di tale metodo come sistema di supporto alle decisioni. Come possibili miglioramenti futuri, possiamo suggerire una più completa raccolta dei dati degli atenei, che includa, ad esempio, dettagli relativi agli esami dei singoli corsi di studio e, quindi, la scelta di una più alta granularità del sistema. Ringraziamenti Un ringraziamento particolare al mio relatore, prof. Domenico Ursino, che ha reso la realizzazione di questa tesi un’esperienza importante, e che ha sempre dimostrato una grandissima disponibilità, professionalità e passione per il proprio lavoro. Un ringraziamento alla Dott.ssa T. Santamaria per il tempo che ci ha dedicato. Un sentito ringraziamento ai miei genitori che, con il loro sostegno, mi hanno permesso di raggiungere questo traguardo e, inoltre, a mia sorella Teresa, che ha sempre tifato per me. Ringrazio poi tutti i colleghi e amici con cui ho condiviso questo percorso. In particolare Demetrio, Giovanni, Domenico C., Domenico R., Valerio, Paolo C., Paolo G. e Lucia. Un ringraziamento speciale va a Celeste, per essermi sempre stata vicino e per avermi aiutato nei momenti difficili. Riferimenti bibliografici 1. A. Berson and S. J. Smith. Data Warehousing, Data Mining, and OLAP. McGraw-Hill, New York, NY, USA, 1997. 2. R. Bouman and J. Van Dongen. Pentaho Solutions: Business Intelligence and Data Warehousing with Pentaho and MySQL. Wiley, 2009. 3. M. Casters, R. Bouman, and J. Van Dongen. Pentaho Kettle solutions: building open source ETL solutions with Pentaho Data Integration. Wiley, 2010. 4. S. Chaudhuru and U. Dayal. An overview of data warehousing and OLAP technology. Statistical Analysis and Data Mining, 26(1):65–74, 1997. 5. M. Z. Elbashir, P. A. Collier, and S. G. Sutton. The Role of Organizational Absorptive Capacity in Strategic Use of Business Intelligence to Support Integrated Management Control Systems. The Accounting Review, 86(1):155–184, 2011. 6. C. Esposito and M. Ficco. Recent Developments on Security and Reliability in LargeScale Data Processing with MapReduce. International Journal of Data Warehousing and Mining, 12:1–20, 2016. 7. P. Giorgini, S. Rizzi, and M. Garzetti. GRAnD: A Goal-Oriented Approach to Requirement Analysis in Data Warehouses. Decision Support Systems, 45:4–21, 2008. 8. M. Golfarelli, F. Mandreoli, W. Penzo, S. Rizzi, and E. Turricchia. Query Reformulation in Peer-to-Peer Data Warehousing. Information Systems, 37:393–411, 2012. 9. M. Golfarelli and S. Rizzi. Managing late measurements in Data Warehouses. International Journal of Data Warehousing and Mining, 3:51–67, 2007. 10. M. Golfarelli and S. Rizzi. A survey on temporal Data Warehousing. International Journal of Data Warehousing and Mining, 5:1–17, 2009. 11. M. Golfarelli and S. Rizzi. Data Warehouse Design: Modern Principles and Methodologies. McGrawHill, NEw York City, 2009. 12. M. Golfarelli and S. Rizzi. Data Warehouse testing. International Journal of Data Warehousing and Mining, 7:25–42, 2011. 13. D. Hedgebeth. Data-driven decision making for the enterprice: an overview of business intelligence applications. http://www.oasis-open.org/cover/xml.html, 37:414–420, 2007. 14. E. G. Mallach. Decision Support and Data Warehouse Systems. McGraw-Hill Higher Education, 1992. 15. M. Pighin and A. Marzona. Sistemi informativi aziendali: struttura e applicazioni. Pearson Education Italia, 2005. 16. L. Quagini. Business Intelligence e Knowledge Management: Gestione delle Informazioni e delle Performance nell’era digitale. Franco Angeli, 2004. 118 Riferimenti bibliografici 17. A. De Toni, G. Nassimbeni, and S. Tonchia. I sistemi di supporto alle decisioni. Franco Angeli, 2000.