theses

annuncio pubblicitario
Università degli Studi Mediterranea di Reggio Calabria
Dipartimento di Ingegneria dell’Informazione, delle Infrastrutture e
dell’Energia Sostenibile
Corso di Laurea Magistrale in Ingegneria Informatica e dei Sistemi per le
Telecomunicazioni
Tesi di Laurea
Progettazione e realizzazione di cruscotti e report relativi ai
contributi, alle immatricolazioni e alle lauree a partire dai
dati dell’Osservatorio Studenti Didattica del MIUR
Relatore
Candidato
Prof. Domenico Ursino
Franco Gangemi
Anno Accademico 2014-2015
Ai miei genitori
Indice
Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1
L’Osservatorio Studenti Didattica del MIUR . . . . . . . . . . . . . . . . . . . 5
1.1 L’Osservatorio Studenti Didattica del MIUR . . . . . . . . . . . . . . . . . . . . . 5
1.2 Cruscotto Ateneo: Organizzazione e Funzionalità . . . . . . . . . . . . . . . . . 6
1.2.1 Analisi Multidimensionale OLAP: Cubi, Dimensioni e Misure 8
1.3 Spedizioni ed Eventi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.3.1 Modalità di invio dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.3.2 Modalità di caricamento dei dati nel sistema . . . . . . . . . . . . . . . 18
2
La Business Intelligence e Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Cos’è la Business Intelligence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Introduzione dei concetti e illustrazione di un sistema di BI . .
2.1.2 Data Warehouse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.3 Data Mining . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Analisi degli strumenti e delle funzionalità di BI . . . . . . . . . . . .
2.2.2 Creazione dei report . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.3 Creazione di analisi dei report . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.4 Creare dashboard con Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.5 Il valore di Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
21
22
23
25
27
28
29
29
31
31
3
Estrazione di conoscenza sui contributi, le immatricolazioni e
le lauree relativa al nostro Ateneo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 MQ1: Residenza di provenienza immatricolati . . . . . . . . . . . . . . . . . . . .
3.2.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
3.2.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 MQ2: Scuola di provenienza degli immatricolati . . . . . . . . . . . . . . . . . .
3.3.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
3.3.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 MQ3: Livello di internazionalizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
33
33
34
34
35
37
37
40
41
43
IV
4
Indice
3.4.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 MQ4: Situazione relativa agli immatricolati . . . . . . . . . . . . . . . . . . . . . .
3.5.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
3.5.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6 MQ5: Situazione relativa ai laureati . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
3.6.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 MQ6: Situazione relativa alle rinunce . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
3.7.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8 MQ7: Situazione relativa ai contributi . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.8.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
3.8.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.9 Cruscotti realizzati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43
44
45
45
49
49
50
55
56
58
67
69
69
73
Estrazione di conoscenza sul immatricolazioni e lauree relativa
al contesto italiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 MQ1: Confronto tra Calabria e Sicilia . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Estrazione di conoscenza relativa agli immatricolati . . . . . . . . .
4.2.2 Estrazione di conoscenza relativa agli usciti . . . . . . . . . . . . . . . .
4.3 MQ2: Confronto in base all’area geografica . . . . . . . . . . . . . . . . . . . . . .
4.3.1 Estrazione di conoscenza relativa agli immatricolati . . . . . . . . .
4.3.2 Estrazione di conoscenza relativa agli usciti . . . . . . . . . . . . . . . .
4.4 MQ3: Confronto tra università tradizionale e telematica . . . . . . . . . . .
4.4.1 Definizione dei KPI e della loro presentazione . . . . . . . . . . . . . .
4.4.2 Conoscenza estratta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.5 Cruscotti realizzati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
77
78
78
81
86
86
92
95
95
96
98
5
Discussione in merito all’attività svolta . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.1 Lessons Learned and Best Practices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
5.2 Generalizzabilità dell’approccio proposto . . . . . . . . . . . . . . . . . . . . . . . . 109
5.3 Punti di forza e di debolezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.4 Approcci correlati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6
Conclusioni e uno sguardo al futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
Riferimenti bibliografici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Elenco delle figure
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
Schermata di accesso dell’Osservatorio Studenti Didattica . . . . . . . . . . 6
Sezione Tool dell’Osservatorio Studenti Didattica . . . . . . . . . . . . . . . . . . 7
Schermata di accesso del Cruscotto Ateneo . . . . . . . . . . . . . . . . . . . . . . . 7
Schermata principale del Cruscotto Ateneo . . . . . . . . . . . . . . . . . . . . . . . 8
Creazione dei report di analisi OLAP . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Testata delle schede . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Variabili presenti all’inizio del record . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Flusso dei dati ed elaborazioni cui sono soggetti . . . . . . . . . . . . . . . . . . . 19
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
Architettura di un sistema di BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Data Warehouse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esportazione dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Architettura del software Pentaho . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Interfaccia per la creazione dei report . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Creazione di nuove analisi o dashboard . . . . . . . . . . . . . . . . . . . . . . . . . .
Costruzione dei report . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Visualizzazione dei dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
24
26
28
30
30
31
31
Schema a stella relativo al cubo Immatricolati usato per la MQ1 . . . .
Immatricolati provenienti dal Comune di Reggio Calabria o da altri
Comuni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Classifica dei Comuni esterni di provenienza . . . . . . . . . . . . . . . . . . . . . .
3.4 Andamento del numero di immatricolati dall’anno 2001 . . . . . . . . . . . .
3.5 Immatricolati provenienti dalla Provincia di Reggio Calabria o da
altre Province . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6 Classifica delle Province esterne di provenienza in base al numero di
immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.7 Andamento del numero di immatricolati a partire dall’anno 2001 . . . .
3.8 Provincia degli immatricolati per Dipartimento relativa all’anno 2013
3.9 Immatricolati residenti in sede e fuori sede per ogni dipartimento . . . .
3.10 Immatricolati residenti in sede e fuori sede per ogni Corso di Studi . .
3.11 Schema a stella relativo al cubo Immatricolati usato per la MQ2 . . . .
3.12 Andamento degli immatricolati con maturità liceale e tecnica . . . . . . .
34
3.1
3.2
35
35
36
37
37
38
38
39
39
40
40
VI
Elenco delle figure
3.13
3.14
3.15
3.16
3.17
3.18
3.19
3.20
3.21
3.22
3.23
3.24
3.25
3.26
3.27
3.28
3.29
3.30
3.31
3.32
3.33
3.34
3.35
3.36
3.37
3.38
3.39
3.40
3.41
3.42
3.43
3.44
3.45
3.46
3.47
3.48
Andamento degli immatricolati con maturità professionale e magistrale
Andamento degli immatricolati con maturità liceale e classica . . . . . . .
Andamento degli immatricolati con maturità non liceali . . . . . . . . . . . .
Attrattiva Corso di Studi in base al macrotipo di diploma . . . . . . . . . .
Schema a stella relativo al cubo Immatricolati usato per la MQ3 . . . .
Andamento degli immatricolati con diploma estero . . . . . . . . . . . . . . . .
Classifica dei Corsi di Studio in base al numero di immatricolati con
diploma estero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Schema a stella relativo al cubo Immatricolati usato per la MQ4 . . . .
Andamento del numero di immatricolazioni per ogni Area . . . . . . . . . .
Andamento del numero di immatricolazioni per ogni Corso di Studio .
Andamento del numero di immatricolazioni per i corsi del DIIES . . . .
Andamento del numero di immatricolazioni in base al macrotipo di
laurea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Confronto tra immatricolati, iscritti ed iscritti regolari . . . . . . . . . . . . .
Attrattività dei Corsi di Studio biennali di Ingegneria . . . . . . . . . . . . . .
Schema a stella relativo al cubo Usciti usato per la MQ5 . . . . . . . . . . .
Andamento del numero di laureati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Andamento del voto di laurea, fasce 66-90 e 91-100 . . . . . . . . . . . . . . . .
Andamento del voto di laurea, fasce 101-105, 106-110 e 110 con lode .
Andamento del voto di laurea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Numero medio di anni per il conseguimento del titolo in base alla
fascia di voto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Numero di laureati in base alla fascia di voto . . . . . . . . . . . . . . . . . . . . .
Numero medio di anni per il conseguimento del titolo in base al
macrotipo di laurea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Andamento del numero di laureati in base al macrotipo di laurea . . . .
Numero medio di anni per conseguimento titolo triennale in Ingegneria
Numero medio di anni per conseguimento titolo biennale in Ingegneria
Numero di laureati nei Corsi di Studio triennali dell’Area di Ingegneria
Numero di laureati nei corsi di Studio biennali dell’Area di Ingegneria
Numero di laureati per ogni Area della Mediterranea a partire dal
2005 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Numero medio di anni per il conseguimento di un titolo di studio
biennale presso l’Università Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . .
Numero medio di anni per il conseguimento di un titolo di studio
triennale presso l’Università Mediterranea . . . . . . . . . . . . . . . . . . . . . . . .
Numero medio di anni per il conseguimento di un titolo di studio
biennale presso l’Università Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . .
Numero di laureati per ciascun corso biennale della Mediterranea . . . .
Numero di laureati meo Corsi di Studi triennali della Mediterranea . .
Numero di laureati nei Corsi di Studio a ciclo unico della Mediterranea
Andamento del numero di laureati, suddivisi per fasce di voto, per
l’Area di Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Andamento del numero di laureati, suddivisi per fasce di voto, per
il Corso di Studi in Ingegneria Elettronica . . . . . . . . . . . . . . . . . . . . . . . .
41
41
42
42
43
43
44
45
46
47
48
48
49
49
50
50
51
51
51
52
52
53
53
54
54
55
55
56
56
57
57
58
59
59
60
60
Elenco delle figure
3.49 Andamento del numero di laureati, suddivisi per fasce di voto, per
il Corso di Studi in Ingegneria dell’Informazione . . . . . . . . . . . . . . . . . . .
3.50 Andamento del numero di laureati, suddivisi per fasce di voto, per
il Corso di Studi in Ingegneria Informatica e dei Sistemi per le
Telecomunicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.51 Confronto tra i Corsi di Studio in Ingegneria delle Telecomunicazioni
DM509 e DM270 per ciò che riguarda la durata media degli studi . . .
3.52 Schema a stella relativo al cubo Usciti usato per la MQ6 . . . . . . . . . . .
3.53 Andamento delle rinunce nel corso degli anni . . . . . . . . . . . . . . . . . . . . .
3.54 Andamento delle rinunce in base al macrotipo di diploma . . . . . . . . . . .
3.55 Andamento delle rinunce in base al macrotipo di laurea . . . . . . . . . . . .
3.56 Andamento delle rinunce in base alle Aree . . . . . . . . . . . . . . . . . . . . . . . .
3.57 Rinunce degli iscritti dell’anno 2011 dopo n+1 anni . . . . . . . . . . . . . . . .
3.58 Numero totale di rinunce, dopo n+1 anni, per ogni Corso di Studi
dell’Area di Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.59 Rinunce per ogni Corso di Studio dell’Area di Ingegneria a partire
dal 2008 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.60 Numero di rinunce in base all’anno di immatricolazione per gli
studenti della Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.61 Rinunce da parte degli immatricolati negli A.A. 2010/2011,
2011/2012 e 2012/2013 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.62 Rinunce da parte degli immatricolati negli A.A. 2010/2011,
2011/2012 e 2012/2013 nei Corsi di Studio triennali dell’Area di
Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.63 Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del
Corso di Studi in Ingegneria dell’Informazione . . . . . . . . . . . . . . . . . . . .
3.64 Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del
Corso di Studi in Ingegneria Informatica e dei Sistemi per le
Telecomunicazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.65 Schema a stella relativo al cubo Contributi usato per la MQ7 . . . . . . .
3.66 Confronto tra importoDovuto e importoPagato negli anni . . . . . . . . . .
3.67 Confronto tra importoDovuto e importoPagato per le Aree della
Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.68 Confronto tra importoDovuto ed importoPagato per i Corsi di
Studio dell’Area Ingegneria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.69 Informazioni relative al Comune di residenza associato alle richieste
di borse di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.70 Informazioni relative alla Provincia di residenza associato alle
richieste di borse di studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.71 Informazioni relative al macrotipo di laurea associato alle richieste
di borse di studio (anno 2014) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.72 Informazioni relative al macrotipo di laurea associato alle richieste
di borse di studio (anno 2015) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.73 Cruscotto relativo agli immatricolati, iscritti, usciti e laureati della
Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.74 Cruscotto relativo al numero di laureati e di rinunce esplicite della
Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VII
61
61
61
62
62
63
64
64
65
65
66
67
67
68
68
68
69
69
70
71
71
72
72
72
73
74
VIII
Elenco delle figure
3.75 Cruscotto relativo al numero di usciti e di laureati della Mediterranea 74
3.76 Cruscotto relativo ai corsi di Ingegneria dell’Informazione e di
Ingegneria Informatica e dei Sistemi per le Telecomunicazioni della
Mediterranea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
4.14
4.15
4.16
4.17
4.18
4.19
4.20
4.21
4.22
4.23
4.24
4.25
4.26
Schema a stella del cubo usato per la MQ1 relativa agli immatricolati
Confronto tra gli andamenti relativi al numero totale di
immatricolati in Calabria e in Sicilia . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Confronto tra il numero totale di immatricolati alle università
calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Classifica degli atenei calabresi e siciliani in base al numero di
immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Andamento delle immatricolazioni presso gli atenei calabresi e siciliani
Informazioni sull’andamento delle immatricolazioni e dei rispettivi
trend ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . .
Andamento delle immatricolazioni con diploma estero . . . . . . . . . . . . . .
Andamento delle immatricolazioni con diploma estero per ogni
ateneo calabrese e siciliano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Immatricolazioni alle Classi di Laurea L-8 e LM-27 calabresi e siciliane
Andamento delle immatricolazioni alle Classi di Laurea L-8 e LM-27
calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Schema a stella del cubo usato per la MQ1 relativa agli usciti . . . . . . .
Andamento del numero di usciti delle università calabresi e siciliane .
Informazioni sull’andamento degli usciti e dei rispettivi trend
ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . .
Andamento del numero di laureati delle università calabresi e siciliane
Informazioni sull’andamento dei laureati e dei rispettivi trend
ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . .
Andamento del numero di rinunce esplicite delle università calabresi
e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Informazioni sull’andamento delle rinunce esplicite e dei rispettivi
trend ottenuti dalle università calabresi e siciliane . . . . . . . . . . . . . . . . .
Schema a stella del cubo usato per la MQ2 relativa agli immatricolati
Andamento delle immatricolazioni relativo alle università presenti
in Italia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Andamento delle immatricolazioni in base all’area geografica degli
atenei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Andamento delle immatricolazioni alla Classe di Laurea L-8 . . . . . . . .
Andamento delle immatricolazioni alla Classe di Laurea L-8 per
ogni area geografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Andamento delle immatricolazioni alla Classe di Laurea LM-27 . . . . . .
Andamento delle immatricolazioni alla Classe di Laurea LM-27 per
ogni area geografica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Classifica degli atenei italiani in base al numero di immatricolati
alla Classe di Laurea L-8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Classifica degli atenei italiani in base al numero di immatricolati
alla Classe di Laurea LM-27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
78
79
79
80
81
82
83
83
84
84
84
85
85
86
87
88
89
90
90
90
91
91
91
92
93
94
Elenco delle figure
IX
4.27 Schema a stella del cubo usato per la MQ2 relativa agli usciti . . . . . . . 94
4.28 Andamento del numero di rinunce esplicite in base all’area geografica 95
4.29 Informazioni sull’andamento delle rinunce esplicite e dei rispettivi
trend ottenuti per ogni area geografica . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
4.30 Andamento del numero di rinunce esplicite relativo al Corso di
Laurea L-8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.31 Andamento del numero di rinunce esplicite relativo al Corso di
Laurea LM-27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.32 Numero medio di anni necessario per conseguire la laurea relativo
alle Classi di Laurea L-8 e LM-27 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
4.33 Numero medio di anni necessario per conseguire la laurea relativo
alle Classi di Laurea L-8 e LM-27 in base all’area geografica . . . . . . . . 98
4.34 Classifica atenei italiani in base al numero medio di anni necessario
per conseguire la laurea (Classi di Laurea L-8) . . . . . . . . . . . . . . . . . . . . 99
4.35 Classifica atenei italiani in base al numero medio di anni necessario
per conseguire la laurea (Classi di Laurea LM-27) . . . . . . . . . . . . . . . . . 99
4.36 Schema a stella del cubo usato per la MQ3 . . . . . . . . . . . . . . . . . . . . . . . 100
4.37 Confronto sull’andamento delle immatricolazioni relativo alle
università tradizionali e telematiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.38 Classifica dei Corsi di Studio delle università telematiche sulla base
del numero di immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4.39 Classifica delle università telematiche sulla base del numero di
immatricolati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.40 Andamento delle immatricolazioni relative alla Classe di Laurea L-8
per le università telematiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
4.41 Cruscotto relativo al numero di immatricolati e laureati delle
università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.42 Cruscotto relativo al numero di laureati e di rinunce esplicite delle
università calabresi e siciliane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.43 Cruscotto relativo al numero di immatricolati delle università
calabresi e siciliane considerando la Classe di Laurea L-8 . . . . . . . . . . . 104
4.44 Cruscotto relativo al numero di immatricolazioni in base al contesto
italiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
Elenco delle tabelle
1.1
1.2
Mapping tra dimensioni e cubi (prima parte) . . . . . . . . . . . . . . . . . . . . . 12
Mapping tra dimensioni e cubi (seconda parte) . . . . . . . . . . . . . . . . . . . . 13
Introduzione
Una delle esigenze fondamentali di ogni organizzazione è quella di trasformare i dati
raccolti in informazioni messe a supporto delle decisioni e delle strategie aziendali.
Negli ultimi anni la Business Intelligence ricopre un ruolo rilevante negli investimenti fatti dalle aziende al fine di ottimizzare i processi di business. Per una gestione
corretta e vincente dell’organizzazione, ogni manager dovrebbe valutare la performance attuale individuando le cause di tale andamento e, infine, indicare le azioni
che andrebbero intraprese per migliorarla. La Business Intelligence si pone, quindi,
l’obbiettivo di offrire un insieme di tecnologie di ausilio per i processi decisionali.
L’insieme di prodotti e soluzioni offerti dalla Business Intelligence permette, infatti,
la gestione, la bonifica, la manipolazione e il controllo dei dati presenti in un’organizzazione al fine di trasformarli, mediante report e cruscotti, in informazioni certe,
affidabili, puntuali ed uniche per tutta l’organizzazione aziendale. I dati vengono
memorizzati interamente nel Data Warehouse il cui accesso è consentito in sola lettura. Tali dati hanno una dimensione storica e possono essere memorizzati in una
serie di Data Mart, specializzati per le varie aree di attività.
Se, inizialmente, la Business Intelligence veniva adoperata nel privato, al giorno
d’oggi lo scenario applicativo di tali tecnologie si è allargato in molteplici organizzazioni come la Pubblica Amministrazione e l’Università. In questi anni si è fatto uno
sforzo di ammodernamento tecnologico significativo, in quanto le amministrazioni
sono state dotate di una struttura informatica di assoluto rilievo, a fronte di investimenti importanti. Le istituzioni hanno scelto, quindi, di intraprendere un percorso
di informatizzazione e di integrare tecnologie di Business Intelligence a valle di una
consolidata base di beni e servizi di ICT.
Il DM 509, contestualmente alla riforma della didattica, ha previsto la costituzione dell’Anagrafe Nazionale degli Studenti del nuovo ordinamento. Nell’A.A.
2004/2005, il Consorzio Universitario Cineca ha iniziato a costruire tale anagrafe
su richiesta del MIUR. Grazie alle competenze acquisite nell’ambito della gestione
delle informazioni, il Cineca ha dato via alla nuova sfida del knowledge management. L’Osservatorio Studenti Didattica è il sistema, accessibile tramite browser
web, messo a disposizione dal Cineca.
Per il presente elaborato di tesi è stato possibile avere accesso ai dati raccolti sul
sistema distribuito relativi a tutti gli atenei italiani. Questi dati vengono periodicamente aggiornati da ogni ateneo attraverso un meccanismo di spedizioni a cadenza
2
Introduzione
settimanale. I dati raccolti forniscono una serie di informazioni su immatricolati,
iscritti, usciti, contributi e crediti relativi a tutti gli atenei italiani. La ricerca effettuata nella presente tesi ha visto l’applicazione di tecniche di Data Warehousing su
questi dati, mediante il software di Business Intelligence Pentaho, al fine di estrarre conoscenza a supporto dei processi decisionali. Pentaho è una piattaforma open
source fondata nel 2004 che offre una serie di tool alcuni dei quali sono stati da noi
adoperati durante la seguente tesi.
A partire dal livello dei dati riconciliati è stato possibile progettare degli schemi a
stella e, quindi, realizzare una serie di cubi di interesse per la governance riguardanti
le misure di riferimento. Ogni cubo si sofferma, in particolare, su un determinato
aspetto di analisi.
La conoscenza di interesse è stata specifica dalla governance di Ateneo (Prorettore delegato alla Didattica, Dirigente Segreteria, Prorettore delegato all’Informatica).
Prima di procedere alla fase di estrazione della conoscenza, è stato necessario documentarsi sulla realtà del mondo universitario, consultando documenti ufficiali e
confrontandosi con gli addetti ai lavori per risolvere eventuali incongruenze nell’interpretazione di alcune definizioni. Questa fase è stata fondamentale per cercare di
garantire una certa consistenza alle analisi successive. Inoltre, è stata anche determinante per l’individuazione dei Key Performance Indicator, ovvero gli indici che
monitorano l’andamento dei processi aziendali concentrandosi su quegli aspetti della
performance di un’organizzazione che sono i più critici per il suo successo corrente
e futuro.
Una volta progettati i cubi, è stato impiegato il tool di Pentaho per eseguire una
serie di operazioni OLAP come, ad esempio, pivoting, slice and dice, drill-down e
roll-up, per la scelta e il processing delle dimensioni e delle misure necessarie per
la creazione dei report. Inizialmente, ci siamo occupati della situazione generale
relativa all’Università Mediterranea di Reggio Calabria e, in un secondo momento, abbiamo spostato la nostra attenzione dalla realtà locale a quella nazionale. I
risultati ottenuti sono stati organizzati in una serie di macro-questioni di interesse.
La fase successiva ha visto la creazione di cruscotti contenenti i report più significativi per un determinato contesto. I cruscotti delle prestazioni costituiscono
l’interfaccia utente che fornisce la sintesi delle informazioni più importanti in termini
di Business Intelligence.
Il presente lavoro di tesi è strutturato come di seguito specificato:
•
•
•
Il primo capitolo descrive nel dettaglio l’Osservatorio Studenti Didattica (OSD)
del MIUR ed il tool denominato Cruscotto Ateneo, che è stato utilizzato per
le analisi multidimensionali sui dati dell’Anagrafe Nazionali Studenti (ANS).
Vengono specificate, inoltre, le informazioni relative a cubi, dimensioni e misure
impiegati per le operazioni OLAP. In seguito, vengono descritte le modalità di
caricamento dei dati, effettuato per costruire l’ANS, le spedizioni ed i relativi
eventi.
Nel secondo capitolo parleremo, inizialmente, di Business Intelligence, illustrando le caratteristiche principali dei sistemi di Data Warehousing e Data Mining
e, successivamente, del tool Pentaho, adoperato per l’analisi dei dati.
Nel terzo capitolo metteremo in evidenza la conoscenza estratta, relativa all’Università Mediterranea di Reggio Calabria, grazie al lavoro svolto a partire
dai dati dell’OSD. Verranno descritti gli schemi a stella a partire dai quali è
Introduzione
3
stato progettato il cubo, e i Key Performance Indicator individuati per ogni
macro-questione.
• Il quarto capitolo illustra la conoscenza estratta su immatricolazioni e lauree, relativa ai vari atenei italiani, individuando i Key Performance Indicator a partire
dai quali sono stati ricavati i report e i cruscotti di interesse.
• Nel quinto capitolo forniremo una descrizione in merito all’attività svolta, indicando le best practices suggerite in modo da migliorare la gestione della conoscenza, per una serie di ostacoli incontrati durante la fase di analisi.
Descriveremo, inoltre, i punti di forza e di debolezza del lavoro effettuato.
• Nel sesto capitolo trarremo le conclusioni sul lavoro svolto e analizzeremo alcuni
possibili sviluppi futuri.
1
L’Osservatorio Studenti Didattica del MIUR
Questo capitolo fornisce una descrizione dell’Osservatorio Studenti Didattica del
MIUR e del tool denominato Cruscotto Ateneo che è stato impiegato per l’analisi multidimensionale sui dati dell’Anagrafe Nazionale Studenti. Vengono, quindi,
specificate le informazioni relative a cubi, dimensioni e misure impiegate per le operazioni OLAP. Successivamente, vengono descritti il caricamento dei dati effettuato
per costruire l’ANS, le spedizioni ed i relativi eventi. Infine, vengono specificate le
modalità di invio dei dati e quelle di caricamento degli stessi nel sistema.
1.1 L’Osservatorio Studenti Didattica del MIUR
Il DM 509, contestualmente alla riforma della didattica, ha previsto la costituzione
dell’Anagrafe Nazionale degli Studenti (nel seguito, ANS) del nuovo ordinamento;
nell’Anno accademico 2004/2005, il Consorzio Interuniversitario Cineca ha iniziato
a costruire tale anagrafe su richiesta del Ministero dell’Istruzione, dell’Università e
della Ricerca (nel seguito, MIUR). Grazie alle competenze acquisite nell’ambito della
gestione delle informazioni, il Consorzio ha dato via alla nuova sfida del knowledge
management, disegnando un approccio originale basato sulle ontologie.
Il Cineca è il maggiore centro di supercalcolo italiano e uno dei più importanti
in Europa, ed occupa una posizione di grande rilievo anche a livello mondiale. È,
infatti, dotato dei più avanzati sistemi per il calcolo ad alte prestazioni e di risorse
hardware per l’elaborazione e il trattamento dell’informazione che hanno consentito
ad esso di diventare un punto di riferimento nell’ambito dell’ICT. Inoltre, la profonda conoscenza del mondo accademico consente al Cineca di offrire soluzioni efficaci,
orientate alla governance, oltre che alla gestione ordinaria degli Atenei, promuovendo il reciproco trasferimento di conoscenze per migliorare continuamente la qualità
dei loro servizi.
L’Osservatorio Studenti Didattica è il sistema messo a disposizione dal Cineca ed
è accessibile tramite browser web digitando l’url http://osservatorio.cineca.it
ed inserendo le credenziali. La schermata di accesso è riportata in Figura 1.1.
Attraverso la fase di autenticazione si accede al sito riservato, realizzato con protocollo SSL, che garantisce la sicurezza delle transazioni effettuate mediante la crittografia dei dati. L’Osservatorio si compone di un’area riservata agli atenei per fornire
6
1 L’Osservatorio Studenti Didattica del MIUR
Figura 1.1. Schermata di accesso dell’Osservatorio Studenti Didattica
le informazioni che confluiranno nell’anagrafe dopo aver superato le verifiche di congruità, ed un’area pubblica, dove, in modo aggregato, tutte le informazioni vengono
pubblicate con l’ausilio di un’interfaccia di navigazione che consente una immediata
aggregazione a livello geografico.
Il sistema è progettato in modo da registrare gli eventi di carriera di ogni studente del sistema accademico nazionale iscritto ad un corso di laurea del nuovo
ordinamento, in modo da poter seguire i loro percorsi di studi in conformità alle
norme previste dal DM 509, in materia di classi, insegnamenti (di base, caratterizzanti ed affini), crediti formativi conseguiti nei diversi settori scientifico-disciplinari
fino al conseguimento del titolo o, eventualmente, all’abbandono.
Ogni Ateneo ha l’obbligo di fornire periodicamente al MIUR precisi indicatori
di qualità relativi ai corsi di studio, i quali forniscono informazioni utili per l’approvazione dei corsi e ai fini della ripartizione delle risorse annualmente assegnate. La
procedura viene reiterata ad ogni apertura e chiusura del corso di laurea. Secondo il
sistema AVA (Autovalutazione, Valutazione, Accreditamento), nel caso in cui l’Ateneo non dovesse superare determinate soglie minime di valutazione, quest’ultimo
non verrà accreditato.
1.2 Cruscotto Ateneo: Organizzazione e Funzionalità
Nell’ottica di fornire uno strumento per l’analisi delle informazioni dell’ANS è stata
progettata e realizzata una piattaforma di Business Intelligence con tecnologia Pentaho EE denominata Cruscotto Ateneo. Il Cruscotto è accessibile tramite la sezione
Tool del sito dell’Osservatorio (Figura 1.2), o tramite browser web digitando l’url:
http://cruscottoateneo.cineca.it/pentaho/Login (Figura 1.3).
Il Cruscotto è a disposizione del MIUR e di tutti gli atenei che contribuiscono
alla raccolta dei dati ANS, ed espone agli utenti tutti i dati spediti dagli atenei e
raccolti periodicamente dal Cineca secondo le vigenti norme di legge. I dati raccolti
1.2 Cruscotto Ateneo: Organizzazione e Funzionalità
7
Figura 1.2. Sezione Tool dell’Osservatorio Studenti Didattica
Figura 1.3. Schermata di accesso del Cruscotto Ateneo
sono elaborati ed armonizzati per essere analizzabili nella loro totalità, ad un livello
di aggregazione tale da rendere possibili sia analisi di sistema che di singolo ateneo.
In Figura 1.4 è possibile visualizzare la schermata principale del Cruscotto. Come
possiamo notare, esso prevede la fruizione delle informazioni dell’ANS attraverso tre
modalità: analisi multidimensionali OLAP su un insieme di cubi tematici, report
ad-hoc su particolari fenomeni o indicatori di interesse generale, composizione di
questi in dashboard o cruscotti di riepilogo.
Gli utenti hanno la possibilità di consultare i contenuti messi a disposizione
dall’ufficio di statistica, esportarli nei vari formati disponibili, o salvarli in una
cartella online personale che, eventualmente, può essere condivisa.
8
1 L’Osservatorio Studenti Didattica del MIUR
Figura 1.4. Schermata principale del Cruscotto Ateneo
1.2.1 Analisi Multidimensionale OLAP: Cubi, Dimensioni e Misure
Per quanto riguarda l’Analisi Multidimensionale OLAP il sistema mette a disposizione i seguenti cubi:
•
•
•
•
•
Cubo
Cubo
Cubo
Cubo
Cubo
Contributi;
Crediti;
Immatricolati;
Iscritti;
Usciti.
Le analisi OLAP effettuate su questi cubi consentono all’utente di vedere soltanto
i dati del proprio ateneo di afferenza. Per dare la possibilità agli utenti di poter fare
analisi di sistema e di confronto con gli altri atenei c’è la possibilità di utilizzare i cubi
pubblici: per ogni cubo illustrato precedentemente vi è una versione pubblica che
contiene i dati di tutti gli atenei italiani. L’unica limitazione riscontrata nell’utilizzo
di questi cubi è la mancanza delle dimensioni didattiche “Corso” e “Nome Corso”.
In Figura 1.5 è riportato l’ambiente di creazione dei report di analisi. Nel ventaglio
di selezione situato sulla sinistra, l’utente può selezionare, in modalità drag and
drop, dimensioni e misure, usufruendo, poi, di una serie di funzionalità aggiuntive,
come filtri e tool grafici, per la creazione di report personalizzati.
I cubi possono essere navigati attraverso una serie di dimensioni organizzate
nelle seguenti categorie:
•
Ateneo. In questo gruppo troviamo tutte le dimensioni riguardanti l’ateneo
associato alle informazioni che stiamo visualizzando. Le dimensioni Ateneo sono:
– Ateneo Corto: il nome dell’ateneo senza caratteri speciali (da usare nelle
dashboard);
– Ateneo USTAT : la denominazione dell’ateneo usata dall’ufficio di statistica
USTAT;
1.2 Cruscotto Ateneo: Organizzazione e Funzionalità
9
Figura 1.5. Creazione dei report di analisi OLAP
–
–
–
Ateneo: la denominazione dell’ateneo;
Modalità Ateneo: la modalità didattica dell’ateneo, tradizionale oppure telematica;
Tipo Ateneo: distinzione tra atenei statali e non statali.
• Carriera. In questo gruppo troviamo tutte le dimensioni riguardanti la carriera
di uno studente. Tra queste dimensioni troviamo:
– Stato Carriera: lo stato attuale della carriera dello studente, ad esempio
attiva, multipla, chiusa, sospesa;
– Prima Immatricolazione: prima carriera, nel caso di prima immatricolazione
al sistema universitario, carriera successiva, altrimenti;
– Tipo Iscrizione: distinzione tra iscrizione normale oppure multipla;
– Studente Regolare: distinzione tra studente regolare e fuoricorso;
– Fascia Voto Laurea: classificazione del voto laurea per fasce di voto;
– Voto Laurea: voto di laurea;
– Motivo Uscita: il motivo di chiusura della carriera, ad esempio laurea,
rinuncia, decadenza, etc.
• Contributi. In questo gruppo troviamo tutte le dimensioni riguardanti il diritto
allo studio e le agevolazioni sui contributi pagati dagli studenti. In particolare,
troviamo:
– Borsa: informazioni sulla richiesta di borsa di studio, come, ad esempio,
idoneo, non idoneo, beneficiario;
– Esensione: informazioni in merito alla richiesta di esenzione dei contributi
universitari ottenuta dallo studente;
– Esonero: informazioni in merito al tipo di esonero ottenuto sui contributi
universitari;
– Lavoratore: informazioni relative allo status di studente/lavoratore.
• Crediti. In questo gruppo troviamo tutte le dimensioni riguardanti i crediti
ottenuti dallo studente. In particolare, troviamo:
10
1 L’Osservatorio Studenti Didattica del MIUR
– Ambito Univoco: ambito univoco specifico, associato ai crediti conseguiti;
– Attività Formativa: tipo di attività formativa associata ai crediti conseguiti;
– Crediti Carriera: distinzione tra crediti validi per carriera corso correnti e
crediti non più validi per carriera corso correnti;
– Area SSD : area relativa al Settore Scientifico Disciplinare;
– Codice SSD : codice del Settore Scientifico Disciplinare;
– Settore SSD : Settore Scientifico Disciplinare;
– Tipo Attività: tipo di attività che ha portato all’ottenimento dei CFU;
– Tipo Crediti: tipologia dei crediti (sostenuti, convalidati, etc).
•
Didattica. In questo gruppo troviamo tutte le dimensioni di analisi che rappresentano il percorso di studi, attraverso vari livelli di aggregazione. In particolare,
troviamo:
– Anno di Iscrizione: l’anno di iscrizione al corso di studio;
– Area CUN : l’area del Consiglio Universitario Nazionale;
– Area: l’area didattica di appartenenza del corso di studio;
– Classe: la classe del corso di studio, nel formato codice classe - nome classe;
– Corso: il corso di studio nel formato chiave corso - nome corso;
– Dipartimento: il dipartimento o l’eventuale struttura di raccordo, secondo la
legge 240/10;
– Facoltà: la facoltà del corso di laurea;
– Field of Education: classificazione del corso di studio per Field of Education1 ;
– Gruppo ISTAT : classificazione del corso di studio secondo un raggruppamento ISTAT;
– Nome Corso Pubblico: la denominazione del corso di studi in base al suo
codicione, come sul sito pubblico anagrafe.miur.it;
– Nome Corso: il nome del corso di studio;
– Ordinamento: l’ordinamento didattico del corso di studio: D.M. 509/99 D.M. 270/04;
– Tipo Laurea: la tipologia del corso di laurea.
•
Geografia - Italia. In questo gruppo troviamo tutte le dimensioni geografiche
italiane:
– Ateneo Area: l’area italiana dell’ateneo;
– Ateneo Regione: la regione della sede dell’ateneo;
– Ateneo Provincia: la provincia della sede dell’ateneo;
– Area Comune: il comune della sede dell’ateneo;
– Corso Area: l’area italiana del corso di studio;
– Corso Regione: la regione del corso di studio;
– Corso Provincia: la provincia del corso di studio;
– Corso Comune: il comune del corso di studio;
– Nascita Area: l’area italiana di nascita dello studente;
– Nascita Regione: la regione di nascita dello studente;
– Nascita Provincia: la provincia di nascita dello studente;
– Nascita Comune: il comune di nascita dello studente;
– Residenza Area: l’area italiana di residenza dello studente;
– Residenza Regione: la regione italiana di residenza dello studente;
1
Settore di studi.
1.2 Cruscotto Ateneo: Organizzazione e Funzionalità
–
–
11
Residenza Provincia: la provincia italiana di residenza dello studente;
Residenza Comune: il comune italiano di residenza dello studente.
• Geografia - Nazioni. In questo gruppo troviamo tutte le dimensioni geografiche
nazionali; in particolare, sono presenti i seguenti campi:
– Cittadinanza Continente ISTAT : il continente cui fa riferimento la cittadinanza dello studente (codifica ISTAT);
– Cittadinanza Nazione ISTAT : la nazione cui fa riferimento la cittadinanza
dello studente (codifica ISTAT);
– Nascita Continente ISTAT : il continente di nascita dello studente (codifica
ISTAT);
– Nascita Nazione ISTAT : la nazione di nascita dello studente (codifica ISTAT).
• Studente. In questo gruppo troviamo tutte le dimensioni che riguardano lo
studente. In particolare, sono presenti i seguenti campi:
– Fascia Anno Nascita: la fascia dell’anno di nascita dello studente;
– Anno Nascita: l’anno di nascita dello studente;
– Sesso: il sesso dello studente;
– Macrotipo Diploma: il macrotipo del diploma dello studente;
– Tipo Diploma: il tipo del diploma dello studente;
– Fascia Voto Diploma: la classificazione del voto diploma per fasce di voto;
– Voto Diploma: il voto di diploma dello studente.
• Tempo. In questo gruppo troviamo tutte le dimensioni che riguardano il tempo.
In particolare, troviamo i seguenti campi:
– A.A. Immatricolazione: l’anno accademico di immatricolazione della carriera
dello studente, nel formato yyyy/yyyy+1;
– A.A. Prima Immatricolazione: l’anno accademico di prima immatricolazione
dello studente, nel formato yyyy/yyyy+1;
– Anno Corto: l’anno accademico nel formato yyyy;
– Anno Accademico: l’anno accademico nel formato yyyy/yyyy+1;
– Anno Diploma: l’anno di diploma dello studente;
– Anno Uscita: l’anno solare di chiusura della carriera, nel formato yyyy;
– Anno Solare: l’anno solare, nel formato yyyy.
• Titolo Univ. Precedente. In questo gruppo troviamo tutte le dimensioni relative a
titoli di studio precedentemente acquisiti dallo studente. In particolare, troviamo
i seguenti campi:
– Anno Accademico Titolo UN : l’anno accademico del titolo universitario
precedente;
– Statale UN : la tipologia dell’ateneo del titolo universitario precedente;
– Telematica UN : la tipologia didattica del titolo universitario precedente;
– Ateneo UN : l’ateneo del titolo universitario precedente;
– Tipo Laurea UN : il tipo laurea del titolo universitario precedente;
– Field of Education UN : Field of Education del titolo universitario precedente;
– Classe UN : la classe del titolo universitario precedente;
– Nazione Titolo UN IT : indica se il titolo universitario precedente è stato
conseguito in Italia, all’estero, o non è stato fornito il dato;
12
1 L’Osservatorio Studenti Didattica del MIUR
Categ./Sottocateg.
Ateneo
Ateneo Corto
Ateneo USTAT
Ateneo
Tipo Ateneo
Modalità Ateneo
Carriera
Stato Carriera
Tipo Immatricolazione
Tipo Iscrizione
Studente Regolare
Fascia Voto Laurea
Voto Laurea
Motivo Uscita
Contributi
Borsa
Esenzione
Esonero
Lavoratore
Crediti
Ambito Univoco
Attività Formativa
Crediti Carriera
Area SSD
Codice SSD
Settore SSD
Tipo Attività
Tipo Crediti
Didattica
Anno di Iscrizione
Area CUN
Area
Classe
Corso
Dipartimento
Facoltà
Field of Education
Gruppo ISTAT
Nome Corso Pubblico
Nome Corso
Ordinamento
Tipo Laurea
Cubo Contributi Cubo Crediti Cubo Immatricolati Cubo Iscritti Cubo Usciti
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Tabella 1.1. Mapping tra dimensioni e cubi (prima parte)
– Nazione Titolo UN UE : indica se il titolo universitario precedente è stato
conseguito in un paese dell’Unione Europea, all’esterno, o non è stato fornito
il dato;
– Nazione Titolo UN : la nazione del titolo universitario precedente.
Nella Tabelle 1.1 e 1.2 viene mostrato il mapping tra dimensioni e cubi.
Ciascun cubo ha le seguenti misure, che l’utente può scegliere per effettuare le
analisi:
•
Cubo Contributi
– Importo Dovuto: somma in euro dei contributi che gli studenti devono
versare;
– Importo Pagato: somma in euro dei contributi che gli studenti hanno effettivamente versato.
•
Cubo Crediti
– CFU Corso: crediti ottenuti nel corso attuale dello studente;
– CFU Altro Corso: crediti ottenuti in corsi diversi da quello attuale dello
studente;
– CFU Altro Ateneo: crediti ottenuti in altri atenei;
1.2 Cruscotto Ateneo: Organizzazione e Funzionalità
Categ./Sottocateg.
Geografia-Italia
Ateneo Area
Ateneo Regione
Ateneo Provincia
Ateneo Comune
Corso Area
Corso Regione
Corso Provincia
Corso Comune
Nascita Area
Nascita Regione
Nascita Provincia
Nascita Comune
Residenza Area
Residenza Regione
Residenza Provincia
Residenza Comune
Geografia-Nazioni
Cittadinanza Continente ISTAT
Cittadinanza Nazione ISTAT
Nascita Continente ISTAT
Nascita Nazione ISTAT
Studente
Fascia Anno Nascita
Anno Nascita
Sesso
Macrotipo Diploma
Tipo Diploma
Fascia Voto Diploma
Voto Diploma
Tempo
A.A. Immatricolazione
A.A. Prima Immatricolazione
A.A. Corto
Anno Accademico
Anno Diploma
Anno Uscita
Anno Solare
Titolo Univ. Precedente
Anno Accademico Titolo UN
Statale UN
Telematica UN
Ateneo UN
Tipo Laurea UN
Field Of Education UN
Classe UN
Nazione Titolo UN IT
Nazione Titolo UN UE
Nazione Titolo UN
13
Cubo Contributi Cubo Crediti Cubo Immatricolati Cubo Iscritti Cubo Usciti
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
Tabella 1.2. Mapping tra dimensioni e cubi (seconda parte)
–
–
–
–
–
CFU
CFU
CFU
CFU
CFU
Atenei Stranieri: crediti ottenuti all’estero;
Stage: crediti ottenuti da attività di stage;
Validi: crediti validi per la carriera attuale;
Totali: crediti totali ottenuti dallo studente;
Totali Validi: crediti totali validi ottenuti dallo studente.
• Cubo Immatricolati
– Immatricolati: numero di immatricolazioni;
– CFU ingresso: crediti riconosciuti al momento dell’immatricolazione;
– Importo Dovuto: somma in euro dei contributi che gli studenti devono
versare;
– Importo Pagato: somma in euro dei contributi che gli studenti hanno effettivamente versato;
– CFU Corso: crediti ottenuti nel corso attuale dello studente;
– CFU Altro Corso: crediti ottenuti in corsi diversi da quello attuale dello
studente;
14
1 L’Osservatorio Studenti Didattica del MIUR
–
–
–
–
–
–
CFU
CFU
CFU
CFU
CFU
CFU
Altro Ateneo: crediti ottenuti in altri atenei;
Atenei Stranieri: crediti ottenuti all’estero;
Stage: crediti ottenuti da attività di stage;
Validi: crediti validi per la carriera attuale;
Totali: crediti totali ottenuti dallo studente;
Totali Validi: crediti totali validi ottenuti dallo studente.
•
Cubo Iscritti
– Iscritti: numero di iscrizioni;
– Media CFU : misura calcolata come CFU totali / Iscritti;
– Importo Dovuto: somma in euro dei contributi che gli studenti devono
versare;
– Importo Pagato: somma in euro dei contributi che gli studenti hanno effettivamente versato;
– CFU Corso: crediti ottenuti nel corso attuale dello studente;
– CFU Altro Corso: crediti ottenuti in corsi diversi da quello attuale dello
studente;
– CFU Altro Ateneo: crediti ottenuti in altri atenei;
– CFU Atenei Stranieri: crediti ottenuti all’estero;
– CFU Stage: crediti ottenuti da attività di stage;
– CFU Validi: crediti validi per la carriera attuale;
– CFU Totali: crediti totali ottenuti dallo studente;
– CFU Totali Validi: crediti totali validi ottenuti dallo studente.
•
Cubo Usciti
– Laureati: numero di laureati;
– Media A.A. Uscita: crediti totali validi ottenuti dallo studente;
– Usciti: numero di usciti.
1.3 Spedizioni ed Eventi
La carriera di una persona all’interno del Sistema Universitario Italiano è soggetta
ad un insieme di eventi raccolti all’interno di gruppi omogenei, indicati come tipo
spedizione. I file inviati per una particolare tipologia di spedizione dichiarata nella
testata, possono contenere più tipologie di evento tra quelli associati alla spedizione.
•
Avvio carriere
– Ingresso (evento IN): una persona entra per la prima volta nel sistema universitario italiano post 509/99. I possibili eventi di accesso a tale sistema
sono:
· conseguimento del titolo di diploma di scuola superiore italiano o straniero (immatricolati puri);
· conseguimento di un titolo di studio di livello universitario estero;
· conclusione, per conseguimento di titolo o per rinuncia o per decadenza,
di una carriera ante 509/99;
· passaggio da un corso di laurea ante 509/99 a un corso post 509/99.
1.3 Spedizioni ed Eventi
–
–
15
Avvio nuova carriera (evento AC): una persona che accede nuovamente a un
corso di laurea post 509/99 avendo concluso una carriera i cui dati sono già
presenti nel Sistema Anagrafe Nazionale Studenti. Un caso tipico sarebbe
l’evoluzione di una laurea triennale in una laurea specialistica.
Avvio nuova carriera con anagrafica (evento IS): una persona che accede
nuovamente a un corso di laurea post 509/99 avendo concluso una carriera nel sistema universitario italiano post 509/99 con decadenza, rinuncia o
conseguimento titolo. Se per questa persona non è stata ancora caricata la
carriera post 509/99, si possono spedire i dati anagrafici legandoli a questo
evento.
• Eventi di carriera
– Iscrizione annuale (evento IA): iscrizione che NON va effettuata all’immatricolazione o all’avvio di una nuova carriera, né in seguito ad un passaggio
o trasferimento in ingresso.
– Passaggio di corso: modifica del codice identificativo del corso di studio, cui
è legata la carriera attiva di una persona. Tale variazione deve essere distinta
secondo quattro tipologie:
· Passaggio di corso vero e proprio (evento PC): lo studente cambia il corso
di studio cui è iscritto (ad esempio, da Scienze Giuridiche passa a Scienze
Economiche).
· Passaggio di ordinamento (evento PO): uno studente cambia l’ordinamento (ID RAD) cui è associato (ad esempio passa dall’ordinamento del
2009/2010 all’ordinamento del 2014/2015, perché ha perso alcuni anni
di iscrizione a causa di una sospensione per malattia), il corso (codicione) rimane invariato. I CFU sostenuti prima del passaggio NON vengono
considerati validi ai fini della carriera (sarà necessario comunicare i CFU
convalidati tramite la spedizione 3).
NB: Nel caso di invio di un evento PO senza cambio ID RAD, i CFU
sostenuti prima del passaggio rimangono validi.
· Passaggio di regolamento o Anno validità offerta formativa annuale
(evento PP): uno studente cambia l’anno di validità dell’offerta formativa annuale, l’ordinamento (ID RAD) cui è associato non cambia, il corso
(codicione) rimane invariato. I CFU sostenuti prima del passaggio restano
validi.
NB: È possibile utilizzare questo evento anche per casi particolari di passaggio di ordinamento in cui rimangono validi i crediti sostenuti prima
del passaggio.
· Variazione del curriculum (evento VC): uno studente entra nel sistema
ANS e gli viene assegnato un curriculum generico, se non diversamente
indicato. Questo comporta che la prima scelta di curriculum (ed eventuali
scelte successive) debba essere comunicata mediante un evento VC. Il
codicione e l’anno di riferimento per la chiave anagrafe del curriculum
scelto rimangono inalterati. Nel caso in cui il corso sia senza curricula non
è possibile legare lo studente ad una chiave anagrafe diversa da quella del
corso generico.
· Variazione di sede (evento VS): uno studente chiede di spostarsi presso
una sede diversa dello stesso corso di studio. Oltre ai dati amministra-
16
1 L’Osservatorio Studenti Didattica del MIUR
–
–
–
–
tivi non sono richieste le informazioni correlate ad un eventuale test di
ingresso, perché lo studente è già associato al corso in esame, né viene domandata la situazione debiti/crediti, perché lo studente non ha cambiato
corso.
· Variazione di classe (evento VI): nel caso di un corso interclasse D.M.
270/04 uno studente chiede di cambiare la classe di afferenza del proprio corso di studio. Oltre ai dati amministrativi non sono richieste le
informazioni correlate ad un eventuale test di ingresso, perché lo studente è già associato al corso in esame, né viene domandata la situazione
debiti/crediti, perché lo studente non ha cambiato corso.
Trasferimento in uscita (evento TU): abbandono di un ateneo, per proseguire la carriera presso un altro ateneo (partecipante all’Anagrafe Nazionale
Studenti).
Trasferimento in ingresso (evento TI): arrivo di uno studente in Ateneo
che prosegue una carriera attivata presso un altro (partecipante all’Anagrafe
Nazionale Studenti).
Sospensione (evento SO): uno studente sospende la propria carriera. La richiesta di sospensione deve essere sostenuta con certificati opportuni ed ammessa dal Regolamento Didattico dell’ateneo. È necessario l’invio della spedizione 5 soltanto per le sospensioni che terminano durante l’anno, cioè per
la sospensione infrannuale.
Ricognizione (evento RI): ricostruzione di Anni di Iscrizione mancanti, dovuti
al mancato rinnovo dell’iscrizione.
•
Crediti/Debiti
– Ottenimento CFU o diminuzione debiti (evento CD): verbalizzazione di:
· attività didattiche superate che hanno portato ad ottenere nuovi CFU;
· registrazione di certificazione operata da altro ente (Università Straniera,
Struttura di Stage o Tirocinio, etc.);
· debito colmato legato all’iscrizione ad un certo corso di studio.
– Annullamento CFU o reintroduzione debiti (evento AN): a causa dell’annullamento di un esame superato, ad esempio, è possibile che vengano annullati
parte dei crediti che lo studente ha acquisito, oppure che vengano reintrodotti
dei debiti che risultavano colmati.
– Certificazione CFU o debiti in ingresso ad un corso di studio (evento DC): si
ha un invio di debiti e crediti anche all’ingresso di uno studente in un corso
di studio, perché, ad ogni accesso ad un nuovo corso devono essere certificati
eventuali debiti che lo studente può avere, il cui ammontare dipende dal corso,
ed eventuali crediti, che ai fini del nuovo corso gli vengono riconosciuti.
•
Chiusura carriera
– Conseguimento titolo (evento CC): conclusione attesa di una carriera, ovvero
ottenimento del titolo di studio.
– Conseguimento senza titolo (evento CC): fine di una carriera dovuta a:
· decadenza;
· decesso;
· rinuncia esplicita;
· rinuncia implicita;
1.3 Spedizioni ed Eventi
·
·
·
·
17
prosecuzione all’estero;
passaggio a corso ante riforma;
prosecuzione in struttura non gestita;
chiusura per irregolarità amministrative.
Tutti questi eventi si possono riassumere nell’unico evento di chiusura carriera
ma con tipologia diversa.
• Variazione dati da storicizzare
– Modifica dati anagrafici variabili (evento DA), in seguito a richiesta dello
studente (ad esempio variazione del comune di residenza).
– Integrazione dati titolo (evento DS e UN), di scuola superiore oppure di livello
universitario o post-universitario.
– Variazioni delle informazioni di natura amministrativa (evento PA) dovute
a:
· ricalcolo tasse, ad esempio in seguito all’attribuzione di un esonero;
· cambiamento degli addebiti, perché sono state aggiunte ulteriori tasse da
pagare;
· registrazione di avvenuti pagamenti;
· modifica dell’impegno;
· variazione dell’anno di iscrizione.
1.3.1 Modalità di invio dei dati
Un Ateneo, prima di spedire i primi dati, deve dichiarare esplicitamente se intende
spedire le informazioni tramite la modalità ad eventi o tramite la modalità del
rinvio totale dei dati. La scelta effettuata varrà per tutte le schede spedite e sarà
modificabile solo dietro richiesta scritta da parte dell’Ateneo stesso. In funzione
della modalità di invio adottata da un Ateneo, cambiano anche le tipologie di invio
ammesse.
Invio ad eventi
La modalità di invio ad eventi garantisce spedizioni di dati incrementali (le
informazioni già inviate non devono essere rispedite) ed un’immagine istantanea di
ciò che è accaduto ad una carriera. Ad esempio, non sono persi i passaggi multipli
nel corso di un anno accademico, vengono registrati con esattezza i flussi delle tasse
per i singoli studenti e si ha l’immagine esatta del ritmo con cui le persone procedono
nel sostenere i propri esami di profitto.
Rinvio totale
Nel caso si adotti la modalità di rinvio totale dei dati, le informazioni sono
spedite fornendo l’immagine della carriera nel momento in cui la fotografia viene
scattata per l’invio.
In Figura 1.6 è possibile vedere la struttura della testata delle schede. In Figura
1.7 viene mostrato l’inizio di ogni record, che contiene le indicazioni dell’evento, la
data dell’evento stesso e il codice fiscale cui esso fa riferimento (tale codice non è
presente nel sistema informativo soltanto se l’evento è un Ingresso, altrimenti deve
essere già stato caricato).
18
1 L’Osservatorio Studenti Didattica del MIUR
Figura 1.6. Testata delle schede
1.3.2 Modalità di caricamento dei dati nel sistema
Tramite la sezione Upload del sito dell’Osservatorio, gli atenei possono procedere
alla trasmissione dei file (txt o XML) secondo le diverse tipologie di spedizione, in
cui sono stati raggruppati gli eventi omogenei, che scandiscono la carriera di uno
studente. Una volta inviato un file, gli atenei vedranno visualizzato un resoconto che
ha lo scopo di evidenziare lo stato del file inviato ed eventuali problemi riscontrati. Il
sistema, una volta che ha accettato il file, procede all’analisi del medesimo ed al caricamento delle informazioni in esso contenute. In Figura 1.8 vengono schematizzati
il flusso dei dati e le elaborazioni cui sono soggetti.
1.3 Spedizioni ed Eventi
Figura 1.7. Variabili presenti all’inizio del record
Figura 1.8. Flusso dei dati ed elaborazioni cui sono soggetti
19
20
1 L’Osservatorio Studenti Didattica del MIUR
Come possiamo notare, il primo passaggio consiste nel caricare i dati nella Staging Area; tale operazione viene effettuata operando dei controlli formali, analizzando la correttezza delle codifiche da inserire, validando il codice fiscale e verificando
la presenza dei corsi di studio dichiarati nel sistema OFF.F.
I dati vengono, poi, processati per essere inseriti nelle strutture dati del Data
Mart. Al termine del caricamento, l’ateneo può accedere nell’area Riepilogo File
dove è possibile verificare lo stato di caricamento del file ed effettuare il download
di un file in formato testo, contenente l’elenco degli errori riscontrati.
2
La Business Intelligence e Pentaho
Questo secondo capitolo descrive la Business Intelligence e il software Pentaho. Nel
seguito della trattazione verranno illustrate le caratteristiche principali dei sistemi di
Data Warehouse e Data Mining, insieme alle altre funzionalità offerte dai processi
di BI. Saranno delineati, in maniera accurata, le modalità di conduzione di analisi
dei report e dei dashboard ottenibili tramite Pentaho.
2.1 Cos’è la Business Intelligence
Il sistema informativo di un’azienda può essere diviso in due categorie, ovvero sistema direzionale e sistema operazionale, che interagiscono tra di loro in modo continuo
e attivo. Il sistema decisionale comprende le attività relative alla definizione degli
obiettivi da raggiungere, al controllo dei risultati ottenuti e alla definizione delle
azioni correttive. Il sistema operazionale comprende, invece, le attività esecutive.
Vi è, quindi, un continuo passaggio di dati e informazioni tra queste due macrocategorie. Per “dato” si intende l’informazione ad un livello atomico, elementare,
mentre con il termine “informazione”, si indica l’elaborazione (che deve essere chiara
e accessibile) di dati al fine di ottenere conoscenza sull’oggetto e sull’evento indagati.
I dati elementari messi in relazione tra loro o aggregati generano nuove informazioni. Essi non sono stabili ma variabili nel tempo, in funzione dei soggetti e della loro
capacità d’uso; ecco perchè nel passaggio di informazioni e di dati vi sono parecchie
difficoltà. A titolo di esempio, alcune possibili difficoltà sono le seguenti:
• si ottengono risultati diversi oppure contradditori;
• aumentano i dati ma le aziende (e, di conseguenza, il management corrispondente), continuano ad essere povere di informazioni.
Per cercare di ovviare a questo problema entra in gioco la Business Intelligence
(nel seguito, BI). Quest’ultima è, infatti, la capacità di un’organizzazione di capire il proprio business (processi, clienti, risorse, sistemi, contesto competitivo) per
intervenire su di esso in modo consapevole, tempestivo ed efficiente. La BI indica,
cioè, un insieme di metodi e strumenti atti alla raccolta e all’analisi dei dati. Il suo
scopo è quello di estrarre informazioni utili dai dati stessi in maniera tale da decidere i processi decisionali di un’organizzazione. Inoltre, il successo di una qualsiasi
22
2 La Business Intelligence e Pentaho
attività, specie nel business, dipende in massima parte dalla capacità di prevedere
il futuro, cogliendone i segni anticipatori. Lo sviluppo delle applicazioni di Business
Intelligence è stato il primo, grande, risultato verso l’individuazione e lo studio dei
segnali nascosti. La BI è, a conti fatti, un insieme di metodologie, processi, architetture e tecnologie che trasformano dati grezzi in informazioni significative e utili,
attraverso l’ utilizzo di Data Warehouse e Data Mining per l’ estrazione e l’ analisi
dei dati.
Le applicazioni di Business Intelligence, se progettate bene e se basate su dati
aggiornati, offrono una visione approfondita del passato o anche del presente, identificando gli schemi che determinano comportamento e prestazioni delle funzioni
progettistiche e aziendali.
2.1.1 Introduzione dei concetti e illustrazione di un sistema di BI
Un sistema di Business Intelligence fornisce un’immediata capacità di visione delle
“informazioni principali” e si occupa dell’analisi dettagliata dei dati di interesse per
comprendere andamenti, eccezioni e anomalie. Esso rende facile e intuitivo focalizzare l’attenzione sui KPI (Key Performance Indicators), indici identificati come
fattori critici per il monitoraggio dello stato di avanzamento degli obiettivi dell’organizzazione. I sistemi di BI, in genere, supportano in dettaglio strumenti di
statistica, previsioni, analisi predittiva e correlazioni. Essi aiutano a definire e verificare gli scenari di business che possono, quindi, essere assunti come input per il
cambiamento dei processi. Ogni attività di business è diversa e ciascuna possiede
una propria strategia per la crescita e il successo.
Una piattaforma di BI ben progettata può fornire un notevole valore aggiunto
a ogni organizzazione rendendola competitiva nel mercato globale. Essa fornisce,
infatti, differenti viste di business e si adatta alle necessità dei singoli utenti.
L’architettura delle applicazioni di Business Intelligence, illustrato in Figura2.1,
comprende diversi componenti:
Figura 2.1. Architettura di un sistema di BI
•
•
Strumenti ETL, che consentono di estrarre dati da fonti eterogenee (database
transazionali, risorse web, file XML o file flat, sensori), e di trasformarli (mediante integrazione, data cleaning, data structure) secondo una struttura dati o
uno schema scelto per la rappresentazione, e di caricarli in un data warehouse.
Data Warehouse (DW) che memorizza i dati storici dell’organizzazione per scopi
di analisi;
2.1 Cos’è la Business Intelligence
23
• Server OLAP (On-Line Analytical Processing), che permette l’esplorazione rapida e flessibile di grandi quantità di dati, salvati nel Data Warehouse, con tecniche
di analisi multidimensionale.
• Strumenti di reporting, dashboard e differenti client OLAP, che visualizzano le
informazioni in modo grafico e in forma riassuntiva (tabelle, grafici) a beneficio
dei decision-maker e dei manager.
• Strumenti di Data-Mining, per recuperare automaticamente pattern e individuare correlazioni nascoste nei dati.
Inoltre, un sistema di BI deve avere le seguenti caratteristiche:
• Facilità d’uso: esso deve rappresentare i dati in un formato che sia facile da
leggere e da interpretare.
• Velocità: esso deve consentire di trattare grandi moli di dati con tempi di risposta quasi istantanei, grazie alle tecniche orientate all’analisi, piuttosto che
all’aggiornamento.
• Integrazione: esso deve integrare tra loro dati provenienti da fonti differenti. Se
i dati non sono puliti e affidabili, prima di inserirli nel database devono passare
attraverso un processo di ETL (Extract, con Transformation and Loading).
• Sicurezza: esso deve consentire di controllare in maniera sicura,e allo stesso
tempo accurata e flessibile, l’accesso ai dati.
2.1.2 Data Warehouse
Tra i sistemi di supporto alle decisioni, i sistemi di Data Warehousing sono quelli
più comuni. Il Data Warehousing è una collezione di metodi, tecnologie e strumenti di ausilio al knowledge worker (dirigente, amministratore, gestore, analista)
per condurre analisi dei dati finalizzate all’attuazione di processi decisionali e al
miglioramento del patrimonio informativo.
Le possibili aree di utilizzo possono essere:
• commercio per l’analisi delle vendite e dei reclami, il controllo di spedizioni e la
questione degli inventari.
• manifattura per il controllo dei costi di produzione, dei fornitori e degli ordini.
• servizi finanziari per l’analisi del rischio e delle carte di credito.
• trasporti per la gestione dei mezzi.
• telecomunicazioni per l’analisi del flusso delle chiamate e del profilo dei clienti.
• sanità per l’analisi dei ricoveri e delle dimissioni.
Il “Data Warehouse”(nel seguito DW) è una collezione di dati (Figura2.2) di
supporto per il processo decisionale che presenta le seguenti caratteristiche:
è orientata ai soggetti di interesse.
è integrata e consistente, poichè si appoggia a più fonti di dati eterogenee,
restituendo una visione unificata.
• è rappresentativa dell’evoluzione temporale.
• è non volatile; infatti, non sono necessarie tecniche sofisticate di gestione delle
transazioni.
•
•
24
2 La Business Intelligence e Pentaho
Figura 2.2. Data Warehouse
In questo processo vi sono, inoltre, le interrogazioni “OLTP (On-Line Transactional Processing)” e “OLAP (On-Line Analytical Processing)”. Le prime riguardano le transazioni nell’ambito dei database relazionali, le relative metodologie e i
corrispettivi concetti che consentono lettura e la scrittura, garantendo atomicità,
consistenza, isolamento e non volatilità dei dati. Le seconde, invece, designano un
insieme di tecniche software per l’analisi interattiva e veloce di grandi quantità
di dati, che è possibile esaminare in modalità piuttosto complesse. Gli strumenti
OLAP si differenziano da quelli OLTP per il fatto che i primi hanno come obiettivo
la performance nella ricerca e l’esecuzione di interrogazioni quanto più articolate
sia possibile; i secondi, invece, mirano ad una garanzia di integrità e sicurezza delle
transazioni.
L’idea alla base del Data Warehousing è quella di separare l’elaborazione di
tipo analitico da quella legata alle transazioni. Infatti, mescolare tali interrogazioni potrebbe portare a inevitabili rallentamenti che renderebbero insoddisfatti gli
utenti.
Esistono varie architetture di Data Warehouse. Le principali tra queste sono le
seguenti:
•
•
architettura ad un livello; in questo caso è presente soltanto il database operazionale, il Data Warehouse è, invece, soltanto virtuale.
architettura a due livelli; in questo caso son presenti sia il database operazionale che il Data Warehouse; quest’ultimo è alimentato proprio dal database
operazionale.
2.1 Cos’è la Business Intelligence
25
• architettura a tre livelli; in questo caso è presente il database operazionale
che alimenta il livello dei dati riconciliati che, a sua volta, alimenta il Data
Warehouse.
Un’ architettura per Data Warehouse dovrebbe avere i seguenti requisiti:
• separazione: l’elaborazione analitica e quella transazionale devono essere mantenute il più possibile separate.
• scalabilità: l’architettura hardware e software deve poter essere facilmente ridimensionata a fronte della crescita nel tempo dei volumi di dati da gestire ed
elaborare e del numero di utenti da soddisfare.
• estendibilità: deve essere possibile accogliere nuove applicazioni e tecnologie
senza riprogettare integralmente il sistema.
• sicurezza: il controllo sugli accessi è essenziale a causa della natura strategica
dei dati memorizzati.
• amministrabilità: la complessità dell’attività di amministrazione non deve risultare eccessiva.
Per essere “alimentato” il DW ha bisogno di strumenti di ETL (Extraction,
Transformation and Loading). Il loro scopo è alimentare il DW dopo, però, aver
effettuato la “pulizia” dei dati a disposizione.
2.1.3 Data Mining
Il Data Mining, a differenza del DW visto in precedenza, è un processo di “estrazione di conoscenza” da banche dati di grandi dimensioni tramite l’applicazione di
algoritmi che individuano le associazioni “nascoste” tra le informazioni e le rendono
visibili. Il software consente agli utenti di analizzare i dati di molte dimensioni o
diversi punti di vista, categorizzare e riassumere le relazioni individuate. Tecnicamente, il data mining è il processo di ricerca di correlazioni o modelli tra decine di
campi in grandi basi di dati relazionali.
Mentre la tecnologia dell’informazione su larga scala si è evoluta in sistemi di
transazione separati da quelli analitici, il data mining fornisce il collegamento tra i
due. I software di data mining analizzano i rapporti e i modelli in dati delle transazioni memorizzati basati su query degli utenti a tempo indeterminato. Strettamente
collegato al concetto di Data Mining vi è quello di Pattern. I pattern, per definizione, sono una rappresentazione sintetica e ricca di semantica di un insieme di dati.
Un pattern dovrebbere essere:
• valido sui dati con un certo grado di confidenza.
• comprensibile dal punto di vista sintattico e semantico, affinchè un utente lo
possa interpretare.
• precedentemente sconosciuto e potenzialmente utile, affinchè un utente possa
intraprendere azioni di conseguenza.
Esistono diverse tecniche di Data Mining; le più importanti sono:
• regole associative: consentono di determinare le regole di implicazione logica
presenti in una base di dati e quindi, di individuare i gruppi di affinità tra
oggetti.
26
•
•
•
•
2 La Business Intelligence e Pentaho
classificatori: consentono di derivare un modello per la classificazione di dati
secondo un insieme di classi assegnate a priori.
alberi decisionali: sono particolari classificatori che permettono di identificare,
in ordine di importanza, le cause che portano al verificarsi di un evento.
clustering: consentono di raggruppare gli elementi di un insieme, a seconda delle
loro caratteristiche, in classi non assegnate a priori.
serie temporali: permettono l’individuazione di pattern ricorrenti o atipici in
sequenze di dati complesse.
Un processo di data mining si compone di “cinque fasi” principali:
•
•
•
•
•
estrarre, trasformare e caricare i dati delle transazioni nel Data Warehouse.
memorizzare e gestire i dati in un sistema di database multidimensionale.
fornire l’accesso ai dati.
Analizzare i dati per il software applicativo.
Presentare i dati in un formato utile, ad esempio un grafico o una tabella, come
mostrato in figura 2.3 .
Figura 2.3. Esportazione dei dati
Prima di parlare delle attività principali legate al Data Mining, è necessario
effettuare una distinzione tra due tipi di sistemi:
•
•
sistemi predittivi, che utilizzano alcune variabili per predire il valore incognito o
futuro di altre variabili;
sistemi descrittivi, che devono trovare dei pattern interpretabili dall’uomo che
descrivano i dati.
2.2 Pentaho
27
2.2 Pentaho
In rete oramai spopola il marchio Pentaho come uno dei leader tra le suite di
Business Intelligence, soprattutto riguardo l’ambito open source. Ma che cosa è
Pentaho? Pentaho è una piattaforma di Business Intelligence (BI) open source
fondata nel 2004 da un team di professionisti della Business Intelligence provenienti
da aziende di successo come Business Objects, Cognos, Hyperion, IBM, Oracle
Corporation, e SAS Institute.
L’obiettivo perseguito da questo software non è quello di fornire un’alternativa
open source, ma di proporre una soluzione migliore rispetto alle offerte commerciali
in termini di caratteristiche, funzioni e benefici, attraverso l’integrazione, in un’unica
piattaforma, di popolari progetti open source come JFreeReport, Kettle, Mondrian
e Weka.
Pentaho vanta di un’ottima interfaccia grafica, che serve per creare report, effettuare analisi e generare dashboard. Tutto questo utilizzando i principi della Business
Analytics e tutti i vantaggi che essa comporta. Viene anche visto come un oggetto
pensato appositamente per collegare molti “raggi” tra loro. Questi oggetti, nella BI,
a volte, sono simili, altre volte diversissimi, e Pentaho li collega attraverso numerosi
strumenti.
Di seguito vediamo le quattro caratteristiche più importanti di Pentaho:
• Versatilità; infatti l’insieme dei prodotti offerti da Pentaho comprende strumenti
completi per aiutare lo sviluppatore nell’implementazione dell’intero processo di
BI.
• Community e Supporto; Pentaho vanta una nutrita community di sviluppatori.
Questo si traduce in diversi vantaggi per gli utenti.
• Collaborazione; utilizzare Pentaho significa soprattutto imparare un nuovo modo
di far “collaborare” i linguaggi già conosciuti.
• Scalabilità e personabilità. L’utilizzo di Pentaho consente di effettuare un processo di BI assolutamente “modulare” che può crescere ed adattarsi ai cambiamenti
repentini della situazione aziendale che deve essere analizzata.
Il framework messo a disposizione da Pentaho permette di sviluppare soluzioni
complete per la BI. Più specificatamente:
• La piattaforma è process-centric perchè il controllore centrale è il Workflow engine. Quest’ultimo usa le definizioni dei processi per costruire il processo di Business Intelligence che esegue nella piattaforma. Il processo può essere facilmente
personalizzato ed è possibile aggiungere nuovi processi.
• La piattaforma è solution-oriented perchè le sue operazioni sono specificate nel
processo di definizione e nei documenti che ne specificano ogni attività.
La piattaforma è composta da:
• un framework di BI, che fornisce procedure per logging, auditing, security,
scheduling, ETL, web service e attribute repository.
• alcuni componenti di BI, che consentono di gestire il reporting, l’analisi, il
workflow e i dashboard e processi di data mining.
28
•
2 La Business Intelligence e Pentaho
alcuni workbench di BI, che si tratta di un insieme di strumenti di progettazione
e di amministrazione che permettono agli analisti e ai progettisti di creare report,
dashboard, modelli di analisi e processi di Business Intelligence.
2.2.1 Analisi degli strumenti e delle funzionalità di BI
In Figura2.4 viene mostrata l’architettura del software Pentaho.
Figura 2.4. Architettura del software Pentaho
•
Thin Client : Pentaho User Console è la principale interfaccia web-based che
permette all’utente finale di visualizzare, creare e pianificare report, report
interattivi e dashboard. Le sue componenti sono:
– Interactive Reporting: fornisce un reporting altamente interattivo e facile da
usare, per creare semplici report; consente, inoltre, di accedere alle fonti di
dati e metadati di Pentaho.
– Analyzer : fornisce un reporting analitico intuitivo e interattivo per far
comprendere rapidamente le informazioni, effettuando un ordinamento e
filtraggio.
– Dashboard Designer : consente agli utenti aziendali di creare ricchi cruscotti
interattivi.
•
Power Tools: Si tratta applicazioni desktop che permettono di creare un ricco
reporting dell’ambiente. Le principali componenti di questa area sono:
– Schema Workbench: costruisce fonti di dati di analisi per facilitare l’esplorazione e l’analisi dei dati per gli utenti business.
– Aggregation Designer : è un ambiente grafico usato per aumentare le prestazioni delle query di analisi, attraverso la creazione di tabelle aggregate.
2.2 Pentaho
29
–
Metadata Editor : costruisce fonti di dati e metadati; è una rappresentazione
del modello dei dati di un database relazionale in cui si possono creare query
senza dover conoscere il linguaggio SQL.
– Report Designer : è un ambiente di progettazione visuale che rende facile
creare rapidamente report graficamente perfetti, per affrontare le esigenze di
tipo operativo, di reporting finanziario e della produzione.
– Data Integration: è un ambiente di progettazione intuitivo che fornisce delle
potenti facility di estrazione, trasformazione e caricamento dei dati.
– Design Studio: viene utilizzato per creare sequenze di azioni; consente la
completa personalizzazione e integrazione tra tutti i componenti all’interno
di Pentaho.
• Server Applications; supporta la Pentaho User Console e soddisfa gli utenti
consentendo loro il reporting, analisi e la realizzazione di dashboard e comprende
servizi per la sicurezza, la programmazione e l’analisi dei dati.
• Server Enterprise Console; supporta la Enterprise Console; include i servizi
per la gestione della sicurezza, della programmazione, del repository; consente,
oltresı̀, la configurazione del server.
• Data Intergration Server ; viene utilizzato per eseguire i lavori di integrazione e
trasformazione dei dati e per offrire servizi quali la pianificazione e la gestione
gestione dei contenuti.
2.2.2 Creazione dei report
Utilizzando Pentaho è possibile creare un semplice report includendo anche grafici
che si autogenerano in base ai dati inseriti. Il modulo di Pentaho per il reporting
consente:
• di accedere direttamente alle fonti di dati;
• un’interazione facile e immediata con i report,qualunque sia la tipologia di utenti
interessati;
• di aggiungere, spostare ed eliminare i campi direttamente all’interno del report;
• la formattazione in riga, il filtraggio, l’ordinamento, il raggruppamento, le
aggregazioni e i calcoli sommari.
La Figura 2.5 mostra l’interfaccia principale per la creazione dei report.
Dopo aver scelto i dati, dopo averli raggruppati, e dopo aver seguito tutte le
impostazioni viene creato il report. Quest’ultimo può essere modificato in ogni momento, attraverso l’inserimento del titolo o delle immagini, e queste modifiche sono
visibili immediatamente. Accanto al report è prevista la presenza di un grafico.
Nella prossima sezione, vedremo i vari passaggi da eseguire per effettuare analisi
sui report.
2.2.3 Creazione di analisi dei report
Uno strumento importante di questo software riguarda la creazione di nuove analisi
o dashboard (Figura2.5) visibili sia in forma tabellare sia attraverso vari tipi di
grafici. Le principali funzionalità fornite da questo software sono:
30
2 La Business Intelligence e Pentaho
Figura 2.5. Interfaccia per la creazione dei report
•
•
•
la creazione di analisi dei dati scelti dall’utente.
ordinamento e filtraggio avanzato.
visualizzazione delle analisi attraverso vari tipi di grafici.
Figura 2.6. Creazione di nuove analisi o dashboard
Come mostra la Figura 2.7 , in quest’area sono elencati i dati di interesse, raggruppati secondo le dimensioni. Questi dati serviranno per la creazione di analisi;
infatti, basta trascinare il nome del dato interessato nell’area centrale e immediatamente si crea una tabella con i dati stessi. Inoltre, è possibile trascinare e combinare
i dati a piacere per creare tutte le analisi possibili desiderate.
2.2 Pentaho
31
Figura 2.7. Costruzione dei report
2.2.4 Creare dashboard con Pentaho
Un’altra funzione importante del software è la creazione dei “dashboard ”, uno strumento di gestione che consente di misurare determinati valori in modo rapido ed
efficiente.
Invece di basarsi su rapporti cartacei per prendere decisioni importanti, un cruscotto fornisce informazioni aggiornate e pertinenti attraverso l’utilizzo di una combinazione di grafici e componenti di report. Questi cruscotti, visivi, sono facili da
leggere e interpretare e forniscono un accesso rapido alle informazioni che aiutano
a rispondere a domande in merito alle prestazioni dei servizi specifici. Il vantaggio
sta, ovviamente, nel fatto che essi possono accedere a questo tipo di informazioni
facilmente e da qualsiasi luogo attraverso il web. Per creare tali cruscotti interattivi basta semplicemente selezionare il layout, il tema e il contenuto che si desidera
visualizzare. Tale contenuto può includere report e grafici e fornisce, anche, la possibilità di aggiungere controlli dinamici per filtrare l’intero contenuto usando un
semplice elenco di selezione, come mostrato in Figura 2.8.
Figura 2.8. Visualizzazione dei dashboard
2.2.5 Il valore di Pentaho
In conclusione, Pentaho Business Analytics è considerato il “best-of-breed ” in soluzioni open source per la gestione e l’analisi dei dati; uno rappresenta, nel campo
32
2 La Business Intelligence e Pentaho
dell’open source, la soluzione più innovativa nel settore della Business Intelligence
e Analytics. La piattaforma semplifica la raccolta di informazioni e consente agli
utenti di analizzare, visualizzare, esplorare i dati e prevedere eventi futuri, trasformando i dati in valore concreto. L’architettura basata su standard aperti permette
di estendere le sue numerose funzioni e di incorporare le analisi di business nelle
applicazioni aziendali esistenti. In definitiva, grazie a Pentaho, le aziende possono
avere analisi, amichevole e, al contempo, sicure, di tutti i dati.
3
Estrazione di conoscenza sui contributi, le
immatricolazioni e le lauree relativa al nostro
Ateneo
Questo terzo capitolo mette in evidenza la conoscenza estratta grazie al lavoro di
progettazione svolto a partire dai dati dell’OSD. Nel seguito della trattazione verranno descritte le macro-questioni (nel seguito, MQ) approfondite, rappresentandone
gli schemi a stella dei relativi cubi progettati, i Key Performance Indicator (nel
seguito, KPI) e la conoscenza estratta. Infine, verranno mostrati i cruscotti creati
grazie al tool di Pentaho.
3.1 Premessa
La conoscenza di interesse è stata specificata dalla governance di Ateneo (Prorettore
delegato alla Didattica, Dirigente Segreteria, Prorettore delegato all’Informatica). È
stato, inoltre, possibile usufruire di documenti relativi agli indicatori sulle carriere
accademiche degli studenti elaborati dalla commissione didattica della CRUI, e dei
documenti dell’Agenzia Nazionale di Valutazione del Sistema Universitario e della
Ricerca (ANVUR). Tali documenti hanno l’obiettivo di analizzare e dare evidenza
a elementi di criticità al fine di proporre soluzioni relative, principalmente, all’implementazione delle recenti e future disposizioni di legge che comportano ricadute
nella progettazione, gestione ed erogazione dell’offerta formativa degli Atenei.
I dati fondamentali sono stati quelli dell’Osservatorio Studenti Didattica, a partire dai quali è stato possibile realizzare i cubi e, quindi, i report ed i cruscotti di
interesse grazie alla piattaforma di Business Intelligence Pentaho. Inoltre, per meglio
comprendere la conoscenza di interesse, abbiamo utilizzato i dati presenti sul sito
www.anvur.it, che fornisce elementi interessanti relativi agli indicatori di Ateneo
(aggiornati fino al 2014), da cui abbiamo preso spunto per la realizzazione di una
serie di report di interesse per la governance. Per approfondire meglio determinate
questioni, abbiamo consultato i dati di GOMP, applicazione web-based che utilizza
sistemi di collaborazione applicativa (web service) e standard di open data (XML).
GOMP offre una serie di moduli che coprono specifiche esigenze degli atenei italiani
tra cui una sezione per il Data Warehousing.
Le analisi effettuate, riguardanti l’Università Mediterranea di Reggio Calabria,
sono state classificate in sette macro-questioni (nel seguito, MQ). Le prime due MQ
analizzano, rispettivamente, la provenienza degli immatricolati, in base al Comune
34
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.1. Schema a stella relativo al cubo Immatricolati usato per la MQ1
e alla Provincia di residenza, e la scuola di provenienza degli immatricolati. La terza
MQ evidenzia la situazione relativa al livello di internazionalizzazione, un indicatore
espressamente richiesto dalla governance. La quarta MQ riguarda la situazione generale degli immatricolati. La quinta e la sesta MQ si soffermano sui laureati e sulle
rinunce, informazioni richieste da alcuni indicatori evidenziati dalla governance. La
settima MQ analizza la situazione dei contributi, ed integra alcuni risultati ricavati
da GOMP, in quanto i dati dell’ODS non erano completi o non erano sufficienti per
evidenziare alcuni aspetti riguardanti le richieste delle borse di studio degli ultimi
due anni.
3.2 MQ1: Residenza di provenienza immatricolati
Per quanto riguarda le analisi relative alla prima macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una
serie di report. Le dimensioni scelte sono: ResidenzaComune, ResidenzaProvincia,
NomeCorsoPubblico, A.A.Corto e Dipartimento. La misura di interesse riguarda il
numero di immatricolati. In Figura 3.1 è possibile vedere lo schema a stella a partire
dal quale è stato progettato il cubo.
3.2.1 Definizione dei KPI e della loro presentazione
I Key Performance Indicator sono indici che monitorano l’andamento di processi
aziendali; essi si concentrano su quegli aspetti della performance di un’organizzazione che sono i più critici per il suo successo corrente e futuro. Le aziende dovrebbero
rivedere regolarmente i loro obiettivi e le loro strategie, e apportare le modifiche
appropriate ai loro KPI. Risulta, quindi, comprensibile la scelta di tale approccio
per la presentazione dei report di interesse per l’Ateneo, soprattutto in relazione ai
cruscotti che vedremo a fine capitolo. Per quanto riguarda la MQ1, è stato scelto
di effettuare una valutazione sul numero di immatricolati in base al comune e alla
provincia di residenza, misurando, in un secondo momento, l’andamento negli anni
o la situazione all’interno dei singoli dipartimenti.
3.2 MQ1: Residenza di provenienza immatricolati
35
Figura 3.2. Immatricolati provenienti dal Comune di Reggio Calabria o da altri Comuni
Figura 3.3. Classifica dei Comuni esterni di provenienza
3.2.2 Conoscenza estratta
Il primo obiettivo che ci siamo posti è stato quello di identificare il bacino d’utenza
della Mediterranea. Nelle Figure 3.2 e 3.3 è possibile vedere, rispettivamente, la
percentuale di immatricolati residenti a Reggio Calabria o in altri Comuni, ed i
Comuni ordinati secondo il numero di immatricolati. Dai report effettuati si può
evincere, come era prevedibile, che la maggior parte degli immatricolati provengono
da residenti in altri Comuni, e che la maggior parte dei residenti esterni proviene
dai Comuni di Villa San Giovanni, Palmi, Messina, Melito di Porto Salvo, Gioia
Tauro, Motta San Giovanni, Lamezia Terme, Rosarno e Taurianova.
In Figura 3.4 è possibile osservare l’andamento del numero di immatricolati
relativo ai Comuni limitrofi evidenziati in precedenza, a partire dall’anno 2001.
Tale report mette in risalto la progressiva diminuizione degli immatricolati vista nel
corso degli anni.
Nelle Figure 3.5 e 3.6 è possibile vedere, grazie ad un’attività di roll-up effettuata,
la percentuale di immatricolati residenti nella Provincia di Reggio Calabria o in altre
Province, nonchè le Province ordinate secondo il numero di immatricolati. Questi
36
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.4. Andamento del numero di immatricolati dall’anno 2001
report mettono in risalto il fatto che solo il 20% degli immatricolati provengono da
altre Province, in particolare, Catanzaro, Vibo Valentia e Messina.
In Figura 3.7 viene mostrato l’andamento del numero di immatricolati per le
otto Province principali. È possibile notare un sensibile miglioramento, a partire
dall’anno 2013, per quanto riguarda gli immatricolati provenienti da Messina e
Cosenza.
In Figura 3.8 è possibile osservare, per ogni dipartimento della Mediterranea, una
classifica delle principali Province di provenienza degli immatricolati del 2013. Ciò
equivale ad effettuare un’operazione di drill-down rispetto ai dipartimenti. Possiamo
notare che per il Dipartimento di Giurisprudenza ed Economia vi è un discreto
numero di immatricolati provenienti dalla provincia di Vibo Valentia.
Gli ultimi due report che riportiamo, hanno l’obiettivo di confrontare il numero
di immatricolati residenti in sede e fuori sede per ogni dipartimento (Figura 3.9) e
per ogni Corso di Studi della Mediterranea (Figura 3.10) nell’anno 2014.
3.3 MQ2: Scuola di provenienza degli immatricolati
37
Figura 3.5. Immatricolati provenienti dalla Provincia di Reggio Calabria o da altre
Province
Figura 3.6. Classifica delle Province esterne di provenienza in base al numero di
immatricolati
Si può notare come, per quanto riguarda le Facoltà di Agraria ed Architettura,
la maggior parte degli immatricolati sia fuori sede.
3.3 MQ2: Scuola di provenienza degli immatricolati
Per le analisi relative alla seconda macro-questione è stato progettato un cubo
su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di report
relativi alla scuola di provenienza degli immatricolati. Le dimensioni scelte sono:
TipoDiploma, MacroTipoDiploma, NomeCorsoPubblico ed A.A.Corto. La misura
di interesse riguarda, ancora, il numero di immatricolati. In Figura 3.11 è possibile
vedere lo schema a stella a partire dal quale è stato progettato il cubo.
3.3.1 Definizione dei KPI e della loro presentazione
I KPI individuati per la seconda macro-questione hanno l’obiettivo di mettere in
luce aspetti relativi agli studi scolastici degli immatricolati, considerando il ma-
38
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.7. Andamento del numero di immatricolati a partire dall’anno 2001
Figura 3.8. Provincia degli immatricolati per Dipartimento relativa all’anno 2013
3.3 MQ2: Scuola di provenienza degli immatricolati
39
Figura 3.9. Immatricolati residenti in sede e fuori sede per ogni dipartimento
Figura 3.10. Immatricolati residenti in sede e fuori sede per ogni Corso di Studi
crotipo ed il tipo diploma. Questa valutazione è di particolare importanza per la
governance in quanto è interessante osservare eventuali differenze sull’andamento
delle immatricolazioni, oppure valutare l’attrattività di un Corso di Studi in base
agli studi pre-universitari effettuati. Sulla base di questi report è facile intuire il
grado di interesse per un determinato Corso di Studi, oppure osservare possibili
riscontri in seguito ad eventuali corsi di orientamento scolastici.
40
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.11. Schema a stella relativo al cubo Immatricolati usato per la MQ2
Figura 3.12. Andamento degli immatricolati con maturità liceale e tecnica
3.3.2 Conoscenza estratta
Nelle Figure 3.12 e 3.13 è possibile visualizzare l’andamento degli immatricolati a
partire dall’anno 2005 in base al macrotipo di diploma, considerando la maturità
liceale, la maturità tecnica, la maturità professionale e la magistrale.
Come si evince dalle figure, la maggior parte degli immatricolati proviene da un
percorso di studi liceale e tecnico. In entrambi i report è riscontrabile un notevole
calo del numero di immatricolati dal 2012 che, però, sta lievemente risalendo negli
ultimi anni. I successivi report mostrano l’andamento in base al tipo di diploma a
partire dall’anno 2005. Nelle Figure 3.14 e 3.15 è possibile osservare che la maggior
parte degli immatricolati proviene dal liceo scientifico mentre la maturità classica è
riuscita a tornare in seconda posizione solo negli ultimi due anni.
In Figura 3.16 vediamo l’andamento delle immatricolazioni ai corsi di Ingegneria in base al macrotipo di diploma (maturità liceale e maturità tecnica) a partire
dall’anno 2008. In particolare, soffermandosi sui corsi triennali di Ingegneria dell’Informazione e di Ingegneria Civile-Ambientale, è possibile constatare una ripresa
3.4 MQ3: Livello di internazionalizzazione
41
Figura 3.13. Andamento degli immatricolati con maturità professionale e magistrale
Figura 3.14. Andamento degli immatricolati con maturità liceale e classica
delle immatricolazioni a partire dal 2013. In Ingegneria dell’Informazione, inoltre,
vediamo che la maggior parte degli immatricolati degli ultimi anni proviene dai licei.
3.4 MQ3: Livello di internazionalizzazione
Per quanto riguarda le analisi relative alla terza macro-questione è stato progettato
un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie di
42
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.15. Andamento degli immatricolati con maturità non liceali
Figura 3.16. Attrattiva Corso di Studi in base al macrotipo di diploma
report per fornire un quadro generale sul livello di internazionalizzazione presente
nella Mediterranea. Le dimensioni scelte sono: TipoDiploma, NomeCorsoPubblico
e A.A.Corto. La misura di interesse riguarda il numero di immatricolati. In Figura
3.4 MQ3: Livello di internazionalizzazione
43
Figura 3.17. Schema a stella relativo al cubo Immatricolati usato per la MQ3
Figura 3.18. Andamento degli immatricolati con diploma estero
3.17 è possibile vedere lo schema a stella a partire dal quale è stato progettato il
cubo.
3.4.1 Definizione dei KPI e della loro presentazione
Per livello di internazionalizzazione si intende il numero di immatricolati che hanno
conseguito il diploma di maturità all’estero. I KPI individuati per questa macroquestione si soffermano sull’andamento temporale delle immatricolazioni, mettendo,
poi, in risalto i corsi con più immatricolati con diploma conseguito all’estero.
3.4.2 Conoscenza estratta
In Figura 3.18 è possibile osservare l’andamento degli immatricolati con diploma
conseguito all’estero dal 2001 in poi. Possiamo constatare, come era prevedibile,
che il numero di immatricolati è particolarmente basso, e presenta un andamento
altalenante che si sta gradualmente abbassando.
44
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.19. Classifica dei Corsi di Studio in base al numero di immatricolati con diploma
estero
In Figura 3.19, invece, è possibile osservare i Corsi di Studio ordinati secondo il
numero di immatricolati con diploma estero. Nelle prime quattro posizioni vi sono
i Corsi delle Facoltà di Giurisprudenza ed Architettura, un risultato sicuramente
condizionato dal fatto che queste Facoltà, soprattutto Giurisprudenza, presentano
un alto numero di immatricolati rispetto alle altre Facoltà della Mediterranea.
3.5 MQ4: Situazione relativa agli immatricolati
Per quanto riguarda le analisi relative alla quarta macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie
di report per fornire un quadro generale sugli immatricolati della Mediterranea. Le
dimensioni scelte sono: MacroTipoLaurea, AnnoAccademico, NomeCorsoPubblico,
Facoltà, Dipartimento, Ateneo e A.A.Corto. La misura di interesse riguarda il nu-
3.5 MQ4: Situazione relativa agli immatricolati
45
Figura 3.20. Schema a stella relativo al cubo Immatricolati usato per la MQ4
mero di immatricolati. In Figura 3.20 è possibile vedere lo schema a stella a partire
dal quale è stato progettato il cubo.
3.5.1 Definizione dei KPI e della loro presentazione
Dai report presentati finora si è riscontrato un discreto calo del numero di immatricolati nel corso degli anni. In questa sezione, quindi, inizialmente ci soffermeremo
su questo aspetto, presentando KPI che valutano la situazione nel corso del tempo sotto diversi punti di vista. In seguito integreremo un report che rappresenta
un aspetto critico riguardante l’attrattività dei Corsi di Studio biennali, in particolare, dei Corsi di Studio del Dipartimento di Ingegneria dell’Informazione, delle
Infrastrutture e dell’Energia Sostenibile (nel seguito, DIIES).
3.5.2 Conoscenza estratta
Nelle Figure 3.21 e 3.22 viene evidenziato l’andamento del numero di immatricolazioni dal 2010 al 2014, rispettivamente, in base all’Area ed in base al Corso di
Studio.
Possiamo notare che l’Area che ha perso più immatricolati dal 2010 al 2014 è
quella di Giurisprudenza. Essa, infatti, dal 2010 al 2014 ha perso quasi la metà delle
immatricolazioni. L’Area di Agraria, invece, non manifesta un andamento problematico rispetto alle altre. È interessante notare come l’Area di Architettura ha visto
il più basso numero di immatricolati, rispetto alle altre Aree, negli anni 2012 e 2013,
ma ha avuto una ripresa importante nell’anno 2014. Per quanto riguarda il report
riguardante i Corsi di Studio è possibile vedere nel dettaglio l’andamento per ogni
Corso di Studio della Mediterranea. In Figura 3.23 ci si sofferma sui corsi del DIIES
monitorando l’andamento delle immatricolazioni dal 2008 al 2015.
Dal grafico si evince come sussista un lento decremento delle immatricolazioni per quanto riguarda i corsi biennali, mentre la situazione relativa ad Ingegne-
46
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.21. Andamento del numero di immatricolazioni per ogni Area
ria dell’Informazione risulta essere migliore, manifestando un calo nel 2014, subito
recuperato l’anno successivo.
La situazione generale relativa al macrotipo di Laurea della Mediterranea, come
possiamo notare in Figura 3.24, manifesta una situazione duale rispetto alla precedente. Dal 2006, infatti, i corsi triennali hanno manifestato un progressivo calo
fino al 2015. I corsi biennali, al contrario, vedono un lento incremento del numero
di immatricolati a partire dal 2013.
Il report seguente, riportato in Figura 3.25, vede messi a confronto, per ogni anno
a partire dal 2010, il numero di immatricolati, il numero di iscritti ed il numero di
iscritti regolari1.
Un altro dato di interesse per la governance riguarda l’attrattività dei Corsi di
Studio biennali. Questa analisi fornisce informazioni relative agli immatricolati nei
Corsi di Studio biennali che hanno conseguito una laurea di primo livello presso altri
Atenei. I dati ottenuti sottolineano una condizione poco incoraggiante rispetto ad
altre realtà. In Figura 3.26 riportiamo i risultati relativi ai singoli Corsi di Studio
biennali dell’Area di Ingegneria.
1
Con il termine studenti regolari si intendono quegli studenti iscritti al sistema da un
numero di anni inferiore o uguale alla durata legale del corso di riferimento. Fonte:
elaborazione su dati MIUR-URST e AFAM-Ufficio di Statistica.
3.5 MQ4: Situazione relativa agli immatricolati
Figura 3.22. Andamento del numero di immatricolazioni per ogni Corso di Studio
47
48
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.23. Andamento del numero di immatricolazioni per i corsi del DIIES
Figura 3.24. Andamento del numero di immatricolazioni in base al macrotipo di laurea
3.6 MQ5: Situazione relativa ai laureati
49
Figura 3.25. Confronto tra immatricolati, iscritti ed iscritti regolari
Figura 3.26. Attrattività dei Corsi di Studio biennali di Ingegneria
3.6 MQ5: Situazione relativa ai laureati
Per quanto riguarda le analisi relative alla quinta macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie
di report per fornire un quadro generale sui laureati. Le dimensioni scelte sono: MacroTipoLaurea, FasciaVotoLaurea, Facoltà, NomeCorsoPubblico e A.A.Corto. Le
misure di interesse riguardano il numero di laureati e la media A.A. uscita, ovvero
il numero medio di anni necessario per ottenere la laurea. In Figura 3.27 è possibile
vedere lo schema a stella a partire dal quale è stato progettato il cubo.
3.6.1 Definizione dei KPI e della loro presentazione
I KPI individuati per la MQ5 hanno considerato l’andamento del numero di laureati
e del numero medio di anni per conseguire la laurea, sotto diversi punti di vista. In
particolare, è stato messo in evidenza l’evolversi dei valori di tali misure, in base alla
fascia del voto di laurea. Inoltre, ci siamo soffermati sull’evoluzione di tali aspetti
all’interno dell’Area di Ingegneria.
50
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.27. Schema a stella relativo al cubo Usciti usato per la MQ5
Figura 3.28. Andamento del numero di laureati
3.6.2 Conoscenza estratta
In Figura 3.28 è possibile osservare come il numero di laureati sia linearmente aumentato a partire dal 2001, invertendo tale comportamento a partire dal 2012,
quando il numero di laureati è cominciato a scendere progressivamente.
Per le analisi successive abbiamo cercato di individuare un qualche tipo di relazione sull’andamento del numero di laureati e del numero medio di anni impiegati
per conseguire il titolo, in base al voto di laurea (classificato in cinque fasce) e al
macrotipo di laurea. Per rendere più chiari i risultati, abbiamo espresso il numero di
laureati con una determinata fascia di voto, in percentuale rispetto al numero complessivo di laureati del rispettivo anno di laurea. Nelle Figure 3.29 e 3.30, vengono
rappresentate, anno per anno a partire dal 2001, le percentuali di conseguimento
del titolo in base alla fascia di voto di laurea.
Analizzando lo stesso report a partire dal 2010 (Figura 3.31), è possibile osservare
che, generalmente, la maggior parte dei laureati ottengono una votazione nella fascia
3.6 MQ5: Situazione relativa ai laureati
51
Figura 3.29. Andamento del voto di laurea, fasce 66-90 e 91-100
Figura 3.30. Andamento del voto di laurea, fasce 101-105, 106-110 e 110 con lode
Figura 3.31. Andamento del voto di laurea
91-100 e, inoltre, che esiste un leggero incremento di laureati con votazione nella
fascia 66-90.
Le due analisi successive (Figure 3.32 e 3.33) considerano, rispettivamente, il
numero medio di anni di conseguimento titolo ed il numero di laureati, in base alla
fascia di voto e per ogni macrotipo di laurea.
In Figura 3.34 è possibile osservare l’andamento del numero medio di anni di
conseguimento titolo a partire dall’anno 2006, in base al macrotipo di laurea.
Possiamo notare che gli anni spesi per conseguire una laurea a ciclo unico stia
linearmente aumentando. Per quanto riguarda le lauree triennali e biennali, invece,
dopo aver toccato dei picchi, rispettivamente nel 2012 e nel 2010, si osserva una
diminuizione generalmente lineare del numero di anni per il conseguimento del titolo.
52
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.32. Numero medio di anni per il conseguimento del titolo in base alla fascia di
voto
Figura 3.33. Numero di laureati in base alla fascia di voto
In Figura 3.35 è possibile osservare l’andamento del numero di laureati, a partire
dall’anno 2006, in base al macrotipo di laurea. In questo caso si osserva che, a
partire dal 2013, i tre macrotipi di lauree hanno subito lo stesso calo del numero di
laureati. Analizziamo, adesso, questi risultati, relativamente ai singoli corsi triennali
e biennali dell’Area di Ingegneria. Le Figure 3.36 e 3.37 mostrano l’andamento del
numero medio di anni per il conseguimento del titolo, rispettivamente, per i corsi
triennali e per i corsi biennali della Facoltà di Ingegneria.
Possiamo notare che il Corso di Studio triennale in Ingegneria per l’Ambiente e
per il Territorio sia, apparentemente, il più problematico dei tre offerti dall’Area di
Ingegneria. Le Figure 3.38 e 3.39 si soffermano, invece, sul numero di laureati.
In Figura 3.40 possiamo confrontare l’andamento del numero di laureati, a partire dal 2005, per ogni Area della Mediterranea. È interessante notare come Architettura, nel corso degli anni, sia stata generalmente l’Area con più laureati. Dal 2013
al 2014,però, quest’Area ha visto abbassarsi notevolmente il numero di laureati,
scendendo leggermente al di sotto del numero di laureati dell’Area di Ingegneria.
3.6 MQ5: Situazione relativa ai laureati
53
Figura 3.34. Numero medio di anni per il conseguimento del titolo in base al macrotipo
di laurea
Figura 3.35. Andamento del numero di laureati in base al macrotipo di laurea
I tre report seguenti mettono a confronto il numero medio di anni per conseguire
un titolo di un Corso di Studio biennale (Figura 3.41), triennale (Figura 3.42) e ciclo
unico (Figura 3.43). Si noti che, in alcuni casi, la media della durata degli studi un
Corso di Studi è inferiore al minimo valore teoricamente possibile (ad esempio,
per il Corso di Studi biennali in Scienze e Tecnologie Alimentari, la media è pari
a 1.73. Questo si può spiegare con il fatto che, in alcuni casi, ci sono state delle
abbreviazioni di carriera con la convalida, ad esempio, di tutti i corsi sostenuti in
un master erogato l’anno precedente sulle medesime tematiche. Le Figure 3.44, 3.45
e 3.46, si soffermano, invece, sul numero di laureati.
In Figura 3.47 è possibile vedere un confronto tra i Corsi di Studio dell’Area di
Ingegneria relativo al livello di uscita dei laureati espresso nelle cinque fasce di voto.
Le Figure 3.48, 3.49 e 3.50 mettono in risalto l’andamento del numero di laureati
in base alle cinque fasce di voto, rispettivamente, per i Corsi di Studio in Ingegneria
54
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.36. Numero medio di anni per conseguimento titolo triennale in Ingegneria
Figura 3.37. Numero medio di anni per conseguimento titolo biennale in Ingegneria
dell’Informazione, Ingegneria Informatica e dei Sistemi per le Telecomunicazioni, e
Ingegneria Elettronica.
Un ultimo report che consideriamo in Figura 3.51 mostra un confronto tra i corsi
di Ingegneria delle Telecomunicazioni DM509 e DM270 in base al numero di anni
spesi per conseguire il titolo. La media di anni necessari per ottenere la laurea in
Ingegneria delle Telecomunicazioni è notevolmente aumentata nel corso degli anni.
Il Corso di Studi in Ingegneria dell’Informazione, attivato negli ultimi anni, ha
ottenuto risultati decisamente migliori.
3.7 MQ6: Situazione relativa alle rinunce
55
Figura 3.38. Numero di laureati nei Corsi di Studio triennali dell’Area di Ingegneria
Figura 3.39. Numero di laureati nei corsi di Studio biennali dell’Area di Ingegneria
3.7 MQ6: Situazione relativa alle rinunce
Per quanto riguarda le analisi relative alla sesta macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una
serie di report per fornire un quadro generale sulle rinunce agli studi universitari.
Le dimensioni scelte sono: MotivoUscita, MacroTipoDiploma, MacroTipoLaurea,
A.A.Immatricolazione, NomeCorsoPubblico, A.A.Corto e AnnoUscita. Le misure
56
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.40. Numero di laureati per ogni Area della Mediterranea a partire dal 2005
Figura 3.41. Numero medio di anni per il conseguimento di un titolo di studio biennale
presso l’Università Mediterranea
di interesse riguardano il numero usciti e di laureati. Per quanto riguarda la dimensione MotivoUscita è stata selezionata la rinuncia esplicita per rendere più specifici
i risultati ricavati. In Figura 3.52 è possibile vedere lo schema a stella a partire dal
quale è stato progettato il cubo.
3.7.1 Definizione dei KPI e della loro presentazione
Le rinunce rappresentano un aspetto molto importante per la governance, in quanto,
mediante l’analisi di tale dato, è possibile capire se lo studente sia stato in qualche
3.7 MQ6: Situazione relativa alle rinunce
57
Figura 3.42. Numero medio di anni per il conseguimento di un titolo di studio triennale
presso l’Università Mediterranea
Figura 3.43. Numero medio di anni per il conseguimento di un titolo di studio biennale
presso l’Università Mediterranea
modo condizionato dal tipo di percorso di studi effettuato precedentemente, o dalla
pesantezza del corso di laurea scelto. I KPI presentati per la MQ6 hanno l’obiettivo di evidenziare quanti più aspetti possibili riguardanti le rinunce da parte degli
studenti.
58
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.44. Numero di laureati per ciascun corso biennale della Mediterranea
3.7.2 Conoscenza estratta
In Figura 3.53 viene mostrato l’andamento delle rinunce da parte degli studenti della
Mediterranea a partire dall’anno 2001. È possibile notare come, dopo un aumento
lineare, le rinunce siano diminuite a partire dall’anno 2010.
Nelle Figure 3.54 e 3.55 vogliamo evidenziare l’andamento delle rinunce, rispettivamente, in base al macrotipo di diploma ed al macrotipo di laurea.
3.7 MQ6: Situazione relativa alle rinunce
59
Figura 3.45. Numero di laureati meo Corsi di Studi triennali della Mediterranea
Figura 3.46. Numero di laureati nei Corsi di Studio a ciclo unico della Mediterranea
60
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.47. Andamento del numero di laureati, suddivisi per fasce di voto, per l’Area
di Ingegneria
Figura 3.48. Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso
di Studi in Ingegneria Elettronica
3.7 MQ6: Situazione relativa alle rinunce
61
Figura 3.49. Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso
di Studi in Ingegneria dell’Informazione
Figura 3.50. Andamento del numero di laureati, suddivisi per fasce di voto, per il Corso
di Studi in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni
Figura 3.51. Confronto tra i Corsi di Studio in Ingegneria delle Telecomunicazioni DM509
e DM270 per ciò che riguarda la durata media degli studi
62
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.52. Schema a stella relativo al cubo Usciti usato per la MQ6
Figura 3.53. Andamento delle rinunce nel corso degli anni
3.7 MQ6: Situazione relativa alle rinunce
63
Figura 3.54. Andamento delle rinunce in base al macrotipo di diploma
Per quanto riguarda l’andamento in base al macrotipo di diploma, per offrire un
risultato quanto più accurato possibile, è stato rapportato il numero delle rinunce
in base al numero di scritti anno per anno e per ogni macrotipo di diploma. Dal
grafico non si notano cambiamenti significativi, a parte una leggera diminuzione delle
rinunce a partire dal 2001. La situazione relativa al macrotipo di laurea mostra,
invece, il numero di rinunce relative a corsi biennali, triennali e a ciclo unico, a
partire dall’anno 2006. Osservando l’andamento delle rinunce ai corsi triennali è
possibile notare un netto calo a partire dal 2012. In Figura 3.56 viene rappresentato
64
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.55. Andamento delle rinunce in base al macrotipo di laurea
Figura 3.56. Andamento delle rinunce in base alle Aree
l’andamento delle rinunce per ogni Area a partire dal 2005.
In questo caso, si può notare che le rinunce siano uniformemente diminuite a
partire dal 2013. In Figura 3.57 sono riportate le rinunce dopo n+1 anni (ovvero
dopo un anno in più dopo la durata legale del Corso di Studi) dall’anno di iscrizione.
Le analisi successive si soffermano sull’Area di Ingegneria. In Figura 3.58 riportiamo
il numero totale di rinunce per ciascun corso di Ingegneria.
In Figura 3.59 osserviamo l’andamento delle rinunce per i Corsi di Studio dell’Area di Ingegneria negli anni a partire dall’anno 2008. Per comprendere meglio
le cause di questi risultati, le analisi successive cercano di individuare i momenti
più critici della carriera universitaria di uno studente. In Figura 3.60, valutiamo le
rinunce ai Corsi di Studi per gli immatricolati dal 2001 in poi.
3.7 MQ6: Situazione relativa alle rinunce
65
Figura 3.57. Rinunce degli iscritti dell’anno 2011 dopo n+1 anni
Figura 3.58. Numero totale di rinunce, dopo n+1 anni, per ogni Corso di Studi dell’Area
di Ingegneria
In Figura 3.61 osserviamo il percorso degli immatricolati negli anni 2010/2011,
2011/2012 e 2012/2013 nella Mediterranea. Risulta chiaro come la maggior parte
delle rinunce avvengano durante il secondo anno di studi universitari.
Vediamo, adesso, i risultati ottenuti dai Corsi di Studio triennali dell’Area
di Ingegneria. In Figura 3.62 osserviamo i risultati ottenuti dagli immatricolati
2010/2011, 2011/2012 e 2012/2013. Come possiamo notare, l’andamento ottenuto
risulta conforme con i dati generali della Mediterranea. Per concludere, vediamo
l’esito ottenuto dopo n+1 anni (durata legale del corso più un anno aggiuntivo)
dall’immatricolazione. Nelle Figure 3.63 e 3.64 valutiamo l’esito degli immatricolati
2008, 2009, 2010 e 2011, confrontando la percentuale di laureati e di rinunce, rispetti-
66
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.59. Rinunce per ogni Corso di Studio dell’Area di Ingegneria a partire dal 2008
vamente, per il Corso di Studi triennale in Ingegneria dell’Informazione e per il Corso
di Studi biennale in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni.
Per quanto riguarda il Corso di Studi in Ingegneria dell’Informazione, è possibile
notare che, trascorsi n+1 anni dall’immatricolazione, esiste un forte distacco tra le
rinunce ed i laureati. La situazione risulta essere nettamente migliore per il Corso di
Studi biennale in Ingegneria Informatica e de Sistemi per le Telecomunicazioni. In
questo caso, infatti, il numero di rinunce si abbassa notevolmente, mentre il numero
di laureati aumenta fino a distaccare di molto il numero di rinunce.
3.8 MQ7: Situazione relativa ai contributi
67
Figura 3.60. Numero di rinunce in base all’anno di immatricolazione per gli studenti
della Mediterranea
Figura 3.61. Rinunce da parte degli immatricolati negli A.A. 2010/2011, 2011/2012 e
2012/2013
3.8 MQ7: Situazione relativa ai contributi
Per quanto riguarda le analisi relative alla settima macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una
serie di report sulla situazione relativa ai contributi. Le dimensioni scelte sono: NomeCorsoPubblico, A.A.Corto e Facoltà. Le misure di interesse riguardano il numeroImmatricolati, importoDovuto e importoPagato. In questo caso, i dati dell’OSD
sono risultati insufficienti. Per questo motivo ci è stato consentito di effettuare una
serie report integrativi su alcuni dati presenti sulla piattaforma GOMP. In Figura
3.65 è possibile vedere lo schema a stella a partire dal quale è stato progettato il
cubo.
68
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.62. Rinunce da parte degli immatricolati negli A.A. 2010/2011, 2011/2012 e
2012/2013 nei Corsi di Studio triennali dell’Area di Ingegneria
Figura 3.63. Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del Corso di
Studi in Ingegneria dell’Informazione
Figura 3.64. Esito, dopo n+1 anni dall’immatricolazione, per gli studenti del Corso di
Studi in Ingegneria Informatica e dei Sistemi per le Telecomunicazioni
3.8 MQ7: Situazione relativa ai contributi
69
Figura 3.65. Schema a stella relativo al cubo Contributi usato per la MQ7
Figura 3.66. Confronto tra importoDovuto e importoPagato negli anni
3.8.1 Definizione dei KPI e della loro presentazione
Le misure a disposizione per ottenere dei report sulla situazione relativa ai contributi hanno evidenziato alcuni limiti nei dati disponibili. Infatti, a causa di un’alta
granularità e di alcuni dati non aggiornati relativi agli ultimi anni, abbiamo incontrato qualche difficoltà nel costruire una visione dettagliata sui contributi. I KPI
proposti per la MQ7 hanno l’obiettivo di mettere in risalto la situazione generale
relativa ai contributi.
3.8.2 Conoscenza estratta
In Figura 3.66 abbiamo messo a confronto importoDovuto e importoPagato a partire
dal 2001. Rapportando i risultati ottenuti si riscontrano situazioni di pendenza negli
anni 2012, 2013 e 2014. Per questa ragione abbiamo scelto di approfondire questo
aspetto. In Figura 3.67 osserviamo, nello specifico, la situazione relativa alle quattro
Aree della Mediterranea.
In Figura 3.68 è possibile osservare in dettaglio la situazione relativa ai singoli
Corsi di Studio dell’Area di Ingegneria. Non avendo elementi sufficienti per dare
70
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.67. Confronto tra importoDovuto e importoPagato per le Aree della
Mediterranea
un’interpretazione riguardo ai risultati ottenuti, ci siamo limitati a mettere in risalto
le percentuali di pendenze ricavate.
Come già accennato, i dati dell’OSD riguardanti, nello specifico, le borse di
studio, risultano ancora in aggiornamento. Per questa ragione abbiamo analizzato
alcuni dati disponibili sulla piattaforma GOMP riguardanti le richieste di ottenimento delle borse di studio negli anni 2014 e 2015. I dati su cui abbiamo effettuato le
analisi successive offrivano informazioni inerenti alle singole istanze di richiesta delle
borse di studio. A partire da queste informazioni, abbiamo classificato le istanze in
base al Comune ed alla Provincia di residenza. I risultati ottenuti sono rappresentati
nelle Figure 3.69 e 3.70. Come possiamo facilmente notare, dall’analisi effettuata si
riscontra un discreto calo di richieste quando si passa dall’anno 2014 all’anno 2015.
I dati a disposizione presentavano, inoltre, informazioni relative al macrotipo di
laurea. Mettendo a confronto i report delle Figure 3.71 e 3.72 è possibile notare come
la maggior parte delle richieste di ottenimento delle borse di studio provengano da
studenti del primo anno. Inoltre, si osserva che, nell’anno 2015, la maggior parte
delle richieste proveniva da studenti di Corsi di Studio a ciclo unico, un cambiamento
interessante rapportato all’anno precedente, dove il maggior numero di richieste
3.8 MQ7: Situazione relativa ai contributi
71
Figura 3.68. Confronto tra importoDovuto ed importoPagato per i Corsi di Studio
dell’Area Ingegneria
Figura 3.69. Informazioni relative al Comune di residenza associato alle richieste di borse
di studio
72
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.70. Informazioni relative alla Provincia di residenza associato alle richieste di
borse di studio
Figura 3.71. Informazioni relative al macrotipo di laurea associato alle richieste di borse
di studio (anno 2014)
Figura 3.72. Informazioni relative al macrotipo di laurea associato alle richieste di borse
di studio (anno 2015)
proveniva da Corsi di Studio triennale.
3.9 Cruscotti realizzati
73
Figura 3.73. Cruscotto relativo agli immatricolati, iscritti, usciti e laureati della
Mediterranea
3.9 Cruscotti realizzati
I cruscotti delle prestazioni costituiscono l’interfaccia utente che fornisce la sintesi
delle informazioni più importanti in termini di Business Intelligence. Un cruscotto,
infatti, offre un reale valore di business grazie alla possibilità di rendere coerente
l’informazione mediante i KPI, ovvero parametri critici associati a criteri operativi,
tattici e strategici dell’azienda. L’efficienza di un cruscotto dipende dalla capacità di
incrociare dinamicamente informazioni, rendendo possibile un’immediata capacità
decisionale. Dopo aver catalogato i report effettuati in una serie di macro-questioni,
abbiamo utilizzato il tool di Pentaho per la realizzazione di una serie di cruscotti
che riportiamo a seguire.
In Figura 3.73 viene riportato il primo cruscotto realizzato. Come possiamo
notare, abbiamo scelto di offrire un quadro generale riguardo al numero di immatricolati, iscritti, usciti e laureati, dell’Università Mediterranea di Reggio Calabria.
Tali misure, infatti, sono i principali indicatori che avevamo a disposizione. Per rendere più chiaro il contenuto offerto dal cruscotto, abbiamo utilizzato delle opzioni
grafiche per quantificare le misure con barre di colorazione diversa. In aggiunta, abbiamo creato un’informazione supplementare, per ogni misura, denominata Trend.
Ogni entry di tale colonna mostra la variazione in percentuale, calcolata in base alla
misura di riferimento, rispetto al valore della entry precedente. Inoltre, è possibile
osservare una freccia che indica l’andamento dell’indicatore.
In Figura 3.74 riportiamo il secondo cruscotto realizzato. Esso offre un confronto
sul numero di laureati e di rinunce esplicite della Mediterranea. In questo caso
abbiamo associato alle misure una scala di gradazione dal verde al rosso in modo
da offrire un chiara visione sui livelli di criticità del numero. In basso, si osserva la
74
3 Estrazione di conoscenza relativa al nostro Ateneo
Figura 3.74. Cruscotto relativo al numero di laureati e di rinunce esplicite della
Mediterranea
Figura 3.75. Cruscotto relativo al numero di usciti e di laureati della Mediterranea
rappresentazione degli andamenti delle due misure di riferimento a partire dall’anno
2001.
In Figura 3.75 riportiamo un cruscotto, che mette a confronto il numero di usciti
e di laureati. In aggiunta, è possibile osservare un grafico a barre che offre una
valutazione sull’andamento delle percentuali associate alle fasce di voto di laurea
negli anni.
In Figura 3.76 è possibile osservare un cruscotto che mette a confronto i singoli corsi di Ingegneria dell’Informazione e di Ingegneria Informatica e dei Sistemi
3.9 Cruscotti realizzati
75
Figura 3.76. Cruscotto relativo ai corsi di Ingegneria dell’Informazione e di Ingegneria
Informatica e dei Sistemi per le Telecomunicazioni della Mediterranea
per le Telecomunicazioni della Mediterranea. In questo caso, l’arco temporale di
riferimento riguarda gli anni dal 2010 al 2014. Nella parte superiore del grafico
vengono mostrate informazioni riguardo al numero di immatricolati per entrambi i
corsi di riferimento. Nella parte inferiore, invece, si osservano gli andamenti relativi
ai laureati e alle rinunce esplicite.
4
Estrazione di conoscenza sul immatricolazioni e
lauree relativa al contesto italiano
Questo capitolo illustra la conoscenza su immatricolazioni e lauree, relative ai vari
atenei italiani, introdotta utilizzando i dati e i tool del sito dell’OSD dopo un’attenta
attività di progettazione. Nel capitolo verranno introdotte alcune macro-questioni
(nel seguito, MQ); per ciascuna di esse verranno rappresentati gli schemi a stella
dei relativi cubi progettati, i Key Performance Indicator e la conoscenza estratta.
Infine, verranno mostrati una serie di cruscotti realizzati.
4.1 Premessa
L’attività di analisi svolta finora ci ha consentito di raccogliere una serie di informazioni interessanti riguardo la situazione generale dell’Università Mediterranea
di Reggio Calabria. Al fine di raggiungere una comprensione di più ampio respiro
è stato, però, necessario spostare la nostra attenzione al di fuori del contesto locale. Questo, come vedremo, ci ha fornito ulteriori spunti di interpretazione della
conoscenza precedentemente estratta.
I dati fondamentali per l’attività svolta sono stati quelli dell’Osservatorio Studenti Didattica. A partire da tali dati è stato possibile realizzare i cubi e, quindi,
i report ed i cruscotti di interesse, grazie alla piattaforma di Business Intelligence
Pentaho.
Le analisi effettuate, relative al contesto italiano, sono state classificate in tre
macro-questioni (nel seguito, MQ), che spostano gradualmente la nostra attenzione
dalla realtà locale del capitolo precedente alla realtà nazionale. La prima MQ evidenzia una serie di indagini relative al numero di immatricolati e di usciti, effettuate
confrontando le realtà univesitarie di Calabria e Sicilia. La seconda MQ, invece, si
sofferma sul contesto italiano, effettuando una serie di analisi sugli immatricolati e
sugli usciti in base all’area geografica. La terza MQ mette a confronto l’università
tradizionale con quella telematica, ovvero un’università che eroga corsi con modalità
a distanza.
78
4 Estrazione di conoscenza relativa al contesto italiano
4.2 MQ1: Confronto tra Calabria e Sicilia
4.2.1 Estrazione di conoscenza relativa agli immatricolati
Per quanto riguarda l’estrazione di conoscenza relativa agli immatricolati delle università calabresi e siciliane, è stato progettato un cubo su cui, mediante operazioni
OLAP, è stato possibile effettuare una serie di report. Le dimensioni scelte sono:
AteneoRegione, AteneoCorto, CorsoRegione, Classe e A.A.Corto. La misura di interesse riguarda il numero di immatricolati. In Figura 4.1 è possibile vedere lo schema
a stella a partire dal quale è stato progettato il cubo.
Figura 4.1. Schema a stella del cubo usato per la MQ1 relativa agli immatricolati
4.2.1.1 Definizione dei KPI e della loro presentazione
I Key Performance Indicator (nel seguito, KPI) scelti per la MQ1 relativa agli
immatricolati vogliono mettere in evidenza una serie di valutazioni riguardo gli immatricolati delle università calabresi e siciliane. Mediante operazioni di roll-up e
drill-down è stato possibile offrire molteplici report che considerano la situazione
complessiva delle due regioni e dei rispettivi atenei. È stato poi effettuato un confronto riguardante gli immatricolati con diploma estero. Infine, si è proceduti con
un confronto relativo alle Classi di Laurea L-8 ed LM-27 presenti nelle due regioni
di riferimento.
4.2.1.2 Conoscenza estratta
In Figura 4.2 è possibile osservare un confronto tra la Calabria e la Sicilia in base al
numero di immatricolazioni. Dal grafico si evince come esista un discreto margine
di distacco tra le due regioni che sembra, però, attenuarsi a partire dall’anno 2007.
Effettuando un’operazione di drill-down sul cubo è stato possibile scendere nel
dettaglio dei singoli atenei. In Figura 4.3 mettiamo a confronto il numero totale di
immatricolati delle università calabresi e siciliane. Come possiamo notare, è possibile valutare le rispettive classifiche regionali degli atenei, in base al numero di
immatricolati.
4.2 MQ1: Confronto tra Calabria e Sicilia
79
Figura 4.2. Confronto tra gli andamenti relativi al numero totale di immatricolati in
Calabria e in Sicilia
Figura 4.3. Confronto tra il numero totale di immatricolati alle università calabresi e
siciliane
In Figura 4.4 vengono classificati gli atenei in base al numero totale di immatricolati. Nelle prime tre posizioni si trovano, rispettivamente, l’Università di Catania,
l’Università di Palermo e l’Università di Messina; l’Università Mediterranea si trova
in terzultima posizione.
Per valutare la classifica ricavata nel corso degli anni è stata aggiunta la dimensione temporale. In Figura 4.5 si può notare come l’Università Mediterranea
sia passata dalla terzultima alla penultima posizione a partire dal 2010. La causa di questo risultato può essere collegata all’apertura dell’Università degli Studi
di Enna Kore. Questa università, infatti, offre un Corso di Studio in Architettura
che è riuscita ad attirare una parte delle immatricolazioni di studenti siciliani che
precedentemente si iscrivevano presso l’Area di Architettura della Mediterranea.
È interessante notare che, se nel complesso si evidenzia un calo generale delle immatricolazioni nel corso degli anni, gli atenei che hanno accusato maggiormente il
fenomeno sono stati quelli di Catania, Palermo e Messina.
A tal proposito, abbiamo effettuato un report (Figura 4.6) che offre informazioni
molto dettagliate sugli andamenti relativi ai singoli atenei delle due regioni. Accanto
80
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.4. Classifica degli atenei calabresi e siciliani in base al numero di immatricolati
ad ogni colonna relativa alla misura immatricolati, ne abbiamo calcolata un’altra,
denominata Trend. Ogni entry di tale colonna mostra la variazione, in percentuale,
calcolata in base alla misura di riferimento, rispetto al valore della entry precedente;
in aggiunta è presente una freccia che, mediante una colorazione verde o rossa,
sottolinea il tipo di andamento corrente. Queste informazioni sono molto utili in
quanto ci consentono di comprendere facilmente i risultati ottenuti da un anno
all’altro. Dal grafico si può notare come ogni ateneo abbia visto ridursi il numero
di immatricolazioni nel corso degli ultimi anni.
In Figura 4.7 vengono mostrati gli andamenti delle immatricolazioni con diploma
conseguito all’estero presso le università calabresi e siciliane. Come possiamo notare,
la Calabria ha avuto una ripresa importante nei confronti della Sicilia. Nel corso
degli anni, infatti, ha manifestato un notevole incremento delle immatricolazioni
con diploma estero, fino a distaccare completamente la Sicilia a partire dal 2010.
Mediante un’operazione di drill-down sul cubo, è stato possibile osservare nel
dettaglio la situazione per ciascun ateneo calabrese e siciliano. In Figura 4.8 riportiamo il risultato ottenuto. Come possiamo notare, il vantaggio raggiunto dalla
Calabria è stato determinato dall’ottimo andamento dell’Università della Calabria.
I report seguenti si soffermano sulle Classi di Laurea L-8 e LM-27 presenti nelle
due regioni. In Figura 4.9 riportiamo il numero totale di immatricolazioni per ogni
classe di laurea di riferimento presente nelle due regioni. Come possiamo notare,
la maggior parte delle immatricolazioni alla Classe di Laurea L-8 è ottenuta dalla
Sicilia. La situazione si ribalta per quanto riguarda le immatricolazioni alla Classe
di Laurea LM-27, che vede un discreto vantaggio ottenuto dalla Calabria.
Aggiungendo la dimensione temporale abbiamo potuto valutare la situazione nel
corso degli anni. In Figura 4.10 sono riportati i risultati ottenuti.
4.2 MQ1: Confronto tra Calabria e Sicilia
81
Figura 4.5. Andamento delle immatricolazioni presso gli atenei calabresi e siciliani
4.2.2 Estrazione di conoscenza relativa agli usciti
Per quanto riguarda l’estrazione di conoscenza relativa agli usciti delle università
calabresi e siciliane, è stato progettato un cubo su cui, mediante operazioni OLAP,
è stato possibile effettuare una serie di report. Le dimensioni scelte sono: AteneoRegione, AteneoCorto, MotivoUscita e A.A.Corto. La misura di interesse riguarda
82
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.6. Informazioni sull’andamento delle immatricolazioni e dei rispettivi trend
ottenuti dalle università calabresi e siciliane
il numero di usciti. In Figura 4.11 è possibile vedere lo schema a stella a partire dal
quale è stato progettato il cubo.
4.2 MQ1: Confronto tra Calabria e Sicilia
83
Figura 4.7. Andamento delle immatricolazioni con diploma estero
4.2.2.1 Definizione dei KPI e della loro presentazione
I KPI scelti per la MQ1 relativa agli usciti vogliono mettere in evidenza una serie di
valutazioni riguardo agli usciti delle università calabresi e siciliane. Mediante operazioni di roll-up e drill-down è stato possibile offrire molteplici report che considerano
la situazione complessiva delle due regioni e dei rispettivi atenei. Ci soffermeremo,
in particolare, sul numero di usciti, di laureati e di rinunce esplicite totalizzato dalle
due regioni.
4.2.2.2 Conoscenza estratta
In Figura 4.12 viene rappresentato l’andamento degli usciti dalle università calabresi
e siciliane. Possiamo notare che, in proporzione, gli andamenti manifestino una
similitudine interessante.
Figura 4.8. Andamento delle immatricolazioni con diploma estero per ogni ateneo
calabrese e siciliano
84
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.9. Immatricolazioni alle Classi di Laurea L-8 e LM-27 calabresi e siciliane
Figura 4.10. Andamento delle immatricolazioni alle Classi di Laurea L-8 e LM-27
calabresi e siciliane
Figura 4.11. Schema a stella del cubo usato per la MQ1 relativa agli usciti
4.2 MQ1: Confronto tra Calabria e Sicilia
85
Figura 4.12. Andamento del numero di usciti delle università calabresi e siciliane
Figura 4.13. Informazioni sull’andamento degli usciti e dei rispettivi trend ottenuti dalle
università calabresi e siciliane
86
4 Estrazione di conoscenza relativa al contesto italiano
Successivamente abbiamo effettuato un’operazione di drill-down considerando i
singoli atenei delle due regioni, al fine di offrire un report il più dettagliato possibile.
In Figura 4.13 sono riportati i dati ottenuti. Per ogni colonna relativa al numero
di usciti ne abbiamo ricavata una, denominata Trend, che mostra la variazione in
percentuale rispetto al valore associato alla entry precedente della colonna usciti.
Anche in questo caso, abbiamo aggiunto una freccia di colorazione verde o rossa che
sottolinea il tipo di andamento corrente.
In Figura 4.14 è possibile osservare l’andamento associato al numero di laureati
delle università calabresi e siciliane. In Figura 4.15, invece, riportiamo i dati ottenuti
considerando i singoli atenei delle rispettive regioni.
Figura 4.14. Andamento del numero di laureati delle università calabresi e siciliane
In Figura 4.16 è rappresentato l’andamento associato al numero di rinunce esplicite delle università calabresi e siciliane. In Figura 4.17, invece, riportiamo i dati ottenuti considerando i singoli atenei delle rispettive regioni. In questo caso è possibile
osservare dei risultati generalmente incoraggianti a partire dal 2010.
4.3 MQ2: Confronto in base all’area geografica
4.3.1 Estrazione di conoscenza relativa agli immatricolati
Per quanto riguarda l’estrazione di conoscenza relativa agli immatricolati, è stato
progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare
una serie di report relativi al contesto italiano. Le dimensioni scelte sono: AteneoArea, AteneoCorto, Classe e A.A.Corto. La misura di interesse riguarda il numero
di immatricolati. In Figura 4.18 è possibile vedere lo schema a stella a partire dal
quale è stato progettato il cubo.
4.3.1.1 Definizione dei KPI e della loro presentazione
I KPI scelti per la MQ2 relativa agli immatricolati vogliono mettere in evidenza
una serie di valutazioni riguardo gli immatricolati in base all’area geografica di
locazione degli atenei italiani. Mediante operazioni di roll-up e drill-down è stato
4.3 MQ2: Confronto in base all’area geografica
87
Figura 4.15. Informazioni sull’andamento dei laureati e dei rispettivi trend ottenuti dalle
università calabresi e siciliane
possibile offrire una serie report che considerano la situazione relativa al contesto
italiano . Abbiamo, inoltre, scelto di soffermarci sulle Classi di Laurea L-8 e LM-27
in base all’area geografica.
4.3.1.2 Conoscenza estratta
In Figura 4.19 osserviamo l’andamento del numero totale di immatricolazioni di
tutte le università italiane nel corso degli anni. È possibile notare come vi sia stato
88
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.16. Andamento del numero di rinunce esplicite delle università calabresi e
siciliane
un brusco calo di immatricolazioni dal 2001 al 2002, recuperato in parte nel 2006; da
quest’ultimo anno, invece, si osserva tendenzialmente una diminuzione del numero
di immatricolati che tocca il punto più basso proprio nell’ultimo anno di analisi.
Questo è un dato molto interessante in quanto riflette una condizione di crisi del
sistema universitario italiano, probabilmente da collegare ad una situazione ancora
più generale in cui versa il nostro paese.
Aggiungendo la dimensione AteneoArea è stato possibile confrontare l’andamento ricavato precedentemente in base all’area geografica degli atenei italiani. In Figura
4.20 vengono rappresentati i risultati ottenuti. Osservando il grafico si evidenzia nel
dettaglio il brusco calo individuato prima, verificatosi dal 2001 al 2002. In questo
caso, però, si riescono a distinguere le aree geografiche dove tale fenomeno si è fatto
sentire di più, ovvero il Centro, il Nord-Est ed il Nord-Ovest. Si noti, inoltre, come
sussista una similitudine tra gli andamenti del Centro e del Sud. Soffermandosi sugli
ultimi due anni dell’arco temporale di analisi, invece, si osserva come il Sud sia stata
l’area geografica che ha perso più immatricolazioni. Le regioni del Nord-Est e del
Nord-Ovest, invece, manifestano una situazione più stabile.
Mediante un’operazione di roll-up sul cubo, abbiamo analizzato la situazione relativa alla Classe di Laurea L-8 nel contesto italiano. In Figura 4.21 è rappresentato
l’andamento delle immatricolazioni alla Classe di Laurea di riferimento a partire dal 2008. Il risultato ricavato mette in risalto un andamento sempre crescente,
specialmente negli ultimi quattro anni.
Effettuando un’operazione di drill-down siamo scesi nel dettaglio delle singole
aree geografiche. In Figura 4.22 sono riportati i risultati ottenuti. Osservando il
grafico, si nota subito come le regioni del Nord-Ovest vedono un aumento importante
del numero di immatricolazioni alla Classe di Laurea di riferimento. Il Sud, invece,
mantiene comunque una situazione piuttosto stabile.
Mediante un’operazione di roll-up sul cubo, abbiamo analizzato la situazione
relativa alla Classe di Laurea LM-27 nel contesto italiano. In Figura 4.23 è rappresentato l’andamento delle immatricolazioni alla Classe di Laurea di riferimento a
partire dal 2008. Il risultato ricavato mette in risalto un andamento molto promettente nei primi tre anni. A partire dal 2010, invece, le immatricolazioni alla Classe
di Laurea LM-27 sono lentamente diminuite. Si nota, inoltre, un vistoso calo degli
4.3 MQ2: Confronto in base all’area geografica
89
Figura 4.17. Informazioni sull’andamento delle rinunce esplicite e dei rispettivi trend
ottenuti dalle università calabresi e siciliane
iscritti nel 2015.
Effettuando un’operazione di drill-down siamo scesi nel dettaglio delle singole
aree geografiche. In Figura 4.24 vengono riportati i risultati ottenuti. Osservando
il grafico, è possibile notare come le regioni del Nord-Est abbiano una situazione
generalmente più stabile rispetto alle altre. Il calo relativo all’anno 2015, evidenziato
precedentemente, è stato determinato, in gran parte, dalle regioni del Centro e del
Sud Italia.
Sulla base dei risultati ottenuti abbiamo scelto di valutare la posizione dell’Uni-
90
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.18. Schema a stella del cubo usato per la MQ2 relativa agli immatricolati
Figura 4.19. Andamento delle immatricolazioni relativo alle università presenti in Italia
Figura 4.20. Andamento delle immatricolazioni in base all’area geografica degli atenei
versità Mediterranea di Reggio Calabria nei confronti degli altri atenei che offrono
corsi di studio delle classi di laurea di riferimento. Nelle Figure 4.25 e 4.26 sono ri-
4.3 MQ2: Confronto in base all’area geografica
91
Figura 4.21. Andamento delle immatricolazioni alla Classe di Laurea L-8
Figura 4.22. Andamento delle immatricolazioni alla Classe di Laurea L-8 per ogni area
geografica
Figura 4.23. Andamento delle immatricolazioni alla Classe di Laurea LM-27
portate le classifiche ottenute, rispettivamente, per le Classi di Laurea L-8 e LM-27.
Osservando la classifica relativa alla Classe di Laurea L-8, il Politecnico di Milano
risulta essere in prima posizione con un distacco importante sul Politecnico di Torino. La Mediterranea, invece, è collocata nella posizione 26. La situazione risulta più
92
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.24. Andamento delle immatricolazioni alla Classe di Laurea LM-27 per ogni
area geografica
sorprendente osservando la classifica relativa alla Classe di Laurea LM-27. In questo
caso, infatti, l’Università Mediterranea risulta essere in quinta posizione, superata
soltanto dagli Atenei di Roma, Trento, Milano e Torino.
4.3.2 Estrazione di conoscenza relativa agli usciti
Per quanto riguarda l’estrazione di conoscenza relativa agli usciti, è stato progettato
un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una serie
di report relativi al contesto italiano. Le dimensioni scelte sono state: AteneoArea,
MotivoUscita, Classe e A.A.Corto. La misura di interesse riguarda il numero di
usciti. In Figura 4.27 è possibile vedere lo schema a stella a partire dal quale è stato
progettato il cubo.
4.3.2.1 Definizione dei KPI e della loro presentazione
I KPI scelti per la MQ2 relativa agli usciti vogliono mettere in evidenza una serie
di valutazioni sulla base dell’area geografica di locazione degli atenei italiani. Mediante operazioni di roll-up e drill-down è stato possibile offrire una serie report che
considerano la situazione relativa al contesto italiano. Abbiamo, inoltre, scelto di
soffermarci sulle Classi di Laurea L-8 e LM-27 in base all’area geografica.
4.3.2.2 Conoscenza estratta
In Figura 4.28 è rappresentato l’andamento del numero di rinunce esplicite in base
all’area geografica di riferimento. Dall’osservazione del grafico si può notare un
sensibile miglioramento a partire dal 2013. I risultati relativi al 2015 sono molto
probabilmente provvisori e, quindi, poco significativi.
In Figura 4.29 riportiamo un quadro più completo sui dati relativi alle rinunce
esplicite. Per ogni colonna relativa al numero di rinunce esplicite ne abbiamo ricavata
un’altra denominata Trend che mostra la variazione in percentuale rispetto al valore
4.3 MQ2: Confronto in base all’area geografica
93
Figura 4.25. Classifica degli atenei italiani in base al numero di immatricolati alla Classe
di Laurea L-8
associato alla entry precedente della colonna Rinuncia Esplicita. Abbiamo aggiunto
una freccia di colorazione verde o rossa che sottolinea il tipo di andamento corrente.
Nelle Figure 4.30 e 4.31 vengono riportati gli andamenti relativi alle rinunce
esplicite in base all’area geografica, rispettivamente, per la Classe di Laurea L-8
e LM-27. Dall’osservazione dei grafici si nota come esista un andamento crescente
delle rinunce per quanto riguarda la Classe di Laurea L-8. La situazione relativa
alla Classe di Laurea LM-27, invece, mostra un andamento più variabile.
Le analisi successive riguardano, invece, il numero medio di anni necessario per
94
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.26. Classifica degli atenei italiani in base al numero di immatricolati alla Classe
di Laurea LM-27
Figura 4.27. Schema a stella del cubo usato per la MQ2 relativa agli usciti
conseguire la laurea. In Figura 4.32 riportiamo la media nazionale relativa alle Classi
di Laurea di riferimento.
Effettuando un’operazione di drill-down è possibile ricavare i dati per ogni area
geografica. Come possiamo notare in Figura 4.33, sussiste una certa similitudine per
quanto riguarda le due classi di laurea di riferimento, che vede un discreto vantaggio
delle regioni del Nord d’Italia. Le differenze sono leggermente meno marcate per
quanto riguarda la Classe di Laurea LM-27.
4.4 MQ3: Confronto tra università tradizionale e telematica
95
Figura 4.28. Andamento del numero di rinunce esplicite in base all’area geografica
Per valutare la posizione dell’Università Mediterranea di Reggio Calabria rispetto agli altri atenei italiani, è stata aggiunta la dimensione AteneoCorto. In Figura
4.34 viene riportata la classifica relativa alla Classe di Laurea L-8. Come possiamo
notare, la Mediterranea si trova nelle ultime posizioni.
In Figura 4.35, invece, possiamo vedere la classifica relativa alla Classe di Laurea
LM-27.
4.4 MQ3: Confronto tra università tradizionale e telematica
Per quanto riguarda le analisi relative alla terza macro-questione, è stato progettato un cubo su cui, mediante operazioni OLAP, è stato possibile effettuare una
serie di report confrontando le università tradizionali con quelle telematiche. Le dimensioni scelte sono: AteneoCorto, ModalitaAteneo, NomeCorsoPubblico, Classe e
A.A.Corto. La misura di interesse riguarda il numero di immatricolati. In Figura
4.36 è possibile vedere lo schema a stella a partire dal quale è stato progettato il
cubo.
4.4.1 Definizione dei KPI e della loro presentazione
Le università telematiche, istituite dal 2003, sono proliferate in Italia e vedono crescere il numero dei loro studenti. Il motivo di questo successo è legato ad una serie
di ragioni. Un’università telematica non necessita l’individuazione del bacino potenziale di utenza complessiva o un numero minimo di studenti immatricolati e
iscritti per poter esistere. Prendere parte ad un percorso di studio on-line consente agli studenti un notevole risparmio economico. Allo stesso tempo, le università
telematiche non devono fornire un supporto agli studenti in termini di biblioteche,
mense, o luoghi di riunioni e aule. I KPI individuati per la MQ3 hanno analizzato
questo fenomeno confrontando i dati relativi alle università tradizionali con quelli
delle università telematiche.
96
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.29. Informazioni sull’andamento delle rinunce esplicite e dei rispettivi trend
ottenuti per ogni area geografica
4.4.2 Conoscenza estratta
In Figura 4.37 viene mostrato l’andamento del numero di immatricolati, rispettivamente, delle università tradizionali e telematiche. Osservando l’andamento relativo
alle università tradizionali si osserva una lenta diminuzione del numero di immatricolati a partire dall’anno 2005. L’andamento relativo alle università telematiche,
invece, mette in evidenza un graduale incremento delle immatricolazioni dal 2007
al 2010. Successivamente si può osservare un declino per il 2011 e il 2012 a cui
segue una ripresa nel 2013 e 2014. I dati del 2015, probabilmente, non sono ancora
definitivi.
4.4 MQ3: Confronto tra università tradizionale e telematica
97
Figura 4.30. Andamento del numero di rinunce esplicite relativo al Corso di Laurea L-8
Figura 4.31. Andamento del numero di rinunce esplicite relativo al Corso di Laurea
LM-27
L’analisi successiva si sofferma sui Corsi di Studio offerti dalle univeristà telematiche che totalizzano il maggior numero di immatricolati. In Figura 4.38 viene
riportata la classifica dei principali Corsi di Studio. Possiamo notare come il Corso
di Studio in Giurisprudenza abbia totalizzato un alto numero di immatricolati. In
Figura 4.39 possiamo osservare la classifica delle università telematiche in base al
numero totale di immatricolati.
L’analisi successiva si sofferma sull’andamento delle immatricolazioni relative
alla Classe di Laurea L-8 per le università telematiche. In Figura 4.40 è possibile
osservare l’andamento delle università telematiche che offrono questo Corso di Studi
a partire dall’anno 2008.
98
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.32. Numero medio di anni necessario per conseguire la laurea relativo alle Classi
di Laurea L-8 e LM-27
Figura 4.33. Numero medio di anni necessario per conseguire la laurea relativo alle Classi
di Laurea L-8 e LM-27 in base all’area geografica
4.5 Cruscotti realizzati
I cruscotti realizzati mediante il tool di Pentaho si soffermano su una serie di
elementi riguardanti il contesto universitario italiano.
Il primo cruscotto realizzato, rappresentato in Figura 4.41, mette in risalto
la situazione relativa agli immatricolati e ai laureati delle università calabresi e
siciliane.
4.5 Cruscotti realizzati
99
Figura 4.34. Classifica atenei italiani in base al numero medio di anni necessario per
conseguire la laurea (Classi di Laurea L-8)
Figura 4.35. Classifica atenei italiani in base al numero medio di anni necessario per
conseguire la laurea (Classi di Laurea LM-27)
Il cruscotto presente in Figura 4.42 mette a confronto, invece, il numero dei
laureati e di rinunce esplicite delle università calabresi e siciliane.
In Figura 4.43 riportiamo il cruscotto che mette a confronto l’andamento del
100
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.36. Schema a stella del cubo usato per la MQ3
Figura 4.37. Confronto sull’andamento delle immatricolazioni relativo alle università
tradizionali e telematiche
Figura 4.38. Classifica dei Corsi di Studio delle università telematiche sulla base del
numero di immatricolati
4.5 Cruscotti realizzati
101
Figura 4.39. Classifica delle università telematiche sulla base del numero di immatricolati
Figura 4.40. Andamento delle immatricolazioni relative alla Classe di Laurea L-8 per le
università telematiche
numero di immatricolati delle università calabresi e siciliane considerando la Classe
di Laurea L-8 a partire dal 2008. In Figura 4.44 è presente il cruscotto relativo alle
immatricolazioni in base al contesto italiano. Nella parte superiore del cruscotto è
presente l’andamento delle immatricolazioni per ogni area geografica. Nella parte
inferiore, invece, viene riportato l’andamento complessivo delle immatricolazioni.
Dall’osservazione del cruscotto si evince che le regioni del Centro, del Sud e delle
Isole stiano avendo un progressivo decremento del numero di immatricolati.
102
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.41. Cruscotto relativo al numero di immatricolati e laureati delle università
calabresi e siciliane
4.5 Cruscotti realizzati
103
Figura 4.42. Cruscotto relativo al numero di laureati e di rinunce esplicite delle università
calabresi e siciliane
104
4 Estrazione di conoscenza relativa al contesto italiano
Figura 4.43. Cruscotto relativo al numero di immatricolati delle università calabresi e
siciliane considerando la Classe di Laurea L-8
4.5 Cruscotti realizzati
105
Figura 4.44. Cruscotto relativo al numero di immatricolazioni in base al contesto italiano
5
Discussione in merito all’attività svolta
In questo quinto capitolo forniremo una discussione in merito all’attività svolta. Inizialmente ci soffermeremo su Lessons Learned and Best Practices, in modo da migliorare la gestione della conoscenza. Successivamente parleremo della generalizzabilità dell’approccio proposto, indicandone, anche, i suoi punti di forza e di debolezza.
Infine, effettueremo una valutazione riguardo agli approcci correlati esistenti.
5.1 Lessons Learned and Best Practices
Dopo aver utilizzato la piattaforma Pentaho per lo studio dei dati dell’OSD, abbiamo individuato elementi sufficienti riguardo alle difficoltà incontrate e, quindi,
alle lezioni apprese dall’attività svolta. Questo ci ha consentito di determinare un
insieme di best practices, ovvero l’insieme delle attività (procedure, comportamenti
e abitudini) che, organizzate in modo sistematico, possono essere prese come riferimento e riprodotte per favorire il raggiungimento dei risultati migliori in ambito
aziendale e ingegneristico. Basandosi su tecniche che si rilevano in grado di ottenere i migliori risultati, è possibile costruire un sistema di regole da rispettare per
rendere più efficiente le modalità produttive. Con i processi adeguati, i giusti controlli e le corrette analisi, il risultato voluto può essere ottenuto evitando problemi
e complicazioni impreviste.
Le principali difficoltà incontrate relative alla progettazione e all’analisi di Data
Warehousing effettuata sui dati dell’OSD riguardano i dati riconciliati, da cui sono
stati progettati i cubi, e le definizioni relative al contesto applicativo di riferimento.
Questi aspetti sono evidenziati nella metodologia denominata metodologia a nove
passi di Kimball per la progettazione di un Data Warehouse. Tale metodologia è
stata proposta alcuni anni fa da Kimball, uno dei fondatori del Data Warehousing.
Il livello dei dati riconciliati (detto anche operational data store), su cui poggia l’attività di progettazione svolta per la realizzazione dei cubi, è il risultato di
tecniche di Extraction Transformation and Loading (ETL) effettuate a livello dell’alimentazione, a partire dal livello delle sorgenti. Il ruolo ricoperto da questa fase,
molto complessa e delicata, consiste nell’alimentare il livello dei dati riconciliati su
cui poggia l’intero sistema di Data Warehouse. Per questo motivo, è fondamentale
108
5 Discussione in merito all’attività svolta
che tale fase sia esauriente e di alta qualità in modo da ottenere un livello di analisi
il più adeguato possibile operante su dati integrati, consistenti e dettagliati.
Nel contesto dell’OSD, le spedizioni dei dati, effettuata da parte degli atenei,
vengono eseguite con cadenza settimanale. Le spedizioni, inoltre, vanno a integrare,
o addirittura riscrivere completamente, parte dei dati nel sistema distribuito. Per
questa ragione, il sistema è dotato di un controllore che verifica la correttezza delle
spedizioni effettuate e che può, quindi, determinare il mancato aggiornamento dei
dati. Questi fattori hanno probabilmente reso molto complicata la fase di integrazione ed hanno avuto effetti sui risultati ottenuti relativi all’ultimo anno di analisi,
in quanto risultavano verosimilmente incompleti e, quindi, inattendibili. Per questo
motivo, riteniamo opportuno tenere sempre presente questo aspetto durante l’attività di analisi, scegliendo opportunamente l’arco temporale di riferimento per la
presentazione dei report.
Un altro problema individuato durante la fase di analisi riguarda una caratteristica molto nota in letteratura, legata alle slowly changing dimension. Il problema
delle slowly changing dimension implica, per esempio, che per i vecchi dati sia necessario fare riferimento alla vecchia organizzazione e alla vecchia strutturazione
degli stessi (ovvero all’organizzazione e alla strutturazione esistenti al tempo a cui
essi si riferiscono).
Nel contesto dell’OSD abbiamo incontrato un problema simile a quello appena
descritto. La riforma Gelmini del 2010 ha soppresso le facoltà universitarie ed i
relativi organi. In particolare, le facoltà e le loro attività sono state assegnate ai loro
dipartimenti. Tra le dimensioni che abbiamo adoperato per la costruzione dei cubi
figuravano sia i dipartimenti che le facoltà. Questo ci ha causato notevoli difficoltà
nel costruire report volti ad analizzare andamenti relativi al corso degli anni pre
e post riforma. Tali difficoltà sono state in parte superate effettuando opportune
modifiche manuali sui dati estratti dalla piattaforma Pentaho per renderli uniformi
e coerenti. In questo caso, sarebbe consigliabile un piano di lavoro sul livello delle
sorgenti in modo da rendere più agevole ed estensibile la costruzione di report che
interessano le dimensioni di riferimento.
Un altro problema incontrato durante l’attività svolta riguarda le descrizioni delle dimensioni e delle misure messe a disposizione dalla piattaforma Pentaho. Spesso,
le descrizioni e, quindi, le definizioni delle dimensioni e delle misure che avevamo a
disposizione erano mancanti o poco esaurienti. Ad esempio, la descrizione dell’attributo studente regolare non era presente, ed è stato, pertanto, necessario avvalersi
della definizione riportata dal MIUR. Altre definizioni, invece, erano presenti, ma
non risultavano pienamente comprensibili per un non addetto ai lavori. Prima di
iniziare l’attività di analisi, è stato necessario effettuare uno studio relativo alle
leggi e, allo stesso tempo, parlare con gli addetti ai lavori per risolvere eventuali incongruenze nelle interpretazione dei risultati proposti. Questi aspetti sono risultati
fondamentali per apprendere quanta più conoscenza possibile sul contesto di riferimento. Per queste ragioni si ritiene opportuno arricchire le descrizioni offerte dalla
piattaforma di analisi per consentire un utilizzo più accessibile e, contemporaneamente, per essere certi e concordi sulle definizioni relative al contesto di riferimento,
prendendo in esame documenti e fonti ufficiali.
Un aspetto fondamentale indicato nella metodologia a nove passi di Kimball per
la progettazione di un Data Warehouse riguarda la scelta della granularità. Sceglie-
5.3 Punti di forza e di debolezza
109
re la granularità comporta decidere esattamente cosa rappresenta una tupla della
Fact Table. Questo fattore influisce notevolmente sul grado di aggregazione dei dati
e, quindi, sul grado di dettaglio in cui è possibile scendere durante le operazioni
OLAP. Per quanto riguarda il contesto applicativo di riferimento, abbiamo evidenziato un’alta granularità che ci ha impedito di approfondire una serie di aspetti di
possibile interesse, come, per esempio, il calcolo dei crediti degli studenti, o informazioni riguardo ai contributi. Pertanto, le analisi relative a queste misure sono state
effettuate su dati raccolti dalla piattaforma GOMP. Inoltre, sarebbe stato interessante poter accedere alle informazioni relative agli esami sostenuti per ogni corso di
laurea.
5.2 Generalizzabilità dell’approccio proposto
Uno dei punti di forza dell’approccio proposto consiste nella sua generalizzabilità,
in quanto esso può essere applicato in diversi contesti di riferimento. L’Anagrafe
Nazionale Studenti (ANS), ovvero la banca dati che raccoglie periodicamente le
informazioni sugli studenti iscritti ai Corsi di Laurea attivati dall’A.A. 2001/2002,
è generalizzabile.
Le università italiane utilizzano, da svariati anni, diverse piattaforme web-based
che hanno determinato l’informatizzazione e la modernizzazione dei vecchi sistemi di
gestione precedentemente utilizzati. L’Università Mediterranea di Reggio Calabria
adotta da diversi anni la piattaforma GOMP.
GOMP è un servizio web-based offerto da Be Smart per gestire tutte le esigenze
relative alle procedure amministrative, didattiche e di programmazione dell’offerta
formativa in capo ad un ateneo. Le attività che abbiamo effettuato su GOMP sono
generalizzabili direttamente per tutti gli atenei che utilizzano tale sistema. Molte
università italiane utilizzano, invece, un’altra piattaforma, denominata Esse3, che
offre un’analoga gamma di servizi online per la didattica. Essendo sia GOMP che
Esse3 proprietari, qualora si volessero utilizzare sui dati di Esse3 le tecniche di analisi
da noi progettate e realizzate per GOMP sarà necessario costruire un wrapper. Con
questo termine, nei sistemi informativi, si intende un modulo che si occupa della
traduzione dei dati da un formato all’altro.
La progettazione di un wrapper da Esse3 a GOMP, che renderebbe generalizzabile quella parte delle nostre tecniche di analisi presentate per GOMP, è abbastanza
agevole e potrebbe essere un utile spunto per sviluppi futuri.
Totalmente generale è, già, invece quella parte delle tecniche del nostro approccio
che agiscono direttamente sui dati OSD, dal momento che il MIUR ha definito
uno standard di strutturazione dei dati a cui si devono uniformare tutti i sistemi
informatici adottati dagli Atenei.
5.3 Punti di forza e di debolezza
Il lavoro svolto dal CINECA, su richiesta del MIUR, per la costituzione dell’Anagrafe Nazionale Studenti mediante l’Osservatorio Studenti Didattica, ci ha permesso di
usufruire di una banca dati in un sistema distribuito che raccoglie le informazioni
110
5 Discussione in merito all’attività svolta
di tutte le università italiane. Uno dei punti di forza nell’avere a disposizione tale
quantità di informazioni consiste nel poter offrire soluzioni efficaci, orientate alla governance, oltre che alla gestione ordinaria degli Atenei, in modo tale da promuovere
il reciproco trasferimento di conoscenza e migliorare la qualità dei servizi.
L’aver adoperato tecniche di Data Warehousing ci ha permesso di estrarre una
notevole quantità di informazioni a partire dai dati di partenza. Lo scopo principale
dell’attività svolta era, infatti, quella di dimostrare i vantaggi derivanti da tale approccio orientato alla Business Intelligence come sistema di supporto alle decisioni.
L’obiettivo principale della Business Intelligence è quello di migliorare il processo
decisionale, a tutti i livelli dell’organizzazione, per incrementare le performance dell’organizzazione stessa. Attraverso l’analisi e l’interpretazione dei risultati ottenuti
sotto forma di report e cruscotti un Ateneo può, quindi, fare delle valutazioni mirate
e apportare determinati cambiamenti basandosi sulla conoscenza estratta.
Il livello di gerarchia delle dimensioni scelte per la progettazione dei cubi ci
ha permesso, inoltre, attraverso svariate operazioni OLAP, di passare facilmente
dal contesto locale relativo all’Università Mediterranea di Reggio Calabria ad un
contesto regionale e nazionale. Questa caratteristica di estensibilità è un altro dei
punti di forza del sistema. Inoltre, i tool a nostra disposizione ci hanno dato la
possibilità di calcolare, tramite una serie di operazioni, nuove misure a partire da
quelle messe a disposizione.
Un altro punto di forza è dato dal tool di Pentaho relativo alla creazione dei
grafici e dei cruscotti di interesse. Per quanto riguarda i cruscotti, essi consentono
di ottenere il giusto equilibrio tra informazioni numeriche e pratiche (l’efficacia dei
grafici, soprattutto nelle grandi organizzazioni, è fondamentale per la comprensione e la condivisione delle informazioni). Una delle caratteristiche più importanti
dei cruscotti è, inoltre, l’interattività, che permette di trovare le risposte in modo
personalizzato, consentendo la manipolazione di grafici e tabelle e, quindi, un’approfondita esplorazione dei dati. I cruscotti non sono, pertanto, solo uno strumento per
la reportistica, ma diventano l’elemento centrale per il performance management,
ovvero il controllo, attraverso KPI (Key Performance Indicator), di un insieme di
obbiettivi strategici selezionati.
Il sistema, però, ha manifestato, anche, qualche punto debolezza. Abbiamo, infatti, constatato che un utente non consapevole della realtà di interesse si trova ad
avere a che fare con un insieme di definizioni di cui si hanno poche informazioni.
Questo problema poteva essere sicuramente ridotto attraverso una più completa
descrizione delle dimensioni disponibili. Un limite di Pentaho è stato l’incapacità
di effettuare l’operazione di drill-across, tecnica OLAP che consente di fondere due
cubi.
5.4 Approcci correlati
L’Italia non è l’unico paese ad aver adottato un sistema informativo distribuito che
raccoglie e amministra i dati delle università del territorio nazionale. In Francia,
ad esempio, viene utilizzato l’APB (Admission Post Bac) che riguarda, però, le
immatricolazioni e le iscrizioni all’anno successivo al primo. Nel Regno Unito si
utilizza il portale UCAS (Undergraduate Courses At Universiry And Collage) come
5.4 Approcci correlati
111
principale punto di accesso per facilitare la ricerca dei corsi di laurea triennali e
magistrali di tutto il paese.
Negli ultimi anni, inoltre, sono nati una serie di progetti dell’Unione Europea,
come EUMIDA (European University Data Collection) ed ETER (European Tertiary Education Register). Quest’ultimo è un progetto di ricerca, lungo ormai un
decennio, che mira a costruire e mantenere un database contenente informazioni
sulle dimensioni degli atenei, sul numero di studenti, sulle lauree, sui corsi e le materie, sui docenti e il personale, sui programmi, la ricerca e l’internazionalizzazione
di 2.673 atenei di trentasei stati, tra cui i paesi europei e alcuni extra-europei. Un
risultato segnalato da questa ricerca indica che, tra i ventinove paesi che hanno fornito dati completi, la Germania conta il maggior numero di istituzioni di istruzione
superiore (374), seguita dalla Polonia (286), dalla Francia (283), dall’Italia (176) e
dal Regno Unito (152).
6
Conclusioni e uno sguardo al futuro
Il presente elaborato di tesi ha avuto come oggetto l’analisi dei dati relativi a tutte
le università italiane presenti nel Cruscotto Ateneo dell’Osservatorio Studenti Didattica del MIUR. Le informazioni a disposizione riguardavano diversi aspetti di
interesse per la governance di ateneo.
Mediante un opportuno sistema di Data Warehousing offerto dal tool di Business
Intelligence di Penthao, è stato possibile progettare e realizzare una serie di cubi
multidimensionali per estrarre conoscenza sui contributi, sulle immatricolazioni e
sulle lauree relativi, dapprima, all’Università Mediterranea di Reggio Calabria e,
successivamente, alle restanti realtà nazionali.
L’attività svolta ha voluto dimostrare l’efficacia delle tecniche adoperate nel
supportare i processi decisionali degli Atenei per migliorare la loro organizzazione. Mediante una serie di operazioni OLAP sui cubi tematici, abbiamo realizzato
molteplici report e cruscotti, organizzandoli in modo tale da rispondere ad alcune
macro-questioni di interesse per la governance.
È stato, inoltre, possibile usufruire di documenti relativi agli indicatori sulle carriere accademiche degli studenti elaborati dalla commissione didattica della CRUI,
e dei documenti dell’Agenzia Nazionale di Valutazione del Sistema Universitario e
della Ricerca (ANVUR). Questo ha consentito di dare maggiore consistenza alla
ricerca ed ai risultati proposti.
Un vantaggio derivante dall’aver avuto a disposizione i dati di tutte le università
italiane è stato quello di aver potuto effettuare un confronto tra i risultati relativi
al contesto locale e a quello nazionale.
In conclusione riteniamo che l’approccio orientato alla tecnica di Data Warehousing consenta di mettere facilmente in risalto una serie di dati oggettivi relativi alla
realtà universitaria e, quindi, la validità di tale metodo come sistema di supporto
alle decisioni. Come possibili miglioramenti futuri, possiamo suggerire una più completa raccolta dei dati degli atenei, che includa, ad esempio, dettagli relativi agli
esami dei singoli corsi di studio e, quindi, la scelta di una più alta granularità del
sistema.
Ringraziamenti
Un ringraziamento particolare al mio relatore, prof. Domenico Ursino, che ha reso
la realizzazione di questa tesi un’esperienza importante, e che ha sempre dimostrato
una grandissima disponibilità, professionalità e passione per il proprio lavoro. Un
ringraziamento alla Dott.ssa T. Santamaria per il tempo che ci ha dedicato.
Un sentito ringraziamento ai miei genitori che, con il loro sostegno, mi hanno
permesso di raggiungere questo traguardo e, inoltre, a mia sorella Teresa, che ha
sempre tifato per me.
Ringrazio poi tutti i colleghi e amici con cui ho condiviso questo percorso. In
particolare Demetrio, Giovanni, Domenico C., Domenico R., Valerio, Paolo C., Paolo
G. e Lucia.
Un ringraziamento speciale va a Celeste, per essermi sempre stata vicino e per
avermi aiutato nei momenti difficili.
Riferimenti bibliografici
1. A. Berson and S. J. Smith. Data Warehousing, Data Mining, and OLAP. McGraw-Hill,
New York, NY, USA, 1997.
2. R. Bouman and J. Van Dongen. Pentaho Solutions: Business Intelligence and Data
Warehousing with Pentaho and MySQL. Wiley, 2009.
3. M. Casters, R. Bouman, and J. Van Dongen. Pentaho Kettle solutions: building open
source ETL solutions with Pentaho Data Integration. Wiley, 2010.
4. S. Chaudhuru and U. Dayal. An overview of data warehousing and OLAP technology.
Statistical Analysis and Data Mining, 26(1):65–74, 1997.
5. M. Z. Elbashir, P. A. Collier, and S. G. Sutton. The Role of Organizational Absorptive
Capacity in Strategic Use of Business Intelligence to Support Integrated Management
Control Systems. The Accounting Review, 86(1):155–184, 2011.
6. C. Esposito and M. Ficco. Recent Developments on Security and Reliability in LargeScale Data Processing with MapReduce. International Journal of Data Warehousing
and Mining, 12:1–20, 2016.
7. P. Giorgini, S. Rizzi, and M. Garzetti. GRAnD: A Goal-Oriented Approach to
Requirement Analysis in Data Warehouses. Decision Support Systems, 45:4–21, 2008.
8. M. Golfarelli, F. Mandreoli, W. Penzo, S. Rizzi, and E. Turricchia. Query Reformulation in Peer-to-Peer Data Warehousing. Information Systems, 37:393–411,
2012.
9. M. Golfarelli and S. Rizzi. Managing late measurements in Data Warehouses.
International Journal of Data Warehousing and Mining, 3:51–67, 2007.
10. M. Golfarelli and S. Rizzi. A survey on temporal Data Warehousing. International
Journal of Data Warehousing and Mining, 5:1–17, 2009.
11. M. Golfarelli and S. Rizzi.
Data Warehouse Design: Modern Principles and
Methodologies. McGrawHill, NEw York City, 2009.
12. M. Golfarelli and S. Rizzi. Data Warehouse testing. International Journal of Data
Warehousing and Mining, 7:25–42, 2011.
13. D. Hedgebeth. Data-driven decision making for the enterprice: an overview of business intelligence applications. http://www.oasis-open.org/cover/xml.html, 37:414–420,
2007.
14. E. G. Mallach. Decision Support and Data Warehouse Systems. McGraw-Hill Higher
Education, 1992.
15. M. Pighin and A. Marzona. Sistemi informativi aziendali: struttura e applicazioni.
Pearson Education Italia, 2005.
16. L. Quagini.
Business Intelligence e Knowledge Management: Gestione delle
Informazioni e delle Performance nell’era digitale. Franco Angeli, 2004.
118
Riferimenti bibliografici
17. A. De Toni, G. Nassimbeni, and S. Tonchia. I sistemi di supporto alle decisioni. Franco
Angeli, 2000.
Scarica