theses

annuncio pubblicitario
Università degli Studi Mediterranea di Reggio Calabria
Dipartimento di Ingegneria dell’Informazione, delle Infrastrutture e
dell’Energia Sostenibile
Corso di Laurea in Ingegneria dell’Informazione
Tesi di Laurea
Utilizzo degli open data di Expo 2015 per un confronto tra
Qlik Sense e Tableau e realizzazione di un software
multimediale per l’apprendimento relativo a tale piattaforma
Relatore
Candidato
Prof. Domenico Ursino
Giuseppina Suraci
Anno Accademico 2015-2016
II
III
Alla mia famiglia
Indice
Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Introduzione ai Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Big Data: cosa sono . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Classificazione dei Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.2 Importanza dei Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.3 Rischi dei Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Principali contesti applicativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Sanità e medicina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Istruzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Settore energetico e dei trasporti . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Social Network e Social Media . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.5 Finanza, Business e Marketing . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.6 Sicurezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 Big Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Evoluzione della Big Data Analytics . . . . . . . . . . . . . . . . . . . . . .
1.3.2 Tipi di analisi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.3 Visualizzazione dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7
8
8
9
10
10
10
11
11
12
12
13
13
13
14
Camtasia Studio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Camtasia Studio: a cosa serve? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Creazione di uno screencast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Clip bin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.4 Library . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.5 Callout . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.6 Zoom-n-Pan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.7 Audio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.8 Transitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.9 Cursor Effects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.10 Voice narration . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.11 Record camera . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.12 Caption . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.13 Quizzing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
17
17
17
18
19
19
19
20
20
20
20
21
22
22
VI
Indice
Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 Introduzione a Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Caratteristiche di Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.2 Creazione di un foglio di lavoro . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Tipologie di grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Grafico a barre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Grafico a linee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Grafico a torta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.4 Scatter Plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.5 Grafico di movimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.6 Grafico a bolle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.7 Mappa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.8 Mappa ad albero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.9 Diagramma di Gantt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Calcoli in Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.1 Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.2 Creazione di un campo di calcolo . . . . . . . . . . . . . . . . . . . . . . . . .
3.3.3 Espressioni LOD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4 Ulteriori potenzialità di Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Filtri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.2 Creazione di dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.3 Creazione di una storia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.4 Previsioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.5 Linee di tendenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 Salvataggio dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
23
24
25
25
26
26
26
27
28
28
29
29
30
30
31
32
33
33
33
34
34
35
36
37
Tableau vs Qlik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Funzionalità di Qlik Sense . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Creazione di un’app . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2 Grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.3 Snapshot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.4 Racconti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Confronto tra Tableau e Qlik Sense . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Interfaccia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Previsioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.3 Mappe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.4 Storie e racconti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.5 Campi di calcolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.6 Grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.7 Caricamento e salvataggio dei dati . . . . . . . . . . . . . . . . . . . . . . . .
39
39
39
40
40
41
41
41
42
43
43
43
44
45
Progettazione di un case study su Tableau . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 Descrizione del dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.1 Fornitori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.2 Sintesi Gare Lavori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.3 Gare Beni e Servizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.4 Dettaglio Gare Lavori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
47
47
48
48
49
Indice
VII
5.1.5 Dati Cruscotti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1.6 Expo Barometro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Analisi dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.1 Progettazione dell’analisi sulla tabella Fornitori . . . . . . . . . . . .
5.2.2 Progettazione analisi sulle tabelle Cruscottoaree e
Cruscottolotti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.3 Progettazione analisi sulla tabella ExpoBarometro . . . . . . . . . .
49
51
52
52
Implementazione di un case study in Tableau . . . . . . . . . . . . . . . . . . . . . . .
6.1 Implementazione dell’analisi sulla tabella Fornitori . . . . . . . . . . . . . . . .
6.2 Implementazione dell’analisi sulle tabelle Cruscottoaree e
Cruscrottolotti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.3 Implementazione dell’analisi sulla tabella Expobarometro . . . . . . . . . .
59
59
Discussione in merito all’esperienza maturata . . . . . . . . . . . . . . . . . . . . . . .
7.1 Analogie tra Tableau e Qlik Sense . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.2 Differenze tra Tableau e Qlik Sense . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.3 Punti di forza di Tableau rispetto a Qlik Sense . . . . . . . . . . . . . . . . . . .
7.4 Punti di forza di Qlik Sense rispetto a Tableau . . . . . . . . . . . . . . . . . . .
67
67
67
69
71
Progettazione di un software multimediale per l’apprendimento di
Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.1 Metodologia usata per la progettazione . . . . . . . . . . . . . . . . . . . . . . . . . .
8.2 Progettazione della vista logica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.3 Progettazione della vista fisica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4 Progettazione della vista utente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.1 BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.2 Principali tool di BI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.3 Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.4 Prodotti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.5 Connessione dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.6 Visualizzazione tabelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.7 Foglio di lavoro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.8 Grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.9 Grafici di movimento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.10 Mappe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.11 Drill-Down . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.12 Roll-Up . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.13 Previsioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.14 Trend line . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.15 Filtri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.16 Campi di calcolo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.17 Storie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.18 Dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.19 Registrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
8.4.20 Installazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
75
75
76
77
77
77
78
78
78
79
79
79
79
79
80
80
80
80
81
82
83
83
84
84
53
54
61
63
VIII
Indice
Realizzazione di un software multimediale per l’apprendimento di
Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1 Implementazione del software multimediale . . . . . . . . . . . . . . . . . . . . . .
9.1.1 Inserimento delle immagini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.2 Registrazione della schermata . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.3 Editing del video . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.1.4 Salvataggio del filmato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9.2 Uno sguardo al software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
91
91
91
92
92
92
Conclusioni e uno sguardo al futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
Ringraziamenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
Riferimenti bibliografici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
Elenco delle figure
1.1
1.3
1.4
Il grafico mostra la preoccupazione nei vari paesi, riguardo a quanto
Internet possa minacciare la privacy dei cittadini. . . . . . . . . . . . . . . . . . 9
Nella figura si nota come, dividendo i numeri in pattern, sia migliore
l’impatto visivo e, conseguentemente, anche la memorizzazione. . . . . . 14
Mappa della metropolitana di Londra, 1908. . . . . . . . . . . . . . . . . . . . . . . 15
Mappa della metropolitana di Londra, 1938. . . . . . . . . . . . . . . . . . . . . . . 16
2.1
2.2
2.3
2.4
2.5
2.6
Registrazione dell’output dello schermo. . . . . . . . . . . . . . . . . . . . . . . . . . .
La figura mostra l’aggiunta di un file multimediale alla timeline. . . . . .
Libreria di Camtasia Studio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aggiunta dei callout. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aggiunta delle transizioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aggiunta di animazioni al cursore. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
18
18
19
20
21
21
3.1
3.2
Logo di Tableau Software. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Nel campo “Show me” vengono suggeriti i possibili grafici per la
visualizzazione dei dati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di grafico a barre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di grafico a linee. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di grafico a torta. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di grafico Scatter Plot. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di grafico a bolle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempi di mappe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di una mappa ad albero. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di un diagramma di Gantt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L’editor di calcolo in Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tipi di filtri applicabili alle misure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Inserimento di un Top Filtro. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di una dashboard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aggiunta delle linee di tendenza. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
1.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
3.10
3.11
3.12
3.13
3.14
3.15
4.1
25
26
27
27
28
29
30
31
31
32
34
35
36
36
In Qlik Sense a sinistra sono mostrate tutte le possibili tipologie di
grafico. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
X
Elenco delle figure
4.2
4.3
4.4
4.5
4.6
4.7
5.1
5.2
5.3
5.4
5.5
5.6
Interfaccia di Tableau Desktop. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Interfaccia di Qlik Sense. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La figura mostra come è possibile visualizzare i dati geografici in
maggiore dettaglio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Elenco delle sorgenti da cui è possible caricare i dati in Qlik Sense. . .
Elenco delle sorgenti da cui è possible caricare i dati in Tableau
Desktop. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Interfaccia mostrata all’avvio di Tableau. . . . . . . . . . . . . . . . . . . . . . . . . .
Lo schema mostra i passaggi logici per ottenere la percentuale di
fornitori per provincie italiane. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lo schema mostra i passaggi logici per ottenere la percentuale di
fornitori per località in provincia di Milano. . . . . . . . . . . . . . . . . . . . . . . .
Lo schema mostra i passaggi logici per ottenere la percentuale di
fornitori per paese straniero. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lo schema mostra i passaggi logici per ottenere la differenza tra
l’importo d’asta e l’importo aggiudicato nelle rispettive aree dell’Expo.
Lo schema mostra i passaggi logici per visualizzare il numero di
giorni stabiliti da contratto e il numero di giorni effettivi di lavoro
su ogni area dell’Expo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Lo schema mostra i passaggi per ottenere il valore assunto dal
barometro nei vari mesi dell’Expo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.1
6.2
6.3
6.4
6.5
6.6
6.7
Applicazione del filtro in Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Percentuale di fornitori per province italiane. . . . . . . . . . . . . . . . . . . . . .
Percentuale di fornitori per località in provincia di Milano. . . . . . . . . .
Numero di fornitori per paese straniero. . . . . . . . . . . . . . . . . . . . . . . . . . .
Importo d’asta e importo aggiudicato per ogni area dell’Expo. . . . . . .
Creazione del campo di calcolo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Differenza tra l’importo asta e l’importo aggiudicato nelle varie aree
dell’Expo. In basso viene mostrato un confronto tra i due importi
per ogni area. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.8 Numero di giorni lavorativi e numero di giorni contrattuali per ogni
area dell’Expo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
6.9 Il grafico mostra l’andamento del barometro durante i mesi dell’Expo.
6.10 Valore assunto dal barometro il giorno 19 di tutti i mesi dell’Expo. . .
7.1
7.2
7.3
7.4
7.5
7.6
7.7
In alto è mostrato un grafico a barre in Tableau; in basso è mostrato
un grafico a barre in Qlik Sense. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Assegnazione di diverse palette di colori in Tableau (in alto) e in
Qlik Sense (in basso). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Editor di caricamento dei dati in Qlik Sense. . . . . . . . . . . . . . . . . . . . . . .
Caricamento dei dati in Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Editor di calcolo in Qlik Sense. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Aggiunta di una dimensione di Drill-Down in Qlik Sense. . . . . . . . . . . .
In alto è mostrato un grafico a barre in Tableau; in basso è mostrato
un grafico a barre in Qlik Sense. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
42
44
45
46
46
53
54
55
56
57
57
60
60
61
62
62
63
64
64
65
65
68
69
70
70
71
72
73
Elenco delle figure
8.1
8.2
8.3
8.4
8.5
8.6
8.7
1
76
76
77
78
79
80
8.8
8.9
8.10
8.11
8.12
8.13
8.14
8.15
8.16
8.17
8.18
8.19
8.20
8.21
8.22
Progettazione della vista logica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Progettazione della vista fisica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Mockup che illustra le principali applicazioni della BI. . . . . . . . . . . . . .
Mockup che illustra i principali tool della BI. . . . . . . . . . . . . . . . . . . . . .
Mockup che illustra le principali caratteristiche di Tableau. . . . . . . . . .
Mockup che illustra la famiglia dei prodotti Tableau. . . . . . . . . . . . . . . .
Mockup che indica le fonti dati alle quali è possibile connettersi in
Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Mockup relativo alla visualizzazione delle tabelle. . . . . . . . . . . . . . . . . . .
Mockup relativo alla creazione di un nuovo foglio di lavoro. . . . . . . . . .
Mockup che elenca tutte le tipologie di grafici. . . . . . . . . . . . . . . . . . . . .
Mockup relativo alla creazione di un grafico di movimento. . . . . . . . . .
Mockup relativo alla creazione di mappe. . . . . . . . . . . . . . . . . . . . . . . . . .
Mockup che descrive l’operazione di Drill-Down. . . . . . . . . . . . . . . . . . . .
Mockup che descrive l’operazione di Roll-Up. . . . . . . . . . . . . . . . . . . . . .
Mockup relativo alla creazione di una previsione. . . . . . . . . . . . . . . . . . .
Mockup relativo alla creazione di trend line. . . . . . . . . . . . . . . . . . . . . . .
Mockup relativo alle tipologie di filtri applicabili in Tableau. . . . . . . . .
Mockup relativo alle tipologie di campi di calcolo. . . . . . . . . . . . . . . . . .
Mockup relativo alla realizzazione di “Storie”. . . . . . . . . . . . . . . . . . . . . .
Mockup relativo alla creazione di una dashboard. . . . . . . . . . . . . . . . . . .
Mockup che illustra i passaggi relativi alla registrazione in Tableau. . .
Mockup che illustra i passaggi relativi all’installazione di Tableau. . . .
9.1
9.2
9.3
9.4
9.5
9.6
9.7
Creazione del filmato attraverso Camtasia Studio. . . . . . . . . . . . . . . . . .
Introduzione al video. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Mockup relativo alla creazione di un grafico di movimento. . . . . . . . . .
Frame di uno screencast. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Mockup relativo alla creazione di una mappa. . . . . . . . . . . . . . . . . . . . . .
Frame relativo alla creazione di un campo di calcolo. . . . . . . . . . . . . . . .
Mockup relativo alla registrazione su Tableau. . . . . . . . . . . . . . . . . . . . .
93
93
94
94
95
95
96
81
81
82
82
83
83
84
84
85
85
86
86
87
88
88
89
Introduzione
Oggi abbiamo l’opportunità di osservare da vicino e misurare il funzionamento della società attraverso i “Big Data”. Tutti questi dati registrano informazioni sui
comportamenti individuali e collettivi con una precisione senza precedenti. I nostri
desideri, le nostre opinioni e i nostri sentimenti lasciano traccia nei social media a
cui partecipiamo, nelle domande che facciamo ai motori di ricerca e nei tweet che
inviamo e riceviamo. Numerosi sono i record dei nostri acquisti; inoltre, i nostri
movimenti sono registrati nelle traiettorie disegnate dagli smartphone e dai sistemi
di navigazione delle nostre auto. Anche le nostre relazioni sociali lasciano traccia
nella rete dei nostri contatti telefonici e delle e-mail.
I Big Data sono il nuovo microscopio che rende “misurabile” la società. Come
la scoperta di ogni nuovo microscopio o telescopio nel passato, i Big Data stanno
spingendo verso una nuova scienza dei dati: il social mining, in grado di misurare e,
in prospettiva, prevedere crisi economiche, epidemie, diffusione di opinioni e distribuzione delle risorse economiche o energetiche. Tuttavia, bisogna tenere conto della
qualità dei dati e bisogna essere consapevoli delle grandi opportunità, cosı̀ come
dei nuovi rischi: occorrono tecnologie a sostegno della privacy, trasparenza e fiducia
per far si che l’accesso alla conoscenza dei Big Data sia pubblico per tutti. Questo
nuovo fenomeno ha ripercussioni su molti aspetti etici: privacy e protezione dei dati
personali (chi può accedere ai miei dati?), proprietà e sfruttamento dei dati (di chi
sono i miei dati? Per quali scopi vengono usati?) e trasparenza (chi può fare cosa
con i miei dati?).
In seguito alla proliferazione di tutte queste informazioni si è sviluppata una
nuova disciplina, ovvero la Big Data Analytics, che include la gestione del ciclo
di vita completo dei dati e comprende la collezione, la ripulitura, l’organizzazione,
la memorizzazione, l’analisi e il governo dei dati. L’obiettivo primario della Big
Data Analytics è quello di aiutare le aziende a prendere decisioni grazie all’aiuto di
modelli descrittivi, diagnostici, predittivi e prescrittivi.
Negli anni sono nati numerosi tool per gestire la visualizzazione e l’analisi dei
dati. Oggi tra i prodotti preferiti dalle aziende si distinguono Tableau e Qlik Sense.
Il “Gartner Magic Quadrant” ci fornisce graficamente il posizionamento dei vari
software usati nei contesti di Business Intelligence. Facendo un confronto negli anni,
è possibile notare come il “Gartner Magic Quadrant 2016” si è significativamente
trasformato rispetto al “Gartner Magic Quadrant 2012”. Infatti, nel 2012, Tableau
4
Introduzione
si collocava nel quadrante dei possibili “Challengers”; invece, oggi è al primo posto
nel quadrante dei “Leaders”. Anche Qlik Sense ha conquistato un ruolo importante
tra i prodotti Qlik (precedentemente conosciuti come Qlik Teck). Questo ci fa notare come il mondo delle tecnologie legate alla Big Data Analytics e alla Business
Intelligence è in continua evoluzione.
QlikView è una piattaforma che fornisce funzioni di Business Intelligence in ambienti aziendali tramite le quali è possibile analizzare i dati e utilizzare le proprie
rilevazioni per supportare il processo decisionale. QlikView consente di porre domande e trovare risposte; esso, inoltre, permette ad un team di utenti di prendere
decisioni in modo collaborativo.
Qlik Sense è il software di nuova generazione, proposto da Qlik, che consente di
analizzare e visualizzare i dati in modo più intuitivo rispetto a QlikView.
Qlik Sense è una potente e innovativa piattaforma creata per utenti singoli,
gruppi o aziende che cercano uno strumento intuitivo per creare visualizzazioni
avanzate, scoprire legami e associazioni e condurre analisi approfondite a partire
dai dati a disposizione. Qlik Sense consente di creare report dinamici, visualizzare
e analizzare i risultati ottenuti e salvare i propri progetti all’interno di app. Esso,
inoltre, è stato sviluppato per la collaborazione in modo da rendere l’analisi dei dati
accessibile a più utenti.
Tableau, come Qlik Sense, è un tool utilizzato per rappresentazioni dinamiche
dei dati. Esso presenta un’area di lavoro intuitiva, grazie al suo ambiente drag-anddrop. Tableau permette di connettersi, visualizzare e condividere rapidamente i dati
da PC, tablet o smartphone. In particolare, esso è in una posizione di forza quando
si tratta della visualizzazione dei dati: è possibile modificare la visualizzazione semplicemente trascinando e rilasciando i vari elementi sull’area di lavoro, modificando
i colori e i tipi di grafici. Le query possono essere effettuate sul grafico in qualsiasi
momento. Infatti, i grafici si allontanano dall’essere rappresentazioni visive statiche
di una singola query e possono evolversi in modo da diventare finestre visive che
possono essere modificate durante l’analisi. Un’altra componente chiave sono i filtri,
integrati nello spazio di lavoro di Tableau, che permettono, in maniera veloce, di
filtrare i dati mediante pochi click.
Lo scopo del presente lavoro di tesi è quello di comprendere quali siano le opportunità e le potenzialità derivanti dall’utilizzo dei Big Data e di fornire gli strumenti
necessari per interfacciarsi alla Big Data Analytics. L’analisi e la gestione di un
numero sempre maggiore di dati potranno favorire l’efficienza operativa, le performance produttive, la trasparenza, l’innovazione nei prodotti, nei servizi e nei modelli
di business. A tale scopo viene utilizzato Tableau, che, come sottolineato in precedenza, rientra tra i tool leader nei contesti di Business Intelligence, insieme a Qlik
Sense. L’obiettivo è quello di effettuare un confronto tra i due software per capire le
opportunità che possono offrire e le principali differenze e analogie dell’uno rispetto
all’altro.
Per comprendere quali siano le potenzialità dei due prodotti e per poter effettuare un confronto abbiamo deciso di analizzare i dati dell’Expo di Milano 2015, resi
disponibili come open data sul portale Open Expo. Il portale Open Expo è stato
realizzato al fine di assicurare ed incentivare la partecipazione dei cittadini, sulla
base di una visione aperta e interattiva del processo decisionale delle istituzioni.
Sul portale sono pubblicate, in formato aperto, tutte le informazioni riguardanti la
Introduzione
5
gestione, la progettazione, l’organizzazione e lo svolgimento dell’evento. Molti dei
dati riguardano la gestione economica delle opere realizzate.
Dopo aver compreso il funzionamento e valutato i due prodotti, l’obiettivo finale
è quello di realizzare un software multimediale che abbia lo scopo di guidare gli
studenti nella comprensione di Tableau. Quest’ultimo è stato progettato usando
una metodologia che prevede l’utilizzo di tre viste differenti: vista logica, vista fisica
e vista utente. Il software è stato realizzato attraverso l’utilizzo di Camtasia Studio,
un editor per la creazione di video. Esso ci ha permesso di realizzare degli screencast,
ovvero dei record dello schermo al fine di mostrare nel filmato tutti i passaggi
per eseguire le query sui dati di Expo e porre l’attenzione sulle funzionalità che
contraddistinguono Tableau.
La presente tesi si struttura come di seguito specificato:
•
•
•
•
•
•
•
•
•
•
Il Capitolo 1 offre una panoramica di quali siano le potenzialità e quali i rischi
del fenomeno dei Big Data. Vengono, inoltre, fornite alcune informazioni circa la
classificazione dei dati e viene illustrato il cosiddetto paradigma delle “cinque V”,
ovvero il modello utilizzato per descriverli. Successivamente vengono descritti
alcuni dei contesti che sfruttano la potenza dei Big Data. Nella seconda parte
del capitolo viene trattata la Big Data Analytics e vengono descritte le tipologie
di analisi.
Nel Capitolo 2 viene introdotto l’editor di video Camtasia Studio, che verrà utilizzato per l’implementazione di un software didattico multimediale su Tableau.
Il Capitolo 3 illustra le potenzialità di Tableau, un potente software utilizzato
nel contesto della Business Intelligence per la visualizzazione e l’analisi di grandi
quantità di dati.
Nel Capitolo 4 vengono descritte le principali potenzialità di Qlik Sense, anch’esso usato nel contesto della Businsess Intelligence. Successivamente, vengono
confrontate le funzionalità dei due prodotti.
Nel Capitolo 5 viene preso in considerazione il case study relativo agli open
data di Expo 2015. In particolare, viene descritto il dataset e, successivamente,
vengono illustrati tutti i passi relativi all’estrazione delle informazioni che, poi,
verranno implementati su Tableau.
Nel Capitolo 6 vengono implementati in Tableau tutti i passi relativi all’estrazione delle informazioni analizzati nel capitolo precedente.
Nel Capitolo 7, a seguito dei risultati ottenuti, vengono discusse le analogie e
le differenze tra Tableau e Qlik Sense, riscontrate nell’implementazione del case
study relativo ai dati dell’Expo.
Nel Capitolo 8 viene presentata la metodologia usata per la realizzazione del
software didattico. Successivamente, vengono illustrati tutti i mockup relativi
alla vista utente, utili per la comprensione di Tableau.
Il Capitolo 9 illustra tutti i passi relativi alla realizzazione del software multimediale per l’apprendimento di Tableau.
Infine, nel Capitolo 10, vengono tratte le conclusioni e vengono discussi gli
obbiettivi e i possibili sviluppi futuri.
1
Introduzione ai Big Data
Questo capitolo illustra il crescente fenomeno dei Big Data e la loro importanza nei
diversi contesti applicativi. I Big Data comportano alcuni rischi; tuttavia se correttamente usati, attraverso le tecniche offerte dalla Big Data Analytics, rappresentano
una grande opportunità.
1.1 Big Data: cosa sono
L’utilizzo sempre più diffuso dei social media e di telefoni intelligenti che raccolgono
e generano dati costantemente, il crescente uso di Internet, cosı̀ come l’utilizzo
sempre più diffuso di sensori, che ci permettono di misurare e monitorare ogni
cosa, fa sı̀ che il volume dei dati prodotti in tutto il mondo stia crescendo in modo
vertiginoso. Questi tipi di dati sono definiti Big Data.
Il termine “ Big Data” è traducibile letteralmente con “grandi quantità di dati”.
In realtà, esso riveste un significato più ampio, in quanto si riferisce a diversi ambiti.
Quando si parla di Big Data non si intendono solo i dati, ma anche la loro analisi e
il loro utilizzo, cercando di trovare modelli e algoritmi capaci di trattare cosı̀ tante
variabili in poco tempo e con poche risorse computazionali.
La rivoluzione dei Big Data presuppone nuove capacità di collegare fra loro le
informazioni per fornire un approccio visuale ai dati, suggerendo pattern e modelli
di interpretazione finora inimmaginabili.
Come già sottolineato, non basta la dimensione per definire il concetto di Big
Data. Il modello utilizzato per descriverli è basato sul cosiddetto paradigma delle
“cinque V”:
•
•
•
Volume: si riferisce alle grandi quantità di dati generati in ogni secondo. Attualmente non si parla di Terabyte ma Zettabyte o Brontobyte (ovvero 270 o 290
byte).
Velocità: si riferisce alla velocità con la quale vengono generati i dati. Nell’ambito
dei Big Data enormi quantità di dati posso accumularsi in periodi di tempo molto
brevi. Basti pensare ai messaggi dei social media, alle transazioni con carte di
credito, ai filmati, alle e-mail.
Varietà: si riferisce ai diversi tipi e formati di dati.
8
1 Introduzione ai Big Data
• Veracità: si riferisce all’attendibilità dei dati. Con una quantità di dati molto
grande la qualità e la precisione sono meno controllabili.
• Valore: è definito come l’utilità dei dati per un’impresa. Quest’ultima caratteristica è molto importante, in quanto sarebbe inutile avere accesso a dati di grandi
dimensioni, se non fosse possibile trasformarli in valore per l’azienda.
1.1.1
Classificazione dei Big Data
I dati possono essere generati dagli uomini o dalle macchine. Nel primo caso i dati
vengono generati dall’interazione dell’uomo con i sistemi (ad esempio, social media,
e-mail, foto, messaggi). Le macchine sono, invece, responsabili della generazione di
dati analitici. Nell’ambito dei Big Data, i dati coinvolti possono essere suddivisi in
tre macro-categorie, ovvero:
• dati strutturati;
• dati non strutturati;
• dati semi-strutturati.
I dati strutturati sono i dati conservati in database, organizzati secondo schemi
e tabelle rigide. Questa è la tipologia di dati più indicata per i modelli di gestione
relazionale delle informazioni. Esempi di questo tipo di dati includono le transazioni
bancarie, le fatture e i record dei clienti.
I dati non strutturati sono i dati conservati senza alcuno schema. Un esempio possono essere i file contenenti testi a carattere narrativo, prodotti per mezzo
di software di editing testuale o un file multimediale. Essi hanno una velocità di
crescita maggiore rispetto ai dati strutturati. In questo caso, i sistemi di gestione
di dati utilizzabili sono quelli basati sul modello dell’Information Retrieval. Con
quest’ultimo termine si intende un insieme di tecniche che si occupano della rappresentazione, memorizzazione e organizzazione dell’informazione testuale, al fine
di rendere agevole all’utente il soddisfacimento dei propri bisogni informativi.
Nei dati semi-strutturati si incontrano alcune delle caratteristiche dei dati strutturati e alcune delle caratteristiche dei dati non strutturati. Un esempio esplicativo
di questa tipologia di organizzazione di informazioni è il file compilato con sintassi
XML. In questo caso, i sistemi di gestione dei dati possono organizzare i documenti
sia attraverso i modelli relazionali, sia attraverso modelli di Information Retrieval.
1.1.2
Importanza dei Big Data
L’importanza dei Big Data non deve essere sottovalutata. Essi hanno un impatto
nello studio del comportamento umano simile all’introduzione del microscopio o
del telescopio nei campi della biologia e dell’astronomia, in quanto sono in grado di
misurare e prevedere crisi economiche, epidemie, diffusione di opinioni, distribuzione
delle risorse energetiche.
I Big Data consentono di capire la società in cui viviamo, offrono la possibilità
di sviluppare nuove tecnologie e modelli matematici per poter estrarre l’effettivo
valore e danno la possibilità di perseguire nuovi modelli di business. Essi, inoltre
portano vantaggi economici alle aziende che hanno deciso di sfruttare l’informazione
ottenibile dai dati in loro possesso.
1.1 Big Data: cosa sono
1.1.3
9
Rischi dei Big Data
Come ogni “nuova tecnologia” i Big Data offrono grandi prospettive e potenzialità,
ma non presentano esclusivamente caratteristiche positive. Vi sono alcuni aspetti
critici che è bene prendere in considerazione; in particolare citiamo:
•
•
problematiche legate alla qualità e all’affidabilità dei dati;
problematiche relative alla privacy e alla proprietà dei dati.
Molti dibattiti riguardanti le criticità dei Big Data sono legati a problemi di
privacy, proprietà e utilizzo dei dati da parte di terzi. I dati del Web sono condivisi
e accessibili a tutti: è etico il loro utilizzo? I dati sensibili, ovvero i dati presenti
nei database degli ospedali, relativi alla storia clinica dei pazienti sono opportunamente protetti? Un’altra problematica interessante riguarda i dati di posizione:
l’uso di smartphone, GPS, sistemi di pagamento elettronico, ma anche social network, lasciano delle tracce da cui è possibile ricavare gli spostamenti degli utenti.
La raccolta e l’archiviazione di dati sensibili e la capacità di analizzare comportamenti individuali e collettivi, elaborando miliardi di informazioni in tempo reale,
rappresenta, senza dubbio, una potenziale minaccia alla riservatezza di ciascuno di
noi. Negli ultimi anni gli utenti preoccupati per la privacy online sono aumentati,
e con loro sono aumentate, anche, le preoccupazioni di chi lavora con i Big Data.
I cittadini sono sempre più consapevoli del fatto che i loro movimenti online sono
osservati, tracciati e studiati (Figura 1.1).
Figura 1.1. Il grafico mostra la preoccupazione nei vari paesi, riguardo a quanto Internet
possa minacciare la privacy dei cittadini.
10
1 Introduzione ai Big Data
La grande quantità di dati incrementa in modo proporzionale anche la necessità
di evitarne la perdita, e di non comprometterne la qualità.
Per proteggere i Big Data in modo adeguato è necessario definire requisiti di
sicurezza specifici, relativi al loro ciclo di vita. Questo processo prevede, inizialmente, la protezione della raccolta dei dati, seguita da quella dell’accesso agli stessi.
Come per la maggior parte delle policy di sicurezza, una corretta valutazione delle
minacce ai Big Data di un’azienda è un processo continuo, che si focalizza nella capacità di garantire l’integrità dei dati sia a riposo che durante l’analisi. Per garantire
che le informazioni non vengano divulgate a persone non autorizzate, è necessario
utilizzare sistemi che garantiscano l’integrità dei dati e il rilevamento di intrusioni.
1.2 Principali contesti applicativi
Nonostante le criticità, gli investimenti crescenti nei Big Data possono portare a interessanti scoperte in campo scientifico, ad esempio nella medicina, vantaggi e guadagni nel settore ICT (Information and Communication Technology) e, in contesti
Business, nuovi servizi e opportunità per gli utenti web. Nelle prossime sottosezioni
daremo uno sguardo ad alcuni contesti applicativi che possono beneficiare dei Big
Data.
1.2.1
Sanità e medicina
Tra i numerosi campi di applicazione dei Big Data la sanità ricopre un ruolo molto importante. In questo caso l’obiettivo principale è, insieme alla possibilità di
tracciare una mappa sanitaria completa di ogni paziente, quello di sapere, in un
determinato lasso di tempo più o meno lungo, quali saranno, presumibilmente, le
prestazioni sanitarie e i farmaci di cui la popolazione di una data zona avrà bisogno.
Questo permetterebbe di adeguare i servizi al reale e concreto bisogno dei pazienti,
migliorando l’efficenza e riducendo i costi sanitari.
Nella ricerca medica riveste un ruolo importante l’analisi delle sequenze genomiche. La conoscenza dell’intero genoma permette di identificare più facilmente i geni
coinvolti e osservare come questi interagiscono, in particolare nel caso di malattie
complesse come tumori. Questi dati permettono di definire un’ampia base di conoscenza con la quale è possibile effettuare studi predittivi sull’incidenza di alcune
malattie.
I Big Data stanno anche aiutando a combattere la diffusione di epidemie. In
Africa, per esempio, i dati di localizzazione degli smartphone vengono impiegati
per tracciare i movimenti della popolazione e, quindi, prevedere la propagazione del
virus Ebola, dando, inoltre, indicazioni su dove realizzare centri per le cure.
1.2.2
Istruzione
I Big Data hanno il potere di rivoluzionare non solo la medicina, ma anche il sistema
di Istruzione. In questo caso i Big Data sono utilizzati per definire dei modelli che
permettono di capire le conoscenze attuali degli studenti per individuare le modalità
con cui aumentarle e per valutare i loro progressi.
1.2 Principali contesti applicativi
11
I nuovi modelli di insegnamento sfruttano le potenzialità dell’informatica e della
tecnologia, combinate con tecniche di analisi dei dati. L’obiettivo è quello di risolvere le problematiche considerando aspetti pedagogici, meccanismi psicologici e
di apprendimento, e, quindi, definire un’istruzione personalizzata, soddisfacendo le
esigenze dei singoli o di gruppi di studenti.
Un altro campo di interesse in questo contesto è l’e-learnig, ovvero l’apprendimento basato sull’uso delle tecnologie multimediali e di Internet, per migliorarne la
qualità e facilitare l’accesso alle risorse e ai servizi. In questo contesto sono definite
due principali tipologie di utenti: learner e learning provider. Nei database vengono
memorizzati tutti i dettagli personali dei learner nonchè le informazioni fornite dai
learning provider.
1.2.3
Settore energetico e dei trasporti
Gli spostamenti delle persone (trasporto pubblico e privato) tra e all’interno delle
aree metropolitane rappresentano uno dei fattori chiave relativamente alla qualità
della vita e coinvolgono una grande varietà e quantità di dati; tra questi citiamo:
•
•
•
•
•
•
i dati relativi all’organizzazione del servizio di treni, tram e autobus;
le informazioni GPS (autobus, taxi, infopoint, etc.);
le informazioni temporanee su interruzioni del traffico;
i dati meteorologici;
i sensori di parcheggio e i servizi di sharing mobility;
gli orari di apertura/chiusura di attività e servizi.
Attraverso l’analisi e la visualizzazione di dati dettagliati della rete stradale,
e mediante l’uso di un modello predittivo, è possibile realizzare un ambiente di
trasporto intelligente.
Per quanto riguarda l’ottimizzazione delle risorse energetiche e il monitoraggio
ambientale, molto importanti sono i dati relativi ai consumi energetici: elettricità,
gas, acqua, emissioni CO2. Appropriate tecniche di analisi e la costruzione di modelli predittivi a partire da questi dati portano a definire strategie intelligenti di
distribuzione dell’energia con l’obiettivo di ridurre i costi e aumentare la qualità
della vita.
1.2.4
Social Network e Social Media
Il volume di dati generati dai servizi Internet, dai siti web, dalle applicazioni mobili e dai social network è grande. Da queste grandi quantità di dati, raccolti in
particolare attraverso i social network, aziende e ricercatori cercano di prevedere il
comportamento collettivo e analizzare i trend.
Ai social network viene applicata la cosiddetta “sentiment analysis”, che si basa sull’ascolto e permette di capire quello che pensano gli utenti su determinate
questioni, senza sollecitazione. Essa è più efficace dei classici sondaggi telefonici, nei
quali, il più delle volte, non vengono date delle risposte sincere. Le applicazioni della
sentiment analysis non si fermano alla politica o ai temi di attualità, ma consentono,
anche, di interpretare il grado di benessere della nostra società.
12
1 Introduzione ai Big Data
Uno dei social media che sfrutta al meglio il ruolo di dataset è Twitter. Il flusso di
dati costante relativo a tutti i tweet che vengono inviati nel web ha, anche, un suo
nome preciso: firehose (letteralmente “idrante antincendio”). Il fatto che Twitter
fornisca i propri dati in maniera cosı̀ diversa, e seguendo regole precise, lo ha reso
il social media più studiato con approcci che usano algoritmi o altre tecniche di
analisi di tipo informatico. Ad esempio, attraverso il monitoraggio degli hashtag di
Twitter, è possibile identificare dei modelli di influenza.
1.2.5
Finanza, Business e Marketing
L’uso diffuso di PC e tecnologie di rete ha creato grandi repository elettronici che
memorizzano numerose transazioni commerciali.
Questi dati possono essere analizzati per:
• definire previsioni sul comportamento degli utenti;
• identificare modelli di acquisto di clienti individuali o gruppi;
• fornire nuovi servizi personalizzati.
Nel mondo del Marketing e delle vendite, ormai sono in molti ad utilizzare con
successo le metodologie di analisi dei dati, ad esempio per fidelizzare la clientela e
per la previsione della domanda.
In campo finanziario, invece, si possono creare piani di investimento e di business
grazie a modelli predittivi, o per scoprire modelli interessanti e significativi dai dati
aziendali.
1.2.6
Sicurezza
I Big Data vengono anche usati nel campo dell’intelligence, della sorveglianza e del
riconoscimento. Le fonti di dati per i sistemi di intelligence sono:
• immagini satellitari;
• comunicazioni intercettate (civili e militari), tra cui voce, e-mail, registri delle
transazioni e altri dati elettronici;
• dati di tracciamento radar;
• dati biometrici (immagini facciali, DNA, impronte digitali, scansioni dell’occhio,
registrazione del portamento);
• dati di sensori (dati meteorologici, oceanografici, riprese di telecamere di sicurezza);
• sorgenti di dominio pubblico e informazioni fornite da aziende e organizzazioni.
L’obiettivo è quello di trovare dei modelli significativi in maniera tempestiva
tra le diverse informazioni provenienti da fonti multiple. Inoltre, è necessario fare
attenzione a non generare dei falsi positivi, in modo che non emergano allarmi
laddove non esistono.
1.3 Big Data Analytics
13
1.3 Big Data Analytics
La Data Analytics è una disciplina che include la gestione del ciclo di vita completo
dei dati e comprende la collezione, la ripulitura, l’organizzazione, la memorizzazione,
l’analisi e il governo dei dati. Essa consente di scoprire i modelli e altre informazioni
utili a supportare decisioni.
1.3.1
Evoluzione della Big Data Analytics
I sistemi di Data Management e Business Intelligence includono, generalmente, un
Enterprise Data Warehouse (EDW) centralizzato. Si tratta di un database unificato
che contiene tutte le informazioni di business di un’organizzazione (dati storici e
correnti). La raccolta dei dati è organizzata in differenti data mart, suddivisi per
specifico dominio.
Le architetture EDW tradizionali hanno un enorme limite, in quanto la quantità
dei dati è in continuo aumento, e questo comporta tempi di risposta più lenti. Ultimamente molte imprese hanno deciso di adottare architetture più evolute, orientate
alla Big Data Analytics, che opera sui dati ripuliti e include anche analisi di tipo
predittvo e prescrittivo.
Mentre le analisi di BI tradizionale generalmente si focalizzano su singoli processi
di business, le analisi di Big Data BI si focalizzano su più processi di business
simultaneamente.
1.3.2
Tipi di analisi
Ci sono quattro categorie generali di data analytics, che si distinguono sulla base
dei risultati che essi producono:
•
•
•
•
descriptive analytics;
diagnostic analytics;
predictive analytics;
prescriptive analytics.
L’analisi descrittiva si occupa di descrivere ciò che accade e di presentare informazioni, servendosi di strumenti di Business Intelligence e di visualizzazione. In
particolare, essa si occupa di analizzare gli eventi passati e ricavarne indicazioni su
come approcciarsi alle prossime attività.
L’analisi diagnostica cerca le cause che hanno portato alla situazione attuale. Conoscere lo stato attuale del business non è sufficiente per comprendere la situazione
corrente e adottare strategie mirate; analisi diagnostiche permettono di individuare
i motivi di determinate tendenze o avvenimenti, per valorizzare e ripetere le azioni
più efficaci e ottimizzare le attività che non hanno portato i risultati previsti.
La previsione di ciò che accadrà nel futuro è affidata all’analisi predittiva. Essa
è in grado di migliorare la comprensione del business, contribuendo a prevedere
il comportamento degli utenti e le performance dell’organizzazione. È ampiamente
utilizzata per rendere competitive le strategie di marketing digitale, per far emergere
nuove opportunità di business e, anche, per identificare i rischi.
14
1 Introduzione ai Big Data
L’analitica prescrittiva si spinge oltre la previsione di risultati futuri, fornendo raccomandazioni in maniera automatica sulle azioni da intraprendere, e anche
specificandone il motivo. Questo tipo di analisi può essere usata per ottenere un
vantaggio o per mitigare un rischio, quindi assume più valore rispetto alle altre tipologie di analisi. Ciò è possibile grazie alla sintesi dei dati e all’utilizzo congiunto
di scienze matematiche, regole di business e tecnologie di Machine Learning.
1.3.3
Visualizzazione dei dati
La visualizzazione dei dati è un aspetto che riguarda una buona parte della nostra
vita, anche non lavorativa, poichè ci permette di comparare rapidamente numeri o
insiemi di numeri.
Oggi, a fronte di questa enorme disponibilità di informazioni, diventa ancora più
critica la fase di sintetizzazione e, soprattutto, comunicazione dei dati, per poterli
utilizzare a fini decisionali.
La visualizzazione dei dati rappresenta il cuore della Business Analytics: è il
modo in cui si trasforma una grande mole di dati complessi in comunicazioni comprensibili, ricche di percezioni e accattivanti. La visualizzazione dei dati, che può
essere intesa come una forma di comunicazione visuale, è diventata un vero e proprio
linguaggio, ovvero il linguaggio delle immagini.
Le regole di questo linguaggio stanno nello scegliere gli oggetti grafici migliori per
il tipo di dato che si vuole rappresentare e per ciò che si vuole comunicare. Le scelte
adottate (anche solo su singole componenti, come il colore) possono radicalmente
modificare la percezione del risultato. Per esempio, come si nota in figura 1.2, si può
rappresentare una serie di numeri tutti uguali dividendoli in pattern e facilitandone
l’impatto visivo e la memorizzazione.
Figura 1.2. Nella figura si nota come, dividendo i numeri in pattern, sia migliore l’impatto
visivo e, conseguentemente, anche la memorizzazione.
Un esempio famoso di visualizzazione dei dati (che non ha raggiunto l’obiettivo
per cui era stata creata) è la mappa della metropolitana di Londra a inizio Novecento
(Figura 3.8).
1.3 Big Data Analytics
15
Figura 1.3. Mappa della metropolitana di Londra, 1908.
La mappa mostra le fermate della metropolitana in relazione alle vie e alle strade
di superficie, ma è molto difficoltoso interpretarla, per esempio se si deve effettuare
un cambio di linea metropolitana.
Dopo qualche anno, si è arrivati a una modalità molto più efficace di visualizzare
la stessa informazione: una mappa schematica, in cui è molto più semplice contare il
numero di fermate, i cambi, e capire qual è la linea con il minor numero di fermate
per arrivare a destinazione (Figura 1.4).
Gli stessi dati possono, quindi, essere mostrati in diverse modalità, a seconda degli obiettivi e di cosa si vuole evidenziare alla propria audience. L’efficacia
della visualizzazione può essere scomposta in tre principali aree di valore: appeal,
comprensione e retention.
L’appeal identifica il potere attrattivo, coinvolgente e stimolante dell’informazione, ovvero l’estetica.
La comprensione si riferisce alla chiarezza e alla velocità con cui l’informazione
viene recepita.
La retention ci permette di memorizzare per lungo tempo le informazioni
visualizzate e collegarle rapidamente ad informazioni già note.
A seconda degli obiettivi, si può puntare più o meno su queste tre diverse aree.
Per esempio, l’obiettivo del marketing è, in primo luogo, l’appeal, in secondo luogo
la retention, e, infine, la comprensione.
16
1 Introduzione ai Big Data
Figura 1.4. Mappa della metropolitana di Londra, 1938.
2
Camtasia Studio
In questo capitolo vengono illustrate le funzionalità di Camtasia Studio, un video editor utilizzato per creare tutorial e presentazioni di software, attraverso la creazione
di screencast.
2.1 Camtasia Studio: a cosa serve?
Camtasia Studio è un software usato principalmente per realizzare screencast, ovvero registrazioni digitali dell’output dello schermo. Lo screencast può essere utilizzato
per mostrare ed insegnare l’uso di alcune funzioni di un software, quindi, per realizzare tutorial o mostrare il prodotto di un progetto. Camtasia Studio permette di
catturare aree personalizzate dello schermo e di registrare, contemporaneamente,
anche l’audio di sistema, l’audio del microfono e le riprese attraverso la webcam. Al
termine della registrazione, Camtasia Studio consente di montare i video, applicando effetti di altissima qualità, rimuovendone le imperfezioni e ottimizzando il loro
formato per i vari dispositivi e siti di destinazione. Terminato il progetto, il programma mette a disposizione una notevole varietà di formati in cui poter esportare
il video (MP4, FLV, SWF, M4V, AVI, WMV, MOV, RM e GIF animate), e inoltre,
dà la possibilità di caricare direttamente i propri video su YouTube o di condividerli
online tramite Screecast.com, Google Drive, My Places e Vimeo.
2.2 Creazione di uno screencast
La creazione di uno screencast avviene attraverso i seguenti passaggi:
•
•
•
la registrazione;
l’editing;
la condivisione.
La registrazione può essere impostata per catturare l’intero schermo, la finestra
attiva, oppure solo una regione dello schermo (Figura2.1).
18
2 Camtasia Studio
Figura 2.1. Registrazione dell’output dello schermo.
Una volta effettuata la registrazione, Camtasia Studio dispone di un editor audio/video per completare lo screencast aggiungendo didascalie, effetti e
transizioni.
2.3 Clip bin
Clip bin è una sezione che contiene tutti gli audio, i video e le immagini importate
nel progetto corrente. Trascinando uno di questi file multimediali sulla timeline,
esso viene aggiunto al progetto (Figura2.2).
Figura 2.2. La figura mostra l’aggiunta di un file multimediale alla timeline.
Quando un oggetto viene aggiunto alla timeline, ne viene creata una copia, in
modo tale che le modifiche non si riflettano sull’originale.
2.6 Zoom-n-Pan
19
2.4 Library
La libreria contiene sequenze di temi e file audio predefiniti, che possono essere usate
per personalizzare i propri video (Figura2.3). Essi vengono chiamati Media Assets
e, per aggiungerli al progetto, basta trascinarli sulla timeline.
Figura 2.3. Libreria di Camtasia Studio.
2.5 Callout
I callout sono delle forme che servono per aggiungere una breve nota, una frase o
un’istruzione a un’immagine o a un testo, per attirare l’attenzione su una particolare
sezione dello schermo (Figura2.4).
I callout possono essere personalizzati, cambiandone il colore, il bordo e lo stile,
e aggiungendo effetti e ombreggiature. Inoltre, è possibile inserire un breve testo,
anch’esso personalizzabile. Quando viene aggiunto un callout, è possibile impostarne
la durata dell’ingresso e dell’uscita.
2.6 Zoom-n-Pan
Attraverso la funzione di Zoom-n-Pan è possibile concentrare l’attenzione su una
particolare sezione dell’immagine, andando manualmente ad ingrandire nella zona
desiderata, per poi ritornare alla dimensione originale dell’immagine.
20
2 Camtasia Studio
Figura 2.4. Aggiunta dei callout.
2.7 Audio
Quando viene aggiunto un file audio alla timeline, esso può essere modificato. Attraverso le funzioni “fade in” e “fade out” è possibile aumentare o diminuire gradualmente il volume del file, rispettivamente in entrata e in uscita. Inoltre, si possono
aggiungere dei momenti di silenzio, oppure aumentare o diminuire il volume del file
audio a proprio piacimento.
2.8 Transitions
Le transizioni consentono di aggiungere effetti tra due immagini, come mostrato in
Figura 2.5. Inoltre, tramite la funzionalità “visual properties”, possono essere aggiunti effetti ed animazioni, per rendere più gradevole la presentazione. Ad esempio,
è possibile aggiungere ombre e modificare colori e opacità.
2.9 Cursor Effects
La funzionalità Cursor Effects può essere applicata esclusivamente su una registrazione dello schermo e serve per applicare degli effetti al cursore in un determinato
momento temporale. Si possono aggiungere animazioni o effetti sonori per ottenere
una visibilità migliore (Figura 2.6).
2.10 Voice narration
Camtasia Studio permette di effettuare registrazioni vocali sincronizzate alla presentazione. Inizialmente, occorre disattivare gli altoparlanti durante la registrazione
2.11 Record camera
21
Figura 2.5. Aggiunta delle transizioni.
Figura 2.6. Aggiunta di animazioni al cursore.
dello schermo. Successivamente è possibile avviare la registrazione dell’audio tramite il tasto “Start recording”, e fermarla selezionando “Stop recording”. Una volta
salvato, il clip audio può essere aggiunto alla timeline nella posizione desiderata.
2.11 Record camera
Oltre alla registrazione di audio, attraverso l’uso della webcam, Camtasia Studio
consente di catturare dei video. Durante la registrazione, il video viene mostrato nella finestra di anteprima. Come nel caso precedente, basta selezionare “Start
recording” e scegliere le opzioni audio. Una volta salvato il video, questo viene ag-
22
2 Camtasia Studio
giunto alla timeline; è possibile modificarne il formato in base alle opzioni specifiche
della telecamera che si sta utilizzando.
2.12 Caption
Questa funzionalità consente di aggiungere paragrafi, titoli o informazioni aggiuntive durante il video. I sottotitoli vengono visualizzati sullo schermo, all’interno di un
video, per fornire informazioni aggiuntive o interpretative agli spettatori. I sottotitoli vengono usati per creare dei video accessibili ad un pubblico più vasto, come ad
esempio gli spettatori con disabilità uditive o gli spettatori non madrelingua, che
necessitano di traduzioni su schermo.
Il testo può essere personalizzato modificando gli attributi dei font tra cui
le dimensioni, il colore e l’allineamento. Le didascalie possono essere aggiunte
manualemente, oppure importando file in formato SRT, SAMI, o SMI .
Una funzionalità molto interessante è l’opzione Speech-to-test, tramite la quale
Camtasia Studio è in grado di trascrivere direttamente i file audio presenti sulla
timeline in didascalie, riconoscendo la voce e trascrivendola in testo.
2.13 Quizzing
Un’ulteriore potenzialità di Camtasia Studio è quella di poter inserire sondaggi e
quiz all’interno dei video. È possibile scegliere la tipologia di risposta (vero/falso,
risposta multipla, risposte brevi o a riempimento).
Per creare questionari è necessario salvare il video in formato MP4 e condividerlo
su Screencast.com.
3
Tableau
Questo capitolo introduce Tableau, un potente software per la visualizzazione e l’analisi di grandi quantità di dati. Nella trattazione vengono illustrate le principali caratteristiche e potenzialità di Tableau, tra cui la possibiltà di aggiungere filtri, creare
previsioni e presentazioni accattivanti. Inoltre, sono descritti alcuni degli innumerevoli grafici che Tableau mette a disposizione per una visualizzazione personalizzata
dei dati.
3.1 Introduzione a Tableau
Tableau è un software realizzato dalla compagnia americana Tableau Software
il cui logo è riportato in Figura 3.1, specializzata nella creazione di prodotti di
visualizzazione di dati basati sulla Business Intelligence.
Figura 3.1. Logo di Tableau Software.
Il prodotto è disponibile in diverse varianti: Tableau Desktop, che permette di
realizzare e visualizzare dashboard interattive, Tableau Server, che permette di condividere le dashboard realizzate tramite Tableau Desktop con altri utenti, e Tableau
Online, che corrisponde alla versione cloud di Tableau Server. Inoltre, è disponibile una versione aggiuntiva, chiamata Tableau Public, che equivale ad una versione
gratuita e pubblica di Tableau Server. Nel capitolo focalizzeremo l’attenzione su
Tableau Desktop, un potente software di analisi dei dati che permette, tramite
24
3 Tableau
un’intuitiva interfaccia grafica, di connettersi a numerosi tipi di sorgenti, e di realizzare l’analisi dei dati in maniera estremamente semplice e veloce, attraverso una
grafica accattivante.
Tableau può collegarsi a:
• file system: CSV, Excel, etc.;
• sistemi relazionali : Oracle, SQL Server, DB2, etc.;
• sistemi cloud : Windows Azure, Google BigQuery, etc.
La funzione Live Connect viene utilizzata per l’analisi dei dati in tempo reale.
In questo modo le ultime modifiche si riflettono sul risultato dell’analisi.
Tableau può, anche, elaborare dati in memoria memorizzandoli in cache, e non
essere più collegato alla sorgente durante l’analisi dei dati. Naturalmente ci sarà un
limite alla quantità di dati memorizzati nella cache a seconda della disponibilità di
memoria.
Tableau può collegarsi contemporaneamente a diverse fonti di dati. Per esempio,
in una singola cartella di lavoro, è possibile connettersi a un file non strutturato e
ad una fonte di dati relazionale, definendo connessioni multiple. Questa operazione
di fusione di dati è una caratteristica unica in Tableau.
3.1.1
Caratteristiche di Tableau
La peculiarità di Tableau, come sottolineato in precedenza, è la sua interfaccia grafica funzionante tramite il meccanismo di “Drag-and-Drop”, ovvero una successione
di tre azioni consistenti nel selezionare un oggetto e trascinarlo in un’altra posizione in cui viene rilasciato (letteralmente, il termine vene tradotto con “trascina e
rilascia”).
Tableau può essere utilizzato da qualsiasi tipologia di utente. Infatti, grazie
alla sua semplicità e velocità di analisi, chiunque può esplorare e analizzare i dati,
utilizzando strumenti visivi come colori, linee di tendenza, diagrammi e grafici.
Tableau ha una varietà molto ampia di opzioni di formattazione per modificare l’aspetto delle visualizzazioni create. È possibile modificare quasi ogni aspetto: in particolare è possibile scegliere il font desiderato, modificare l’orientamento e il formato degli assi, il colore e lo sfondo, nonchè i bordi, l’allineamento e
l’ombreggiatura.
Tableau, inoltre, offre la possibilità di creare una visualizzazione personalizzata
dei dati, estendendo le normali visualizzazioni con alcune caratteristiche aggiuntive,
in modo da creare diversi tipi di grafici per gli stessi dati. Ad esempio, è possibile
effettuare operazioni di Drill-Down, in maniera tale da visualizzare i dati ad un
livello di granularità più fine, e di Roll-Up, operazione che, al contrario, consente di
visualizzare i dati ad un livello di dettaglio minore.
Un’altra caratteristica molto importante di Tableau è l’ordinamento dei dati dimensionali. Ci sono due modi con cui Tableau svolge l’ordinamento: attraverso l’ordinamento automatico è possibile scegliere un ordinamento ascendente o
discendente; in alternativa è possibile effettuare l’ordinamento in maniera manuale.
3.2 Tipologie di grafici
3.1.2
25
Creazione di un foglio di lavoro
La pagina iniziale di Tableau mostra le varie fonti di dati a cui è possibile connettersi.
Sotto l’intestazione “Connect”, sono presenti delle opzioni per scegliere un file, un
server o una fonte di dati salvati.
Nel caso in cui vengono aperti più schemi di dati, Tableau esegue l’operazione di
Inner Join sugli attributi che hanno nome uguale. Tuttavia, è possibile modificare le
impostazioni predefinite, scegliendo la tipologia di Join desiderata. Tableau mette
a disposizione Inner Join, Left Join, Right Join e Full Outer Join.
Per visualizzare il foglio di lavoro occorre selezionare la scheda “Sheet” che
appare nella barra inferiore. Una volta aperto il foglio di lavoro, a destra, vengono
visualizzate le dimensioni, ovvero i dati descrittivi, e le misure, che, invece, sono i
dati numerici.
Per la creazione di un grafico è sufficiente trascinare dimensioni e misure all’interno dei campi “righe” e “colonne”. Automaticamente verrà generato un grafico
attraverso cui è possibile visualizzare l’andamento dei dati dimensionali rispetto a
quelli numerici.
3.2 Tipologie di grafici
In qualità di strumento di visualizzazione avanzata dei dati, Tableau mette a disposizione svariate tipologie di grafici, fornendo tecniche di analisi senza avere la
necessità di scrivere codice personalizzato.
Ogni volta che viene creato un foglio di lavoro, sono disponibili, nel campo “Show
me” (Figura 3.2), alcuni dei grafici possibili, in base alla natura dei dati selezionati.
Figura 3.2. Nel campo “Show me” vengono suggeriti i possibili grafici per la
visualizzazione dei dati.
26
3.2.1
3 Tableau
Grafico a barre
Un grafico a barre rappresenta i dati attraverso delle barre rettangolari la cui
lunghezza risulta essere proporzionale al valore della variabile.
Tableau produce automaticamente un grafico a barre ogni volta che si trascina
una dimensione nel campo “righe” e una misura nel campo “colonne”, o viceversa.
Inoltre, è possibile applicare una gamma di colori alle barre in base al valore
che assumono i dati. Ad esempio, è possibile attribuire tonalità più scure alle barre
più lunghe, e tonalità più chiare alle barre più corte. Per fare questo, è necessario
trascinare la misura desiderata all’interno del riquadro “Marks” e attribuire ad essa
un colore (Figura 3.3).
Figura 3.3. Esempio di grafico a barre.
3.2.2
Grafico a linee
In un grafico a linee, sono necessarie una misura e una dimensione, i cui valori sono
associati ai due assi del grafico. Ogni coppia di valori fornisce un punto nel grafico
per ciascuna osservazione. L’unione di tutti i punti contribuisce a creare una linea
che mostra la variazione, o il rapporto, tra le dimensioni e le misure scelte (Figura
3.4).
3.2.3
Grafico a torta
Un grafico a torta rappresenta i dati all’interno di un cerchio, suddiviso in fette di
diverse dimensioni e colori. Anche in questo caso, occorre trascinare almeno una
dimensione e una misura sui campi “righe” e “colonne”, per la creazione del grafico.
All’interno del campo “Marks” è possibile modificare il colore e la dimensione delle
fette a seconda dei dati (Figura 3.5).
3.2 Tipologie di grafici
27
Figura 3.4. Esempio di grafico a linee.
Figura 3.5. Esempio di grafico a torta.
3.2.4
Scatter Plot
Il grafico Scatter Plot è un diagramma a dispersione che mostra dei punti sparsi nel
piano cartesiano (Figura 3.6). Esso viene creato riportando i valori delle variabili
numeriche come coordinate. Per creare un grafico a dispersione, Tableau richiede
almeno una misura nel campo “righe” e una misura nel campo “colonne”. Si possono,
28
3 Tableau
anche, aggiungere delle dimensioni che svolgono un ruolo nell’assegnazione di colori
o di grandezze diverse, per i punti già esistenti nel grafico.
Figura 3.6. Esempio di grafico Scatter Plot.
3.2.5
Grafico di movimento
I grafici di movimento mostrano i cambiamenti nel tempo dei dati, attraverso il movimento di punti all’interno dello spazio definito dagli assi cartesiani. Per effettuare
ciò, è necessario avere una dimensione temporale all’interno del campo “righe” o
“colonne”; a seguito di ciò, effettuando un’operazione di Drill-Down, è necessario
ricavare una dimensione a granularità più fine, che deve essere trascinata all’interno del campo “Pages”. Successivamente, nella sezione “Show History”, è sufficiente
selezionare il tasto “play” per visualizzare come sono variati i dati all’interno di
un intervallo temporale. Ad esempio, è possibile visualizzare come sono cambiati i
profitti di un’azienda, simultaneamente, ad ogni mese, per tutti gli anni.
3.2.6
Grafico a bolle
I grafici a bolle consentono la visualizzazione dei dati attraverso un raggruppamento
di cerchi (Figura 3.7). Ciascuno dei valori descrittivi rappresenta un cerchio, mentre
i valori di misura rappresentano le dimensioni di tali cerchi. Poichè i campi non
devono essere disposti su righe o su colonne, è sufficiente trascinare i valori coinvolti
all’interno della sezione “Marks”.
3.2 Tipologie di grafici
29
Figura 3.7. Esempio di grafico a bolle.
3.2.7
Mappa
Ogni volta che viene aperto un foglio di lavoro, vengono automaticamente generate le coordinate geografiche, ovvero latitudine e longitudine. Le mappe possono
essere costruite a partire dalla presenza di dati geografici. Occorre assegnare un
ruolo geografico a ciascun valore; a seguito di questa operazione, trascinando il dato
nel campo “Marks”, vengono inserite, rispettivamente, sulle righe e sulle colonne,
latitudine e longitudine. In questo modo viene creata la mappa dell’intero pianeta, e, attraverso sfumature di colori o punti, vengono visualizzati i dati delle zone
desiderate (Figura 3.8).
Tableau ha la capacità di individuare paesi, stati, regioni, città, e persino codici
postali, per costruire mappe dettagliate. Un’applicazione molto comune di questo
tipo di grafico consiste nel mostrare le attività sismiche che sono state segnalate nel
corso del tempo, il loro livello di intensità, e, conseguentemente, le zone a rischio,
attraverso statistiche e analisi predittive.
3.2.8
Mappa ad albero
La mappa ad albero visualizza i dati in rettangoli annidati (Figura 3.9). Le dimensioni, come nel caso del grafico a bolle, servono per definire la struttura della mappa
dell’albero, mentre le misure consentono di definire il formato o il colore del singolo
rettangolo.
Una mappa ad albero viene creata associando una o più dimensioni ad una o
due misure.
30
3 Tableau
Figura 3.8. Esempi di mappe.
3.2.9
Diagramma di Gantt
Un diagramma Gantt mostra l’avanzamento del valore di un’attività per un periodo
di tempo (Figura 3.10). Esso, quindi, richiede una dimensione temporale e almeno
una dimensione. In aggiunta a questi dati possono essere inserite anche una o due
misure.
3.3 Calcoli in Tableau
Per creare le visualizzazioni, oltre al meccanismo di Drag-and-drop, Tableau offre,
agli utenti più esperti, la possibilità di effettuare query più complesse, mettendo a
3.3 Calcoli in Tableau
31
Figura 3.9. Esempio di una mappa ad albero.
Figura 3.10. Esempio di un diagramma di Gantt.
disposizione una grande varietà di operatori, e consentendo la creazione di fogli di
calcolo.
3.3.1
Operatori
Tableau dispone di un certo numero di operatori, utilizzati per creare campi di
calcolo e formule. Gli operatori possono essere suddivisi nelle seguenti categorie:
•
•
•
operatori generali;
operatori aritmetici;
operatori relazionali;
32
3 Tableau
• operatori logici.
Gli operatori generali comprendono le operazioni di addizione e sottrazione.
L’addizione consente di sommare valori numerici, concatenare due stringhe e aggiungere giorni alle date. La sottrazione consente di sottrarre valori numerici e
sottrarre giorni alle date.
Gli operatori aritmetici agiscono solo sui dati numerici e comprendono le
operazioni di moltiplicazione, divisione, modulo e potenza.
Gli operatori di confronto vengono usati all’interno di espressioni per confrontare
numeri, date o stringhe; essi restituiscono un valore booleano (vero o falso).
Gli operatori logici sono utilizzati in espressioni il cui risultato è un booleano e,
a loro volta, restituiscono un valore booleano.
3.3.2
Creazione di un campo di calcolo
Per creare un campo di calcolo occorre selezionare “Create Calculated Field” dalla
voce “Analysis” che compare nel menù. Si aprirà un editor di calcolo che elenca
tutte le funzioni disponibili in Tableau (Figura 3.11).
Figura 3.11. L’editor di calcolo in Tableau.
Una volta scritta la formula, basta trascinare il campo creato sulle righe o sulle
colonne, analogamente a quanto avviene per le misure e le dimensioni.
Oltre alle espressioni più complesse, Tableau consente di aggiungere dei calcoli
che vengono applicati ai valori dell’intera tabella, poichè alcune operazioni non
possono essere eseguite solo su alcune righe selezionate. Percentuali, differenze e
medie mobili sono solo alcune delle opzioni che possono essere applicate alle misure.
Le operazioni da svolgere per questo tipo di calcolo sono le seguenti:
• selezionare la misura su cui deve essere applicato il calcolo e trascinarlo sulle
righe o sulle colonne;
• fare click con il tasto destro del mouse sulla misura e scegliere l’opzione “Quick
Table Calculation”;
• scegliere una delle opzioni da applicare alla misura.
3.4 Ulteriori potenzialità di Tableau
3.3.3
33
Espressioni LOD
Le espressioni LOD sono utilizzate per eseguire query complesse che coinvolgono
molte dimensioni. I tre tipi principali di espressioni LOD sono elencati di seguito:
•
•
•
l’espressione “FIXED” seleziona i valori utilizzando le dimensioni specificate,
senza riferimento ad eventuali altre dimensioni;
l’espressione “INCLUDE” consente di aggiungere dimensioni oltre a quelle già
presenti nella visualizzazione;
l’espressione “EXCLUDE” consente di sottrarre dimensioni dalla visualizzazione.
3.4 Ulteriori potenzialità di Tableau
Tableau Desktop, in qualità di prodotto utilizzato per individuare i trend, le opportunità e per prendere decisioni consente di creare presentazioni interattive. Oltre alla
creazione di dashboard e storie, è possibile trascinare, all’interno del grafico, delle
linee di riferimento, effettuare previsioni ed applicare filtri. Nelle prossime sezioni
esamineremo queste funzionalità di Tableau.
3.4.1
Filtri
Il filtraggio è il processo di rimozione di alcuni valori o di un intervallo di valori da
un set di risultati.
Ci sono tre tipi di filtri di base disponibili in Tableau:
•
•
•
filtri per le dimensioni;
filtri per le misure;
filtri per le date.
Tableau offre i seguenti tipi di filtri per le misure (Figura 3.12):
•
•
•
•
“range of values”: consente di specificare i valori minimo e massimo da includere
nella visualizzazione;
“at least”: include tutti i valori che sono maggiori o uguali a un valore minimo
specificato;
“at most”: consente di includere tutti i valori che sono inferiori o uguali a un
valore massimo specificato;
“special”: è un particolare tipo di filtro che consente di effettuare dei filtri che
coinvolgono i valori NULL. Permette di includere solo i valori nulli, solo i valori
non nulli, o tutti i valori.
Molti tipi di filtro sono rapidamente disponibili selezionando, con il tasto destro
del mouse, la dimensione o la misura di interesse. Questi filtri, noti come filtri rapidi,
possiedono un numero di funzionalità sufficiente per il soddisfare la maggior parte
delle esigenze di filtraggio comuni.
Ci possono essere situazioni in cui è necessario che un secondo filtro venga applicato solo sui risultati restituiti da un primo filtro. In questo caso il secondo filtro
34
3 Tableau
Figura 3.12. Tipi di filtri applicabili alle misure.
è noto come filtro dipendente, in quanto elabora solo i dati che passano attraverso
il primo filtro.
Queste tipologie di filtri sono usate per migliorare le prestazioni, ad esempio
quando si dispone di una grande quantità di dati che rallenta l’esecuzione delle
query.
Un’altra opzione è quella del cosiddetto “Top Filtro”, che viene utilizzata per
limitare il set di risultati. I Top Filtri possono essere applicati spuntando i campi
da escludere oppure tramite l’uso di formule (Figura 3.13).
I filtri possono essere eliminati scegliendo l’opzione “Clear Filter”.
3.4.2
Creazione di dashboard
Una dashboard è una visualizzazione di molti fogli di lavoro all’interno di un unico
foglio (Figura 3.14). Questo tipo di visualizzazione viene usato per confrontare e
monitorare svariati dati simultaneamente. Quando vengono create delle dashboard,
queste vengono mostrate come schede nella parte inferiore della cartella di lavoro
e vengono automaticamente aggiornate con i dati più recenti quando si modifica il
foglio di lavoro.
Per aggiungere dei fogli di lavoro ad una dashboard basta trascinarli nella
posizione desiderata. Alla visualizzazione è possibile aggiungere molti oggetti di
supporto, come le aree di testo, le pagine web e le immagini.
3.4.3
Creazione di una storia
Una storia è una presentazione che contiene una sequenza di fogli di lavoro o dashboard, utilizzata per trasmettere informazioni e visualizzare le variazioni dei dati.
Grazie a questa funzionalità è possibile mostrare come i dati siano tra loro collegati,
fornire risultati ed esporre decisioni.
Per creare una storia è necessario selezionare la voce “New story”. Attraverso
la sezione “New blank point” vengono aggiunti tutti i fogli di lavoro che, nel loro
3.4 Ulteriori potenzialità di Tableau
35
Figura 3.13. Inserimento di un Top Filtro.
insieme, comporranno la storia. Una volta che la storia viene creata, è possibile ad
essa assegnare un titolo e aggiungere una breve didascalia per ogni foglio di lavoro.
Per presentare una storia, basta passare alla modalità di presentazione dalla barra
degli strumenti.
3.4.4
Previsioni
Una funzionalità molto interessante di Tableau è quella che consente di creare delle
previsioni, ovvero di prevedere il valore futuro di una misura. Le previsioni sono
uno strumento molto utile, in quanto, sulla base di queste, molto spesso vengono
prese decisioni importanti, ad esempio sul futuro di un’azienda, o in qualunque altro
campo applicativo. Ci sono molti modelli matematici di previsione. Tableau utilizza il modello conosciuto come livellamento esponenziale. Attraverso il livellamento
esponenziale viene dato più peso alle osservazioni recenti e meno peso a quelle più
remote. Affinchè venga creata una previsione, è necessario avere una dimensione
temporale e un campo di misura.
Bisogna spostarsi nella sezione “Analytics” e trascinare il campo “Forecast”
all’interno del grafico. Automaticamente verrà aggiunta al grafico una predizione,
calcolata sui prossimi due anni. Tuttavia è possibile personalizzare la previsione,
scegliendo l’intervallo temporale desiderato attraverso il campo “Forecast Options”.
Per visualizzare i dettagli della previsione è sufficiente selezionare la voce “Describe
Forecast”.
36
3 Tableau
Figura 3.14. Esempio di una dashboard.
3.4.5
Linee di tendenza
Le linee di tendenza vengono utilizzate per prevedere il proseguimento di alcuni
andamenti di una variabile. Inoltre, contribuiscono a identificare la correlazione tra
due variabili, osservando simultaneamente l’andamento di entrambe. Ci sono molti
modelli matematici per stabilire le linee di tendenza. Tableau offre quattro opzioni:
lineare, logaritmico, esponenziale e polinomiale (Figura 3.15).
Figura 3.15. Aggiunta delle linee di tendenza.
È possibile anche ottenere una descrizione più dettagliata facendo click con il
3.5 Salvataggio dei dati
37
tasto destro del mouse all’interno del grafico e selezionando l’opzione “Describe
Trend Line”.
3.5 Salvataggio dei dati
Il risultato di analisi dei dati in Tableau può essere salvato in vari formati per poi
essere distribuito. Questi diversi tipi di file sono identificati da diverse estensioni. I
loro formati dipendono dal modo in cui i dati vengono prodotti e dallo scopo per cui
vengono utilizzati. Essi sono tutti memorizzati come file XML che possono essere
aperti e modificati.
La descrizione di ogni tipo di file e del rispettivo utilizzo è la seguente:
•
•
•
•
•
•
•
Tableau Workbook (.twb): contiene informazioni su ciascun foglio e cruscotto presenti in una cartella di lavoro. Esso contiene, anche, le informazioni di
connessione all’origine dei dati nonchè tutte le informazioni create per quella
connessione.
Tableau Packaged Workbook (.twbx): contiene i dettagli di lavoro, nonchè i
dati utilizzati nell’analisi. Il suo scopo è quello di condividere con altri utenti i
risultati dell’analisi;
Tableau Data source (.tds): memorizza i dettagli della connessione utilizzata
per creare i report.
Tableau Packaged Data source (.tdsx): è simile al file con estensione .tds, con
l’aggiunta di dati ai dettagli sulla connessione.
Tableau Data Extract (.tde): contiene i dati utilizzati in un file .twb altamente
compressi. Questo aiuta l’ottimizzazione dello storage e dei calcoli che vengono
applicati nell’analisi.
Tableau Bookmark (.tbm): contiene un unico foglio di lavoro che viene condiviso
facilmente per essere copiato in altre cartelle di lavoro.
Tableau Preferences (.tps): memorizza la preferenza di colore utilizzato in tutte
le cartelle di lavoro. Viene utilizzato principalmente per ottenere un aspetto
uniforme tra gli utenti.
4
Tableau vs Qlik
Nel capitolo vengono descritte le principali potenzialità di Qlik Sense, che, come
Tableau, è un software usato nei contesti di Businsess Intelligence per la gestione
di grandi quantità di dati. Successivamente, vengono confrontate le funzionalità dei
due prodotti.
4.1 Funzionalità di Qlik Sense
Qlik Sense è una piattaforma per l’analisi dei dati, principalmente nata per l’ambiente aziendale, ma che può essere sfruttata anche per uso personale. Qlik Sense
consente di creare query, grafici dettagliati e cambiare rapidamente l’aspetto delle visualizzazioni. Inoltre, è possibile creare racconti e snapshot per presentare al
meglio l’analisi dei dati.
Qlik Sense è disponibile in due versioni: Qlik Sense Desktop, ovvero la versione
base, che può essere scaricata gratuitamente, e Qlik Sense Enterprise, che aggiunge
l’opportunità di condividere con tutti i membri del proprio team i progressi effettuati in real time. Un’ulteriore versione è Qlik Sense Cloud, a cui è possibile accedere
tramite la registrazione alla piattaforma. In questo caso l’utente ottiene l’opportunità di caricare le app create nel proprio cloud, oppure di pubblicarle nel cloud
condiviso, dal quale gli sarà possibile condividerle con un numero massimo di cinque
utenti.
4.1.1
Creazione di un’app
All’avvio di Qlik Sense apparirà l’hub, ovvero la schermata in cui sono visualizzate
tutte le app sulle quali l’utente può lavorare. Un’app è una raccolta di dati, fogli
e racconti, caratterizzata da un proprio nome, una descrizione e un’immagine di
anteprima. Una volta creata l’app, è possibile creare un foglio, assegnare ad esso un
titolo, una descrizione e un’immagine di anteprima. Ogni elemento presente nel foglio potrà essere modificato in qualsiasi momento. Inoltre, il foglio può essere salvato
come snapshot, esportato come immagine o file PDF, per essere poi eventualmente
riutilizzato. Per creare un grafico è sufficiente trascinarlo all’interno del foglio.
40
4.1.2
4 Tableau vs Qlik
Grafici
Qlik Sense offre svariati tipi di grafici (Figura 4.1):
• grafico a barre: visualizza una barra per ogni valore assunto dalla dimensione;
• grafico a linee: visualizza i valori assunti dai dati congiungendoli tramite una
linea;
• grafico combinato: riunisce le barre e le linee nello stesso grafico;
• grafico a torta: visualizza la relazione tra una dimensione e una misura;
• tabella pivot: mostra le dimensioni e le misure come righe di una tabella;
• grafico a dispersione: rappresenta contemporaneamente i valori relativi a due
misure;
• tachimetro: consente di visualizzare il valore di una singola misura, senza dover
specificare le dimensioni;
• mappa ad albero: mostra i dati gerarchici.
È possibile effettuare delle selezioni per ottenere delle informazioni più precise
e filtrarle rispetto alle altre tramite la casella di filtro.
Figura 4.1. In Qlik Sense a sinistra sono mostrate tutte le possibili tipologie di grafico.
4.1.3
Snapshot
Qlik Sense mette a disposizione lo strumento “Snapshot” per effettuare delle catture
di visualizzazioni, che possono essere utilizzate successivamente nei racconti. Ad ogni
Snapshot può essere assegnata una breve didascalia che lo descrive.
4.2 Confronto tra Tableau e Qlik Sense
4.1.4
41
Racconti
Il racconto in Qlik Sense corrisponde alla creazione di una storia in Tableau. Esso viene usato come strumento di comunicazione per effettuare presentazioni a
sostegno dell’esposizione dei dati ottenuti. È possibile aggiungere al racconto direttamente i fogli creati, oppure snapshot, allegando anche forme, immagini o
testo. Successivamente il racconto può essere mostrato al pubblico in modalità
“Presentazione”.
4.2 Confronto tra Tableau e Qlik Sense
Qlik Sense, insieme a Tableau, è uno dei protagonisti della visualizzazione dei dati
nei contesti di Business Intelligence. Queste due piattaforme sono facili da usare,
consentendo agli utenti con vario livello di esperienza di descrivere le attività, utilizzando grafici, cruscotti, mappe, tabelle e altri strumenti visivi. La scelta tra Tableau
e Qlik Sense viene effettuata sulla base delle varie esigenze. Entrambe le piattaforme
offrono un’eccellente scalabilità e una facile visualizzazione dei dati.
I due prodotti sono molto simili tra di loro, anche se, per alcuni aspetti,
l’approccio adottato varia.
4.2.1
Interfaccia
Entrambi i prodotti forniscono un’interfaccia facile da usare, adatta a tutti i livelli
di esperienza. Le due piattaforme sono state costruite anche per l’accesso mobile;
infatti, è possibile usare Qlik Sense e Tableau su qualsiasi display e su dispositivi
touch.
Nonostante entrambi i prodotti possiedono un ambiente di esplorazione dei dati
drag-and-drop, Tableau accentua molto questo aspetto, in quanto consente di trascinare manualmente qualsiasi oggetto, persino campi di calcolo, previsioni, dimensioni
e misure, all’interno del foglio di lavoro.
Tableau, come mostrato in Figura 4.2, nella parte superiore, presenta una toolbar
per gestire le visualizzazioni e l’accesso alle varie fonti di dati. I fogli di lavoro, le
storie e le dashboard vengono visualizzati come schede nella parte inferiore. Inoltre,
sono presenti dei box per la gestione dei filtri e dell’aspetto grafico nonchè la sezione
“Analytics” per l’analisi dei dati. Facendo click con il tasto destro del mouse su
qualsiasi oggetto vengono elencate tutte le operazioni possibili da applicare.
L’interfaccia di Qlik Sense, mostrata in Figura 4.3, è basata su una grafica
più essenziale. A sinistra compare un menù che racchiude le voci principali: campi,
grafici e oggetti personalizzati. Nella parte superiore Qlik Sense mette a disposizione
le funzionalità per il caricamento e il salvataggio dei dati e le opzioni per modificare
il foglio di lavoro e creare racconti.
Tableau mostra, a sinistra, un elenco di tutti i valori, classificandoli automaticamente in misure e dimensioni. Questi devono essere trascinati nelle apposite sezioni
per la creazione di un grafico. Qlik Sense, invece, mostra tutti i valori all’interno
della voce “campi”. In questo caso, piuttosto che trascinare i campi stessi, è necessario trascinare il grafico che si desidera creare all’interno del foglio di lavoro e,
42
4 Tableau vs Qlik
Figura 4.2. Interfaccia di Tableau Desktop.
Figura 4.3. Interfaccia di Qlik Sense.
automaticamente, appariranno il numero di dimensioni e di misure necessarie alla
costruzione del grafico. Quindi, in Qlik Sense, immediatamente vengono suggeriti il
numero di misure e di dimensioni da inserire, a seconda della tipologia di grafico che
si vuole creare. Invece, in Tableau, è possibile inserire un numero di dimensioni e di
misure non prefissato e, sulla base dei campi inseriti, automaticamente si genererà
il grafico.
4.2.2
Previsioni
Qlik Sense, a differenza di Tableau, non possiede capacità di analisi statistiche o
predittive avanzate. Tableau, infatti, mette a disposizione la possibilità di creare
4.2 Confronto tra Tableau e Qlik Sense
43
previsioni e di inserire linee di tendenza all’interno del grafico. Sia previsioni che
linee di tendenza possono essere trascinate come oggetti all’interno del grafico, e
automaticamente apparirà il proseguimento del grafico, in base al valore stimato
che potrebbe essere assunto dai dati in esame in futuro.
La capacità di analisi è uno degli aspetti più importanti che differenzia Tableau
da Qlik Sense. Infatti, dalla sezione “Analytics” è possibile inserire, all’interno dei
grafici, anche ulteriori elementi analitici, quali Reference Line, Reference Band,
Distribution Band e Box Plot.
Le Reference Line sono linee rette che hanno origine da un valore costante e
identificano un valore specifico.
Le Reference Band sono le aree tra due valori costanti e identificano una regione
di valori.
Le Distribution Band sono simili alle Reference Band, con l’aggiunta di opzioni
di ombreggiatura per indicare la distribuzione dei valori lungo un asse.
Il Box Plot è un modo visivamente conciso di vedere le distribuzioni di dati
contrastanti.
Tutti questi elementi possono essere aggiunti ai grafici per mostrare ulteriori
informazioni sulla distribuzione dei dati, per evidenziare una zona particolare lungo
l’asse oppure per aiutare a identificare potenziali valori anomali.
4.2.3
Mappe
Sebbene entrambi gli strumenti offrono la possibilità di creare mappe, il supporto
per i dati geografici è particolarmente ben considerato dagli utenti Tableau, e trova
ampia applicazione in diversi settori. La creazione di mappe in Tableau è più intuitiva e veloce poichè è possibile assegnare ruoli geografici alle dimensioni, e poichè le
coordinate geografiche vengono generate automaticamente. Grazie alla capacità di
creare mappe in dettaglio è possibile visualizzare le stazioni, gli aeroporti, le città
e, persino, i comuni di un’area geografica (Figura 4.4).
4.2.4
Storie e racconti
Entrambi i prodotti consentono la creazione di presentazioni. Tableau permette di
farlo mediante lo strumento “Story”; invece, Qlik Sense consente di farlo tramite la
creazione del “racconto”. La modalità di creazione è molto simile: basta aggiungere
i vari fogli, con la possibilità di inserire titoli e didascalie. In Tableau si possono
inserire esclusivamente i fogli di lavoro; invece, Qlik Sense, oltre alla possibilità di
salvare snapshot, che poi possono venire inseriti nei racconti, mette a disposizione
una libreria multimediale. In questo modo è possibile arricchire il racconto con
immagini, forme, testo ed effetti. In Tableau è possibile inserire didascalie scegliendo
il font desiderato, e personalizzare l’aspetto della visualizzazione scegliendo il colore
dei bordi, lo stile e l’allineamento.
4.2.5
Campi di calcolo
Uno degli aspetti più interessanti di Tableau è la sua integrazione con il linguaggio analitico, anche se tale integrazione riduce fortemente la facilità di utilizzo. In
44
4 Tableau vs Qlik
Figura 4.4. La figura mostra come è possibile visualizzare i dati geografici in maggiore
dettaglio.
questo modo si dà agli utenti più esperti e ai programmatori la possibilità di aggiungere altre forme di analisi nell’ambiente Tableau, in particolare l’analisi statistica
e l’analisi predittiva. Per creare un nuovo campo di calcolo in Tableau è sufficiente
selezionare la misura o la dimensione su cui si desidera effettuare un’operazione. Si
aprirà l’editor di calcolo in cui è possibile scrivere l’espressione desiderata;questa
può restituire un valore numerico (in tal caso il calcolo verrà considerato una misura) oppure valori booleani o stringhe (nel qual caso il calcolo verrà inserito nel
campo dimensioni).
Anche Qlik Sense mette a disposizione l’editor di calcolo per scrivere le funzioni.
In questo caso è necessario creare una nuova misura e scegliere la tabella e il campo
su cui si vuole effettuare l’operazione. Successivamente occorre scegliere una delle
operazioni da applicare, ovvero SUM, COUNT, MIN, MAX e AVG. È possibile assegnare
un nome alla nuova misura ed, eventualmente, una descrizione. La stessa cosa si
può fare con le dimensioni, solo che, in questo caso, le operazioni consentite sono
quelle di drill-down o di roll-up, in quanto le funzioni non restituiscono un valore
numerico.
4.2.6
Grafici
I grafici messi a disposizione dai due prodotti sono molto simili tra di loro. In entrambi i casi è possibile personalizzarli, modificandone colori, aspetto e dimensioni.
Tuttavia Tableau offre una maggiore varietà di grafici, tra cui il grafico di Gantt, il
grafico proiettile, il grafico Bump e, persino, la possibilità di creare grafici di movimento. È possibile passare da un grafico all’altro con un semplice click. I grafici
possibili sono messi in evidenza; tuttavia, oltre quelli suggeriti, è possibile creare e
4.2 Confronto tra Tableau e Qlik Sense
45
modificare i grafici a proprio piacimento. Attraverso il campo “Marks” è possibile
cambiare sfumature di colori, dimensioni, forme e tipologia di visualizzazione.
4.2.7
Caricamento e salvataggio dei dati
Qlik Sense consente di caricare i dati da una sorgente (Figura 4.5), ad esempio file
Excel, file Web o database SQL. In alternativa, i dati possono essere inseriti tramite
un editor di caricamento che utilizza uno script di caricamento dei dati. Nello script
sono specificati i campi e le tabelle da caricare. In questo modo è possibile modificare
la struttura dei dati utilizzando espressioni e istruzioni, assegnando nuovi nomi ai
campi, aggregando valori e unendo tabelle.
Figura 4.5. Elenco delle sorgenti da cui è possible caricare i dati in Qlik Sense.
In Tableau è possibile caricare i dati da un file o da un server, tra cui Oracle,
MySQL, Tableau Server e moltissimi altri (Figura 4.6). Successivamente verrà visualizzato lo schema tabellare ed è possibile aggiungere altri file, scegliere le opzioni
di join desiderate, i nomi dei vari campi e l’ordinamento dei valori.
Per quanto riguarda il salvataggio dei dati in Tableau i progetti vengono salvati
come file Workbook in formato .twb. In uno stesso file Workbook vengono salvati
tutti i fogli di lavoro, le storie e le dashboard create nel progetto. I file aperti di
recente vengo visualizzati all’avvio di Tableau (Figura 4.7).
Qlik Sense, invece, permette di salvare i progetti come app, che vengono visualizzate all’apertura dell’hub. Per condividere fogli e racconti, inoltre, esiste la
possibilità di esportare i fogli in formato PDF e le visualizzazioni in formato immagine o PDF; un racconto, invece, può essere esportato in formato Power Point o
PDF.
46
4 Tableau vs Qlik
Figura 4.6. Elenco delle sorgenti da cui è possible caricare i dati in Tableau Desktop.
Figura 4.7. Interfaccia mostrata all’avvio di Tableau.
5
Progettazione di un case study su Tableau
In questo capitolo viene descritto il dataset relativo al case study preso in considerazione. Successivamente vengono illustrati tutti i passi relativi all’estrazione delle
informazioni che poi verranno implementati su Tableau.
5.1 Descrizione del dataset
Abbiamo deciso di analizzare i dati dell’Expo Milano 2015, ovvero l’Esposizione
Universale che l’Italia ha ospitato dal 1 maggio al 31 ottobre 2015, e che è stato il
più grande evento mai realizzato sull’alimentazione e la nutrizione.
Il portale Open Expo è stato realizzato al fine di assicurare ed incentivare la
partecipazione dei cittadini, sulla base di una visione aperta e interattiva del processo decisionale delle istituzioni. Il sito è costituito dall’insieme dei dati relativi
alla gestione e all’organizzazione dell’evento, disponibili in Open Data e forniti da
Expo 2015 S.p.A a partire dall’8 luglio 2014 sino al termine della manifestazione.
Sul portale sono pubblicate, in formato aperto, tutte le informazioni riguardanti la
gestione, la progettazione, l’organizzazione e lo svolgimento dell’evento. Molti dei
dati riguardano la gestione economica delle opere realizzate.
I dataset disponibili sono sei, ovvero:
•
•
•
•
•
•
Dettaglio Gare Lavori;
Fornitori;
Gare Beni e Servizi;
Sintesi Gare Lavori;
Dati Cruscotti;
Expo Barometro.
5.1.1
Fornitori
Il dataset Fornitori contiene un solo file, dal nome “Fornitori”. In esso è presente
l’elenco completo di tutti i fornitori che hanno partecipato a tutte le gare di Expo
2015. Nel file, per ogni fornitore, sono disponibili tutti i dati anagrafici, ovvero:
48
•
•
•
•
•
•
•
•
5 Progettazione di un case study su Tableau
Ragione sociale;
Codice fiscale;
Partita IVA;
Paese;
Provincia;
Località;
CAP;
Via.
5.1.2
Sintesi Gare Lavori
Il dataset Sintesi Gare Lavori contiene cinque file:
• Elenco completo delle gare. In questo file vengono riportati i dettagli sulle gare
relative ai 34 lotti presenti nel sito espositivo di Expo.
• Composizione delle commissioni giudicatrici. Questo file contiene l’elenco dei
commissari delle gare per i lavori dei cantieri di Expo 2015.
• Registro delle imprese escluse dalle gare. Questo file contiene l’elenco completo
delle imprese che sono state escluse dalle gare dei cantieri di Expo 2015.
• Registro delle imprese invitate alle gare. Questo file contiene l’elenco delle imprese che sono state invitate alla partecipazione alle gare di appalto per i lavori
dei cantieri di Expo 2015.
• Registro delle imprese che hanno partecipato alle gare. Questo file contiene l’elenco delle imprese che hanno partecipato alle gare di appalto per i lavori dei
cantieri di Expo 2015; sia le imprese invitate che quelle escluse sono presenti in
questo registro.
5.1.3
Gare Beni e Servizi
Il dataset Gare Beni e Servizi contiene un solo file denominato “Gare Beni Servizi”,
il quale contiene l’anagrafica completa dei contratti per l’acquisizione di beni e
servizi e gli affidamenti per i servizi connessi ai lavori di Expo 2015.
La tabella contiene i seguenti attributi:
•
•
•
•
•
•
•
•
•
•
•
•
Numero gara;
RUP;
Oggetto della gara;
CIG non obbligatorio;
CIG;
Criterio di aggiudicazione;
Esito della procedura;
Tipo aggiudicatario;
Aggiudicatario;
Importo complessivo appalto;
Data Stipula;
Data fine contratto.
5.1 Descrizione del dataset
5.1.4
49
Dettaglio Gare Lavori
Il dataset Dettaglio Gare Lavori è composto da due file: “Autorizzazioni subappalti
per i lavori” e “Affidamenti gare e lavori”. Questi file descrivono nel dettaglio a
quali aziende sono stati affidati gli appalti per la costruzione delle aree e a quali
aziende gli aggiudicatari si sono rivolti per subappaltare i lavori vinti.
Il file “Autorizzazioni subappalti per i lavori” è composto dalle seguenti voci:
•
•
•
•
•
•
•
•
•
•
•
Numero gara;
RUP;
Oggetto della gara;
ID Lotto;
CIG AREA;
Oggetto del lotto;
Aggiudicatario Appalto;
Azienda subappaltatrice;
Importo presunto;
Importo effettivo;
Data autorizzazione.
Mentre, il file “Gare Lavori Aggiudicazioni” presenta le seguenti voci:
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Numero gara;
RUP;
Oggetto della gara;
ID Lotto;
CIG AREA;
Oggetto del lotto;
Criterio di aggiudicazione;
Esito della procedura;
Tipo Aggiudicatario;
Importo componenti lavori;
Importo componenti servizi;
Importo componente forniture;
Importo totale attuazione sicurezza;
Somme non assoggettate a ribasso;
Importo componente forniture;
Importo progettazione;
Importo complessivo appalto;
Importo totale somme a disposizione;
Importo complessivo intervento;
Stato.
5.1.5
Dati Cruscotti
Nel dataset Dati Cruscotti sono presenti due file: “Dati cruscotto lavori per area”
e “Dati cruscotto lavori per lotto”.
Il file relativo alle aree è composto dalle seguenti voci:
50
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
5 Progettazione di un case study su Tableau
Stato;
ID Cantiere;
AREA;
Importo asta;
Importo oneri sicurezza;
Importo aggiudicato;
Importo aggiudicato progettazione;
Eventuali ulteriori somme non assoggettate a ribasso asta;
Importo subappalti;
Numero di giorni contrattuali;
Data Consegna Lavori;
Data Fine lavori;
Proroghe per varianti riconosciute;
Importo varianti;
Proroghe per forza maggiore;
Importo globale SAL;
Data ultimo SAL;
Ultima data sospensioni;
Numero giorni lavorati;
Numeratore AT;
Denominatore AT;
N AL;
Numeratore scostamento temporale;
Somma importo aggiudicato e varianti;
Importo ribasso;
I Ribasso;
I AT;
I AL;
I Tempo varianti;
I importo varianti;
I Scostamento temporale;
I IPR;
Nuova data di fine lavori.
Il file relativo ai lotti presenta le seguenti voci:
•
•
•
•
•
•
•
•
•
•
•
•
Numero Gara;
ID Lotto;
ID Cantiere;
Area;
Stato;
Oggetto del lotto;
Memo lotto;
CIG SIMOG;
Importo asta;
Importo oneri sicurezza;
Importo aggiudicato;
Importo aggiudicato progettazione;
5.1 Descrizione del dataset
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
51
Eventuali ulteriori somme non assoggettate a ribasso asta;
Importo subappalti;
Numero di giorni contrattuali;
Data Consegna Lavori;
Data Fine lavori;
Proroghe per varianti riconosciute;
Importo varianti;
Proroghe per forza maggiore;
Importo globale SAL;
Data ultimo SAL;
Aggiudicatario;
Procedura di scelta del contraente;
Condizioni che giustificano il ricorso alla Procedura negoziata;
Modalità indizione;
Ultima data Sospensioni;
Numero giorni lavorati;
N AT;
D AT;
N AL;
N Scostamento temporale;
Somma importo aggiudicato varianti;
Importo ribasso;
I Ribasso praticato;
I AT;
I AL;
I Tempo varianti;
I Importo varianti;
I Scostamento temporale;
I Ritardo.
5.1.6
Expo Barometro
Il dataset Expo Barometro contiene un file denominato “Serie Storica ExpoBarometro”. Esso contiene:
•
•
•
data;
barometro;
MM.
La serie storica riporta sia il dato giornaliero che la media mobile settimanale
(MM). Expo Barometro è un indicatore che misura la social experience quotidiana
di Expo, ovvero le esplicite reazioni alla visita all’evento milanese, come emerge dai
post pubblicati su Twitter ogni giorno. Per farlo sviluppa un indicatore di gradimento costruito come il rapporto tra la percentuale di post che fanno un riferimento
positivo all’esperienza vissuta ad Expo, rispetto alla somma di post positivi e negativi, eliminando quelli di contenuto neutro (ovvero informazioni su eventi, ecc.). Expo
Barometro varia tra 0 (minimo apprezzamento) e 100 (massimo apprezzamento).
52
5 Progettazione di un case study su Tableau
5.2 Analisi dei dati
Dopo aver compreso la struttura dei dati contenuti nel database Open Expo abbiamo definito la conoscenza che vogliamo estrapolare dalle informazioni a nostra
disposizione. Abbiamo deciso di focalizzare l’analisi su quattro tabelle:
•
•
•
•
fornitori;
cruscottoaree;
cruscottolotti;
expobarometro.
Visti i dati a nostra disposizione e determinate le analisi da condurre, si è rivelato
necessario effettuare alcune operazioni. Un’importante modifica è stata effettuata
sui file; infatti è stato necessario utilizzare come separatore decimale la virgola
anzichè il punto.
Inoltre, da un controllo sulle righe è emersa la presenza di tuple ripetute, per cui
è stato indispensabile provvedere alla loro eliminazione, altrimenti le informazioni
estratte sarebbero state pesantemente falsate.
5.2.1
Progettazione dell’analisi sulla tabella Fornitori
Analizzando la tabella dei fornitori è stato deciso di estrarre delle statistiche sui paesi
di provenienza dei fornitori, sia analizzando in generale quali paesi sono coinvolti
sia concentrandoci in seguito sull’Italia, analizzando, cosı̀, le province coinvolte e
le singole località. Successivamente sono stati analizzati anche i paesi stranieri,
considerando, anche in questo caso, le singole località coinvolte.
Dalla tabella fornitori si è deciso di estrapolare la percentuale di fornitori. In
particolare, le richieste sono le seguenti:
• percentuale di fornitori per province italiane;
• percentuale di fornitori per località in provincia di Milano;
• percentuale di fornitori per paese straniero.
Per calcolare la percentuale di fornitori per provincie italiane bisogna applicare
un filtro sui paesi, mantenendo soltanto l’Italia. Successivamente, attraverso l’operazione di Drill-Down, occorre ricavare le provincie. Dopo aver combinato i valori
ottenuti a seguito di queste due operazioni, si ricava il numero di fornitori in ogni
provincia italiana. A quest’ultimo risultato viene applicata la percentuale (Figura
5.1).
Per ottenere la percentuale di fornitori per località in provincia di Milano i
passaggi sono i seguenti (Figura 5.2):
•
•
•
•
•
filtrare sui paesi, lasciando solo l’Italia;
applicare l’operazione di Drill-Down, ricavando cosı̀ le provincie italiane;
filtrare sulle provincie, lasciando solo la provincia di Milano;
applicare l’operazione di Drill-Down, ricavando cosı̀ le località milanesi;
combinare il risultato ottenuto con il numero di fornitori (quest’ultimo è ottenuto
effettuando l’operazione di COUNT sul campo “ragione sociale”);
5.2 Analisi dei dati
53
Figura 5.1. Lo schema mostra i passaggi logici per ottenere la percentuale di fornitori
per provincie italiane.
•
applicare la percentuale sul risultato ottenuto.
Per calcolare la percentuale di fornitori per paese straniero occorre effettuare un’operazione di filtraggio sui paesi, in modo da escludere dall’analisi l’Italia.
Successivamente, dopo aver effettuato l’operazione di COUNT sulla ragione sociale, occorre combinare i campi ottenuti. Il risultato mostrerà il numero di fornitori
per ogni paese straniero. L’ultimo passo è applicare la percentuale su quest’ultimo
risultato (Figura 5.1).
5.2.2 Progettazione analisi sulle tabelle Cruscottoaree e Cruscottolotti
Dalle tabelle cruscottoaree e cruscottolotti ci siamo concentrati sulle 21 aree dell’Expo, estraendo le statistiche sugli importi per ogni area.
Dalle due tabelle si è ricavato il valore dell’importo asta e dell’importo aggiudicato per ogni area. Successivamente è stata calcolata la differenza tra i due importi
(Figura 5.4).
Considerando la tabella Cruscottoaree si vogliono visualizzare il numero di giorni
di lavoro stabiliti da contratto e il numero di giorni effettivi di lavoro. Per fare questo
è necessario effettuare un’operazione di SUM sul numero di giorni contrattuali e sul
numero di giorni lavorativi. Successivamente bisogna combinare i due valori ottenuti
54
5 Progettazione di un case study su Tableau
Figura 5.2. Lo schema mostra i passaggi logici per ottenere la percentuale di fornitori
per località in provincia di Milano.
con il campo “area”. In questo modo sarà possibile confrontare i due valori e vedere
in quali aree i giorni lavorativi sono stati rispettati o meno (Figura 5.5).
5.2.3
Progettazione analisi sulla tabella ExpoBarometro
Dalla tabella expobarometro si vogliono ricavare:
•
•
•
•
•
•
il
il
il
il
il
il
valore del barometro per i mesi dell’Expo;
valore del barometro per le settimane dell’Expo;
valore media mobile per le settimane dell’Expo;
valore media mobile per i mesi dell’Expo;
confronto tra il barometro e la media mobile per i mesi dell’Expo;
confronto tra il barometro e la media mobile per le settimane dell’Expo.
Dopo aver selezionato lo schema di riferimento, il primo passo da effettuare è
un’operazione di Drill-Down sul campo “data”, in modo da generare due nuovi attributi: mesi e settimane. Successivamente, è necessario eseguire un’operazione di
SUM sul campo “barometro”. La combinazione del risultato ottenuto con il campo “mesi” restituirà l’andamento del barometro durante i mesi dell’Expo (Figura
5.2 Analisi dei dati
55
Figura 5.3. Lo schema mostra i passaggi logici per ottenere la percentuale di fornitori
per paese straniero.
5.6). Invece, considerando il campo “settimane”, è possibile andare più in dettaglio
osservando il valore assunto dal barometro in funzione delle settimane.
Analogamente, effettuando l’operazione di SUM sul campo “MM”, è possible
osservare l’andamento della media mobile durante i mesi o le settimane dell’Expo.
Per effettuare il confronto è necessario combinare entrambi i campi barometro e
media mobile con i mesi, oppure con le settimane.
56
5 Progettazione di un case study su Tableau
Figura 5.4. Lo schema mostra i passaggi logici per ottenere la differenza tra l’importo
d’asta e l’importo aggiudicato nelle rispettive aree dell’Expo.
5.2 Analisi dei dati
57
Figura 5.5. Lo schema mostra i passaggi logici per visualizzare il numero di giorni stabiliti
da contratto e il numero di giorni effettivi di lavoro su ogni area dell’Expo.
Figura 5.6. Lo schema mostra i passaggi per ottenere il valore assunto dal barometro nei
vari mesi dell’Expo.
6
Implementazione di un case study in
Tableau
In questo capitolo vengono implementati in Tableau tutti i passi relativi all’estrazione delle informazioni analizzati nel capitolo precedente per Qlik Sense.
6.1 Implementazione dell’analisi sulla tabella Fornitori
Il primo passo per iniziare ad implementare le analisi su Tableau è quello di caricare
i dati come file Excel.
Vogliamo calcolare la percentuale di fornitori per province italiane. Dopo aver
caricato su Tableau la tabella fornitori, è necessario convertire il campo “Ragione
sociale” in misura. Automaticamente verrà effettuata l’operazione di COUNT sul campo “Ragione sociale”, la quale effettua un conteggio di tutte le istanze di “Ragione
sociale”. Il secondo passo è quello di applicare un filtro sul campo “Paese”, escludendo tutti i paesi ad eccezione dell’Italia (Figura 6.1). Per fare questo è necessario
trascinare il campo di interesse all’interno del box “Filters” e scegliere le opzioni
desiderate.
Combinando i due campi ottenuti su righe e colonne, verrà calcolato il numero
di fornitori in Italia. Per conoscere più in dettaglio il numero di fornitori in ogni
provincia italiana trasciniamo il campo “Provincia” accanto al campo “Paese”. Automaticamente verrà generato il grafico a barre in cui ogni provincia ha associata
una barra che indica il numero di fornitori ad essa relatvi.
Attraverso il data sorting i valori possono essere ordinati in modo decrescente
o crescente. In questo caso abbiamo scelto un ordinamento decrescente. L’ultimo
passo è quello di applicare la percentuale al risultato ottenuto. Per fare questo
è necessario selezionare il campo “Ragione sociale”, mediante il tasto destro del
mouse, fare click su “Quick Table Calculation” e selezionare “Percent of Total”
(Figura 6.2). Spostando il mouse sulle varie barre, verranno specificati il paese, la
provincia e la percentuale di fornitori.
Vogliamo, adesso, ottenere la percentuale di fornitori per località in provincia di
Milano.
Trasciniamo il campo “Ragione sociale”, sul quale è stata precedentemente effettuata l’operazione di COUNT, sulle colonne. Successivamente applichiamo due filtri;
60
6 Implementazione di un case study in Tableau
Figura 6.1. Applicazione del filtro in Tableau.
Figura 6.2. Percentuale di fornitori per province italiane.
uno sul campo “Paese”, in cui manterremo solo l’Italia, e uno sul campo “Provincia”,
in cui manterremo soltanto la provincia di Milano. Trasciniamo questi due campi
sulle righe assieme al campo “Località”, in modo da conoscere tutte le località in
provincia di Milano. Automaticamente verrà generato il grafico a barre.
6.2 Implementazione dell’analisi sulle tabelle Cruscottoaree e Cruscrottolotti
61
La visualizzazione può essere modificata selezionando, dal menù “Show me”,
il grafico desiderato e impostando i colori e le dimensioni attraverso la sezione
“Marks”. Ad esempio, in Figura 6.3, è stato generato un grafico a bolle. Ogni località
di Milano ha associato un colore diverso, mentre la dimensione dei cerchi dipende
dal numero di fornitori per ogni località.
Figura 6.3. Percentuale di fornitori per località in provincia di Milano.
Analogamente al caso precedente, possiamo scegliere di visualizzare il valore
numerico o il valore espresso in percentuale dei fornitori selezionando le varie bolle.
Come ultima analisi, sulla tabella fornitori vogliamo calcolare la percentuale di
fornitori per paese straniero e visualizzare i dati ottenuti in un grafico a mappa.
Il primo passo è quello di trascinare i campi “latitudine” e “longitudine”, generati
automaticamente da Tableau, rispettivamente su righe e colonne. Dopo aver filtrato
ed escluso l’Italia dai paesi, trasciniamo i campi “Paese” e “Ragione sociale” all’interno della sezione “Marks”. Da qui è possibile impostare i colori e personalizzare
il grafico (Figura 6.4). Abbiamo deciso di assegnare un colore diverso in base al
numero di fornitori presenti in ciascun paese. Le tonalità vicine al verde indicano i
paesi in cui è presente il maggior numero di fornitori.
6.2 Implementazione dell’analisi sulle tabelle Cruscottoaree e Cruscrottolotti
A partire dalle tabelle cruscottoaree e cruscottolotti vogliamo visualizzare il valore
dell’importo d’asta e dell’importo calcolato per ogni area dell’Expo. In questo caso
abbiamo eseguito l’operazione di SUM sui campi “Importo asta” e “Importo aggiudicato”. A differenza di COUNT, l’operazione di SUM somma i valori contenuti nelle
varie istanze.
62
6 Implementazione di un case study in Tableau
Figura 6.4. Numero di fornitori per paese straniero.
Combinando ciascuno di questi due campi con il campo “AREA”, viene generato
il grafico a barre che consente di visualizzare i valori degli importi per ogni area
dell’Expo. Tramite il data sorting i valori sono stati ordinati in modo decrescente.
Infine, abbiamo creato una dashboard per avere una visione compatta dei due grafici
ottenuti (Figura 6.5).
Figura 6.5. Importo d’asta e importo aggiudicato per ogni area dell’Expo.
Per calcolare la differenza tra i due importi abbiamo deciso di creare un campo
di calcolo (Figura 6.6), in cui, per ogni area, all’importo d’asta è stato sottratto l’importo aggiudicato. Per creare un campo di calcolo è sufficiente selezionare “Create
6.3 Implementazione dell’analisi sulla tabella Expobarometro
63
Calculated Field” dal menù Analysis e scrivere l’espressione all’interno dell’editor di
calcolo. Il campo di calcolo verrà automaticamente inserito tra le misure, in quanto
restituisce un valore numerico.
Figura 6.6. Creazione del campo di calcolo.
Trascinando il campo di calcolo sulle righe e il campo “AREA” sulle colonne
viene generato un grafico a barre che mostra la differenza tra i due importi.
Abbiamo ordinato i valori in ordine decrescente e assegnato una tonalità di colore
diversa ad ogni area. Inoltre, cambiando tipologia di grafico e utilizzando il campo
“Measure names”, è stato possibile ottenere un confronto tra i due importi in ogni
area. In questo caso abbiamo evidenziato in blu l’importo d’asta e in arancione
l’importo aggiudicato.
I due grafici ottenuti sono stati inseriti in una dashboard (Figura 6.7).
Focalizzando l’attenzione sulla tabella cruscottoaree vogliamo calcolare il numero
di giorni lavorativi e il numero di giorni contrattuali per ogni area. Per fare questo
occorre eseguire l’operazione di SUM sui due campi. Successivamente, è necessario
trascinare i due campi sulle righe e il campo “AREA” sulle colonne. In questo
caso abbiamo scelto una rappresentazione mediante un grafico di Gantt (Figura
6.8), che permette di confrontare i due valori ottenuti e di capire in quale area i
giorni lavorativi sono stati rispettati o meno. In verde sono rappresentati i giorni
contrattuali e in rosso quelli lavorativi.
6.3 Implementazione dell’analisi sulla tabella Expobarometro
Dalla tabella expobarometro si vogliono ricavare i valori assunti dal barometro e
dalla media mobile durante il periodo dello svolgimento dell’Expo.
Per calcolare il valore assunto dal barometro durante i mesi dell’Expo, occorre
effettuare un’operazione di Drill-Down sul campo “data”, che identifica l’anno in cui
64
6 Implementazione di un case study in Tableau
Figura 6.7. Differenza tra l’importo asta e l’importo aggiudicato nelle varie aree dell’Expo.
In basso viene mostrato un confronto tra i due importi per ogni area.
Figura 6.8. Numero di giorni lavorativi e numero di giorni contrattuali per ogni area
dell’Expo.
si è svolto l’evento. Per fare questo è sufficiente selezionare il campo “data” con il
tasto destro del mouse e scegliere la voce “Month”. Dopo aver applicato l’operazione
di SUM al campo “barometro”, occorre trascinare i due campi ottenuti su colonne e
righe. Abbiamo scelto un grafico a linee per mostrare l’andamento del barometro
durante i mesi dell’Expo (Figura 6.9).
Avendo una dimensione di tipo “date”, è possibile generare un grafico di movimento che ci mostra come è variato il barometro ogni giorno dei mesi dell’Expo.
6.3 Implementazione dell’analisi sulla tabella Expobarometro
65
Figura 6.9. Il grafico mostra l’andamento del barometro durante i mesi dell’Expo.
In tal caso è necessario scendere ad un livello di maggiore dettaglio e selezionare
la voce “Day”. Abbiamo trascinato questo campo all’interno dei box “”Pages” e
“Marks”, assegnando un colore diverso ad ogni giorno del mese. In questo modo abbiamo generato una “storia’; facendo click sul tasto “play”, il grafico di movimento
ci mostrerà il cambiamento del barometro nel tempo (Figura 6.10).
Figura 6.10. Valore assunto dal barometro il giorno 19 di tutti i mesi dell’Expo.
Per calcolare, invece, il valore assunto dalla media mobile durante le settimane
dell’Expo abbiamo effettuato un’altra operazione di Drill-Down scegliendo, in questo
caso, di visualizzare le settimane. Applicando l’operazione di SUM al campo “MM”,
66
6 Implementazione di un case study in Tableau
ovvero alla media mobile, e combinando i due campi su righe e colonne, abbiamo
ottenuto l’andamento della media mobile in funzione delle settimane dell’Expo.
7
Discussione in merito all’esperienza
maturata
In questo capitolo, a seguito dei risultati ottenuti, vengono discusse le analogie e le
differenze tra Tableau e Qlik Sense, riscontrate nell’implementazione del case study
relativo ai dati dell’Expo.
7.1 Analogie tra Tableau e Qlik Sense
Dalle analisi effettuate con i dati dell’Expo notiamo che i due prodotti consentono di
visualizzare i dati tramite dei grafici abbastanza simili tra di loro. Infatti, calcolando
la percentuale di fornitori per province italiane e scegliendo le stesse opzioni di
visualizzazione, è possibile notare l’analogia tra i due grafici (Figura 7.1).
Un grafico può essere posizionato in maniera orizzontale o verticale e i risultati
ottenuti possono essere ordinati in modo crescente o decrescente. Inoltre, i grafici
possono essere personalizzati assegnando colori diversi in base alle dimensioni o a
seconda del valore assunto dalle misure. È possibile specificare i colori utilizzati
per differenziare i vari valori attraverso l’inserimento di legende accanto ai grafici.
Tableau e Qlik Sense mettono a disposizione una grande varietà di palette di colori
(Figura 7.2).
I due software offrono funzionalità comparabili tra di loro. Entrambi mettono a
disposizione un editor di calcolo, consentendo di effettuare selezioni su determinati
campi e operazioni di Drill-Down e Roll-Up. Infine, entrambi offrono la possibilità
di creare presentazioni e dashboard al cui interno i fogli di lavoro possono essere
disposti a proprio piacimento.
7.2 Differenze tra Tableau e Qlik Sense
La prima differenza riscontrata nel caricamento dei dati è il fatto che Qlik Sense
mette a disposizione un editor di caricamento tramite il quale è possibile modificare
le tabelle (Figura 7.3).
Tableau offre anch’esso la possibilità di modificare le tabelle caricate all’avvio
senza, però, l’utilizzo di un editor (Figura 7.4).
68
7 Discussione in merito all’esperienza maturata
Figura 7.1. In alto è mostrato un grafico a barre in Tableau; in basso è mostrato un
grafico a barre in Qlik Sense.
Un’altra differenza è la presenza dell’hub in Qlik Sense che consente di salvare
i progetti come app. Eventualmente i fogli possono essere, poi, esportati come file
PDF. In Tableau, invece, possono essere salvati come file Workbook.
Tableau mette a disposizione una notevole varietà di filtri rispetto a Qlik Sense.
Anch’essi possono essere applicati in maniera veloce e senza la necessità di dover
scrivere codice. Ad esempio, per selezionare i fornitori italiani, in Qlik Sense è stato
necessario creare una nuova misura tramite l’espressione riportata in Figura 7.5;
Tableau, invece, consente di farlo senza la necessità di creare nuove misure o fogli i
calcolo.
Tra le altre differenze riscontrate notiamo che Tableau considera separatamente
i concetti di “Worksheet”, ovvero il foglio di lavoro, e di “Dashboard”. Infatti, nel
foglio di lavoro è possible apportare modifiche esclusivamente su un unico grafico.
Una volta concluse le modifiche, i grafici possono essere inseriti all’interno delle
7.3 Punti di forza di Tableau rispetto a Qlik Sense
69
Figura 7.2. Assegnazione di diverse palette di colori in Tableau (in alto) e in Qlik Sense
(in basso).
dashboard. In Qlik Sense, invece, il foglio di lavoro è proprio una dashboard in cui è
possibile lavorare e apportare modifiche su uno o più grafici contemporaneamente.
7.3 Punti di forza di Tableau rispetto a Qlik Sense
Tableau, rispetto a Qlik Sense, consente di creare grafici in maniera dinamica, trascinando i vari elementi e consentendo di cambiare il tipo di visualizzazione attraverso
pochi click.
Un aspetto notevole è la capacità di Tableau di riconoscere misure e dimensioni.
Infatti, alla creazione di un campo di calcolo, Tableau lo inserisce automaticamente
come misura, se restituisce un valore numerico, e come dimensione, se restituisce
una stringa o un valore booleano. Tuttavia, è possibile convertire manualmente dimensioni in misure, e viceversa. Questa operazione è stata fatta con la dimensione
70
7 Discussione in merito all’esperienza maturata
Figura 7.3. Editor di caricamento dei dati in Qlik Sense.
Figura 7.4. Caricamento dei dati in Tableau.
“Ragione sociale” della tabella fornitori, per convertire tale campo in misura. Inoltre, Tableau applica automaticamente le operazioni, come quelle di SUM o di COUNT,
in base al tipo di dato riconosciuto. Infatti, alla nuova misura “Ragione Sociale”, è stata automaticamente applicata un’operazione di COUNT, piuttosto che una
SUM, per conteggiare tutte le istanze di “Ragione sociale”. Ovviamente, l’operazione
applicata può essere modificata.
Tableau consente di passare da un foglio all’altro salvando automaticamente i
risultati ottenuti e consentendo di annullare le operazioni effettuate. Inoltre, i valori
assunti dai dati possono essere visualizzati al passaggio del mouse sul grafico.
In presenza di elementi di tipo “date”, Tableau consente la creazione di grafici di
movimento che descrivono l’andamento dei dati nel tempo. I grafici di movimento
possono essere utili per creare delle presentazioni accattivanti. Nel case study analizzato in precedenza abbiamo potuto utilizzare questo tipo di grafico per mostrare
7.4 Punti di forza di Qlik Sense rispetto a Tableau
71
Figura 7.5. Editor di calcolo in Qlik Sense.
l’andamento del barometro e della media mobile nel tempo.
Attraverso l’utilizzo delle mappe abbiamo anche potuto visualizzare il numero
di fornitori per paese straniero. Tableau è particolarmente apprezzato per il modo
in cui vengono trattate le informazioni su mappe personalizzabili e, soprattutto,
perchè consente di assegnare ai dati dei ruoli geografici.
Quando ci si connette a una fonte di dati, Tableau crea automaticamente i campi
“Measure Names” e “Measure Values” che contengono tutti i nomi e i valori delle
misure. Un uso comune dei nomi e dei valori di misura è quello di creare una tabella
che mostra i dettagli di tutti i valori di misura per alcune categorie. Un altro uso
di questi campi è quando si vogliono fondere le misure su un unico asse, cosı̀ come
abbiamo fatto per confrontare l’importo d’asta e l’importo aggiudicato nelle aree
dell’Expo.
Infine, Tableau consente di effettuare operazioni di Drill-Down o Roll-Up in
modo facile ed intuitivo senza avere necessità di creare nuove dimensioni come,
invece, avviene in Qlik Sense (Figura 7.6).
7.4 Punti di forza di Qlik Sense rispetto a Tableau
Tra i punti di forza di Qlik Sense si nota la sua semplicità, in quanto mette a
disposizione gli strumenti essenziali per una buona visualizzazione dei dati.
Qlik Sense, a differenza di Tableau, specifica il numero minimo di dimensioni e
di misure necessarie alla creazione del grafico scelto. Tuttavia, è possibile inserire
misure e dimensioni aggiuntive in un secondo momento.
Per fondere più misure in un unico asse basta aggiungere una nuova misura, che
verrà inserita automaticamente all’interno del grafico in un colore diverso. Attraverso questa funzionalità abbiamo confrontato il numero di giorni lavorativi e il numero
di giorni contrattuali per ogni area dell’Expo, su entrambi i software. Come si nota
in Figura 7.7, i grafici sono simili tra di loro; la differenza principale è che in Tableau
abbiamo avuto la necessità di usare il campo “Measure Names”, per unificare due
72
7 Discussione in merito all’esperienza maturata
Figura 7.6. Aggiunta di una dimensione di Drill-Down in Qlik Sense.
misure su uno stesso asse; invece, in Qlik Sense è bastato aggiungere una seconda
misura. Inoltre è possibile notare che Qlik Sense esclude dalla visualizzazione i valori
trascurabili ed effettua un ordinamento decrescente in automatico.
Un altro punto di forza di Qlik Sense rispetto a Tableau è la possibilità di inserire oggetti personalizzati, tra cui testo, immagini e segnalibri. È possibile modificare
la dashboard, aggiungendo titoli ai grafici e didascalie. I grafici possono essere posizionati e dimensionati a proprio piacimento. Inoltre, è possibile salvare i grafici
come snapshot per poi riutilizzarli nella creazione di presentazioni.
7.4 Punti di forza di Qlik Sense rispetto a Tableau
73
Figura 7.7. In alto è mostrato un grafico a barre in Tableau; in basso è mostrato un
grafico a barre in Qlik Sense.
8
Progettazione di un software multimediale
per l’apprendimento di Tableau
Questo capitolo illustra tutti i passi relativi alla realizzazione del software multimediale per l’apprendimento di Tableau.
8.1 Metodologia usata per la progettazione
La metodologia scelta per la progettazione del software multimediale consiste
nell’utilizzo di tre viste differenti:
•
•
•
vista logica;
vista fisica;
vista utente.
Attraverso la vista logica definiamo il comportamento logico del sistema.
Organizzeremo le tematiche principali attraverso una struttura ad albero. In
questa struttura gerarchica appaiono due tipi di entità: “padre” e “fratello”. I fratelli
sono indipendenti tra di loro; invece il figlio è dipendente dal padre. Queste entità
identificano gli argomenti trattati.
La vista fisica ha lo scopo di rendere più semplice la comprensione degli argomenti. Per rendere lineare la struttura gerarchica relativa alla vista logica, si è scelto
l’algoritmo “Depth First Search” (DFS), noto anche come “Ricerca in profondità”.
Questo algoritmo ha la caratteristica di essere ricorsivo. A partire dal nodo padre,
la visita prosegue verso i suoi figli, passando attraverso gli archi che ancora non
sono stati esplorati. Quando sono stati visitati tutti gli archi di un nodo, si torna
al nodo padre e si esplorano i suoi ulteriori archi non ancora esplorati.
Infine, la vista utente ci consente di rendere visibile il risultato ottenuto sotto
forma grafica. Per fare ciò abbiamo deciso di utilizzare dei mockup di primo livello.
8.2 Progettazione della vista logica
In Figura 8.1 viene mostrato lo schema ad albero che rappresenta la vista logica del
software multimediale. Si parte dalla collocazione dei principali software di Business
Intelligence per poi analizzare le principali caratteristiche di Tableau.
76
8 Progettazione di un software multimediale per l’apprendimento di Tableau
Figura 8.1. Progettazione della vista logica.
8.3 Progettazione della vista fisica
Linearizzando la struttura relativa alla vista logica, abbiamo ottenuto una visione
sequenziale degli argomenti trattati, come evdenziato in Figura 8.2.
Figura 8.2. Progettazione della vista fisica.
8.4 Progettazione della vista utente
77
8.4 Progettazione della vista utente
Per la progettazione della vista utente, abbiamo realizzato dei mockup di livello 1,
descritti nelle prossime sottosezioni.
8.4.1
BI
La Business Intelligence è un sistema di modelli, metodi, processi, persone e strumenti che rendono possibile la raccolta e l’organizzazione dei dati generati da un’azienda. Inoltre, attraverso elaborazioni e analisi, essa permette di trasformare le
informazioni e di presentarle in una forma semplice, in modo da facilitare la presa
di decisioni strategiche. In Figura 8.3 sono mostrati gli aspetti chiave della Business
Intelligence.
Figura 8.3. Mockup che illustra le principali applicazioni della BI.
8.4.2
Principali tool di BI
In Figura 8.4 viene evidenziato il posizionamento dei principali tool di Business Intelligence nel Febbraio 2016. Attraverso il “Gartner 2016 Business Intelligence Magic
Quadrants” si può notare che Tableau è collocato al primo posto nel “quadrant”
dei LEADERS.
78
8 Progettazione di un software multimediale per l’apprendimento di Tableau
Figura 8.4. Mockup che illustra i principali tool della BI.
8.4.3
Tableau
Tableau è una piattaforma innovativa che consente di gestire al meglio la visualizzazione e l’analisi dei dati. In Figura 8.5 vengono illustrati i principali punti di forza
di Tableau.
8.4.4
Prodotti
Tableau Software è una compagnia che si occupa della realizzazione di prodotti
interattivi per la visualizzazione dei dati, focalizzati sulla Business Intelligence. In
Figura 8.6 sono evidenziati i principali prodotti Tableau Software.
8.4.5
Connessione dati
All’avvio di Tableau è possibile connettersi a due principali categorie di fonti
mostrate in Figura 8.7.
8.4 Progettazione della vista utente
79
Figura 8.5. Mockup che illustra le principali caratteristiche di Tableau.
8.4.6
Visualizzazione tabelle
Dopo aver caricato i dati in Tableau, vengono visualizzati i valori all’interno di una
tabella. Da qui è possibile modificare i nomi degli attributi ed applicare le opzioni
di JOIN desiderate (Figura 8.8).
8.4.7
Foglio di lavoro
In Figura 8.9 è mostrata la struttura di un foglio di lavoro. A sinistra vengono
raggruppate misure e dimensioni. Trascinando questi valori su righe e colonne è
possibile generare un grafico.
8.4.8
Grafici
Tableau mette a disposizione innumerevoli tipologie di grafico, elencate in Figura
8.10.
8.4.9
Grafici di movimento
Una peculiarità di Tableau è la creazione di grafici di movimento. I passaggi relativi
alla creazione di questa tipologia di grafici sono schematizzati in Figura 8.11.
8.4.10 Mappe
Un altro aspetto importante in Tableau è la generazione di mappe geografiche. Il
procedimento è illustrato in Figura 8.12.
80
8 Progettazione di un software multimediale per l’apprendimento di Tableau
Figura 8.6. Mockup che illustra la famiglia dei prodotti Tableau.
8.4.11 Drill-Down
In Figura 8.13 viene definita l’operazione di Drill-Down.
8.4.12 Roll-Up
In Figura 8.14 viene definita l’operazione di Roll-Up.
8.4.13 Previsioni
Tableau, attraverso la creazione di una previsione, è in grado di stimare il valore
che i dati potranno assumere in futuro. In Figura 8.15 è mostrata la creazione di
una previsione.
8.4.14 Trend line
In Figura 8.16 sono mostrate la varie tipologie di Trend Line che possono essere
aggiunte al grafico per evidenziare l’andamento di una o più variabili.
8.4 Progettazione della vista utente
81
Figura 8.7. Mockup che indica le fonti dati alle quali è possibile connettersi in Tableau.
Figura 8.8. Mockup relativo alla visualizzazione delle tabelle.
8.4.15 Filtri
In Figura 8.17 sono descritte le varie tipologie di filtri messe a disposizione da
Tableau. Inoltre, viene mostrato come è possibile scegliere il range di valori da
visualizzare.
82
8 Progettazione di un software multimediale per l’apprendimento di Tableau
Figura 8.9. Mockup relativo alla creazione di un nuovo foglio di lavoro.
Figura 8.10. Mockup che elenca tutte le tipologie di grafici.
8.4.16 Campi di calcolo
In Figura 8.18 sono mostrate le due metodologie principali per applicare operazioni.
Più specificatamente, tale attività può essere condotta mediante un editor di calcolo o tramite operazioni da applicare direttamente alla tabella. Nel primo caso il
risultato potrà essere un valore numerico o booleano.
8.4 Progettazione della vista utente
83
Figura 8.11. Mockup relativo alla creazione di un grafico di movimento.
Figura 8.12. Mockup relativo alla creazione di mappe.
8.4.17 Storie
La Figura 8.19 illustra il mockup relativo alla realizzazione di storie, ovvero di
presentazioni utilizzate per mostrare i risultati ottenuti ad un pubblico.
8.4.18 Dashboard
La Figura 8.20 illustra il mockup relativo alla costruzione di una dashboard, che
consente di visualizzare i fogli di lavoro all’interno di un’unica schermata.
84
8 Progettazione di un software multimediale per l’apprendimento di Tableau
Figura 8.13. Mockup che descrive l’operazione di Drill-Down.
Figura 8.14. Mockup che descrive l’operazione di Roll-Up.
8.4.19 Registrazione
In Figura 8.21 vengono spiegati i passaggi per effettuare la registrazione in modo
da ottenere Tableau Desktop.
8.4.20 Installazione
Il Figura 8.22 viene illustrata la procedura per installare Tableau Desktop gratuitamente.
8.4 Progettazione della vista utente
Figura 8.15. Mockup relativo alla creazione di una previsione.
Figura 8.16. Mockup relativo alla creazione di trend line.
85
86
8 Progettazione di un software multimediale per l’apprendimento di Tableau
Figura 8.17. Mockup relativo alle tipologie di filtri applicabili in Tableau.
Figura 8.18. Mockup relativo alle tipologie di campi di calcolo.
8.4 Progettazione della vista utente
Figura 8.19. Mockup relativo alla realizzazione di “Storie”.
87
88
8 Progettazione di un software multimediale per l’apprendimento di Tableau
Figura 8.20. Mockup relativo alla creazione di una dashboard.
Figura 8.21. Mockup che illustra i passaggi relativi alla registrazione in Tableau.
8.4 Progettazione della vista utente
Figura 8.22. Mockup che illustra i passaggi relativi all’installazione di Tableau.
89
9
Realizzazione di un software multimediale
per l’apprendimento di Tableau
Questo capitolo illustra tutti i passi relativi alla realizzazione del software multimediale per l’apprendimento di Tableau.
9.1 Implementazione del software multimediale
Per facilitare l’apprendimento delle funzionalità principali di Tableau, abbiamo realizzato un software multimediale, utilizzando l’editor di video Camtasia Studio.
L’implementazione è stata suddivisa in quattro fasi:
•
•
•
•
inserimento delle immagini;
registrazione delle schermate;
editing del video;
salvataggio del filmato.
Nelle prossime sottosezioni esamineremo in dettaglio ciascuna di queste fasi.
9.1.1
Inserimento delle immagini
Il primo passo è stato l’inserimento dei mockup derivati dalla vista utente. Inoltre,
abbiamo creato nuove immagini per rendere il filmato più comprensibile.
9.1.2
Registrazione della schermata
Nella realizzazione del filmato ci siamo concentrati sulle tabelle relative al case study
di Expo 2015. In particolare le tabelle prese in considerazione sono:
•
•
•
•
fornitori ;
cruscottolotti ;
cruscottoaree;
expobarometro.
92
9 Realizzazione di un software multimediale per l’apprendimento di Tableau
Abbiamo registrato gli screencast che consentono di guidarci meglio nella comprensione di Tableau. Nelle schermate si possono vedere tutti i passaggi per eseguire
alcune delle query relative ai dati di Expo 2015. Inoltre, sono stati realizzati degli screencast aggiuntivi per spiegare le ulteriori funzionalità di Tableau, tra cui
l’inserimento di previsioni e di Trend Line.
Abbiamo suddiviso le registrazioni effettuate in base alle seguenti funzionalità:
•
•
•
•
•
•
•
•
•
•
•
•
caricamento dei dati;
modifica di un foglio di lavoro;
realizzazione di grafici di movimento;
creazione di mappe;
operazioni di Drill-Down;
creazione di previsioni;
inserimento di Trend Line;
applicazione di filtri;
creazione di campi di calcolo;
creazione di storie;
creazione di dashboard;
registrazione e installazione.
9.1.3
Editing del video
Durante l’editing del video sono state inserite le transazioni tra i vari elementi multimediali, ovvero gli screencast e le immagini. Successivamente abbiamo aggiunto
alcuni elementi, tra cui forme e zoom, per focalizzare l’attenzione su specifiche aree
all’interno del filmato. Per una migliore comprensione dei passi logici abbiamo inserito delle didascalie e dei callout. Infine sono state aggiunte delle tracce audio di
sottofondo per l’intera durata della presentazione.
9.1.4
Salvataggio del filmato
Il filmato è stato esportato in formato mp4 grazie alla funzionaltà messa a disposizione da Camtasia Studio (Figura 9.1).
9.2 Uno sguardo al software
In questa sezione vengono mostrate alcune delle schermate del filmato realizzato.
In Figura 9.2 è mostrata la slide introduttiva del video.
9.2 Uno sguardo al software
93
Figura 9.1. Creazione del filmato attraverso Camtasia Studio.
Figura 9.2. Introduzione al video.
La Figura 9.3 mostra il mockup relativo alla costruzione di un grafico di
movimento.
94
9 Realizzazione di un software multimediale per l’apprendimento di Tableau
Figura 9.3. Mockup relativo alla creazione di un grafico di movimento.
In Figura 9.4 viene mostrato l’utilizzo di un callout durante uno screencast
riguardante la creazione di una previsione.
Figura 9.4. Frame di uno screencast.
La Figura 9.5 rappresenta il mockup relativo alla creazione di una mappa.
9.2 Uno sguardo al software
95
Figura 9.5. Mockup relativo alla creazione di una mappa.
In Figura 9.6 è mostrato un frame di uno screencast relativo alla creazione di
un campo di calcolo.
Figura 9.6. Frame relativo alla creazione di un campo di calcolo.
Infine, in Figura 9.7, è rappresentata la slide che ci guida durante la registrazione
su Tableau.
96
9 Realizzazione di un software multimediale per l’apprendimento di Tableau
Figura 9.7. Mockup relativo alla registrazione su Tableau.
10
Conclusioni e uno sguardo al futuro
Durante la stesura della tesi è stata discussa l’importanza dei Big Data nella società
attuale. I Big Data offrono la possibilità di sviluppare nuove tecnologie e modelli
matematici per poter estrarre l’effettivo valore, e danno la possibilità di perseguire
nuovi modelli di business. Essi consentono di individuare i trend e, inoltre, portano
vantaggi economici alle aziende che hanno deciso di sfruttare l’informazione ottenibile dai dati in loro possesso. Grazie alla Big Data Analytics è possibile usare
l’informazione ottenibile dai dati per fini predittivi e decisionali.
Molti sono i contesti applicativi che beneficiano dei Big Data: sanità, sicurezza, istruzione, trasporti, marketing e social network sono solo alcuni dei settori che
sfruttano il grande potere dei Big Data. Tuttavia, bisogna saper sfruttare questo potere derivante dai Big Data con cautela, in quanto, oltre ad offrire grandi prospettive
e potenzialità, vi sono alcuni aspetti critici che è bene prendere in considerazione;
basti pensare in particolare alle problematiche legate alla qualità e all’affidabilità
dei dati e, a quelle relative alla privacy e alla proprietà degli stessi.
I software utilizzati nei contesti della Business Intelligence sono numerosi.
Tableau è uno dei principali leader in questo settore, insieme a Qlik Sense.
Nella tesi sono state illustrate le caratteristiche e le potenzialità di Tableau Desktop. Dopo aver valutato il prodotto, sono stati discussi i principali punti di forza
e di debolezza di Tableau rispetto a Qlik Sense. Per evidenziare meglio il funzionamento dei due software, e poter fare un confronto più dettagliato, è stato preso in
considerazione il case study relativo agli open data di Expo 2015. Successivamente
alla descrizione del dataset di Expo, sono state scelte alcune tabelle su cui effettuare
l’analisi. Durante la fase di progettazione sono stati analizzati tutti i passaggi logici
per poter eseguire le query sui dati di Expo. Successivamente, sono state implementate tali query attraverso i grafici messi a disposizione da Tableau. Da qui è stato
possibile individuare le differenze e le analogie tra Tableau e Qlik Sense riguardo al
loro utilizzo e alla creazione di visualizzazioni e presentazioni.
Nella fase finale della tesi è stato progettato un software multimediale al fine di
guidare gli studenti nella comprensione di Tableau. In particolare, è stata usata una
metodologia basata su tre viste differenti, ovvero vista logica, vista fisica e vista
utente. Durante la fase di progettazione del software è stato necessario definire e
organizzare le tematiche più importanti da trattare e approfondire. Tali tematiche
derivano dallo studio di Tableau e dall’analisi del case study relativo ai dati di Expo
98
10 Conclusioni e uno sguardo al futuro
2015. L’implementazione è stata effettuata attraverso l’editor di video Camtasia
Studio che ci ha permesso di realizzare degli screencast e di inserire ulteriori elementi
multimediali al filmato.
L’obiettivo principale è stato quello di fornire agli studenti gli strumenti per
scoprire il mondo dei Big Data e guidarli meglio nella comprensione di Tableau.
Le fonti di dati continuano ad evolvere e a crescere. La crescita dei Big Data e
delle loro opportunità è accompagnata dalla nascita di nuovi tool per la gestione degli stessi. Per questo motivo nasce l’esigenza di ottenere nuove competenze riguardo
l’utilizzo di questi strumenti, anche a sostegno della competitività aziendale.
In futuro abbiamo valutato la possibilità di concentrarci ancora di più sull’aspetto analitico, in particolare approfondendo le analisi prescrittive e predittive.
In questo modo è possibile analizzare scientificamente i dati e, quindi, arricchirli di
significato utile; l’obiettivo non è generare dei report su ciò che è accaduto, ma comprendere come l’informazione estraibile dai dati possa aiutare a prendere decisioni
migliori.
Ringraziamenti
A conclusione della stesura di questa tesi desidero ringraziare tutte le persone che
in diversi modi hanno contribuito e mi sono state vicine in questo percorso.
Ringrazio il professore Domenico Ursino per la sua disponibilità, per il suo
sostegno e per tutto l’aiuto che mi ha dato in questi mesi.
Un ringraziamento particolare va ai miei genitori e a mio fratello che mi hanno
sostenuto sempre nelle scelte e mi hanno supportato nei periodi difficili.
Grazie alle mie colleghe-amiche che mi hanno accompagnato durante questo
percorso di studi e con le quali ho condiviso momenti ed esperienze indimenticabili.
Infine, ringrazio tutti coloro che mi sono accanto e continuano ogni giorno a
dimostrarmi il loro affetto.
Riferimenti bibliografici
1. Big data: qual è il loro impatto sulla società? http://www.volontariperlosviluppo.
it/index.php?option=com_content&view=article&id=1779%3Abig-data-qual-eil-loro-impatto-sulla-societa&catid=161&Itemid=200055, 2011.
2. Tableau: le basi. http://www.datajournalism.it/tableau-public-parte-1-lebasi/, 2013.
3. Big Data-The 5 Vs Everyone Must Know.
http://www.slideshare.net/
BernardMarr/140228-big-data-volume-velocity-variety-varacity-value, 2014.
4. Cosa sono i Big Data e a cosa servono? http://thebizloft.com/big-data-cosasono-a-cosa-servono/, 2014.
5. Qlik Sense: verso una BI di seconda generazione. http://www.techweekeurope.
it/data-storage/business-intelligence/qlik-sense-verso-bi-secondagenerazione-72383, 2014.
6. Cosa sono i Big Data: esempi concreti della vita quotidiana. http://www.cloudtalk.
it/big-data-esempi-concreti/, 2015.
7. Sicurezza e Big Data. http://www.tecnaeditrice.com/articoli/ict_security/
sicurezza_e_big_data, 2015.
8. Big Data: cosa sono e perchè sono importanti. http://www.sas.com/it_it/insights/
big-data/what-is-big-data.html, 2016.
9. Guida di Qlik Sense. https://help.qlik.com/it-IT/sense/1.1/Content/Home.htm,
2016.
10. Presentazione di Qlik Sense. http://global.qlik.com/it/explore/products/sense,
2016.
11. Tableau lezione. http://www.w3ii.com/it/tableau/tableau_show_me.html, 2016.
12. Tableau Software. http://www.tableau.com/, 2016.
13. B. Baesens. Analytics in a Big Data World: The Essential Guide to Data Science and
its Applications. Wiley, 2014.
14. T. H. Davenport. Big data @l lavoro. Sfatare i miti, scoprire le opportunità : Sfatare
i miti, scoprire le opportunità. Franco Angeli Edizioni, 2015.
15. T. Erl, W. Khattak, and P. Buhler. Big Data Fundamentals: Concepts, Drivers &
Techniques. Prentice Hall, 2015.
16. C. Ilacqua, H. Cronstram, and J. Richardson. Learning Qlik Sense: The Official Guide.
Packt Publishing, 2015.
17. M. Kaufman, Fern Halper, and Alan Nugent. Big Data For Dummies. For Dummies,
2013.
18. B. Marr. Big Data in Practice. Wiley, 2016.
19. N. Marz. Big Data: Principles and best practices of scalable realtime data systems.
Manning Publications, 2015.
102
Riferimenti bibliografici
20. V. Mayer-Schanberger. Big Data: A Revolution That Will Transform How We Live,
Work, and Think. Eamon Dolan/Mariner Books; Reprint edition, 2014.
21. J. Milligan. Learning Tableau 10. Packt, 2016.
22. D. G. Murray. Tableau Your Data!: Fast and Easy Visual Analysis With Tableau
Software. Wiley, 2016.
23. M. O’Donovan. Qlik Sense for Beginners. TechStuffy Books, 2014.
24. V. Reynolds. Big Data For Beginners. CreateSpace Independent Publishing Platform,
2016.
25. A. Rezzani. Big data. Architettura, tecnologie e metodi per l’utilizzo di grandi basi di
dati. Apogeo Education, 2013.
26. J. Smith. Data Analytics: What Every Business Must Know About Big Data And Data
Science. Pinnacle Publishers, 2016.
Scarica