theses

annuncio pubblicitario
Università degli Studi Mediterranea di Reggio Calabria
Dipartimento di Ingegneria dell’Informazione, delle Infrastrutture e
dell’Energia Sostenibile
Corso di Laurea Triennale in Ingegneria dell’Informazione
Tesi di Laurea
Utilizzo di Tableau per analisi di tipo descrittivo, diagnostico
e predittivo relative al settore finanziario a partire dagli
open data della Banca Mondiale
Relatore
Candidato
Prof. Domenico Ursino
Francesco Attinà
Anno Accademico 2015-2016
Alla mia famiglia.
Indice
Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
La Big Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 I Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1 Caratteristiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2 Principali contesti applicativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.1 Finanza e Business . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.2 Istruzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.3 Settore energetico e dei trasporti . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.4 Medicina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.5 Social Network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.2.6 Sicurezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3 La Data Analysis e la Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.3.1 Categorie di Big Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4 Pianificazione di uno studio sui Big Data . . . . . . . . . . . . . . . . . . . . . . . .
1.4.1 Analisi e acquisizione dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.4.2 Big Data Analytics Lifecycle . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
7
8
11
11
12
12
13
13
14
14
14
17
18
19
Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Descrizione dell’applicazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.1 Caratteristiche del software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.2 Creazione di un foglio di lavoro . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1.3 Tipi di grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Calcoli in Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.1 Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.2 Creazione di un campo di calcolo . . . . . . . . . . . . . . . . . . . . . . . . .
2.2.3 Espressioni LOD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Ulteriori funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.1 Filtri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.2 Creazione di una dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.3 Creazione di una storia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.4 Trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3.5 Previsioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
23
24
25
26
28
29
29
30
30
31
33
33
34
35
VI
Indice
2.4 Salvataggio dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Descrizione dei dati a disposizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 Sorgente dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Caratteristiche del dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Descrizione dei dati di interesse per la tesi . . . . . . . . . . . . . . . . . . . . . . .
3.2.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.2 Crescita moneta in senso ampio . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.3 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . .
3.2.4 Capitale bancario sul totale delle attività bancarie . . . . . . . . . .
3.2.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.6 Tasso d’interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2.8 Differenziale del tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . .
3.2.9 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . .
3.3 Paesi di interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
37
38
39
40
41
42
43
43
44
44
45
45
45
Attività di ETL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1 Nozioni di ETL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.1 Estrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.2 Trasformazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.1.3 Caricamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Attività svolte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1 Verifica dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.2 Rimozione dei campi non di interesse . . . . . . . . . . . . . . . . . . . . .
4.2.3 Modifica dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.4 Trasformazione delle tabelle in tabelle pivot . . . . . . . . . . . . . . .
4.2.5 Caricamento dei dati puliti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
49
49
50
51
52
52
53
53
53
55
58
Analisi Descrittiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2 Visualizzazione dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.2 Crescita della moneta in senso ampio . . . . . . . . . . . . . . . . . . . . .
5.2.3 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . .
5.2.4 Capitale bancario sul totale delle attività bancarie . . . . . . . . . .
5.2.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.6 Tasso di interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.2.8 Differenziale del tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . .
5.2.9 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3 Ricerca di outlier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.2 Crescita della moneta in senso ampio . . . . . . . . . . . . . . . . . . . . .
5.3.3 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . .
5.3.4 Capitale bancario sul totale delle attività bancarie . . . . . . . . . .
5.3.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.3.6 Tasso d’interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
59
59
59
59
63
66
69
73
76
80
83
87
90
90
91
91
91
92
92
Indice
VII
5.3.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.3.8 Differenziale del tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . . 93
5.3.9 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . 93
Analisi Diagnostica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2 Diagnostic Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2.1 Europa Occidentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.2.2 Europa Orientale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98
6.2.3 Africa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
6.2.4 Asia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
6.2.5 Sud America . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106
6.2.6 Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
6.2.7 BRICS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
Analisi Predittiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.2 Trend e Forecast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
7.2.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
7.2.2 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . . 118
7.2.3 Capitale bancario sul totale delle attività bancarie . . . . . . . . . . 119
7.2.4 Differenziale sul tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . . . 120
7.2.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.2.6 Tasso di interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
7.2.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
7.2.8 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Conclusioni e uno sguardo al futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
Riferimenti bibliografici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
Ringraziamenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
Elenco delle figure
1.1
1.2
1.3
1.4
1.5
1.6
7
8
9
9
10
1.14
Il mondo dei Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
I cinque tratti che caratterizzano i Big Data . . . . . . . . . . . . . . . . . . . . . .
Dati generati in un minuto da vari social media . . . . . . . . . . . . . . . . . . .
Andamento del valore in relazione alla veracità e al tempo . . . . . . . . . .
Differenza tra tipologie di dati strutturati e non strutturati . . . . . . . . .
Percentuali dei settori che operano con i Big Data. “Fonte
Osservatorio Big Data Analytics e Business Intelligence della School
of Management del Politecnico di Milano” . . . . . . . . . . . . . . . . . . . . . . . .
Panoramica dei principali social network che utilizzano i big data . . . .
Grafico che mostra l’andamento crescente della complessità al
variare dell’analisi da svolgere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Struttura di un sistema di descriptive analytics . . . . . . . . . . . . . . . . . . . .
Struttura di un sistema di diagnostic analytics . . . . . . . . . . . . . . . . . . . .
Struttura di un sistema di predictive analytics . . . . . . . . . . . . . . . . . . . .
Struttura di un sistema di prescriptive analytics . . . . . . . . . . . . . . . . . . .
Fasi che riguardano la memorizzazione delle informazioni sulla
provenienza del dato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Le nove fasi che compongono il ciclo di vita della Big Data Analytics
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
2.13
2.14
Il logo dell’azienda Tableau Software. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Le diverse varianti della piattaforma Tableau. . . . . . . . . . . . . . . . . . . . . .
La schermata del foglio di lavoro vuoto. . . . . . . . . . . . . . . . . . . . . . . . . . .
L’elenco dei grafici ottenibili, visualizzato nel campo “Show Me”. . . . .
Esempio di grafico a linee. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di grafico a bolle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di grafico a mappa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di diagramma di Gantt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
L’editor di calcolo in Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La schermata di creazione filtri. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Le diverse tipologie di filtri per le misure. . . . . . . . . . . . . . . . . . . . . . . . .
Le diverse tipologie di filtri per le misure. . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di Dashboard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Esempio di storia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
24
25
26
27
27
28
29
30
31
32
32
33
33
1.7
1.8
1.9
1.10
1.11
1.12
1.13
11
13
15
16
16
17
17
18
19
X
Elenco delle figure
2.15 Esempio di grafico con linee di tendenza. . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.16 Tipologie di modelli matematici da poter utilizzare per la creazione
del trend. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.17 Esempio di grafico con aggiunta di previsioni. . . . . . . . . . . . . . . . . . . . . . 35
3.1
3.2
3.3
3.4
3.5
3.6
3.7
4.1
4.2
4.3
4.4
4.5
4.6
4.7
4.8
4.9
4.10
4.11
4.12
4.13
4.14
5.1
5.2
5.3
5.4
5.5
5.6
5.7
5.8
5.9
Logo della Banca Mondiale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Il Data Catalog messo a disposizione dalla Banca Mondiale. . . . . . . . .
Schermata relativa al download del dataset, inclusa di impostazioni
di filtraggio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Totalità dei dataset riguardanti il settore finanziario. . . . . . . . . . . . . . . .
Schermata della tabella ottenuta dal download. . . . . . . . . . . . . . . . . . . .
Esempio di Mappa economica, relativa al Prodotto Interno Lordo. . . .
Principali punti comuni relativi allo sviluppo dei Paesi appartenenti
al BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
37
38
Schema di un database oggetto di un lavoro di ETL. . . . . . . . . . . . . . . .
Schema che evidenzia le differenza tra ETL e ELT. . . . . . . . . . . . . . . . .
Schema di esempio di un’operazione di estrazione di dati aziendali. . .
Schema di esempio di un’operazione di estrazione e trasformazione
di dati aziendali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Schema di esempio di un’operazione di estrazione, trasformazione e
caricamento di dati aziendali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabella alla quale non è stata applicata alcuna attività di ETL. . . . . .
Tabella trattata con operazione di rimozione dei campi di non
interesse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabella trasformata con delle operazioni di modifica di dati. . . . . . . . .
Esempio di tabella e di grafico corrispondente. . . . . . . . . . . . . . . . . . . . .
Esempio di tabella trasformata in pivot e di grafico corrispondente. . .
Schermata di come si presenta su Excel il componente aggiuntivo
che consente l’attivazione di Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Tabella pulita, ma non ancora pronta all’operazione di caricamento. .
Tabella pivot pronta ad essere utilizzata per il caricamento. . . . . . . . . .
Schermata di caricamento dei dati su Tableau. . . . . . . . . . . . . . . . . . . . .
49
50
51
Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa
Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa
Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grafico a linee relativo alla situazione inflattiva dei Paesi
Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grafico a linee relativo alla situazione inflattiva dei Paesi Asiatici. . . .
Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Africa. .
Grafico a linee relativo alla situazione inflattiva degli Stati Arabi. . . . .
Grafico a linee relativo alla situazione inflattiva dei Paesi BRICS. . . . .
Grafico a linee relativo alla crescita della moneta in senso ampio dei
Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Grafico a linee relativo alla crescita della moneta in senso ampio dei
Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
39
40
41
46
47
52
53
54
54
55
56
56
56
57
57
58
60
60
61
61
62
62
63
63
64
Elenco delle figure
5.10 Grafico a linee relativo alla crescita della moneta in senso ampio dei
Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.11 Grafico a linee relativo alla crescita della moneta in senso ampio dei
Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.12 Grafico a linee relativo alla crescita della moneta in senso ampio
degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.13 Grafico a linee relativo alla crescita della moneta in senso ampio dei
Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.14 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei
prestiti dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . .
5.15 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei
prestiti dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . .
5.16 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei
prestiti dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.17 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei
prestiti dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.18 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei
prestiti dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.19 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei
prestiti degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.20 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei
prestiti dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.21 Grafico a linee relativo al capitale bancario sul totale delle attività
bancarie dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . .
5.22 Grafico a linee relativo al capitale bancario sul totale delle attività
bancarie dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . .
5.23 Grafico a linee relativo al capitale bancario sul totale delle attività
bancarie dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.24 Grafico a linee relativo al capitale bancario sul totale delle attività
bancarie dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.25 Grafico a linee relativo al capitale bancario sul totale delle attività
bancarie degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.26 Grafico a linee relativo al capitale bancario sul totale delle attività
bancarie dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.27 Grafico a linee relativo al capitale bancario sul totale delle attività
bancarie dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.28 Grafico a linee relativo al tasso di interesse reale dei Paesi
dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.29 Grafico a linee relativo al tasso di interesse reale dei Paesi
dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.30 Grafico a linee relativo al tasso di interesse reale dei Paesi Asiatici. . .
5.31 Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Africa.
5.32 Grafico a linee relativo al tasso di interesse reale dei Paesi
Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.33 Grafico a linee relativo al tasso di interesse reale degli Stati Arabi . . .
5.34 Grafico a linee relativo al tasso di interesse reale dei Paesi BRICS. . . .
XI
64
65
65
66
66
67
67
68
68
69
69
70
70
71
71
72
72
73
73
74
74
75
75
76
76
XII
Elenco delle figure
5.35 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi
dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.36 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi
dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.37 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi
Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.38 Grafico a linee relativo al tasso di interesse sui depositi degli Stati
Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.39 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi
dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.40 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi
Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.41 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi
BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.42 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi
dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.43 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi
dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.44 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi
dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.45 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi
Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.46 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi
Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.47 Grafico a linee relativo al tasso di interesse sui prestiti degli Stati
Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.48 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi
BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.49 Grafico a linee relativo allo spread del tasso di interesse dei Paesi
dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.50 Grafico a linee relativo allo spread del tasso di interesse dei Paesi
dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.51 Grafico a linee relativo allo spread del tasso di interesse dei Paesi
Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.52 Grafico a linee relativo allo spread del tasso di interesse dei Paesi
dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.53 Grafico a linee relativo allo spread del tasso di interesse degli Stati
Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.54 Grafico a linee relativo allo spread del tasso di interesse dei Paesi
Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.55 Grafico a linee relativo allo spread del tasso di interesse dei Paesi
BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.56 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.57 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
77
77
78
78
79
79
80
80
81
81
82
82
83
83
84
84
85
85
86
86
87
87
88
Elenco delle figure
5.58 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.59 Grafico a linee relativo al premio per il rischio sui prestiti degli Stati
Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.60 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5.61 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7.1
7.2
7.3
7.4
7.5
7.6
7.7
7.8
7.9
7.10
7.11
7.12
7.13
7.14
7.15
7.16
7.17
7.18
1
88
89
89
90
Schermata delle opzioni per gestire al meglio le linee di tendenza. . . . . 116
Schermata delle opzioni per gestire al meglio il forecasting. . . . . . . . . . 117
Schermata che descrive i dettagli analitici della trend line
sull’inflazione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
Dashboard che visualizza i risultati di trend e forecasting
sull’inflazione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
Schermata che descrive i dettagli analitici della trend line dei crediti
bancari deteriorati sul totale dei prestiti lordi. . . . . . . . . . . . . . . . . . . . . . 118
Dashboard che visualizza i risultati di trend e forecasting dei crediti
bancari deteriorati sul totale dei prestiti lordi. . . . . . . . . . . . . . . . . . . . . . 119
Schermata che descrive i dettagli analitici della trend line del
capitale bancario sul totale delle attività bancarie. . . . . . . . . . . . . . . . . . 119
Dashboard che visualizza i risultati di trend e forecasting del
capitale bancario sul totale delle attività bancarie. . . . . . . . . . . . . . . . . . 120
Schermata che descrive i dettagli analitici della trend line del
differenziale sul tasso d’interesse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
Dashboard che visualizza i risultati di trend e forecasting del
differenziale sul tasso d’interesse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Schermata che descrive i dettagli analitici della trend line sul tasso
di interesse reale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
Dashboard che visualizza i risultati di trend e forecasting sul tasso
di interesse reale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Schermata che descrive i dettagli analitici della trend line sul tasso
di interesse sui depositi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
Dashboard che visualizza i risultati di trend e forecasting sul tasso
di interesse sui depositi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Schermata che descrive i dettagli analitici della trend line sul tasso
di interesse sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
Dashboard che visualizza i risultati di trend e forecasting sul tasso
di interesse sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Schermata che descrive i dettagli analitici della trend line sul premio
per il rischio sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
Dashboard che visualizza i risultati di trend e forecasting sul premio
per il rischio sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
Introduzione
Il termine “Big Data” è traducibile, letteralmente, con “grandi quantità di dati”. In
realtà, esso riveste un significato più ampio, in quanto si riferisce a diversi ambiti.
Quando si parla di Big Data non si intendono solo i dati, ma anche la loro analisi e
il loro utilizzo, cercando di trovare modelli e algoritmi capaci di trattare cosı̀ tante
variabili in poco tempo e con una quantità adeguata di risorse computazionali. La
rivoluzione dei Big Data presuppone nuove capacità di collegare fra loro le informazioni per fornire un approccio visuale ai dati, suggerendo pattern e modelli di
interpretazione finora inimmaginabili.
La Data Analytics fornisce, dunque, un supporto alle decisioni sulla base di dati
di fatto e non sulla base di intuizioni o decisioni passate. In genere, la Big Data
Analytics viene utilizzata dalle organizzazioni per vari scopi. Ad esempio, in ambito
aziendale, è usata per facilitare la presa di decisioni strategiche; in ambiente scientifico, i risultati ottenuti con la Data Analytics possono essere usati per dimostrare
l’accuratezza delle previsioni e per identificare la causa di determinati fenomeni;
nel settore dei servizi, ad esempio nella Pubblica Amministrazione, la Data Analytics può essere usata per comprendere come mantenere alta la qualità dei servizi
abbassandone i costi. Dunque, visto il supporto che la Big Data Analytics può fornire a livello aziendale, è facile capire come essa sia legata, in generale, al settore
economico e bancario.
In questo determinato campo di utilizzo esiste un’autorità fondamentale per la
gestione di informazioni: la World Bank (WB).
La Banca Mondiale nasce nel 1945 con l’obiettivo di lottare contro la povertà
e organizzare aiuti e finanziamenti ai Paesi in difficoltà. Essa è stata creata principalmente per aiutare Europa e Giappone nella loro ricostruzione dopo la seconda
guerra mondiale. In seguito alla decolonizzazione degli anni sessanta, essa iniziò ad
occuparsi anche dello sviluppo economico dei Paesi dell’Africa, dell’Asia e dell’America Latina. La Banca Mondiale è costituita da due istituzioni internazionali:
la Banca internazionale per la ricostruzione e lo sviluppo (IBRD - International
Bank for Reconstruction and Development) e l’Agenzia internazionale per lo sviluppo (IDA - International Development Association) e fa parte delle istituzioni
specializzate dell’Organizzazione delle Nazioni Unite.
A disposizione degli utenti, tramite il sito di riferimento, è messa un’enorme
quantità di dati sotto forma di Open Data. Il corrispettivo database è composto
4
Introduzione
da un insieme molto ampio di variabili, raggruppate a seconda della materia di
riferimento (finanziaria, sanitaria, infrastrutture, etc.), dell’area geografica e della
periodicità dei dati (annuali, settimanali, giornalieri). Inoltre il Data Catalog contiene tabelle pre-formattate, studi svolti, commenti, e altre informazioni utili ad
ulteriori analisi.
Il dataset della WB è facilmente manipolabile direttamente dal sito. Infatti, esso
consente, seppure in maniera limitata, la creazione di query nocnhè la visualizzazione di tabelle e grafici di diverse tipologie a seconda dei dati di interesse. Esso
comprende inoltre la possibilità di effettuare il download dei dati in vari formati
(XML, CSV, Tabbed TXT, SDMX), anche applicando un filtraggio preventivo, cosı̀
da eliminare le variabili che non saranno utilizzate nello studio.
Questo lavoro di tesi nasce dall’idea di analizzare gli Open Data finanziari della
World Bank, con lo scopo di produrre analisi di tipo descrittivo, diagnostico e
predittivo.
Il lavoro consiste in diverse fasi; la prima fase, denominata ETL, si occupa della
manipolazione dei dati, al fine di renderli “puliti” e ottimizzati per l’elaborazione
sul software di Big Data Analytics. Solo dopo aver effettuato tale operazione, si
procede al caricamento del dataset su Tableau, il leader del mercato nel settore di
Data Analytics e Business Intelligence.
La seconda fase consiste nell’analisi descrittiva, che si occupa di illustrare ciò che
accade e di presentare le informazioni in modo opportuno, servendosi di strumenti di
Business Intelligence e di visualizzazione. In particolare, essa si occupa di analizzare
gli eventi passati, per riassumere e chiarire le dinamiche e le performance delle
metriche di interesse e per ricavarne indicazioni su come approcciarsi alle prossime
attività. Durante questa fase vengono, altresı̀, individuati i dati che si discostano
notevolmente rispetto alla normale tendenza; si parla. in questo caso, di outlier.
La terza fase consiste nell’analisi diagnostica, che si basa sulla ricerca delle cause
che hanno portato lo scenario di interesse alla situazione attuale. Conoscere questo
stato, però, non è sufficiente per comprendere la situazione corrente e adottare strategie mirate; analisi diagnostiche permettono di individuare i motivi di determinate
tendenze o avvenimenti, per valorizzare e ripetere le azioni più efficaci e ottimizzare
le attività che non hanno portato ai risultati previsti.
La quarta e ultima fase consiste nell’analisi predittiva, che si occupa delle previsioni su ciò che accadrà in futuro. Essa permette di migliorare la comprensione
dei dati, contribuendo a prevedere il comportamento dei soggetti principali del case
study. Tale operazione avviene tramite l’utilizzo di opzioni di trending e forecasting,
cioè la creazione di linee di tendenza e linee di previsione, che, attraverso particolari
grandezze statistiche, consentono di impostare in maniera ottimale il sistema per
predire, nel modo più accurato possibile, l’evoluzione dello scenario di riferimento.
Il presente elaborato di tesi è articolato come di seguito specificato:
• Il Capitolo 1 si occupa di illustrare il crescente fenomeno dei Big Data, la descrizione delle caratteristiche e la loro importanza nei diversi contesti applicativi.
• Il Capitolo 2 introduce Tableau, un potente software per la visualizzazione e l’analisi di grandi quantità di dati. Nella trattazione vengono illustrate le principali
caratteristiche e potenzialità di Tableau.
• Il Capitolo 3 ha lo scopo di fornire un’ampia descrizione della sorgente dei dati,
utilizzata in seguito per implementare le analisi.
Introduzione
•
•
•
•
•
5
Il Capitolo 4 ha lo scopo di illustrare una delle operazioni preliminari fondamentali per la realizzazione di uno studio di Big Data Analysis, ovvero l’ETL.
In particolare ci soffermeremo sulle attività di ETL svolte sui dati di nostro
interesse.
Il Capitolo 5 mostra la prima fase di analisi, ovvero la Descriptive Analytics.
Verranno visualizzate, analizzate e descritte le informazioni derivanti dal dataset
oggetto del case study.
Il Capitolo 6 illustra la seconda fase di analisi, ovvero la Diagnostic Analytics. Verranno analizzate tutte le cause, dalle quali derivano gli squilibri visti
nell’analisi descrittiva.
Il Capitolo 7 contiene la terza e ultima fase di analisi, la Predictive Analytics.
Verranno analizzate le linee di tendenza di alcuni Paesi e le relative previsioni
sui diversi indici economici presi in considerazione dal nostro case study.
Il Capitolo 8 ha il compito di trarre le conclusioni relative al lavoro svolto e di
gettare le basi per eventuali progetti futuri.
1
La Big Data Analytics
Questo capitolo illustra il crescente fenomeno dei Big Data e la loro importanza nei
diversi contesti applicativi. Verranno descritte le caratteristiche e, infine, verranno
illustrati i passi principali necessari all’avvio e all’esecuzione di uno studio di Big
Data Analytics.
1.1 I Big Data
Il termine “Big Data” è traducibile letteralmente con “grandi quantità di dati”. In
realtà, esso riveste un significato più ampio, in quanto si riferisce a diversi ambiti.
Quando si parla di Big Data (Figura 1.1) non si intendono solo i dati, ma anche la
loro analisi e il loro utilizzo, cercando di trovare modelli e algoritmi capaci di trattare
cosı̀ tante variabili in poco tempo e con poche risorse computazionali. La rivoluzione
dei Big Data presuppone nuove capacità di collegare fra loro le informazioni per
fornire un approccio visuale ai dati, suggerendo pattern e modelli di interpretazione
finora inimmaginabili.
Figura 1.1. Il mondo dei Big Data
8
1 La Big Data Analytics
Le informazioni sono contenute in dei dataset. Con questo termine intendiamo
delle collezioni di dati correlati tra loro; in altre parole, ogni elemento del dataset
possiede gli stessi attributi o proprietà di tutti gli altri elementi. Esempi di dataset sono i dati memorizzati in file CSV e XML, oppure i dati memorizzati in file
contenuti in cartelle.
1.1.1
Caratteristiche
Affinchè un problema rientri nella categoria dei Big Data, il dataset deve possedere una o più caratteristiche che richiedono un adattamento nella progettazione
e nell’architettura. L’obiettivo è fare analisi di dati al fine di ottenere risultati di
alta qualità e disponibili tempestivamente. I cinque tratti caratteristici dei Big Data
sono noti come le 5 V (Figura 1.2).
Figura 1.2. I cinque tratti che caratterizzano i Big Data
Essi sono:
• Velocità (Figura 1.3); nel contesto dei Big Data i dati possono arrivare a velocità
elevate, ed enormi dataset possono essere accumulati in tempi molto brevi. Ciò
implica che aumenta, anche, il tempo necessario per analizzare i dati. La velocità
dipende, comunque, dal contesto in cui vengono generati i dati.
• Volume; il volume di dati è consistente e sempre in crescita. Grandi moli di
dati implicano diversi metodi di elaborazione e di memorizzazione. Le sorgenti
di imponenti volumi di dati sono transazioni online, esperimenti scientifici e di
ricerca, sensori e social media.
• Varietà; con questo termine si intende la diversità del formato e del tipo di dati
supportati da soluzioni di Big Data. La varietà dei dati implica per l’impresa la
necessità di integrare, trasformare, processare ed immagazzinare i dati.
• Veracità; è un parametro che indica la fedeltà dei dati. In un ambiente con i
Big Data è importante che i dati siano di qualità; in caso contrario, è necessario
avviare dei processi di pulizia per rimuovere i dati non validi e il rumore. Un
dataset contiene, infatti, dati puliti e rumore; quest’ultimo rappresenta dati da
cui non è possibile ricavare informazioni. In genere, i dati ricavati da processi
controllati sono meno rumorosi dei dati acquisiti in modo non controllato. La
1.1 I Big Data
9
Figura 1.3. Dati generati in un minuto da vari social media
•
rumorosità dei dati dipende dalle sorgenti da cui essi provengono. Un’ampia
varietà nei dati significa dover integrare, trasformare ed elaborare gli stessi prima
di poterli analizzare.
Valore; esso definisce quanto i dati siano utili per l’azienda. Il valore è, ovviamente, legato alla veracità dei dati (Figura 1.4); infatti più è alta la fedeltà dei
dati e più cresce il loro valore. Inoltre, il valore dei dati dipende anche dal tempo
richiesto dalla loro elaborazione: più tempo è richiesto, e minore è il valore dei
dati poichè, data l’alta velocità con cui vengono generati gli stessi, più è alto il
tempo di elaborazione e più il risultato ottenuto si riferisce a dati distanti nel
tempo.
Figura 1.4. Andamento del valore in relazione alla veracità e al tempo
I dati che generalmente vengono elaborati dalle soluzioni di Big Data possono
essere generati dall’uomo o dalle macchine; tuttavia, i risultati analitici dell’elaborazione possono essere generati solo da macchine. I dati generati dall’uomo derivano
dell’interazione con dispositivi digitali. I dati generati dalle macchine sono ricavati
da sensori, GPS, database e server. I dati provengono, quindi, da diverse sorgenti, e
ciò si traduce in una forte varietà degli stessi; essi, infatti, possono essere suddivisi in
diverse tipologie: strutturati, non strutturati (Figura 1.5), semi-struttuati e, infine,
metadati.
10
1 La Big Data Analytics
• Dati strutturati ; che sono conformi ad un modello o schema di dati e, spesso,
sono memorizzati sotto forma di tabelle. I dati strutturati consentono di rappresentare relazioni tra diverse entità e possono essere memorizzati, anche, in
database relazionali, per cui è raro che sia necessario creare soluzioni ad hoc per
l’elaborazione e la memorizzazione. I dati strutturati possono essere generati, ad
esempio dai sistemi ERP e CRM.
• Dati non strutturati ; sono dati non conformi a modelli o schemi ed, in genere,
costituiscono l’80% dei dati di qualsiasi organizzazione. Solitamente sono dati che
non hanno una struttura propria e sono memorizzati in file di testo o file binari.
Poichè non hanno una propria struttura, sono memorizzati in DBMS relazionali
sotto forma di BLOB (Binary Large Object), oppure in DBMS NoSQL (NotOnly SQL); questi ultimi sono DBMS non relazionali in cui i dati non devono
necessariamente avere una struttura definita. Esempi di dati non strutturati
sono file video, audio e immagini.
Figura 1.5. Differenza tra tipologie di dati strutturati e non strutturati
• Dati semi-strutturati ; comprendono dati con una certa struttura e una data
consistenza; tuttavia queste ultime non sono cosı̀ ben definite come nel caso
dei DBMS relazionali. In genere, sono dati con struttura gerarchica o a grafo,
memorizzati in file di testo, come i file XML o i file JSON. I dati provenienti da
sensori, RSS feed, fogli elettronici e file EDI sono dati semi-strutturati e, spesso,
richiedono una pre-elaborazione ed una memorizzazione particolari.
• Metadati. Questi sono particolari tipi di dati che forniscono informazioni sulla
struttura e sulle caratteristiche del dataset. In genere, vengono affiancati ai dati
e forniscono informazioni sull’origine degli stessi; tali informazioni possono risultare di fondamentale importanza nella scelta delle tecniche di elaborazione ed
analisi dei dati.
1.2 Principali contesti applicativi
11
1.2 Principali contesti applicativi
L’importanza dei Big Data non deve essere sottovalutata. Essi hanno un impatto
nello studio del comportamento umano simile all’introduzione del microscopio o del
telescopio nei campi della biologia e dell’astronomia, in quanto sono in grado di misurare e prevedere crisi economiche, epidemie, diffusione di opinioni, distribuzione
delle risorse energetiche. I Big Data consentono di capire la società in cui viviamo,
offrono la possibilità di sviluppare nuove tecnologie e modelli matematici per poter estrarre l’effettivo valore e danno la possibilità di perseguire nuovi modelli di
business.
Essi, inoltre portano vantaggi economici alle aziende che hanno deciso di sfruttare l’informazione ottenibile dai dati in loro possesso. Per questo motivo gli investimenti crescenti nei Big Data possono portare a interessanti scoperte in campo
scientifico, ad esempio nella medicina, vantaggi e guadagni nel settore ICT (Information and Communication Technology) e, in contesti Business, nuovi servizi e
opportunità per gli utenti web. Nelle prossime sottosezioni daremo uno sguardo ad
alcuni contesti applicativi che possono beneficiare dei Big Data (figura 1.6).
Figura 1.6. Percentuali dei settori che operano con i Big Data. “Fonte Osservatorio
Big Data Analytics e Business Intelligence della School of Management del Politecnico di
Milano”
1.2.1
Finanza e Business
L’uso diffuso di Personal Computer e tecnologie di rete ha creato grandi repository
elettronici che memorizzano numerose transazioni commerciali. Questi dati possono
essere analizzati per:
•
•
•
definire previsioni sul comportamento degli utenti;
identificare modelli di acquisto di clienti singoli o di gruppi di clienti;
fornire nuovi servizi personalizzati.
12
1 La Big Data Analytics
In campo finanziario, invece, si possono creare piani di investimento e di business grazie a modelli predittivi, oppure è possibile scoprire modelli interessanti e
significativi dai dati aziendali.
I progetti di Big Data analytics possono essere impiegati trasversalmente su tutte
le aree di attività, ma oggi le applicazioni in ambito finanziario a livello internazionale sono prevalentemente solo nel marketing e nella relazioni con la clientela (quasi
il 63% dei progetti). Sono ancora pochi (20%) i progetti che coinvolgono attività
cardine del business bancario e finanziario, come il Risk Management, l’erogazione
di credito o il supporto alle decisioni di investimento.
1.2.2
Istruzione
I nuovi modelli di insegnamento sfruttano le potenzialità dell’informatica e della
tecnologia, combinate con tecniche di analisi dei dati.
L’obiettivo è quello di risolvere le problematiche considerando aspetti pedagogici, meccanismi psicologici e di apprendimento, e, quindi, definire un’istruzione
personalizzata, soddisfacendo le esigenze dei singoli o di gruppi di studenti.
Un altro campo di interesse in questo contesto è l’e-learnig, ovvero l’apprendimento basato sull’uso delle tecnologie multimediali e di Internet, per migliorarne la
qualità e facilitare l’accesso alle risorse e ai servizi. In questo contesto sono definite
due principali tipologie di utenti: learner e learning provider. Nei database vengono
memorizzati tutti i dettagli personali dei learner nonchè le informazioni fornite dai
learning provider.
1.2.3
Settore energetico e dei trasporti
Gli spostamenti delle persone (trasporto pubblico e privato) tra e all’interno delle
aree metropolitane rappresentano uno dei fattori chiave relativamente alla qualità
della vita e coinvolgono una grande varietà e quantità di dati; tra questi citiamo:
•
•
•
•
•
•
i dati relativi all’organizzazione del servizio di treni,tram e autobus;
le informazioni GPS (autobus, taxi, infopoint, etc.);
le informazioni temporanee su interruzioni del traffico;
i dati meteorologici;
i sensori di parcheggio e i servizi di sharing mobility;
gli orari di apertura/chiusura di attività e servizi.
Attraverso l’analisi e la visualizzazione di dati dettagliati della rete stradale,
e mediante l’uso di un modello predittivo, è possibile realizzare un ambiente di
trasporto intelligente.
Per quanto riguarda l’ottimizzazione delle risorse energetiche e il monitoraggio
ambientale, molto importanti sono i dati relativi ai consumi energetici: elettricità,
gas, acqua, emissioni CO2. Appropriate tecniche di analisi e la costruzione di modelli predittivi a partire da questi dati portano a definire strategie intelligenti di
distribuzione dell’energia con l’obiettivo di ridurre i costi e aumentare la qualità
della vita.
1.2 Principali contesti applicativi
1.2.4
13
Medicina
Tra i numerosi campi di applicazione dei Big Data la sanità ricopre un ruolo molto importante. In questo caso l’obiettivo principale è, insieme alla possibilità di
tracciare una mappa sanitaria completa di ogni paziente, quello di sapere, in un
determinato lasso di tempo più o meno lungo, quali saranno, presumibilmente, le
prestazioni sanitarie e i farmaci di cui la popolazione di una data zona avrà bisogno.
Questo permetterebbe di adeguare i servizi al reale e concreto bisogno dei pazienti,
migliorando l’efficenza e riducendo i costi sanitari.
Nella ricerca medica riveste un ruolo importante l’analisi delle sequenze genomiche. La conoscenza dell’intero genoma permette di identificare più facilmente i geni
coinvolti e osservare come questi interagiscono, in particolare nel caso di malattie
complesse come tumori. Questi dati permettono di definire un’ampia base di conoscenza con la quale è possibile effettuare studi predittivi sull’incidenza di alcune
malattie.
I Big Data stanno anche aiutando a combattere la diffusione di epidemie. In
Africa, per esempio, i dati di localizzazione degli smartphone vengono impiegati
per tracciare i movimenti della popolazione e, quindi, prevedere la propagazione del
virus Ebola, dando, inoltre, indicazioni su dove realizzare centri per le cure.
1.2.5
Social Network
Il volume di dati generati dai servizi Internet, dai siti web, dalle applicazioni mobili
e dai social network è grande. Da queste grandi quantità di dati (figura 1.7), raccolti
in particolare attraverso i social network, aziende e ricercatori cercano di prevedere
il comportamento collettivo e analizzare i trend.
Figura 1.7. Panoramica dei principali social network che utilizzano i big data
Ai social network viene applicata la cosiddetta “sentiment analysis”, che si basa sull’ascolto e permette di capire quello che pensano gli utenti su determinate
questioni, senza sollecitazione. Essa è più efficace dei classici sondaggi telefonici, nei
quali, il più delle volte, non vengono date delle risposte sincere. Le applicazioni della
sentiment analysis non si fermano alla politica o ai temi di attualità, ma consentono,
anche, di interpretare il grado di benessere della nostra società.
14
1 La Big Data Analytics
Uno dei social media che sfrutta al meglio il ruolo di dataset è Twitter. Il flusso di
dati costante relativo a tutti i tweet che vengono inviati nel web ha, anche, un suo
nome preciso: firehose (letteralmente “idrante antincendio”). Il fatto che Twitter
fornisca i propri dati in maniera cosı̀ diversa, e seguendo regole precise, lo ha reso
il social media più studiato con approcci che usano algoritmi o altre tecniche di
analisi di tipo informatico. Ad esempio, attraverso il monitoraggio degli hashtag di
Twitter, è possibile identificare dei modelli di influenza.
1.2.6
Sicurezza
I Big Data vengono anche usati nel campo dell’intelligence, della sorveglianza e del
riconoscimento. Le fonti di dati per i sistemi di intelligence sono:
• immagini satellitari;
• comunicazioni intercettate (civili e militari), tra cui voce, e-mail, registri delle
transazioni e altri dati elettronici;
• dati di tracciamento radar;
• dati biometrici (immagini facciali, DNA, impronte digitali, scansioni dell’occhio,
registrazione del portamento);
• dati di sensori (dati meteorologici, oceanografici, riprese di telecamere di sicurezza);
• sorgenti di dominio pubblico e informazioni fornite da aziende e organizzazioni.
L’obiettivo è quello di trovare dei modelli significativi in maniera tempestiva
tra le diverse informazioni provenienti da fonti multiple. Inoltre, è necessario fare
attenzione a non generare dei falsi positivi, in modo che non emergano allarmi
laddove non esistono.
1.3 La Data Analysis e la Data Analytics
La Data Analysis è un processo che verifica la presenza di pattern, relazioni, intuizioni e/o tendenze esaminando i dataset, allo scopo di fornire supporto alle
decisioni.
La Data Analytics è, invece, una disciplina che gestisce il ciclo di vita dei dati
e, dunque, comprende la raccolta, la pulizia, l’organizzazione, la memorizzazione e
l’analisi dei dati grazie a metodi scientifici. La Data Analysis è, quindi, un processo
della Data Analytics, nata, appunto, con lo scopo di fornire alla Data Analysis
dei metodi in grado di lavorare con grandi volumi di dati in ambienti distribuiti e
scalabili.
1.3.1
Categorie di Big Data Analytics
In genere la Big Data Analytics viene utilizzata dalle organizzazioni per vari scopi.
In ambiente aziendale, è usata per abbassare i costi operazionali e per facilitare la
presa di decisioni strategiche; in ambiente scientifico, i risultati ottenuti con la Data
Analytics possono essere usati per dimostrare l’accuratezza delle previsioni identificando la causa di determinati fenomeni; infine, nel settore dei servizi, ad esempio
1.3 La Data Analysis e la Data Analytics
15
nella Pubblica Amministrazione, può essere usata per capire come mantenere alta
la qualità dei servizi abbassandone i costi. Essa fornisce, pertanto, un supporto alle
decisioni sulla base di dati di fatto e non sulla base di intuizioni o decisioni passate.
Ci sono quattro tipologie di Data Analytics:
•
•
•
•
Descriptive analytics;
Diagnostic analytics;
Predictive analytics;
Prescriptive analytics.
A seconda della tipologia vengono adottate diverse tecniche di analisi, variando
quindi, anche i metodi di acquisizione, memorizzazione e elaborazione dei dati in
base ai risultati che si vogliono ottenere (Figura 1.8).
Figura 1.8. Grafico che mostra l’andamento crescente della complessità al variare
dell’analisi da svolgere
Vediamo queste quattro tipologie più nello specifico.
La descriptive analytics riguarda eventi che sono già accaduti, e che vengono
contestualizzati in modo da ricavare informazioni. Domande tipiche sono: “Quante
vendite ci sono state negli ultimi 12 mesi?” oppure “Quanti bambini sono nati
tra il 2000 e il 2010 nelle regioni italiane?”. In genere l’80% delle analisi hanno
natura descrittiva. Come possiamo notare in Figura 1.9, le analisi vengono effettuate
su dati operazionali, memorizzati in sistemi ERP (Enterprise Resourse Planning),
CRM (Customer Relationship Management) oppure OLTP (OnLine Transaction
Processing). I risultati della descriptive analytics vengono visualizzati tramite report
statici o dashboard, col supporto di griglie e grafici.
La diagnostic analytics ha lo scopo di capire quali sono state le cause di eventi
passati. Domande tipiche sono: “Perchè il prodotto X ha venduto meno del prodotto
Y?” oppure “Perchè nello stato A sono aumentati i casi della malattia B negli
16
1 La Big Data Analytics
Figura 1.9. Struttura di un sistema di descriptive analytics
ultimi 15 anni?”. Come mostra la Figura 1.10, la dignostic analytics, in genere,
analizza dati multidimensionali provenienti da diverse sorgenti e gestiti da sistemi
OLAP (On-Line Analytical Processing). I risultati sono ottenuti tramite tool di
visualizzazione interattivi, che consentono di effettuare operazioni di roll-up e drilldown sui dati. Rispetto alla descriptive analytics, la diagnostic analytics richiede
competenze più avanzate, anche a causa della maggiore complessità delle query.
Figura 1.10. Struttura di un sistema di diagnostic analytics
La predictive analytics viene usata per determinare il probabile esito di un evento
futuro. Essa lega, quindi, l’informazione al suo significato, e questa associazione
consente di creare un modello che effettua predizioni sul futuro sulla base di eventi
accaduti nel passato in certe condizioni. Se queste condizioni cambiano, cambia
anche il modello di predizione, poichè la predizione si basa su pattern, trend ed
eccezioni ricavate dai dati. Domande tipiche delle predictive analytics sono: “Se un
cliente ha acquistato i prodotti A e B, qual è la probabilità che acquisti anche il
prodotto C?” oppure “Qual è la probabilità di guarigione per il paziente X se viene
curato col farmaco A piuttosto che con il farmaco B?”. Dalla Figura 1.11 si evince
che la predictive analytics usa grandi dataset sia interni che esterni e varie tecniche
di analisi. I risultati sono visualizzati tramite strumenti statistici con interfaccia
user-friendly.
La prescriptive analytics si basa sui risultati della predictive analytics per consigliare le azioni da intraprendere, focalizzandosi su quale sia la migliore a seconda del
contesto. Per questo motivo la prescriptive analytics viene utilizzata nei casi in cui
bisogna prendere una decisione per ottenere un vantaggio o per ridurre un rischio.
1.4 Pianificazione di uno studio sui Big Data
17
Figura 1.11. Struttura di un sistema di predictive analytics
Domande tipiche sono: “Tra quattro farmaci, quale consente di ottenere i risultati
migliori?” oppure “Qual è il miglior momento per immettere sul mercato un nuovo
prodotto?”. Per ogni query vengono calcolati vari risultati nei diversi contesti ed,
infine, si determina l’azione migliore da intraprendere.
Nella Figura 1.12 vediamo che questo tipo di analisi viene svolta su dati provenienti da sorgenti interne (dati su vendite, informazioni sui consumatori, sui prodotti, etc.) ed esterne (dati da social media, dati demografici, previsioni meteo, etc.).
Anche in questo caso i risultati sono visualizzati tramite strumenti statistici con
interfaccia user-friendly.
Figura 1.12. Struttura di un sistema di prescriptive analytics
Come si nota dalla descrizione dei diversi tipi di analisi, ciascuna ha un livello
di complessità e un valore diverso; entrambi crescono dall’analisi descrittiva fino a
quella prescrittiva. Essere in grado di conoscere le azioni da compiere, date alcune
circostanze, in un tempo futuro, è il più grande valore che lo studio dei Big Data
può darci.
1.4 Pianificazione di uno studio sui Big Data
Come già detto, l’adozione di tecniche di Big Data è utile per consentire alle aziende
di pianificare al meglio nuove strategie, e può contribuire a cambiamenti per lo più
innovativi. Le attività di trasformazione sono, in genere, a basso rischio e mirano ad
aumentare l’efficienza dei processi aziendali. Le attività innovative, invece, vanno
ad alterare le dinamiche aziendali, dai prodotti ai servizi e, dunque, richiedono,
18
1 La Big Data Analytics
una maggiore apertura mentale. Tale cambiamento è reso possibile dall’adozione di
approcci basati sui Big Data.
L’uso di tecniche proprie dei Big Data non è immediato, ed è necessario pianificare fin dall’inizio lo studio da intraprendere, anche a causa dei problemi che
potrebbero insorgere. Un’analisi basata su Big Data inizia con la definizione del
business case e finisce quando i risultati analitici consentono all’azienda di ricavarne il massimo valore. Prima di svolgere le analisi, i dati devono essere identificati,
procurati, filtrati, estratti, puliti e aggregati.
1.4.1
Analisi e acquisizione dei dati
Per poter effettuare delle analisi sui dati, le organizzazioni devono possedere degli
strumenti di gestione degli stessi; il personale che utilizzerà le soluzioni di Big Data
deve avere delle abilità specifiche, e la qualità dei dati da analizzare deve essere
valutata adeguatamente. Infatti dati non validi, vecchi o poveri sono di bassa qualità e non possono che produrre risultati di bassa qualità, nonostante l’adozione di
tecniche di Big Data.
Potrebbero essere necessari dei fondi per recuperare dati esterni, anche se alcune
tipologie di dati sono gratuiti, come quelli forniti dalla Pubblica Amministrazione,
dati geografici, dati finanziari. I dati potrebbero contenere delle informazioni confidenziali, di aziende o di individui, per cui è necessario analizzare i dataset e separare
le informazioni confidenziali, in modo da evitare l’eventuale violazione di leggi sulla
privacy.
Un fattore fondamentale per lo studio riguarda la sicurezza. Questa, nel contesto
dei Big Data, è garantita da diversi livelli di accesso a seconda degli utenti, grazie a
meccanismi di autenticazione e di autorizzazione. Le informazioni sulla provenienza
dei dati contengono notizie sulle sorgenti e su come i dati sono stati elaborati. In
altre parole, esse forniscono informazioni sull’autenticità e la qualità dei dati, anche
se l’acquisizione, la combinazione e la memorizzazione dei dati stessi attraverso più
processi (Figura 1.13) può rendere complesso il mantenimento delle informazioni di
provenienza.
Figura 1.13. Fasi che riguardano la memorizzazione delle informazioni sulla provenienza
del dato
1.4 Pianificazione di uno studio sui Big Data
19
Per venire incontro a esigenze riguardanti grandi quantità di memoria è possibile
utilizzare il cloud computing, cioè un insieme di servizi che vengono erogati in hosting in Rete. L’innovazione apportata da questa tecnologia consiste nella possibilità
di accedere a risorse facilmente configurabili secondo le proprie esigenze e accessibili direttamente da Internet e, quindi, di usare infrastrutture, capacità di calcolo
e di memoria fornite da questi sistemi ed implementare soluzioni di Big Data per
svolgere processi su larga scala.
In genere, l’uso del cloud computing a supporto dei Big Data è giustificabile nel
caso in cui le risorse proprietarie siano insufficienti e non siano disponibili risorse
finanziare per migliorarle, nel caso in cui i dati da analizzare si trovino già sul cloud
o nel caso in cui il progetto di analisi deve essere isolato rispetto al resto dei processi
aziendali, in modo da non influenzarli.
1.4.2
Big Data Analytics Lifecycle
Come mostrato in Figura 1.14, la Big Data Analytics ha un ciclo di vita composto
da nove fasi:
1.
2.
3.
4.
5.
6.
7.
8.
9.
valutazione del business case;
identificazione dei dataset;
acquisizione e filtraggio dei dati;
estrazione dei dati;
convalida e pulizia dei dati;
unione e rappresentazione dei dati;
analisi dei dati;
visualizzazione dei dati;
utilizzo dei risultati di analisi.
Figura 1.14. Le nove fasi che compongono il ciclo di vita della Big Data Analytics
20
1 La Big Data Analytics
Nel seguito di questa sezione vedremo più in dettaglio ciascuna di queste fasi.
La prima fase consiste nella valutazione del business case, che deve essere ben
definito e deve contenere le motivazioni e gli obiettivi da ottenere dall’analisi. Tale
procedimento deve essere creato, valutato e approvato prima dell’inizio della prima
fase, in modo da capire quali risorse aziendali usare e quali sfide dovranno essere
affrontate durante il progetto. Inoltre, la definizione di un parametro capace di
misurare le prestazioni aiuta a valutare la bontà dei risultati delle analisi. Affinchè
i problemi siano classificabili come problemi di Big Data, essi devono possedere
una delle caratteristiche dei Big Data stessi, ossia volume, velocità o varietà. Un
risultato di questa fase è l’identificazione del budget richiesto per eseguire il progetto
di analisi; infatti, ogni acquisto deve essere preventivato in modo da essere pesato
rispetto ai benefici che si stima di ottenere dal raggiungimento degli obiettivi.
La seconda fase è costituita dall’identificazione dei dataset necessari per il proseguimento delle analisi. Identificare sorgenti di dati molto variabili aumenta la
probabilità di trovare pattern nascosti e correlazioni tra dati. I dati possono essere
interni e/o esterni, a seconda dei problemi aziendali e dello scopo delle analisi da condurre. In genere i dati interni provengono da data warehouse e sistemi operazionali,
mentre i dati esterni possono essere dati di mercato e pubblicità.
La terza fase prevede l’acquisizione e il filtraggio dei dati provenienti dalle sorgenti identificate al passo precedente. Dei filtri automatici rimuovono i dati corrotti,
che non hanno valore per l’analisi. In genere, i dati corrotti sono costituiti da valori
mancanti, non significativi o non validi. Durante questa fase è possibile affiancare
ai dati, sia interni che esterni, i metadati, in modo da mantenere informazioni sulla
sorgente dei dati, sulla loro struttura ed, eventualmente, su una loro classificazione.
La quarta fase consiste nell’estrazione dei dati per trasformarli e renderli compatibili con i formati previsti dalle soluzioni di Big Data. Questa fase è molto legata
agli strumenti di Big Data utilizzati; ad esempio, in alcuni casi, non è necessario
effettuare operazioni di selezione di campi se il tool di analisi è in grado di effettuare
in seguito questa operazione.
La quinta fase prevede la convalida e la pulizia dei dati in modo approfondito.
Infatti, dati non validi possono falsificare i risultati delle analisi e inoltre, avere dati
da diversi dataset può portare a ridondanza, che può essere sfruttata per capire
le interconnessioni tra dataset e per completare i dati mancanti. Le operazioni di
questa fase possono essere effettuate tramite operazioni di estrazione, trasformazione
e caricamento offline, nel caso di analisi non in realtime. In caso contrario, i dati
devono essere validati e puliti non appena arrivano dalla sorgente.
La sesta fase consiste nell’aggregazione e nella rappresentazione dei dati, integrando vari dataset tramite campi in comune in modo da avere una vista unificata
dei dati. Potrebbero esserci differenze nella struttura e nella semantica dei dati, risolvibili tramite una logica complessa eseguita automaticamente senza bisogno che
ci sia l’intervento umano.
La settima fase è quella di analisi dei dati, in cui vengono svolti i compiti di
analisi. Questa fase ha natura iterativa, soprattutto se l’analisi è esplorativa e mira
a scoprire correlazioni o pattern. I risultati di questa fase possono essere ottenuti da
semplici interrogazioni sui dataset oppure da una combinazione di tecniche di data
mining e analisi statistiche complesse. Vi sono due tipologie di risultati: confermativi, nel caso in cui si usa un approccio deduttivo per capire le cause dei fenomeni
1.4 Pianificazione di uno studio sui Big Data
21
con l’obiettivo di affermare o negare l’ipotesi e di fornire una risposta definitiva ad
una specifica domanda; esplorativi, nel caso in cui si usa un approccio induttivo
strettamente legato al data mining; in questo caso non vengono formulate ipotesi e
i dati vengono semplicemente analizzati per scoprire le cause dei fenomeni. Anche se
non fornisce risposte definitive, questo tipo di analisi consente di scoprire facilmente
pattern e anomalie.
L’ottava fase consiste nella visualizzazione dei dati tramite tecniche e tool che
espongono graficamente i risultati delle analisi, in modo che siano comprensibili per
ottenere risposte a domande su questioni aziendali. Lo stesso risultato può essere
presentato, e quindi interpretato, in molti modi diversi.
La nona e ultima fase è quella di utilizzo dei risultati di analisi ed è dedicata
a determinare come e dove i dati elaborati possono essere ulteriormente sfruttati.
Infatti, l’analisi dei dati può portare a trovare pattern e relazioni tra dati prima
ignote; da ciò può scaturire la realizzazione di un nuovo processo di business o di
un nuovo sistema.
2
Tableau
Questo capitolo introduce Tableau, un potente software per la visualizzazione e l’analisi di grandi quantità di dati. Nella trattazione vengono illustrate le principali caratteristiche e potenzialità di Tableau, tra cui la possibiltà di aggiungere filtri, creare
previsioni e presentazioni accattivanti. Inoltre, sono descritti alcuni degli innumerevoli grafici che Tableau mette a disposizione per una visualizzazione personalizzata
dei dati.
2.1 Descrizione dell’applicazione
Tableau è un software realizzato dalla compagnia americana Tableau Software (Figura 2.1), specializzata nella creazione di prodotti di visualizzazione di dati basati
sulla Business Intelligence.
Figura 2.1. Il logo dell’azienda Tableau Software.
Il prodotto è disponibile in diverse varianti (Figura 2.2): Tableau Desktop, che
permette di realizzare e visualizzare dashboard interattive, Tableau Server, che permette di condividere le dashboard realizzate tramite Tableau Desktop con altri utenti e Tableau Online, che corrisponde alla versione cloud di Tableau Server. Inoltre, è
disponibile una versione aggiuntiva, chiamata Tableau Public, che equivale ad una
versione gratuita e pubblica di Tableau Server. Nel capitolo focalizzeremo l’attenzione su Tableau Desktop, un potente software di analisi dei dati che permette,
tramite un’intuitiva interfaccia grafica, di connettersi a numerosi tipi di sorgenti, e
24
2 Tableau
Figura 2.2. Le diverse varianti della piattaforma Tableau.
di realizzare l’analisi dei dati in maniera estremamente semplice e veloce, attraverso
una grafica accattivante.
Tableau può collegarsi a:
• file system: CSV, Excel, etc. ;
• sistemi relazionali : Oracle, SQL Server, DB2, etc. ;
• sistemi cloud : Windows Azure, Google BigQuery, etc.
La funzione Live Connect viene utilizzata per l’analisi dei dati in tempo reale.
In questo modo le ultime modifiche si riflettono sul risultato dell’analisi.
Tableau può anche elaborare dati in memoria memorizzandoli in cache, e non
essere più collegato alla sorgente durante l’analisi dei dati. Naturalmente ci sarà un
limite alla quantità di dati memorizzati nella cache a seconda della disponibilità di
memoria.
Tableau può collegarsi contemporaneamente a diverse fonti di dati. Per esempio,
in una singola cartella di lavoro, è possibile connettersi a un file non strutturato e
ad una fonte di dati relazionale, definendo connessioni multiple. Questa operazione
di fusione dei dati è una caratteristica unica in Tableau.
2.1.1
Caratteristiche del software
La caratteristica di Tableau, come sottolineato in precedenza, è la sua interfaccia
funzionante tramite il meccanismo di “Drag-and-Drop”, ovvero una successione di
tre azioni consistenti nel selezionare un oggetto e trascinarlo in un’altra posizione in
cui viene rilasciato (letteralmente, il termine vene tradotto con “trascina e rilascia”).
Tableau può essere utilizzato da qualsiasi tipologia di utente. Infatti, grazie alla sua
semplicità e velocità di analisi, chiunque può esplorare e analizzare i dati, utilizzando
strumenti visivi come colori, linee di tendenza, diagrammi e grafici. Tableau ha
una varietà molto ampia di opzioni di formattazione per modificare l’aspetto delle
visualizzazioni create. È possibile modificare quasi ogni aspetto: in particolare è
possibile scegliere il carattere desiderato, modificare l’orientamento e il formato
degli assi, il colore e lo sfondo, nonchè i bordi, l’allineamento e l’ombreggiatura.
Tableau, inoltre, offre la possibilità di creare una visualizzazione personalizzata
dei dati, estendendo le normali visualizzazioni con alcune caratteristiche aggiuntive,
in modo da creare diversi tipi di grafici per gli stessi dati. Ad esempio, è possibile
effettuare operazioni di Drill-Down, in maniera tale da visualizzare i dati ad un
livello di granularità più fine, e di Roll-Up, che al contrario consente di visualizzare
i dati ad un livello di dettaglio minore.
2.1 Descrizione dell’applicazione
25
Un’altra caratteristica molto importante di Tableau è l’ordinamento dei dati dimensionali. Ci sono due modi con cui Tableau svolge tale attività; in particolare,
attraverso l’ordinamento automatico è possibile scegliere un ordinamento ascendente o discendente; in alternativa è possibile effettuare l’ordinamento in maniera
manuale.
2.1.2
Creazione di un foglio di lavoro
La pagina iniziale di Tableau mostra le varie fonti di dati a cui è possibile connettersi.
Sotto l’intestazione “Connect” sono presenti delle opzioni per scegliere un file, un
server o una fonte di dati salvati. Nel caso in cui vengono aperti più schemi di dati,
Tableau esegue l’operazione di Inner Join sugli attributi che hanno nome uguale.
Tuttavia, è possibile modificare le impostazioni predefinite scegliendo la tipologia
di join desiderata. Tableau mette a disposizione Inner Join, Left Join, Right Join
e Full Outer Join. Per visualizzare il foglio di lavoro occorre selezionare la scheda
“Sheet” che appare nella barra inferiore. Una volta aperto il foglio di lavoro, a
destra, vengono visualizzate le dimensioni, ovvero i dati descrittivi, e le misure, che,
invece, sono i dati numerici.
Il foglio di lavoro (worksheet) è l’area in cui si lavora per l’analisi dei dati, creando grafici, effettuando calcoli e descrizioni. Per impostazione predefinita Tableau
fornisce tre fogli di lavoro vuoti (Figura 2.3) quando si è stabilita una connessione alla sorgente dati (offline o online). Possiamo aggiungere più fogli di lavoro per
visualizzare nella stessa schermata i diversi lavori.
Figura 2.3. La schermata del foglio di lavoro vuoto.
Per la creazione di un grafico è sufficiente trascinare dimensioni e misure all’interno dei campi “righe” e “colonne”. Automaticamente sarà generato un grafico
attraverso il quale è possibile visualizzare l’andamento dei dati dimensionali rispetto
a quelli numerici.
26
2 Tableau
2.1.3
Tipi di grafici
Visto come strumento di visualizzazione avanzata dei dati, Tableau mette a disposizione svariate tipologie di grafici, fornendo tecniche di analisi senza la necessità di
scrivere codice personalizzato. Ogni volta che viene creato un foglio di lavoro, sono
disponibili, nel campo “Show me”, alcuni dei grafici possibili (Figura 2.4), in base
alla natura dei dati selezionati.
Figura 2.4. L’elenco dei grafici ottenibili, visualizzato nel campo “Show Me”.
I dati possono essere visualizzati attraverso diverse tipologie di grafici, ovvero:
• Grafico a torta; esso permette di rappresentare i dati all’interno di un cerchio,
suddiviso in fette di diverse dimensioni e colori. Anche in questo caso occorre
trascinare almeno una dimensione e una misura sui campi “righe” e “colonne”,
per la creazione del grafico. All’interno del campo “Marks” è possibile modificare
il colore e la dimensione delle fette a seconda dei dati.
• Grafico a barre; esso permette di rappresentare i dati attraverso delle barre
rettangolari la cui lunghezza risulta essere proporzionale al valore della variabile.
Tableau produce automaticamente un grafico a barre ogni volta che si trascina
una dimensione nel campo “righe” e una misura nel campo “colonne”, o viceversa. Inoltre è possibile applicare una gamma di colori alle barre in base al
valore che assumono i dati. Ad esempio, è possibile attribuire tonalità più scure
alle barre più lunghe, e tonalità più chiare alle barre più corte. Per fare questo,
è necessario trascinare la misura desiderata all’interno del riquadro “Marks” e
attribuire ad essa un colore.
• Grafico a linee; per utilizzare questo tipo di rappresentazione sono necessarie
una misura e una dimensione, i cui valori sono associati ai due assi del grafico
(Figura 2.5). Ogni coppia di valori fornisce un punto nel grafico per ciascuna
osservazione. L’unione di tutti i punti contribuisce a creare una linea che mostra
la variazione, o il rapporto, tra le dimensioni e le misure scelte.
2.1 Descrizione dell’applicazione
27
Figura 2.5. Esempio di grafico a linee.
•
Grafico a bolle; esso consente la visualizzazione dei dati attraverso un raggruppamento di cerchi (Figura 2.6). Ciascuno dei valori descrittivi rappresenta un
cerchio, mentre i valori di misura rappresentano le dimensioni di tali cerchi.
Poichè i campi non devono essere disposti su righe o su colonne, è sufficiente
trascinare i valori coinvolti all’interno della sezione “Marks”.
Figura 2.6. Esempio di grafico a bolle.
•
Grafico di movimento; questa tipologia mostra i cambiamenti nel tempo dei dati,
attraverso il movimento di punti all’interno dello spazio definito dagli assi cartesiani. Per effettuare ciò è necessario avere una dimensione temporale all’interno
del campo “righe” o “colonne”; a seguito di ciò, effettuando un’operazione di
drill-down, è necessario ricavare una dimensione a granularità più fine, che deve
essere trascinata all’interno del campo “Pages”. Successivamente, nella sezione
“Show History”, è sufficiente selezionare il tasto “play” per visualizzare come
sono variati i dati all’interno di un intervallo temporale. Ad esempio, è possibile
visualizzare come sono cambiati i profitti di un’azienda, simultaneamente, ad
ogni mese, per tutti gli anni.
28
2 Tableau
• Mappa; essa può essere creata quando, ogni volta che viene aperto un foglio di
lavoro, vengono automaticamente generate le coordinate geografiche, ovvero latitudine e longitudine. Le mappe possono essere costruite a partire dalla presenza
di dati geografici (Figura 2.7). Occorre assegnare un ruolo geografico a ciascun
valore; a seguito di questa operazione, trascinando il dato nel campo “Marks”,
vengono inserite, rispettivamente, sulle righe e sulle colonne, latitudine e longitudine. In questo modo viene creata la mappa dell’intero pianeta, e, attraverso
sfumature di colori o punti, vengono visualizzati i dati delle zone desiderate.
Figura 2.7. Esempio di grafico a mappa.
Tableau ha la capacità di individuare paesi, stati, regioni, città, e persino codici postali, per costruire mappe dettagliate. Un’applicazione molto comune di
questo tipo di grafico consiste nel mostrare le attività sismiche che sono state
segnalate nel corso del tempo, il loro livello di intensità, e, conseguentemente, le
zone a rischio, attraverso statistiche e analisi predittive.
• Mappa ad albero; essa visualizza i dati in rettangoli annidati. Le dimensioni,
come nel caso del grafico a bolle, servono per definire la struttura della mappa
dell’albero, mentre le misure consentono di definire il formato o il colore del
singolo rettangolo. Una mappa ad albero viene creata associando una o più
dimensioni ad una o due misure.
• Diagramma di Gantt; tale diagramma mostra l’avanzamento del valore di un’attività per un periodo di tempo (Figura 2.8). Esso, quindi, richiede una dimensione temporale e almeno una dimensione. In aggiunta a questi dati possono essere
inserite anche una o due misure.
2.2 Calcoli in Tableau
Per creare le visualizzazioni, oltre al meccanismo di Drag-and-drop, Tableau offre,
agli utenti più esperti, la possibilità di effettuare query più complesse, mettendo a
disposizione una grande varietà di operatori, e consentendo la creazione di fogli di
calcolo.
2.2 Calcoli in Tableau
29
Figura 2.8. Esempio di diagramma di Gantt.
2.2.1
Operatori
Tableau dispone di un certo numero di operatori, utilizzati per creare campi di
calcolo e formule. Gli operatori possono essere suddivisi nelle seguenti categorie:
•
•
•
•
Operatori generali ; questi comprendono le operazioni di addizione e sottrazione.
L’addizione consente di sommare valori numerici, concatenare due stringhe e
aggiungere giorni alle date. La sottrazione consente di sottrarre valori numerici
e sottrarre giorni alle date.
Operatori aritmetici ; essi agiscono solo sui dati numerici e comprendono le
operazioni di moltiplicazione, divisione, modulo e potenza.
Operatori relazionali ; questi vengono usati all’interno di espressioni per confrontare numeri, date o stringhe; essi restituiscono un valore booleano (vero o
falso).
Operatori logici ; essi sono utilizzati in espressioni il cui risultato è un booleano
e, a loro volta, restituiscono un valore booleano.
2.2.2
Creazione di un campo di calcolo
Per creare un campo di calcolo occorre selezionare “Create Calculated Field” dalla
voce “Analysis” che compare nel menù. Si aprirà un editor di calcolo che elenca
tutte le funzioni disponibili in Tableau (Figura 2.9) .
Una volta scritta la formula, basta trascinare il campo creato sulle righe o sulle
colonne, analogamente a quanto avviene per le misure e le dimensioni.
Oltre alle espressioni più complesse, Tableau consente di aggiungere dei calcoli
che vengono applicati ai valori dell’intera tabella, poichè alcune operazioni non
possono essere eseguite solo su alcune righe selezionate. Percentuali, differenze e
medie mobili sono solo alcune delle opzioni che possono essere applicate alle misure.
Le operazioni da svolgere per questo tipo di calcolo sono le seguenti:
30
2 Tableau
Figura 2.9. L’editor di calcolo in Tableau.
1. selezionare la misura su cui deve essere applicato il calcolo e trascinarlo sulle
righe o sulle colonne;
2. fare click con il tasto destro del mouse sulla misura e scegliere l’opzione “Quick
Table Calculation”;
3. scegliere una delle opzioni da applicare alla misura.
2.2.3
Espressioni LOD
Con il termine “LOD” intendiamo il livello di dettaglio delle espressioni (Level of
Detail) in Tableau. Essi sono utilizzati per eseguire query complesse, che coinvolgono
molte dimensioni. Un semplice esempio è l’aggiunta di una dimensione per un valore
aggregato già calcolato.
Esistono tre tipi di espressioni LOD:
• l’espressione “FIXED” seleziona i valori utilizzando le dimensioni specificate,
senza riferimento ad eventuali altre dimensioni;
• l’espressione “INCLUDE” consente di aggiungere dimensioni oltre a quelle già
presenti nella visualizzazione;
• l’espressione “EXCLUDE” consente di sottrarre dimensioni dal livello di visualizzazione dei dettagli.
2.3 Ulteriori funzioni
Tableau Desktop, in qualità di prodotto utilizzato per individuare i trend e le opportunità, nonchè per prendere decisioni, consente di creare presentazioni interattive.
Oltre alla creazione di dashboard e storie, è possibile trascinare, all’interno del grafico, delle linee di riferimento, effettuare previsioni ed applicare filtri. Nelle prossime
sezioni esamineremo queste funzionalità del software.
2.3 Ulteriori funzioni
2.3.1
31
Filtri
Il filtraggio è il processo di rimozione di alcuni valori o di un intervallo di valori
da un set di risultati. I filtri vengono creati, in maniera molto semplice e intuitiva
(Figura 2.10), trascinando il campo richiesto nello spazio “Filtri”, che si trova sopra
la scheda “Marks”.
Figura 2.10. La schermata di creazione filtri.
Ci sono tre tipi di filtri di base disponibili in Tableau:
•
•
•
filtri per le dimensioni, che comprendono il filtraggio in base a categorie di testo
o valori numerici con espressioni logiche regolate da eventuali condizioni;
filtri per le misure, utilizzati, appunto, per filtrare particolari tipi di operazioni
e calcoli basati su campi di misure;
filtri per le date, necessari se si vuole restringere il range di date da visualizzare,
o per soffermarsi su particolari anni ed eventi.
A sua volta, Tableau offre i seguenti tipi di filtri per le misure (Figura 2.11):
•
•
•
•
Range of values; consente di specificare i valori minimo e massimo da includere
nella visualizzazione;
At least; include tutti i valori che sono maggiori o uguali a un valore minimo
specificato;
At most; consente di includere tutti i valori che sono inferiori o uguali a un valore
massimo specificato;
Special ; è una particolare tipologia che consente di effettuare filtraggi che coinvolgono i valori NULL. Permette di includere solo i valori nulli, solo i valori non
nulli, o tutti i valori.
Molti tipi di filtro sono rapidamente disponibili selezionando, con il tasto destro
del mouse, la dimensione o la misura di interesse. Questi filtri, noti come filtri
rapidi, possiedono un numero di funzionalità sufficiente per soddisfare la maggior
parte delle esigenze di filtraggio comuni.
32
2 Tableau
Figura 2.11. Le diverse tipologie di filtri per le misure.
Ci possono essere situazioni in cui è necessario che un secondo filtro venga applicato solo sui risultati restituiti da un primo filtro. In questo caso il secondo filtro
è noto come filtro dipendente, in quanto elabora solo i dati che passano attraverso
il primo filtro.
Queste tipologie di filtri sono usate per migliorare le prestazioni, ad esempio
quando si dispone di una grande quantità di dati che rallenta l’esecuzione delle
query.
Un’altra opzione è quella del cosiddetto “Top Filtro” (Figura 2.12), che viene utilizzata per limitare il set di risultati. I Top Filtri possono essere applicati
spuntando i campi da escludere, oppure tramite l’uso di apposite formule.
Figura 2.12. Le diverse tipologie di filtri per le misure.
I filtri possono essere eliminati scegliendo l’opzione “Clear Filter”.
2.3 Ulteriori funzioni
2.3.2
33
Creazione di una dashboard
Una dashboard (Figura 2.13) è una visualizzazione di molti fogli di lavoro all’interno
di un unico foglio. Questo tipo di visualizzazione viene usato per confrontare e
monitorare svariati dati simultaneamente.
Figura 2.13. Esempio di Dashboard.
Quando vengono create delle dashboard, queste vengono mostrate come schede
nella parte inferiore della cartella di lavoro e vengono automaticamente aggiornate
con i dati più recenti quando si modifica il foglio di lavoro. Per aggiungere dei fogli
di lavoro ad una dashboard basta trascinarli nella posizione desiderata.
Alla visualizzazione è possibile aggiungere molti oggetti di supporto, come le
aree di testo, le pagine web e le immagini.
2.3.3
Creazione di una storia
Una storia è una presentazione che contiene una sequenza di fogli di lavoro o
dashboard (Figura 2.14), utilizzata per trasmettere informazioni e visualizzare le
variazioni dei dati.
Figura 2.14. Esempio di storia.
34
2 Tableau
Grazie a questa funzionalità è possibile mostrare come i dati siano tra loro
collegati, fornire risultati ed esporre decisioni. Per creare una storia è necessario
selezionare la voce “New story”. Attraverso la sezione “New blank point” vengono
aggiunti tutti i fogli di lavoro che, nel loro insieme, comporranno la storia. Una volta
che la storia viene creata, è possibile ad essa assegnare un titolo e aggiungere una
breve didascalia per ogni foglio di lavoro. Per presentare una storia, basta passare
alla modalità di presentazione dalla barra degli strumenti.
2.3.4
Trend
Il trend (Figura 2.15), o linee di tendenza, viene utilizzato per prevedere il proseguimento di alcuni andamenti di una variabile. I trend, inoltre, contribuiscono
a identificare la correlazione tra due variabili, osservando simultaneamente l’andamento di entrambe. Tableau necessita della presenza di una dimensione temporale
e di un campo di misura per creare una linea di tendenza.
Figura 2.15. Esempio di grafico con linee di tendenza.
Ci sono molti modelli matematici per stabilire le linee di tendenza. Tableau offre
quattro opzioni(Figura 2.16): lineare, logaritmico, esponenziale e polinomiale.
Figura 2.16. Tipologie di modelli matematici da poter utilizzare per la creazione del
trend.
È possibile, anche, ottenere una descrizione più dettagliata facendo click con
il tasto destro del mouse all’interno del grafico e selezionando l’opzione “Describe
Trend Line”; essa permette di mostrare i coefficienti e l’equazione matematica che
indica la correlazione tra i diversi campi d’interesse. Questi dettagli possono essere
copiati negli appunti e sottoposti ad ulteriore analisi.
2.4 Salvataggio dei dati
2.3.5
35
Previsioni
Una funzionalità molto interessante di Tableau è quella che consente di creare delle
previsioni (Figura 2.17), ovvero di prevedere il valore futuro di una misura.
Le previsioni sono uno strumento molto utile, in quanto, sulla base di queste, molto spesso vengono prese decisioni importanti, ad esempio sul futuro di
un’azienda, o in qualunque altro campo applicativo.
Ci sono molti modelli matematici di previsione. Tableau utilizza il modello conosciuto come livellamento esponenziale. Attraverso il livellamento esponenziale viene
dato più peso alle osservazioni recenti e meno peso a quelle più remote.
Affinchè venga creata una previsione, è necessario avere una dimensione temporale e un campo di misura. Bisogna spostarsi nella sezione “Analytics” e trascinare il
campo “Forecast” all’interno del grafico. Automaticamente verrà aggiunta al grafico
una predizione, calcolata sui prossimi due anni. Tuttavia è possibile personalizzare
la previsione, scegliendo l’intervallo temporale desiderato, anche escludendo alcuni
periodi temporali, attraverso il campo “Forecast Options”. Per visualizzare i dettagli
della previsione è sufficiente selezionare la voce “Describe Forecast”.
Figura 2.17. Esempio di grafico con aggiunta di previsioni.
2.4 Salvataggio dei dati
Il risultato di analisi dei dati in Tableau può essere salvato in vari formati per poi
essere distribuito.
Questi diversi tipi di file sono identificati da diverse estensioni. I loro formati
dipendono dal modo in cui i dati vengono prodotti e dallo scopo per cui vengono
utilizzati. Essi sono tutti memorizzati come file XML che possono essere aperti e
modificati.
La descrizione di ogni tipo di file e del rispettivo utilizzo è la seguente:
36
2 Tableau
• Tableau Workbook (.twb): contiene informazioni su ciascun foglio e cruscotto presenti in una cartella di lavoro. Esso contiene anche le informazioni di
connessione all’origine dei dati nonchè tutte le informazioni create per quella
connessione.
• Tableau Packaged Workbook (.twbx): contiene i dettagli di lavoro, nonchè i dati
utilizzati nell’analisi. Il suo scopo è quello di condividere con altri utenti i risultati
dell’analisi.
• Tableau Data source(.tds): memorizza i dettagli della connessione utilizzata per
creare i report.
• Tableau Packaged Data source (.tdsx): è simile al file con estensione .tds, ma
con l’aggiunta di dati relativi ai dettagli sulla connessione.
• Tableau Data Extract (.tde): contiene i dati utilizzati in un file .twb altamente
compressi. Questo aiuta l’ottimizzazione dello storage e dei calcoli che vengono
applicati nell’analisi.
• Tableau Bookmark (.tbm): contiene un unico foglio di lavoro che viene condiviso
facilmente per essere copiato in altre cartelle di lavoro.
• Tableau Preferences (.tps): memorizza la preferenza di colore utilizzato in tutte
le cartelle di lavoro. Viene utilizzato principalmente per ottenere un aspetto
uniforme tra gli utenti.
3
Descrizione dei dati a disposizione
Questo capitolo ha lo scopo di fornire un’ampia descrizione della sorgente dei dati,
utilizzata in seguito per implementare le analisi. In particolare, verranno illustrati i
componenti del dataset oggetto del case study.
3.1 Sorgente dei dati
Il nostro obbiettivo è quello di fornire diversi tipi di analisi, riguardanti principalmente dati di natura finanziaria, provenienti dall’Istituto Mondiale Bancario (WB
- World Bank, Figura 3.1).
Figura 3.1. Logo della Banca Mondiale.
La WB è formalmente un’Agenzia specializzata delle Nazioni Unite, con l’obiettivo di lottare contro la povertà e organizzare aiuti e finanziamenti agli stati in
difficoltà.
A differenza del sistema ONU, il sistema di voto in seno alla WB è ponderato sulla base della quote di capitale versate dai suoi membri/azionisti; l’azionista
maggioritario è il governo degli Stati Uniti d’America.
La normativa sull’accesso alle informazioni, varata il 1 luglio 2010, è un punto di
riferimento della politica informativa adottata dalla Banca Mondiale. A disposizione
degli utenti, infatti, tramite il sito di riferimento, è messa un’enorme quantità di dato
sotto forma di Open Data. Il corrispettivo database è composto di un insieme molto
ampio di variabili (Figura 3.2), raggruppate a seconda della materia di riferimento
38
3 Descrizione dei dati a disposizione
(finanziaria, sanitaria, infrastrutture, etc.), dell’area geografica e della periodicità
dei dati (annuali, settimanali, giornalieri). Inoltre il Data Catalog contiene tabelle
pre-formattate, studi svolti, commenti e altre informazioni utili ad ulteriori analisi.
Figura 3.2. Il Data Catalog messo a disposizione dalla Banca Mondiale.
3.1.1
Caratteristiche del dataset
Il dataset della WB è facilmente manipolabile direttamente dal sito. Infatti esso
consente, seppur in maniera limitata, la creazione di query, la visualizzazione di
tabelle e grafici di diverse tipologie a seconda dei dati di interesse. Esso comprende
inoltre la possibilità di effettuare il download dei dati in vari formati (XML, CSV,
Tabbed TXT, SDMX), anche applicando un filtraggio preventivo (Figura 3.3) cosı̀
da eliminare le variabili che non saranno utilizzate nello studio.
Il database ha come caratteristica principale quella di fornire dati “puliti” ai
quali, cioè, sono stati applicati operazioni di:
• “parsing”, per suddividere il contenuto di un campo in più campi (ad esempio,
il nome suddiviso nei campi nome e cognome);
• “cleaning”, per correggere gli errori di ortografia più comuni;
3.2 Descrizione dei dati di interesse per la tesi
39
Figura 3.3. Schermata relativa al download del dataset, inclusa di impostazioni di
filtraggio.
•
•
“standardization”, per rendere omogeneo il contenuto dello stesso campo proveniente da fonti diverse (ad esempio, per tradurre nomi di città, stati, etc.);
“deduplication”, per unificare sotto lo stesso identificativo i campi che contengono le stesse informazioni.
3.2 Descrizione dei dati di interesse per la tesi
I dataset che saranno oggetto delle analisi relative alla presente tesi comprendono
diverse tipologie di indici finanziari (Figura 3.4):
•
•
•
•
•
•
•
•
•
Inflazione (Inflation, consumer prices, annual %).
Crescita della moneta in senso ampio (Broad money growth, %).
Crediti bancari deteriorati sul totale dei prestiti lordi (Bank nonperforming loans
to total gross loans, %).
Capitale bancario sul totale delle attività bancarie (Bank capital to assets ratio,
annual %).
Tasso di interesse reale (Real interest rate, annual %).
Tasso di interesse sui depositi (Deposit interest rate, %).
Tasso di interesse sui prestiti (Lending interest rate , %).
Differenziale sul tasso di interesse (Interest rate spread ,lending rate minus
deposit rate, %).
Premio per il rischio sui prestiti (Risk premium on lending, lending rate minus
treasury bill rate, %).
Le impostazioni dei dataset sono comuni a tutte le tipologie di indici. Come
si nota in Figura 3.5, le prime due colonne delle tabelle sono relative al Paese
d’interesse; la prima indica il nominativo per esteso, mentre la seconda la sigla dello
stesso (codice riconosciuto globalmente).
40
3 Descrizione dei dati a disposizione
Figura 3.4. Totalità dei dataset riguardanti il settore finanziario.
Le successive due sono relative alla tipologia di indice da analizzare. Anche in
questo caso, una contiene il nome per esteso e l’altro il codice (Indicator Code),
utilizzato per riconoscere in maniera universale il settore oggetto degli studi.
Le successive indicano i valori, suddivisi per anno. I dataset contengono le
informazioni registrate dall’anno 1960 all’anno 2016.
Nelle prossime sottosezioni illustreremo più in dettaglio gli indici finanziari di
nostro interesse.
3.2.1
Inflazione
L’inflazione (Indicator Code FP.CPI.TOTL.ZG) è il progressivo aumento del livello
medio generale dei prezzi, o, anche, la diminuzione progressiva del potere di acquisto
della moneta, detta svalutazione monetaria.
Si parla, spesso, di inflazione in senso generico.Tuttavia, in realtà, è necessario
distinguere due macroclassi:
• Strisciante (Creaping inflation), quando il fenomeno inflativo si sviluppa in modo
persistente, ma contenuto.
• Galoppante (Run Away inflation), quando essa, ampliandosi in maniera progressiva, tramite il fenomeno della spirale inflazionistica, genera aumenti elevati del
livello generale dei prezzi; ne consegue lo svilimento del valore monetario.
3.2 Descrizione dei dati di interesse per la tesi
41
Figura 3.5. Schermata della tabella ottenuta dal download.
Le principali cause che determinano una situazione inflattiva possono essere
classificate in: cause endogene al sistema economico, quando dipendono da fenomeni
interni al paese e possono o meno fare riferimento al mercato di beni, e cause esogene
al sistema economico, quando sono da ricercarsi all’estero, in quelle nazioni che
intrattengono rapporti economici, monetari e finanziari con il paese in questione.
È necessario definire i fenomeni inflattivi, interni ed esterni, perchè i primi creano la cosidetta inflazione da domanda (demand pull), determinata da un’eccessiva
richiesta globale di servizi e beni rispetto a quanti ne può offrire il mercato. I secondi
generano l’inflazione da costi (inflazione da offerta), cioè quando le cause inflattive
sono estranee al mercato dei beni e dei prodotti finali. I fenomeni inflattivi esterni
(esogeni) a una nazione possono essere causati da una quantità eccessiva di moneta estera che viene ceduta alla nazione in questione in cambio di corrispettivi non
monetari.
Gli strumenti attraverso cui è possibile controllare le varie situazioni inflattive
sono essenzialmente rappresentati dalle politiche fiscali e monetarie che i competenti
organi governativi possono attuare.
3.2.2
Crescita moneta in senso ampio
La moneta in senso ampio è il metodo più inclusivo per calcolare la liquidità monetaria di un dato paese. Per poter comprendere al meglio la crescita, nel tempo,
di tale indice (Indicator Code FM.LBL.BMNY.ZG), dobbiamo rendere note alcune
definizioni monetarie.
La liquidità monetaria è la totalità dei beni che le famiglie e le imprese possono
utilizzare per effettuare pagamenti o tenere come investimenti a breve termine; essa
comprende, per esempio, la valuta, fondi nei conti bancari, e qualcosa di valore che
sia simile a denaro.
Non è un compito semplice per gli economisti definire quanto denaro vi sia attualmente in una data economia. Questi sono, quindi, soliti raggruppare la moneta e
i suoi simili nei cosiddetti “aggregati monetari”, cioè insiemi di attività patrimoniali
42
3 Descrizione dei dati a disposizione
caratterizzati da un grado via via decrescente di liquidità. Questi aggregati vengono
normalmente indicati utilizzando una lettera maiuscola “M” seguita da un numero
che si riferisce al calcolo che stanno utilizzando nel determinato contesto (M1, M2
ed M3) .
Ci si riferisce, invece, a M0 come alla cosiddetta base monetaria. Con M0, la
“base monetaria”, si intende la somma di tutte le banconote e le monete metalliche
(cioè tutto il circolante) esistente nel sistema economico, compreso quel circolante
che è tenuto dalle banche come forma di riserva. Pertanto, si dice che M0 è composto dalla somma del circolante detenuto dal pubblico, più le riserve detenute dalle
banche commerciali.
Con M1 si intende la somma di tutto il circolante (monete e banconote) più i
depositi a vista, cioè i depositi bancari pagabili su richiesta (ad esempio, i conti
correnti). M1 è l’aggregato più liquido (escluso, ovviamente, M0), cioè quello comprendente quelle forme di attività immediatamente “spendibili”. I depositi a vista
hanno tre principali caratteristiche: possono essere rapidamente convertiti in contanti dalla banca emittente; possono essere trasferiti con assegni o bonifici; pagano
un tasso di interesse prossimo a zero.
M2 è composto dalla somma di M1 (cioè il circolante più i depositi a vista) con
i depositi a risparmio a breve termine (fino a 2 anni). Si comprende già che questo
aggregato, più ampio di M1, è anche meno “liquido”.
Infine, il terzo aggregato, M3, si caratterizza per l’aggiunta ad M2 di tutta una
serie di attività finanziarie ancora meno liquide: obbligazioni con scadenza originaria
inferiore a 2 anni e i titoli del mercato monetario.
È, proprio, M3 che indica il concetto di moneta in senso ampio.
3.2.3
Crediti bancari deteriorati sul totale dei prestiti lordi
L’indice relativo ai crediti bancari deteriorati sul totale dei prestiti lordi (Indicator
Code FB.AST.NPER.ZS) è formato da due tipi di parametri:
• Crediti bancari deteriorati;
• Prestiti lordi.
I crediti bancari deteriorati sono i crediti che la banca vanta nei confronti dei
suoi debitori, ma dei quali non è più sicura di riscuoterne l’importo, sia in termini
di rispetto delle scadenze, sia per l’intero ammontare dell’esposizione di capitale. I
debitori, per difficoltà economiche, non riescono più a ripagare regolarmente, o del
tutto, il debito nei confronti della banca.
I prestiti lordi sono i soldi che la banca centrale fornisce come crediti alle banche
commerciali e ad altri istituti di credito, quando le banche hanno completamente
esaurito le proprie risorse interne e non sono in grado di mantenere la loro solvibilità
attraverso altri mezzi.
L’indice complessivo va, quindi, a misurare l’esposizione finanziaria della banca,
ossia la qualità dei crediti che vanta e l’esposizione debitoria nei confronti della
Banca Centrale.
3.2 Descrizione dei dati di interesse per la tesi
3.2.4
43
Capitale bancario sul totale delle attività bancarie
L’indice relativo al capitale bancario sul totale delle attività bancarie (Indicator
Code FB.BNK.CAPA.ZS) ha lo scopo di andare la percentuale di patrimonializzazione di una banca, ossia calcola con quale solidità patrimoniale l’operatore opera
rispetto al totale delle sue attività, che comportano ovviamente vari rischi.
Per rendere più chiara questa descrizione abbiamo la necessità di definire i due
parametri che compongono l’indice, ovvero:
•
•
capitale bancario;
attività bancarie.
Per capitale bancario intendiamo la componente primaria del capitale di una
banca, riassumibile nella sigla “Tier 1 capital”, ovvero “Patrimonio di classe 1”.
In base agli accordi di Basilea, che gestiscono le normative finanziarie, il patrimonio di una banca può essere distinto in due classi: una classe principale (Tier 1),
composta dal capitale azionario e dalle riserve di bilancio provenienti da utili non
distribuiti, al netto delle imposte, e da una classe supplementare composta da elementi aggiuntivi. Il Comitato di Basilea, per evitare che il Tier 1 capital venisse reso
meno solido dall’uso di strumenti innovativi creati nel tempo dalle banche, decise
di stabilire che il Tier 1 capitale potesse comprendere al più il 15 % del totale.
Il capitale bancario è formato, anche, dal Tier 2, che presenta un livello di
seniority decrescente, ovvero minore garanzia di rimborso per l’investitore. Esso
è scomponibile in Upper Tier 2 (che accoglie obbligazioni di durata superiore a
10 anni e utilizzabili per coprire perdite derivanti dall’operatività dell’ente, che
non le consentirebbero la prosecuzione dell’attività) e in Lower Tier 2 (contenente
obbligazioni della durata superiore ai 5 anni).
Per attività bancarie intendiamo le varie attività nell’intermediazione del credito
che la banca offre, oltre ad offrire un numero sempre più ampio di servizi. Possiamo
distinguere diversi tipi di attività; in particolare, possiamo considerare operazioni
bancarie passive e attive. Le operazioni passive sono quelle in cui la banca riconosce
degli interessi ai clienti; esse sono: i conti correnti, i depositi a risparmio, e altre
forme, come i certificati di depositi. Le operazioni attive sono i finanziamenti che
la banca dà ai suoi clienti. Esempi di finanziamenti bancari sono l’erogazione di un
mutuo o di un prestito.
3.2.5
Tasso di interesse reale
Il tasso d’interesse reale (Indicator Code FR.INR.RINR) è il saggio d’interesse al
netto del tasso d’inflazione vigente in una data economia.
Dal punto di vista concettuale il tasso d’interesse reale è dato dalla differenza tra
il tasso d’interesse nominale e il tasso d’inflazione, anche se la formula corretta da
applicare per trovare la misura precisa, e non approssimata, del valore è la seguente:
rr + 1 =
1+i
1 + p∗
Dove rr è il tasso d’interesse reale, i è il tasso d’interesse sul debito e p∗ è il
tasso d’inflazione.
44
3 Descrizione dei dati a disposizione
Il tasso d’interesse è il prezzo pagato da chi riceve capitali e incassato da chi li
offre. Tuttavia, per effetto dell’inflazione, diminuisce la quantità di beni acquistabili
con la stessa quantità di denaro.
Bisogna, quindi, tener conto del rendimento di un’attività finanziaria al netto
della perdita di capacità d’acquisto causata dall’inflazione. Nel caso in cui il tasso d’inflazione sale e il tasso nominale d’interesse è basso è possibile che il tasso
d’interesse reale sia negativo. Chi percepisce il tasso d’interesse rischia di credere di
incassare un reddito positivo, che, in realtà, tenuto conto dell’inflazione, è negativo.
3.2.6
Tasso d’interesse sui depositi
Il tasso d’interesse sui depositi (Indicator Code FR.INR.DPST ) è uno degli indici
bancari più a stretto contatto con il cittadino. Esso è presente in conti correnti e
conti deposito.
Il primo (spesso abbreviato con la sigla C/C) è uno strumento tecnico che indica, generalmente, il deposito di denaro, da parte del titolare/possessore del conto,
comunemente detto correntista, all’interno dell’istituto di credito, e che consente
l’utilizzo di moneta bancaria, del cosiddetto denaro elettronico, ed altri strumenti
finanziari da parte del titolare stesso.
Il secondo è un contratto bancario, che si distingue dal conto corrente per essere
solo un deposito di denaro remunerato. Con esso si possono, generalmente, effettuare
solo operazioni di prelievo e versamento, ossia sono inibite operazioni tipiche bancarie quali bonifico verso conti non predefiniti, il pagamento di assegni, il prelievo
con bancomat o carta di credito.
Questo tipo di tasso è considerato interesse “attivo”, perchè la banca corrisponde
al titolare del conto gli interessi bancari per aver ricevuto in deposito del capitale,
che può essere, a sua volta, utilizzato per altre operazioni.
3.2.7
Tasso di interesse sui prestiti
Il tasso d’interesse sui prestiti (Indicator Code FR.INR.LEND), considerato interesse “passivo”, viene espresso come una percentuale per un dato periodo di tempo;
esso indica quanta parte della somma prestata debba essere corrisposta come interesse al termine del tempo considerato o, da un altro punto di vista, indica il costo
del denaro.
Il debitore, infatti, ricevendo una somma di denaro, si impegna a pagare una
somma superiore a quella ricevuta. La differenza costituisce l’interesse, che viene
solitamente calcolato in percentuale sulla somma prestata. Il tasso d’interesse è
variabile anche in funzione della moneta di riferimento, del rischio connesso alla
solvibilità del debitore e della lunghezza del periodo di riferimento.
Oltre che dalla percentuale, i tassi d’interesse sono caratterizzati dal cosiddetto
regime di capitalizzazione degli interessi, che può essere semplice o composto. Se la
durata del prestito è superiore al periodo di tempo per cui l’interesse viene conteggiato, si parla di tasso di interesse composto, perché vengono conteggiati nel calcolo
dell’interesse finale anche gli interessi parziali già maturati per ogni periodo.
Qualsiasi sia l’operazione, l’erogazione di un mutuo ad una famiglia o un prestito
ad una impresa, il debitore dovrà pagare una percentuale sul totale della somma
erogata a prestito dai soggetti finanziatori.
3.3 Paesi di interesse
3.2.8
45
Differenziale del tasso di interesse
Il differenziale (Spread) del tasso d’interesse (Indicator Code FR.INR.LNDP) è,
semplicemente, definito come la differenza tra il tasso sui prestiti e il tasso sui
depositi.
In altri termini, consiste nella differenza tra il costo del denaro per finanziamenti,
presenti in uno stato, e la remunerazione sui depositi che un risparmiatore ottiene
depositando i suoi soldi in banca o presso altri intermediari finanziari.
3.2.9
Premio per il rischio sui prestiti
Il premio per il rischio sui prestiti (Indicator Code FR.INR.RISK) è la differenza
tra il tasso d’interesse sui prestiti e il tasso sui buoni del tesoro.
Più nello specifico, esso indica la differenza tra il rendimento atteso dalla banca o
dall’intermediario finanziario a seguito dell’erogazione del finanziamento, quindi un
credito soggetto a rischi di solvenza e di riscossione (che può riguardare una qualsiasi
attività finanziaria), e, appunto, il tasso d’interesse applicato nella collocazione sul
mercato dei buoni del tesoro da parte dello stato, che rappresentano, generalmente,
un finanziamento più sicuro da riscuotere da parte dell’operatore pubblico, e con
un rischio di mercato quasi nullo.
Viene chiamato premio, appunto perché, a fronte dell’attività più rischiosa riguardante qualsiasi tipo di finanziamento a prestito, la banca viene premiata con
una remunerazione maggiore rispetto all’emissione dei buoni del tesoro, più sicuri
ma meno remunerativi.
3.3 Paesi di interesse
Nonostante, in linea di principio, i dati a disposizione riguardino tutte le nazioni
del mondo, il nostro studio si è concentrato, principalmente, su alcune categorie di
Paesi.
Esiste una disciplina, la Geografia Economica, che analizza le connessioni economiche globali (Figura 3.6), occupandosi di fenomeni come la macroeconomia, la globalizzazione, o di entità sovranazionali, come l’ASEAN (Associazione delle Nazioni
del Sud-est asiatico), il MERCOSUR (Mercato comune dell’America meridionale),
l’Unione Europea, il NAFTA (Accordo nordamericano per il libero scambio), l’APEC (Cooperazione Economica Asiatico-Pacifica), l’ALCA (Zona di libero scambio
delle Americhe), l’OPEC (Organizzazione dei Paesi esportatori di petrolio).
Rispetto alla geografia classica, quella economica approfondisce questioni che
dalla prima vengono soltanto sfiorate: l’economia, la geopolitica, le dinamiche socioeconomiche, l’andamento dei settori primario, secondario, terziario e quaternario, i
flussi di persone, capitali, beni ed informazioni, la differenza tra Nord e Sud, e le
più moderne tendenze in atto, vedendo le trasformazioni anche da un punto di vista
storico.
46
3 Descrizione dei dati a disposizione
Figura 3.6. Esempio di Mappa economica, relativa al Prodotto Interno Lordo.
Il nostro studio, in linea con alcune analisi tipiche della Geografia Economica,
si occupa di analisi di tipo descrittivo, predittivo e diagnostico su alcuni gruppi di
Paesi; questi sono:
•
•
•
•
•
•
•
Europa Occidentale;
Europa Orientale;
America Latina;
Asia;
Africa;
Stati Arabi;
BRICS.
Tale elenco, può essere al meglio esplicato con un’ulteriore suddivisione. Per
quanto riguarda l’Europa Occidentale ci soffermeremo su Germania, Italia, Grecia,
Spagna, Francia, Olanda; per l’Europa Orientale studieremo Polonia e Romania; per
l’America Latina le nazioni di interesse sono Argentina e Venezuela; per l’Asia sono
Giappone, Corea del Sud, Vietnam; per quanto riguarda l’Africa ci soffermiamo su
Egitto, Libia, Marocco, Algeria, Tunisia, Burkina Faso, Etiopia, Kenya; per gli Stati
Arabi analizzeremo Iran, Iraq, Kuwait, Qatar.
Brasile, Russia, India, Cina, Sud Africa compongono, in economia internazionale,
un’associazione delle maggiori economie emergenti. Il nome è l’acronimo delle iniziali
dei cinque stati: BRICS.
Solo pochi anni fa le economie di questi Paesi venivano considerate marginali;
adesso sono caratterizzate da alti tassi di crescita del Prodotto Interno Lordo (PIL),
da ampie quote del commercio internazionale, da risorse e disponibilità di fattori
produttivi tali da poter influenzare, con il loro incremento, gli equilibri economici e
di potere mondiali (Figura 3.7).
Queste economie sono caratterizzate da una storia economica comune, da ricercare in una fase di specializzazione nella produzione dei beni primari (1870-1913),
nella industrializzazione per sostituzione delle importazioni (1945-1980), nel processo di liberalizzazione (1991-1992) e nel ruolo predominante dello Stato come motore
dello sviluppo.
3.3 Paesi di interesse
47
Figura 3.7. Principali punti comuni relativi allo sviluppo dei Paesi appartenenti al BRICS.
Il BRICS non rappresenta un’organizzazione internazionale, ma è piuttosto, uno
strumento di collaborazione tra le principali potenze che ne fanno parte. I Paesi
appartenenti al BRICS si riuniscono annualmente in incontri in cui si discute su
accordi di cooperazione multilaterale, di partenariato strategico, di utilizzo delle
riserve valutarie e, nell’ultima conferenza a Durban in Sud Africa, della creazione
di una Banca di sviluppo BRICS simile alla Banca Mondiale.
4
Attività di ETL
Questo capitolo ha lo scopo di illustrare una delle operazioni preliminari fondamentali per la realizzazione di uno studio di Big Data Analysis, ovvero l’ETL. In
particolare ci soffermeremo sulle attività di ETL svolte sul case study.
4.1 Nozioni di ETL
Nella gestione dei database, Extract, Transform and Load (ETL) si riferisce a tre
funzioni separate, combinate in un unico strumento di programmazione (Figura
4.1).
Figura 4.1. Schema di un database oggetto di un lavoro di ETL.
50
4 Attività di ETL
Innanzitutto, la funzione di estrazione consiste nel leggere i dati da una fonte
specifica ed estrarne da essa il sottoinsieme desiderato. Successivamente, la funzione
di trasformazione lavora con i dati acquisiti, utilizzando regole o tabelle di ricerca,
oppure sfrutta la creazione di combinazioni con altri dati, per convertirli fino ad
ottenere lo stato desiderato. Infine, la funzione di caricamento viene utilizzata per
scrivere i dati risultanti (sia tutto il sottoinsieme o solo le modifiche) per un database
di destinazione, che può o non può esistere in precedenza.
Le operazioni di ETL possono essere in contrasto con quelle di ELT (Extract,
Load, Transform), che si utilizzano per trasferire dati grezzi da una determinata
sorgente di dati (Server) a un data Warehouse, sfruttando un server di destinazione,
preparando, cosı̀, le informazioni per l’operazione finale di caricamento (Figura 4.2).
Figura 4.2. Schema che evidenzia le differenza tra ETL e ELT.
Nelle prossime sottosezioni illustreremo le operazioni più nello specifico.
4.1.1
Estrazione
L’estrazione, ovvero la prima fase del processo, implica la predisposizione di routine
in grado di leggere i record contenuti nel database sorgente e di predisporli per la
successiva fase di trasformazione (Figura 4.3). Tre sono le alternative che è possibile
seguire durante fase di estrazione dei dati: gli sviluppatori potranno scrivere programmi ad hoc, scegliere di affidarsi ai tool di ETL presenti sul mercato, o utilizzare
entrambe le soluzioni.
Gli strumenti software presenti sul mercato hanno l’indubbio vantaggio di non
forzare gli utilizzatori a dover scrivere righe di codice di infrastruttura per far eseguire al sistema funzionalità quali l’apertura dei file o la lettura dei tracciati record,
tutte attività svolte automaticamente dai tool ETL in commercio. La maggior parte di essi prevede routine di estrazione specifiche per i più noti sistemi ERP o i
più diffusi applicativi; questo consente di ridurre al minimo il lavoro del personale
incaricato della gestione dei dati.
4.1 Nozioni di ETL
51
Figura 4.3. Schema di esempio di un’operazione di estrazione di dati aziendali.
4.1.2
Trasformazione
La seconda fase del processo (Figura 4.4) è l’insieme di due operazioni:
•
•
Preparare e trasformare i dati. Dopo aver raccolto i dati, le routine di trasformazione provvedono a prepararli per la loro nuova collocazione. L’aggregazione è
una delle tecniche principali che consente di rimpiazzare numerosi record dettagliati con pochi riassuntivi immagazzinati nelle soluzioni di Business Intelligence. I data mart e i data warehouse sono dei database di dimensioni diverse che
consentono agli utenti di analizzare insiemi di dati preventivamente aggregati e
riassunti sulla base di criteri definiti, presentandoli secondo modalità piuttosto
intuitive, allo scopo di verificare trend, macro-tendenze e caratteri salienti di un
determinato fenomeno. I data mart sono di dimensioni minori e possono includere non informazioni dettagliate, ma dati aggregati, in modo da poter essere
utilizzati direttamente dal responsabile decisionale.
Filtrare e pulire. Gli applicativi ETL aggregano i dati con pochi sforzi. L’utente può, infatti, impostare filtri che permettono di selezionare e riassumere con
pochi click le informazioni salienti relative al fenomeno analizzato, senza dover
scrivere alcuna riga di codice. La traduzione in valori espliciti dei codici è un’altra tecnica di trasformazione utilizzata di frequente. I database operativi, infatti,
immagazzinano informazioni codificate, allo scopo di ridurre al minimo lo spazio
occupato. Tuttavia, i data mart contengono informazioni riassunte e sono pensati per un facile utilizzo; quindi, i programmatori generalmente rimpiazzano i dati
codificati con le descrizioni degli stessi. Un’altra opzione per la trasformazione
dei dati è la derivazione delle informazioni dal campo. Questa tecnica permette
di creare nuove informazioni direttamente utilizzabili dagli utenti finali. Se, ad
esempio, un database contiene due campi distinti, uno relativo alle quantità di
vendita e l’altro al prezzo unitario, sarà possibile creare un campo unitario (ad
esempio “fatturato”) durante la fase di trasformazione dei dati, in modo da semplificare l’analisi del fenomeno vendite. Oltre a derivare campi in modo semplice,
dall’unione di due o più campi precedenti, i software di ETL permettono, anche,
di crearne di nuovi, attraverso l’impiego di funzioni matematiche o statistiche e
analisi logiche. L’altra routine di trasformazione consiste nella “pulitura”, ovvero nell’utilizzo di algoritmi per eliminare dal sistema i dati non accurati o non
consistenti rispetto al fenomeno da valutare. Le funzionalità di pulitura possono
52
4 Attività di ETL
essere utilizzate anche per sostituire con un singolo valore i dati che figurano in
molteplici modalità all’interno del database.
Figura 4.4. Schema di esempio di un’operazione di estrazione e trasformazione di dati
aziendali.
4.1.3
Caricamento
L’ultima fase del processo di ETL è il caricamento delle informazioni nella base
di dati di destinazione (Figura 4.5). Durante questa fase, il programmatore dovrà
decidere come impostare il caricamento della base di dati, se in forma periodica
o continuativa (in tempo reale). La maggior parte degli applicativi ETL supporta
entrambe le opzioni, anche se la seconda (continuativa) richiede reti dedicate ad
alta velocità, risultando piuttosto costosa. Per ovviare a questi limiti i tool oggi
in commercio, tuttavia, supportano anche funzionalità avanzate che permettono di
diffondere in rete solo le modifiche intervenute nei dati.
Nella fase di caricamento, inoltre, all’utente si impone la scelta tra due modelli
distinti di replicazione dei dati. Nella replicazione “push”, l’applicativo spinge i dati
trasformati sul database di destinazione. Nella replicazione “pull”, al contrario,
l’applicazione o il database di destinazione richiedono i dati, in conformità alle
esigenze specifiche del momento. È, infine, anche possibile utilizzare una modalità
mista.
Qualunque sia la scelta effettuata, è importante selezionare una soluzione di
estrazione, validazione, trasformazione e caricamento dei dati. I sistemi ETL rappresentano, infatti, l’infrastruttura chiave per il supporto decisionale dei sistemi di
Business Intelligence.
4.2 Attività svolte
Il dataset messo a disposizione dalla Banca Mondiale, nonostante contenga un’enorme quantità di informazioni, le rende disponibili all’utenza sotto forma di dati
puliti. Ciò significa che essi sono stati già sottoposti a delle operazioni di ETL, con
lo scopo di essere facilmente leggibili per tutti (o gran parte) gli utilizzatori.
4.2 Attività svolte
53
Figura 4.5. Schema di esempio di un’operazione di estrazione, trasformazione e
caricamento di dati aziendali.
Il download può essere eseguito sotto forma di file .xml, .csv, .xms, .txt; tutte
queste sono estensioni riconosciute da software diffusi nella stragrande maggioranza dei Personal Computer, ad esempio Microsoft Excel; nel caso di metadati, è
necessario un semplice lettore di appunti di testo.
Nonostante ciò, per rendere il dataset facilmente utilizzabile nella piattaforma Tableau, sono state necessarie ulteriori operazioni; queste saranno illustrate in
dettaglio nelle prossime sottosezioni.
4.2.1
Verifica dei dati
La prima attività a cui è stato sottoposto il dataset consiste nella verifica dei dati.
Questa è, fondamentalmente, una fase di controllo per verificare che tutte le voci
delle tabelle abbiano una struttura formale corretta al fine di evitare che, nel successivo processo di analisi, si possano riscontrare errori. Tale procedimento è stato reso
facile grazie al lavoro preliminare della Banca Mondiale; a noi è rimasto il compito
di controllare che la formattazione delle tabelle (Figura 4.6) fosse comune a tutte,
e, in caso contrario, di modificarla.
4.2.2
Rimozione dei campi non di interesse
Per poter usufruire al meglio dei dati su Tableau, è necessario eliminare i dati di
non interesse. Come si nota dalla Figura 4.6, i campi relativi a “Data Source”, “Last
Updated Date”, “Country Code”, “Indicator Name”, “Indicator Code” contengono
informazioni che non sono utili al fine dell’analisi; tali campi, pertanto, saranno
rimossi.
Oltretutto, è necessario eliminare eventuali righe o colonne completamente vuote, affinchè non compaiano voci “null” durante lo studio su Tableau. Di seguito, in
Figura 4.7, si nota il risultato della tabella sottoposta a operazioni di rimozione.
4.2.3
Modifica dei dati
Sporadicamente, all’interno di database, si possono trovare voci che, nonostante
siano formalmente corrette, non sono utilizzabili in tutta completezza nei software
adatti a svolgere le analisi.
54
4 Attività di ETL
Figura 4.6. Tabella alla quale non è stata applicata alcuna attività di ETL.
Figura 4.7. Tabella trattata con operazione di rimozione dei campi di non interesse.
Nelle tabelle messe a disposizione dalla Banca Mondiale, notiamo alcune incompatibilità da correggere in maniera opportuna. Esse riguardano, principalmente,le
voci relative alle date. In particolare, notiamo che la forma “1960”, “1961”, etc.
(cioè “YYYY”), contenente solo l’anno, non è riconoscibile dal software Tableau
come data, ma solo come sequenza di caratteri; perciò, è stato necessario modificare
i campi con una sequenza “DD/MM/YYYY”. Tali sequenze saranno, quindi, immesse su Tableau e, dopo l’immissione e il successivo riconoscimento, si selezionerà
solo il campo “YYYY”.
Ulteriori controlli sono stati effettuati nella lista dei Paesi, verificando che tutti
i campi siano correttamente visualizzabili su mappa come “Geographic Role”. In
Figura 4.8 viene mostrata la tabella ottenuta a seguito dell’operazione di modifica.
4.2 Attività svolte
55
Figura 4.8. Tabella trasformata con delle operazioni di modifica di dati.
4.2.4
Trasformazione delle tabelle in tabelle pivot
Una tabella pivot è uno strumento analitico e di reporting necessario alla creazione
di tabelle riassuntive. Uno dei fini principali di queste tabelle è l’organizzazione di
dati complessi tramite una scelta opportuna dei campi e degli elementi che devono
comporla.
Una tabella pivot può descrivere un numero anche molto elevato di variabili,
dette caratteristiche o dimensioni di analisi; in parole più semplici, la tabella sorgente su cui viene calcolata la tabella pivot può avere un numero alto di righe e
di colonne. Per poter generare una tabella pivot, la tabella sorgente deve essere
formattata secondo alcune semplici regole: ogni cella della prima riga della tabella
pivot deve contenere un nome testuale che rappresenta la colonna sottostante (detto
“etichetta di colonna” o “intestazione di campo”), non devono esserci colonne prive
di intestazione, non devono esserci righe o colonne con tutte le celle vuote (prive di
valori), i valori presenti nelle celle di ciascuna colonna devono essere tra loro omogenei (stesso comune formato di cella, tipo numero, di data, valuta, testo) perché,
poi, nel pivot sono oggetto di operazioni matematiche o raggruppamenti di valori
che, chiaramente, non sono possibili fra celle di tipo diverso. La formattazione della
tabella sorgente e la creazione/aggiornamento della tabella pivot, se è una attività
svolta di frequente senza importanti variazioni, può essere resa veloce ed automatica
registrando una macro.
La trasformazione in tabella pivot è necessaria per visualizzare più dati riferiti
ad uno stesso attributo temporale. In Figura 4.9 notiamo come vengono visualizzati,
tramite grafico a barre, dei dati riferiti ad un classico tipo di tabella; essi sono divisi
per anno, ma non sono raggruppati, nonostante si utilizzi l’operazione somma (SUM).
In Figura 4.10, invece, notiamo come i dati si possono visualizzare, nello stesso
scenario, più situazioni contemporaneamente.
56
4 Attività di ETL
Figura 4.9. Esempio di tabella e di grafico corrispondente.
Figura 4.10. Esempio di tabella trasformata in pivot e di grafico corrispondente.
Per aiutarci nel compito di “pivottizzazione”, Tableau software ha messo a disposizione dell’utenza un’estensione compatibile con le più recenti versioni di Excel
(Figura 4.11).
Figura 4.11. Schermata di come si presenta su Excel il componente aggiuntivo che
consente l’attivazione di Tableau.
Tale componente aggiuntivo, tramite il comando “Reshape data”, selezionando
le celle di interesse, permette di convertire la tabella in tabella pivot, eliminando
oltrettutto i campi contenenti valori nulli, quindi semplificando ulteriormente il
4.2 Attività svolte
57
processo di ETL. Tramite il comando “Pivot to table” si ottiene il procedimento
inverso, ovvero la conversione da tabella pivot in tabella classica.
In Figura 4.12 vediamo una delle tabelle del nostro dataset prima e dopo
l’operazione di pivot (Figura 4.13), con i campi opportunamente rinominati.
Figura 4.12. Tabella pulita, ma non ancora pronta all’operazione di caricamento.
Figura 4.13. Tabella pivot pronta ad essere utilizzata per il caricamento.
58
4.2.5
4 Attività di ETL
Caricamento dei dati puliti
L’ultima fase consiste nel caricamento dei dati che, tramite le operazioni viste precedentemente, sono stati ottimizzati “ad hoc” per il software di Data Analytics.
Quest’ultima operazione si effettua, come mostrato in Figura 4.14, direttamente
dall’applicativo.
Figura 4.14. Schermata di caricamento dei dati su Tableau.
A questo punto, il dataset è pronto per le analisi. Queste ultime verranno
illustrate in dettaglio nei prossimi capitoli.
5
Analisi Descrittiva
In questo capitolo verrà illustrata la prima fase di analisi, ovvero la Descriptive Analytics. In particolare, verranno visualizzate, analizzate e descritte le informazioni
derivanti dal dataset oggetto del case study.
5.1 Premessa
Come già illustrato nei capitoli precedenti, l’analisi descrittiva si occupa di illustrare
ciò che accade e di presentare informazioni servendosi di strumenti di Business
Intelligence e di visualizzazione. In particolare, essa si occupa di analizzare gli eventi
passati per riassumere e chiarire le dinamiche e le performance delle metriche di
interesse e per ricavarne indicazioni su come approcciarsi alle prossime attività.
5.2 Visualizzazione dei dati
In questa fase iniziamo ad usare Tableau. Dopo il caricamento dei dati inizia l’operazione di analisi. Tramite il meccanismo di drag-and-drop creiamo i presupposti
per la visualizzazione e, tramite il comando “Filtri”, vediamo divisi per Paese, nelle
sottosezioni successive, i diversi scenari.
5.2.1
Inflazione
Per quanto riguarda i Paesi dell’Europa Occidentale, al fine di garantire un’ottimale
comprensione dei valori, la visualizzazione è divisa in due grafici (Figura 5.1). Il
primo, riguardante Italia, Spagna e Francia, delinea un andamento comune per
questi tre stati, compreso il picco inflattivo nella decade che va dal 1973 al 1983.
Nel secondo grafico, riguardante Germania, Olanda e Grecia, notiamo un andamento
comune solo per gli anni dal 1999 al 2015.
60
5 Analisi Descrittiva
Figura 5.1. Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa
Occidentale.
Per quanto riguarda i Paesi dell’Europa Orientale, Polonia e Romania assumono
un comportamento inflattivo molto diverso tra loro (Figura 5.2) fino agli anni 2000;
successivamente si riportano a un valore costante fino ai giorni nostri.
Figura 5.2. Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa
Orientale.
Per quanto riguarda i Paesi dell’America Latina, Argentina e Venezuela (Figura 5.3) necessitano di due grafici separati, a causa del diverso comportamento, in
particolare a causa di valori elevati rispetto alla normalità, che non consentirebbero
una comprensione corretta del grafico.
5.2 Visualizzazione dei dati
61
Figura 5.3. Grafico a linee relativo alla situazione inflattiva dei Paesi Sudamericani.
Per quanto riguarda i Paesi dell’Asia, a illustrare la situazione inflattiva è la
Figura 5.4. Tale grafico delinea un comportamento simile per Giappone e Korea,
ma per il Vietnam, i cui dati sono presenti solo dal 1997, notiamo un andamento
molto diverso in quanto i valori, anche solo nell’arco temporale di un quinquennio,
presentano più picchi inflattivi.
Figura 5.4. Grafico a linee relativo alla situazione inflattiva dei Paesi Asiatici.
Per quanto riguarda i Paesi dell’Africa, a causa dell’elevato numero di Nazioni
considerate, necessitiamo di tre differenti grafici (Figura 5.5). Il primo di essi, riguardante Algeria, Tunisia ed Egitto, evidenzia una situazione inflattiva turbolenta,
con diversi valori di picco nel quinquennio che va dal 1992 al 1997. Il grafico relativo
a Etiopia, Kenya e Marocco delinea un comportamento simile e molto discontinuo
per i primi due Paesi; per il terzo l’andamento è più costante. Il grafico relativo a
Burkina Faso e Libia, evidenzia un andamento complessivo affine.
62
5 Analisi Descrittiva
Figura 5.5. Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Africa.
Per quanto riguarda i Paesi Arabi, notiamo, in Figura 5.6, una situazione inflattiva simile per Kuwait e Qatar, mentre per Iran e Iraq si nota un andamento
discontinuo; in particolare, per quest’ultimo, vediamo un picco nel quinquennio che
va dal 1990 al 1995.
Figura 5.6. Grafico a linee relativo alla situazione inflattiva degli Stati Arabi.
Per quanto riguarda i Paesi appartenenti al BRICS (Figura 5.7), il Brasile delinea
un andamento, negli anni antecedenti al 1998, molto discontinuo con alcuni valori
fuori dalla norma. La Russia, presenta nel primo triennio posteriore al 1993, dei
valori elevati, che poi si andranno a normalizzare fino ai giorni nostri. India, Cina
e Sud Africa, nonostante non presentino un comportamento comune (a causa di
svariati valori di picco), mantengono l’indice inflattivo entro un range limitato di
valori.
5.2 Visualizzazione dei dati
63
Figura 5.7. Grafico a linee relativo alla situazione inflattiva dei Paesi BRICS.
5.2.2
Crescita della moneta in senso ampio
Per quanto riguarda la crescita della moneta in senso ampio, i dati graficati, relativi a Polonia e Romania (Figura 5.8) evidenziano un andamento non costante; in
particolare, per la Polonia, si nota un picco fuori norma nel triennio che va dal 1987
al 1990.
Figura 5.8. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi
dell’Europa Orientale.
Per quanto concerne ai Paesi Africani (Figura 5.9), notiamo che l’andamento
complessivo è a “dente di sega”, ma, eccetto per alcuni valori di picco registrati
dall’Algeria nel biennio 2000 - 2001, dal Kenya negli anni che vanno dal 1976 al
1978, dal Burkina Faso negli anni che vanno dal 2002 al 2004, si mantengono in un
range di valori nella norma.
64
5 Analisi Descrittiva
Figura 5.9. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi
dell’Africa.
I paesi del Sud America (Figura 5.10), invece, evidenziano un comportamento
discorde tra loro. In particolare, l’Argentina presenta alcuni valori di picco negli
anni antecedenti al 1990; proprio in quell’anno notiamo una crescita esponenziale
della moneta in senso ampio, che supera la soglia del 2000%. Il Venezuela, invece,
evidenzia un andamento instabile che, però, non raggiunge mai valori simili a quelli
registrati del Brasile.
Figura 5.10. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi
Sudamericani.
Per quanto riguarda i Paesi dell’Asia (Figura 5.11), si nota che fino al 1995
l’andamento complessivo è simile, compresi i valori di picco nel quinquennio che va
dal 1967 al 1972; successivamente si nota un momento in cui i valori sono comple-
5.2 Visualizzazione dei dati
65
tamente opposti, con una crescita improvvisa per la Korea e una decrescita per il
Giappone. Successivamente il valore ritorna nella norma.
Figura 5.11. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi
Asiatici.
I Paesi Arabi (Figura 5.12) presentano un andamento analogo, ma che possiamo
visualizzare in due sottogruppi; uno è formato da Iran e Iraq, l’altro è formato da
Kuwait e Qatar.
Figura 5.12. Grafico a linee relativo alla crescita della moneta in senso ampio degli Stati
Arabi
Il comportamento che riguarda i Paesi appartenenti al BRICS (Figura 5.13) può
essere rappresentato separatamente per Brasile e Russia, che presentano andamenti
diversi rispetto alla norma, il primo con valori di picco che superano l’ordine del
3000% nella decade che va dal 1985 al 1995; il secondo che mostra una tendenza
decrescente, con un picco iniziale e poi un decremento fino a un valore quasi costante.
Per Cina, India e Sud Africa, non sono presenti dati che spiccano rispetto agli altri.
66
5 Analisi Descrittiva
Figura 5.13. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi
BRICS.
5.2.3
Crediti bancari deteriorati sul totale dei prestiti lordi
Il dataset che riguarda tale indice è quello di installazione più recente, in quanto le
informazioni fornite riguardano solo gli anni successivi al 1998.
Per quanto riguarda l’Europa Occidentale (Figura 5.14) l’andamento è pressochè
simile per Francia, Spagna, Olanda, Germania. Per l’Italia, e in misura maggiore
per la Grecia, si nota un andamento crescente.
Figura 5.14. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti
dei Paesi dell’Europa Occidentale.
In Europa Orientale (Figura 5.15) l’andamento mostrato è simile, cioè un valore iniziale crescente con una successiva stabilizzazione ad un valore costante che
rispecchia gli standard.
5.2 Visualizzazione dei dati
67
Figura 5.15. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti
dei Paesi dell’Europa Orientale.
Per quanto riguarda l’Africa (Figura 5.16), le informazioni delineano un comportamento comune, di natura decrescente.
Figura 5.16. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti
dei Paesi dell’Africa.
Anche Argentina e Venezuela (Figura 5.17) presentano valori simili che, negli
ultimi anni, si mantengono costanti con percentuali tra lo 0% e il 5%.
68
5 Analisi Descrittiva
Figura 5.17. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti
dei Paesi Sudamericani.
I dati dei Paesi Asiatici (Figura 5.18) sono pressochè analoghi, con percentuali
che si mantengono sotto al 9%.
Figura 5.18. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti
dei Paesi Asiatici.
Per quanto concerne gli Stati Arabi (Figura 5.19), il Qatar presenta dati solo dal
2008, con un andamento di natura costante; il Kuwait presenta due valori di picco
nel 2000 e nel triennio tra il 2008 al 2011, ma che si mantengono entrambi sotto la
soglia del 20%.
5.2 Visualizzazione dei dati
69
Figura 5.19. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti
degli Stati Arabi
I Paesi del BRICS (Figura 5.20) sono divisi in due sottografici solo per questioni
di visualizzazione, ma presentano un comportamento comune, con valori iniziali
elevati che, negli ultimi anni, vanno a stabilizzarsi con percentuali sotto al 10%.
Figura 5.20. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti
dei Paesi BRICS.
5.2.4
Capitale bancario sul totale delle attività bancarie
I grafici relativi al capitale bancario sul totale delle attività bancarie, per quanto concerne agli stati dell’Europa Occidentale (Figura 5.21), si presenta con un
andamento comune, con valori compresi tra il 5% e il 10%.
70
5 Analisi Descrittiva
Figura 5.21. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie
dei Paesi dell’Europa Occidentale.
Anche per Polonia e Romania (Figura 5.22) la tendenza è simile e, negli ultimi
anni, si nota una leggera crescita.
Figura 5.22. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie
dei Paesi dell’Europa Orientale.
Per quanto riguarda i Paesi Africani (Figura 5.23), notiamo per Algeria e Tunisia un comportamento, per gli ultimi anni, crescente; mentre per Egitto, Kenya e
Marocco esso è costante, con valori massimi (Kenya) intorno al 15%.
5.2 Visualizzazione dei dati
71
Figura 5.23. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie
dei Paesi dell’Africa.
I dati riguardanti i Paesi Asiatici (Figura 5.24), nonostante evidenti mancanze nel quinquennio 2003-2008, mostrano un andamento costante, con valori che si
mantengono sotto al 10%.
Figura 5.24. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie
dei Paesi Asiatici.
L’unico Stato Arabo di cui disponiamo informazioni relative a tale parametro è
il Kuwait (Figura 5.25), che presenta valori tra il 10% e il 13%.
72
5 Analisi Descrittiva
Figura 5.25. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie
degli Stati Arabi
Argentina e Venezuela delineano due andamenti diversi (Figura 5.26); ovvero
costante per il primo (con valori nell’intorno del 12%), inizialmente elevato per il
secondo che tende ad un assestamento sotto l’11% negli ultimi anni.
Figura 5.26. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie
dei Paesi Sudamericani.
I Paesi appartenenti al BRICS (Figura 5.27) hanno dei valori che vanno a stabilizzarsi tra l’8% e il 10%. Di questi, solo il Brasile ha uno “starting value” elevato
rispetto alla norma che, successivamente, si riconduce a quello tipico degli altri
Paesi.
5.2 Visualizzazione dei dati
73
Figura 5.27. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie
dei Paesi BRICS.
5.2.5
Tasso di interesse reale
L’andamento grafico relativo al tasso di interesse reale dei Paesi Europei (Figura
5.28), fino all’anno 2000, è pressochè comune, con valori inferiori al 10% per Francia,
Italia, Spagna, Olanda, Germania. Solo la Grecia si discosta dalla comunità con
percentuali che arrivano al -10% (nel 1973) e sucessivamente, in maniera progressiva
raggiunge un tasso fino al +15% (1994).
Figura 5.28. Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Europa
Occidentale.
Per quanto riguarda l’Est Europa (Figura 5.29), Polonia e Romania presentano
comportamenti diversi; in particolare, negli anni antecedenti al 1998, la Romania
delinea valori impprovisamente bassi(fino al -25%), seguiti da un assestamento che,
negli ultimi anni, si maniene nell’intorno del 5%.
74
5 Analisi Descrittiva
Figura 5.29. Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Europa
Orientale.
Gli Stati Asiatici (Figura 5.30) evidenziano un comportamento discontinuo, ma
che, negli ultimi anni, per Giappone e Repubblica Koreana è di natura decrescente;
per il Vietnam è, invece, di natura crescente.
Figura 5.30. Grafico a linee relativo al tasso di interesse reale dei Paesi Asiatici.
Per quanto concerne i Paesi dell’Africa (Figura 5.31), gli andamenti sono
piuttosto discostanti, con valori di picco per la Libia che raggiungono il 40%.
5.2 Visualizzazione dei dati
75
Figura 5.31. Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Africa.
I Paesi dell’America Latina (Figura 5.32) assumono comportamenti differenti:
l’Argentina, dopo un picco, presenta un decremento e una successiva stabilizzazione
fino ai giorni nostri. Il Venezuela presenta due percentuali inferiori alla norma (nel
1988 e nel 1996), che raggiungono il -35%. Nell’ultimo tratto si intuisce un leggero
indice decrescente per il Venezuela e un lieve innalzamento per l’Argentina.
Figura 5.32. Grafico a linee relativo al tasso di interesse reale dei Paesi Sudamericani.
Gli Stati Arabi (Figura 5.33) sono divisi in due sottogruppi; il primo è formato da Iran e Iraq, con un complessivo andamento comune, eccetto un valore di
picco nell’anno 2009 per l’Iraq; il secondo, composto da Kuwait e Qatar, presenta
un andamento comune anche negli anni con improvvisi incrementi in percentuale
(2009).
76
5 Analisi Descrittiva
Figura 5.33. Grafico a linee relativo al tasso di interesse reale degli Stati Arabi
Per quanto riguarda i Paesi appartenenti al BRICS (Figura 5.34), Russia e Brasile, dopo una fase iniziale di decremento, si stabilizzano nell’intorno del 30% per
il Brasile, e nell’intorno dello 0% per la Russia. Cina, India e Sud Africa hanno
comportamenti, invece, molto scostanti, che, però, si mantengono tra lo 0% e il 15%
e nella fase finale delineano un leggero innalzamento di valore comune.
Figura 5.34. Grafico a linee relativo al tasso di interesse reale dei Paesi BRICS.
5.2.6
Tasso di interesse sui depositi
L’indice sul tasso d’interesse sui depositi delinea, per i Paesi Europei (Figura 5.35),
un andamento comune di natura decrescente fino ai giorni nostri, che si mantiene
tra lo 0% e il 5%. Solo il grafico relativo alla Grecia denota una crescita progressiva
fino ad arrivare ad un valore di poco superiore al 20% (1991), con un successivo
decremento che si riporta alla situazione comune.
5.2 Visualizzazione dei dati
77
Figura 5.35. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Europa
Occidentale.
Polonia e Romania delineano comportamenti di natura simile (Figura 5.36),
decrescente, ma con valori iniziali ben differenti: il 57% per la Romania e ben il
240% per la Polonia. In seguito, fino ai giorni nostri, si mantengono tra lo 0% e il
5%
Figura 5.36. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Europa
Orientale.
Per quanto riguarda Argentina e Venezuela (Figura 5.37), si evidenziano comportamenti scostanti; in particolare, si può osservare un picco del 18000% per
l’Argentina (1989).
78
5 Analisi Descrittiva
Figura 5.37. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi
Sudamericani.
Negli gli Stati Arabi (Figura 5.38), Kuwait e Qatar presentano un andamento
simile, con una stabilizzazione nell’intorno del 2% fino ai giorni nostri; l’Iran, i cui
dati sono presenti solo dal 2003, delinea, negli ultimi anni, una sostanziale crescita,
fino al 17%.
Figura 5.38. Grafico a linee relativo al tasso di interesse sui depositi degli Stati Arabi
La situazione Africana (Figura 5.39) presenta più differenze: Algeria, Egitto,
Etiopia e Kenya assumono un andamento costante, dopo un lieve picco di valore nel
1995 (Algeria) e 1998 (Kenya). Burkina Faso e Libia hanno un andamento lineare,
con valori tra il 2% e il 6%.
5.2 Visualizzazione dei dati
79
Figura 5.39. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Africa.
Per quanto riguarda l’Asia (Figura 5.40); Giappone, Korea e Vietnam hanno
un comportamento finale comune, di natura decrescente, ma presentano, nei primi
anni di presenza dei dati, differenze di valore, elevate per la Korea (23%), più nella
norma per il Giappone (sotto il 5%).
Figura 5.40. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi Asiatici.
I Paesi appartenenti al BRICS (Figura 5.41) sono divisi in tre sottografici. Cina
e Sud Africa presentano un comportamento lineare simile, al quale si riporta l’indice
Russo dopo un valore iniziale elevato (101%); il Brasile, invece, presenta due picchi
negli anni tra il 1988 e il 1995, con percentuali che sfiorano la soglia del 10000% e
del 5000%.
80
5 Analisi Descrittiva
Figura 5.41. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi BRICS.
5.2.7
Tasso di interesse sui prestiti
L’indice sul tasso d’interesse sui prestiti delinea, per i Paesi Europei (Figura 5.42),
un andamento comune di natura decrescente fino ai giorni nostri. La Grecia si
discosta inizialmente, con una crescita progressiva fino ad arrivare ad un valore
di quasi 30% (1991), con un successivo decremento che si riporta alla situazione
comune.
Figura 5.42. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Europa
Occidentale.
Polonia e Romania (Figura 5.43) delineano comportamenti di natura simile,
decrescente, ma con un picco di valore per il primo che supera i 600 punti (1990).
5.2 Visualizzazione dei dati
81
Figura 5.43. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Europa
Orientale.
Gli Stati Africani (Figura 5.44) presentano valori elevati nella decade 1989-1999
(35% in Kenya, 20% in Algeria e Egitto), seguiti da un decremento che li riporta a
una situazione lineare fino ai giorni nostri.
Figura 5.44. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Africa.
I Paesi dell’America Latina (Figura 5.45) presentano un simile andamento discontinuo, con incrementi fino al 60% (1993) per il Venezuela e fino al 50% (2002)
per l’Argentina. Si delinea una crescita di valore negli ultimi anni.
82
5 Analisi Descrittiva
Figura 5.45. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi
Sudamericani.
Gli Stati Asiatici (Figura 5.46) assumono un comportamento decrescente, con
alcuni innalzamenti di valori improvvisi nel 1998, per la Korea del Sud, e nel 2009
e nel 2012, per il Vietnam.
Figura 5.46. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi Asiatici.
Per quanto riguarda le Nazioni Arabe (Figura 5.47), Iran e Iraq assumono un
andamento lineare con valori tra il 10% e il 20%; Kuwait e Qatar mostrano, invece,
un andamento discontinuo ma comune, con un decremento negli ultimi anni.
5.2 Visualizzazione dei dati
83
Figura 5.47. Grafico a linee relativo al tasso di interesse sui prestiti degli Stati Arabi
Per quanto riguarda i Paesi del BRICS (Figura 5.48); il Brasile presenta, dopo
un progressivo abbassamento della percentuale, che lo porta da oltre l’80% fino
al 30%, una lieve crescita negli ultimi due anni; la Russia ha un comportamento
decrescente, con elevati valori iniziali (sopra i 300 punti); India, Cina e Sud Africa
hanno un comportamento comune, con valori al di sotto del 20%.
Figura 5.48. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi BRICS.
5.2.8
Differenziale del tasso di interesse
Il valore differenziale del tasso di interesse per i Paesi Europei (Figura 5.49) presenta, per Francia, Spagna, Germania e Italia un andamento pressochè comune, con
valori, nell’ultimo periodo temporale, costanti tra lo 0% e il 5%; la Grecia assume
84
5 Analisi Descrittiva
inizialmente una crescita, fino ad arrivare a percentuali nell’intorno dell’8%, successivamente si ha un decremento fino ai giorni nostri; anche l’Olanda presenta un
andamento in discesa, ma con un dato iniziale di circa il 10%.
Figura 5.49. Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Europa
Occidentale.
Polonia e Romania (Figura 5.50) hanno un andamento inizialmente opposto,
con valori che raggiungono un picco positivo nel 1990 per il primo (circa 550%), e
una decrescita per il secondo; in un secondo momento i due andamenti diventano
comuni diventando pressochè costanti in un intervallo tra lo 0% e il 10%.
Figura 5.50. Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Europa
Orientale.
I Paesi Latino-Americani (Figura 5.51) si mantengono, con un andamento non
5.2 Visualizzazione dei dati
85
lineare, in un intervallo di valori tra il 2% e il 16% (si può osservare un valore di
picco per il Venezuela nel 1995)
Figura 5.51. Grafico a linee relativo allo spread del tasso di interesse dei Paesi
Sudamericani.
La situazione Africana (Figura 5.52) è illustrabile in due sottografici; il primo
mostra il comportamento complessivamente comune di Algeria, Egitto e Tunisia,
in un range di valori tra il 3% e l’8%; il secondo evidenzia, in modo particolare,
l’andamento decrescente del Kenya.
Figura 5.52. Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Africa.
Gli Stati Arabi (Figura 5.53) evidenziano l’andamento comune di Kuwait e Qatar, costante tra i 2 e i 4 punti percentuali; l’Iran, invece, mostra un andamento
86
5 Analisi Descrittiva
decrescente, che raggiunge il valore di -4%.
Figura 5.53. Grafico a linee relativo allo spread del tasso di interesse degli Stati Arabi
Per quanto riguarda l’Asia (Figura 5.54), notiamo un andamento decrescente
per il Giappone, mentre per Korea del Sud e Vietnam, dopo una crescita ripida, i
valori si assestano entro percentuali comprese tra l’1% e il 3%.
Figura 5.54. Grafico a linee relativo allo spread del tasso di interesse dei Paesi Asiatici.
I Paesi del BRICS presentano tre grafici separati (Figura 5.55). Il Brasile assume
un andamento che tende a decrescere leggermente nel tempo; la Russia assume il
picco più alto nel 1995 e rapidamente decresce mantenendosi, poi, costante; Cina e
Sud Africa assumono valori con percentuali inferiori al 5%, con un comportamento
lineare.
5.2 Visualizzazione dei dati
87
Figura 5.55. Grafico a linee relativo allo spread del tasso di interesse dei Paesi BRICS.
5.2.9
Premio per il rischio sui prestiti
Nell’illustrare i valori relativi al premio per il rischio sui prestiti, i Paesi Europei
sono divisi in due grafici (Figura 5.56). Il primo illustra l’andamento comune di
Italia e Spagna; nel secondo grafico vi sono Olanda, Francia e Germania; questi
ultimi due presentano un comportamento complessivamente simile con natura, per
gli ultimi anni, crescente.
Figura 5.56. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
dell’Europa Occidentale.
Romania e Polonia (Figura 5.57) assumono un andamento che va dallo 0% al
10%, eccetto per un valore di picco negativo registrato nel 1997 dalla Romania
(-13%).
88
5 Analisi Descrittiva
Figura 5.57. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
dell’Europa Orientale.
Esaminando l’andamento dei Paesi Africani (Figura 5.58), notiamo che questo
risulta essere costante negli anni per il Kenya, a eccezione del triennio che va dal
1992 al 1994, dove vi è la presenza di un picco negativo (-20%). L’andamento di
Algeria ed Etiopia, dopo un’iniziale discesa, tende ad incrementarsi e a rendersi
costante. L’Egitto presenta un comportamento decrescente e discostante.
Figura 5.58. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi
dell’Africa.
I Paesi Arabi (Figura 5.59), Iraq e Kuwait, delineano due andamenti totalmente
diversi. Mentre quello del Kuwait, dopo un decremento, si presenta complessivamente crescente, quello dell’Iraq, nello spazio di soli tre anni, denota ripidi innalzamenti
e abbassamenti di percentuale.
5.2 Visualizzazione dei dati
89
Figura 5.59. Grafico a linee relativo al premio per il rischio sui prestiti degli Stati Arabi
Per quanto riguarda i Paesi Asiatici (Figura 5.60), il Giappone ha un andamento
che, nonostante sia frastagliato, si mantiene tra l’1% e il 3%; Il Vietnam ha un
andamento discontinuo, con valori tra il 2% e il 7%.
Figura 5.60. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi Asiatici.
I tre Paesi del BRICS (Brasile, Russia e Sud Africa) presentano tre grafici separati (Figura 5.61). Il Brasile assume un andamento che tende a decrescere leggermente
nel tempo; la Russia assume il picco più alto nel 1995 e rapidamente arriva a raggiungere quello più basso nel 1997, per poi diventare strettamente costante. Il Sud
Africa, invece, ha un andamento discontinuo, ma che si mantiene su valori tra il 2%
e il 6%.
90
5 Analisi Descrittiva
Figura 5.61. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi BRICS.
5.3 Ricerca di outlier
Outlier è un termine utilizzato in statistica per definire, in un insieme di osservazioni, un valore anomalo e aberrante; un valore quindi chiaramente distante dalle
altre osservazioni disponibili.
Gli outlier costituiscono un problema, perché tendono a distorcere i risultati delle
analisi dei dati, in particolare le statistiche descrittive e le correlazioni. In linea di
principio dovrebbero essere individuati nella fase di data cleaning (se derivano da
errori di estrazione), ma possono essere trattati anche nella fase successiva di analisi
dei dati.
In realtà, negli ultimi anni, accanto ad un’accezione negativa associata al termine
“outlier” si può osservare un’accezione positiva che vede negli outlier porzioni di
informazione inaspettata che, se confermata essere veritiera, diventa estremamente
preziosa.
Nelle successive sottosezioni saranno illustrate le entità di questi dati che si
discostano dalla norma.
5.3.1
Inflazione
I grafici inflattivi denotano diversi punti che si discostano dalla normalità del Paese
in questione.
Per quanto riguarda l’Europa Occidentale, individuiamo per l’Italia degli outlier:
nel 1974 (19,40%) e nel 1980 (21,27%); per la Grecia sempre nel 1974 (26,86%); per
la Spagna nel 1977 (24,52%).
In Europa Orientale, la Polonia presenta due valori inflattivi importanti: 103,55%
nel 1982 e 555,38% nel 1990; la Romania presenta outlier nel 1993 (255,16%) e nel
1997 (154,76%).
In America Latina si nota l’Argentina nel 1976 (443,96%) e nel biennio 1989-1990
(3079,81%; 2313,96%).
5.3 Ricerca di outlier
91
In Asia individuiamo outlier in Giappone nel 1974 (23,17%), in Korea del Sud
nel 1980 (28,70%), in Vietnam nel 2008 (23,11%).
Le Nazioni Africane mostrano i seguenti outlier sull’inflazione: Algeria nel 1992
(31,66%) e nel 1994 (29,04%); Libia nel 1978 (29,37%); Burkina Faso nel 1977
(29,98%) e nel 1994 (25,17%); Etiopia nel 1976 (28,53%), nel 1991 (35,72%), nel
2008 (44,39%), nel 2011 (33,22%); Kenya nel 1993 (45,97%).
Per gli Stati arabi notiamo outlier in Iraq nel 1994 (448,5%) e in Iran nel 1995
(49,65%) e nel 2013 (39,26%)
Nei Paesi del BRICS, il Brasile presenta nel quinquennio che va dal 1989 al 1994
diversi outlier, con valori che vanno dal 1430,72% al 2075,88%; la Russia mostra
outlier nel 1993 (874,62%) e nel 1999 (85,74%); la Cina nel 1994 (24,23%); l’India
nel 1974 (28,60%).
5.3.2
Crescita della moneta in senso ampio
Per quanto riguarda l’Europa Orientale si registrano oulier in Polonia nel 1989
(509,48%) e in Romania nel 1993 (172,16%).
In America Latina notiamo come la situazione Argentina sia molto turbolenta;
qui abbiamo più outlier: nel 1972 (110%), 1976 (353,48%), 1977 (227,17%), 1983
(410,19%), 1984 (654,96%), 1985 (428,25%), 1989 (2235,18%), 1990 (1113,27%). In
Venezuela possiamo evidenziare outlier nel 1975 (53,28%), nel 1990 (64,88 %) e nel
2003 (62,40%).
La situazione asiatica delinea anche un outlier negativo (Giappone, 2001, 17,23%). Gli altri valori comprendono outlier per il Giappone nel 1962 (61,02%)
e nel 1970 (67,39%); per la Korea del Sud nel 2001 (85,20%); per il Vietnam nel
1999 (66,45%) e nel 2007 (49,10%).
In Africa i valori sono presenti in Egitto nel 1980 (51,41%); in Libia nel 1965
(50,94%), nel 1974 (56,45%), nel 2008 (49,19%); in Algeria nel 2001 (54,05%); in
Burkina Faso nel 2003 (69,07%); in Kenya nel 1977 (48,89%).
Negli Stati Arabi evidenziamo i valori di Qatar nel 1975 (66,74%), nel 1976
(54,67%) e Kuwait nel 1966 (41,36%) e nel 1981 (41,43%).
Per i Paesi del BRICS notiamo numerosi punti fuori dalla norma, in particolare
in Brasile nel 1988 (2732,95%), 1989 (1904,88%), 1992 (1749,38%), 1993 (3280,65%),
1994 (1102,38%); in Russia nel 1994 (216,54%), 1995 (112,57%); in Cina nel 1979
(49,24%), e nel 1993 (46,66%).
5.3.3
Crediti bancari deteriorati sul totale dei prestiti lordi
In Europa Occidentale notiamo valori fuori dalla norma solo per la Grecia, in
particolare nel 2012 (23,27%) e 2013 (31,89%).
Per la situazione dell’Europa Orientale abbiamo outlier in Romania nel 1997
(65%) e nel 1998 (71,7%).
Per l’Africa, abbiamo un outlier in Etiopia nel biennio 2002-2003 (43,8%; 40,5%)
e in Kenya nel 2003 (34,9%).
5.3.4
Capitale bancario sul totale delle attività bancarie
Per questo indice i valori si mantengono nella norma per tutti i Paesi in oggetto.
92
5.3.5
5 Analisi Descrittiva
Tasso di interesse reale
Riguardo il tasso di interesse reale, in Europa Occidentale solo la Grecia presenta
un outlier negativo nel 1973 (-9,85%).
In Europa Orientale vediamo outlier in Romania nel 1994 (-20,34%) e 1997
(-26,72%).
Anche in America notiamo numerosi outlier: uno soltanto in Argentina, nel 2001
(29,12%); mentre in Venezuela abbiamo outlier nel 1987 (-18,61%), 1989 (-35,07%),
1993 (21,46%), 1996 (-35,31%), 1998 (23,09%), 2010 (-18,90%).
In Asia sono presenti due dati di picco in negativo in Giappone nel 1970 (12,22%) e nel 1974 (-9,78%).
Per quanto riguarda l’Africa, si registrano outlier: in Libia nel 2009 (41,92%); in
Marocco nel 1980 (-19,56%); in Algeria nel 2009 (21,56%); in Etiopia nel 1985
(-17,67%), 2001 (17,63%), 2008 (-17,12%); in Kenya nel 1971 (20,06%) e 1998
(21,09%).
Negli stati Arabi notiamo outlier in Qatar nel 2005 (-18,30%), 2009 (41,25%),
2015 (35,45%); in Iran nel 2013 (-17,37%); in Iraq nel 2005 (-14,1%) e 2009 (43,67%);
in Kuwait nel 1979 (-24,50%), 1980 (25,08%), 1986 (46,20%), 1998 (31,47%), 2009
(28,23%), 2015 (43,24%).
Per i Paesi appartenenti al BRICS notiamo variazioni di valore improvvise in
Brasile nel 1998 (77,61%); in Russia nel 1995 (72,25%), 1996 (69,27%), 1999 (18,95%) e in Sud Africa nel 1980 (-12,34%).
5.3.6
Tasso d’interesse sui depositi
Per quanto concerne l’indice relativo al tasso d’interesse sui depositi in Europa
Orientale, notiamo un outlier in Polonia nel 1989 (246,87%).
Nelle nazioni del Sud America, registramo in Argentina un valore incredibile
(17235,81%) nel 1989, e un valore appena meno clamoroso (1517,87%) nel 1990; in
Venezuela si riscontra un outlier nel 1993 (53,74%).
Dei Paesi appartenenti al BRICS notiamo dati improvvisamente elevati in Brasile nel 1989 (5844,98%), 1990 (9394,29%), 1993 (3293,50%), 1994 (5175,24%) e in
Russia nel 1995 (101,95%).
5.3.7
Tasso di interesse sui prestiti
L’indice relativo al tasso di interesse sui prestiti registra forti squilibri per alcuni
Paesi del Globo.
In Europa Orientale vediamo tali outlier in Polonia nel 1990 (644,49%).
In America Latina notiamo outlier per l’Argentina nel 2002 (51,67%); in Venezuela nel 1993 (59,90%), 1998 (46,36%) e 2002 (36,57%).
In Asia si vede un picco in Vietnam nel 1993 (32,18%).
Per quanto riguarda i Paesi Africani, vediamo due outlier in Kenya nel 1994
(36,24%) e 1996 (33,78%).
Dei Paesi appartenenti al BRICS evidenziamo i valori della Russia nel 1995
(320,30%).
5.3 Ricerca di outlier
5.3.8
93
Differenziale del tasso di interesse
I dati relativi allo Spread del tasso di interesse registrano squilibri per l’Europa
Orientale in Polonia nel 1989 (-165,06%) e 1990 (541,63%) e in Romania nel 1994
(33,39%).
In America Latina registriamo dati fuori dalla norma in Venezuela nel 1989
(-6,41%).
In Asia solo il Vietnam presenta un outlier nell 1993 (10,14%).
La situazione dei Paesi apparenenti al BRICS è pressochè costante, eccetto per
la Russia nel 1995 (218,35%) e 1996 (91,75%).
5.3.9
Premio per il rischio sui prestiti
Il premio per il rischio sui prestiti evidenzia andamenti discostanti dalla norma in
diversi Paesi.
In Europa Occidentale si nota nella Spagna un outlier nel 1983 (-4,79%).
Per l’Europa Orientale vediamo outlier in Romania nel 1997 (-13.19%) e 2003
(10,36%).
Dei Paesi africani registriamo il dato del Kenya che presenta un outlier nel 1993
(-25,71%).
Per quanto riguarda i Paesi del BRICS, è la Russia che presenta outlier nel 1995
(152,26%) e nel 1996 (60,74%).
6
Analisi Diagnostica
In questo capitolo verrà illustrata la seconda fase di Big Data Analytics, ovvero la
Diagnostic Analytics. In particolare, verranno analizzate tutte le cause dalle quali
derivano gli squilibri visti nell’analisi descrittiva.
6.1 Premessa
Come già illustrato nei capitoli precedenti, l’analisi diagnostica si basa sulla ricerca
delle cause che hanno portato alla situazione attuale. Conoscere lo stato attuale però
non è sufficiente per comprendere la situazione corrente e adottare strategie mirate:
analisi diagnostiche permettono di individuare i motivi di determinate tendenze o
avvenimenti, per valorizzare e ripetere le azioni più efficaci e ottimizzare le attività
che non hanno portato i risultati previsti.
6.2 Diagnostic Analytics
In questa fase di analisi, illustriamo le cause e le problematiche che, come abbiamo
visto con la Descriptive Analytics, hanno portato alla creazione di outlier. Inoltre
vedremo i collegamenti tra i Paesi, sia appartenenti allo stesso gruppo che a gruppi
differenti.
6.2.1
Europa Occidentale
Gli outlier registrati in Europa Occidentale riguardano l’Italia, la Grecia e la Spagna.
Italia, 1974, 1990
In Italia, il 1974 è passato alla storia come l’anno dell’inflazione galoppante; si tratta
di un’inflazione distruttrice e sperequatrice. Le categorie più povere e più deboli ne
soffrono di più di quelle ricche e più robuste. Le regioni meno sviluppate sono le più
sacrificate rispetto a quelle più progredite. L’indice del costo della vita per il mese
96
6 Analisi Diagnostica
di settembre 1974 segna un incremento del 24,6% rispetto allo stesso mese dell’anno
precedente. Il potere d’acquisto della moneta, in termini di prezzi al minuto, ha,
quindi, perso un quarto del suo valore.
Un taglio gravissimo verificatosi nel giro di soli dodici mesi, più elevato di quello
subito negli anni di guerra, un periodo di pace che, però, ha visto un periodo di
guerra dei prezzi.
La crisi petrolifera del periodo ’73-’76 sconvolge il quadro economico del Paese;
la dipendenza della nostra economia dagli idrocarburi rivela tutto il suo costo e la
sua pericolosità. Si tenta una programmazione industriale, ma alle chiacchiere non
seguono i fatti, se non nel salvataggio di imprese e banche in crisi. Nella politica
di salvataggio viene coinvolta principalmente la chimica di base (Montedison, Sir e
Liquichimica finiscono all’Eni per strade diverse); l’Efim persegue autonome politiche espansive creando gravi squilibri economici e finanziari; i fondi di dotazione
raggiungono, nel 1978, quasi il 25% dei trasferimenti complessivi alle imprese. L’intervento di sostegno alle imprese si caratterizza, quindi, per una forte componente
“assistenziale” a società non più remunerative, in settori obsoleti.
Le stime sui ritorni economici che sarebbero entrati nelle casse dello stato dalla
nazionalizzazione del settore elettrico si rivelano utopistiche, anzi, anche l’Enel entra
in una crisi finanziaria di tale gravità che impone, nel 1973, la costituzione di un
fondo di dotazione. Il settore elettrico, in mano privata produceva “vergognosi” utili
per gli azionisti, in mano pubblica produce “democratici” debiti a carico del Paese.
Il 1980 è l’anno record per l’inflazione italiana dal 1960 ad oggi, un’inflazione
che tocca 21.27 punti; si tratta un aggravarsi della malattia inflazionistica nata
nel 1974. Pose rimedio al problema l’allora neo governatore della Banca d’Italia;
infatti, Carlo Azeglio Ciampi sostenne che, per curare la malattia inflazionistica
italiana, bisognava sostenere con maggiore determinazione l’applicazione di una
politica monetaria restrittiva, funzionale agli accordi dello SME, cioè di un sistema
di cambi semifissi con le altre valute europee che il nostro paese sottoscrisse nel 1979,
al fine di ridurre il gap inflazionistico tra l’Italia e gli altri paesi europei. Col divorzio
tra Tesoro e Banca d’Italia, sancito in maniera consensuale tra l’allora Ministro del
Tesoro Beniamino Andreatta e Carlo Azeglio Ciampi, la nostra Banca Centrale non
fu più costretta ad acquistare in asta primaria i titoli invenduti. Ciò fu applicato
gradualmente ed ebbe un effetto benefico per il calo dell’inflazione italiana, unito,
appunto, ad una più determinata politica monetaria restrittiva.
Grecia, 1974, 2012
Il 1974 è un anno di svolta epocale per la Grecia; vi è la fine della dittatura dei
colonnelli iniziata il 21 aprile 1967 e terminata il 24 luglio 1974. Si ritorna al voto
e alla democrazia; questo è un anno di iperinflazione come, del resto, in altri paesi
europei come, l’Italia. La causa dell’aumento dell’inflazione fu monetaria. Partı̀ tutto
dagli anni ’60 quando la Federal Reserve aumentò la base monetaria ad un ritmo
sostenuto per aiutare il Governo a finanziare sia la Guerra del Vietnam sia le nuove
politiche di welfare proposte dal presidente Johnson.
Questo contribuı̀ alla fine degli accordi di Bretton Woods nell’agosto del 1971,
lasciando mano libera alla creazione di moneta ad un ritmo ancora maggiore. L’inevitabile conseguenza di tali azioni fu un maggiore tasso d’inflazione. Inoltre, per
6.2 Diagnostic Analytics
97
evitare che la propria valuta si apprezzasse troppo rispetto al dollaro americano,
molti paesi adottarono una politica monetaria ugualmente espansiva, e perciò iperinflazionistica, ed è quello che fece anche la Grecia. L’aumento dell’inflazione degli
anni ’70 fu dovuta, anche, alle crisi petrolifere di quel periodo dovute all’embargo
delle esportazioni da parte dell’OPEC (ottobre 1973 - marzo 1974) ed al calo della
produzione in seguito alla rivoluzione iraniana (1979 - 1983). In pratica, si sostiene
che l’aumento del prezzo del petrolio abbia aumentato tutti gli altri prezzi; infatti è
ragionevole sostenere che un calo della produzione petrolifera, e perciò energetica,
portare alla diminuzione della la produzione di altri beni. Se tutti i beni diventano
più scarsi, è lecito aspettarsi un aumento nel livello generale dei prezzi.
Un’altra epoca finanziaria che ha sconvolto la Grecia è nel 2012. Ma per arrivare a quel punto bisogna procedere per gradi, illustrando la situazione politicoeconomica di pochi anni prima.
Quando la crisi finanziaria ha colpito il mondo, la Grecia già era poco preparata. Il debito pubblico, dopo anni di spreco, dopo il colpo di grazia sui conti dato
dalle costosissime Olimpiadi ospitate nel 2004, e dopo che il governo non era riuscito a colmare la voragine degli sperperi, era cresciuto enormemente nel 2009 fino
ad inghiottire, prima il 120% del Prodotto Interno Lordo (PIL), e poi, negli anni
successivi, fino al 160%. Fin dall’inizio della crisi economica il paese era già stato
individuato come bersaglio dagli speculatori che hanno iniziato a scommettere su
un suo crollo finanziario.
Successimamente, la crisi greca, nel 2012, ha fatto lievitare il costo del denaro
preso in prestito dagli altri stati in condizioni di bilancio simili a quelle greche,
inclusa l’Italia. Questo significa, in sostanza, che gli stati devono pagare interessi
più alti sui loro prestiti e, di conseguenza, sono costretti a inasprire le politiche,
riducendo le spese e aumentando le tasse.
Il caso greco è considerato, dall’Unione Europea, una questione molto importante vista la possibilità che tale situazione si ripercuota negli altri mercati della
zona euro. Per tale motivo, al fine di scongiurare il default della stessa, l’UE, assieme al Fondo Monetario Internazionale, ha concesso alla Grecia un prestito per la
somma di 45 miliardi di Euro. Tale prestito è stato concesso a seguito di un piano
economico approvato dal governo ellenico, volto a ridurre il proprio debito pubblico
attraverso tagli significativi della spesa. Parte dell’opinione pubblica è contraria a
tale finanziaria e ciò ha portato a numerosi scontri ad Atene tra manifestanti e
forze dell’ordine, in occasione della festività del primo maggio 2010. Quindi, senza
mezzi termini, la troika di creditori (Fmi-Unione Europea-Bce), nel 2012, pose come
condizione, per sbloccare il pacchetto di aiuti internazionali, l’attuazione, da parte
del governo greco, di nuove misure strutturali e di austerità. Fra esse spiccava la
proposta/pretesa di ridurre del 22 per cento i salari minimi, per dare uno slancio
alla competitività dei prodotti greci.
Per la Grecia, per la prima volta nell’Eurozona, si è concesso l’aiuto sotto forma di prestito europeo (in passato erano stati impiegati fondi Europei per aiutare
l’Ungheria e la Lettonia). Sebbene, in termini di dimensioni sul mercato mondiale,
il peso della Grecia appaia insignificante, la sua crisi ricorda agli investitori che i
governi non possono fare affidamento su prestiti concessi a buon mercato e che una
crisi in un solo paese UE rischia di destabilizzare l’euro e di generare un crollo monetario a livello internazionale. Anche gli altri Paesi dell’area Europea risentono di
98
6 Analisi Diagnostica
ciò.
Spagna, 1977
Per quanto riguarda la Spagna notiamo outlier nel 1977. Siamo nel periodo della
transizione spagnola, quel periodo storico in cui la Spagna abbandonava il regime dittatoriale del generale Francisco Franco, passando ad una Costituzione che
consacrava uno Stato sociale, democratico e di diritto.
La maggior parte degli storici fissano la data della transizione al 20 novembre
1975, data della morte del dittatore Francisco Franco. Il cambiamento radicale avvenne il 15 giugno 1977, con le prime elezioni democratiche spagnole con la vittoria
del partito UCD, L’Unione del Centro Democratico di Adolfo Suarez. La soluzione della crisi economica e la stesura di una nuova Costituzione sono i due grandi
obbiettivi del nuovo Governo.
Nel 1977 la situazione economica è esplosiva: in un paese in cui il 66% dell’energia
è importata, la crisi petrolifera del 1973 è passata inavvertita. Gli ultimi Governi di
Franco non hanno preso nessuna misura di fronte al barile di petrolio che passa, in
dodici mesi, da 1,63 a 14 dollari. Le esportazioni coprono il 45% delle importazioni,
il paese e carente di risorse per mantenere il suo interscambio con l’estero e perde
100 milioni di dollari al giorno di riserve esterne. Si accumulano, tra il 1973 e il 1977,
14000 milioni di dollari di debito estero, il che rappresenta un importo superiore
al triplo delle riserve auree e di divisa del Banco di Spagna. L’inflazione è a livelli
quasi sudamericani: dal 20% del 1976, si passa a mediamente al 44% del 1977.
Le imprese hanno debiti per un centinaio di migliaia di milioni di pesetas; la disoccupazione raggiunge una larghissima crescita, toccando 2 milioni di disoccupati.
Le forze politiche, di comune accordo, approvarono, il 27 ottobre del 1977, i patti di
Moncloa (un accordo tra tutte le forze politiche parlamentari per combattere l’allarmante situazione economica), con il loro contenuto che si divide in misure urgenti
contro l’inflazione e lo squilibrio esterno e riforme necessarie a medio termine per
ripartire i costi della crisi. Gli effetti dei patti di Moncloa sono positivi in alcuni
versi e meno in altri: l’inflazione crolla, nell’anno, al 26,4% contro le previsioni del
80% e chiuderà, nel 1978 al 16%; le riserve di divise duplicano; i conti delle imprese
cominciano a migliorare e comincia il cammino verso un bilancio in attivo.
6.2.2
Europa Orientale
Polonia e Romania subiscono diversi squilibri economici, come vedremo nelle
prossime sottosezioni.
Polonia, 1982, 1990
In Polonia si registrano due importanti outlier, nell’anno 1982 e nell’anno 1990.
Questo è il periodo della legge marziale, un periodo di tempo che va dal 13
dicembre 1981 al 22 luglio 1983, quando il governo comunista della Repubblica Popolare polacca limitò drasticamente la vita quotidiana con l’introduzione della legge
marziale, nel tentativo di schiacciare l’opposizione politica, guidata dal movimento
Solidarnosc.
6.2 Diagnostic Analytics
99
Migliaia di attivisti dell’opposizione furono internati senza accuse formali, e fino
a 100 persone vennero uccise. Anche se la legge marziale fu revocata nel 1983, molti
dei prigionieri politici non vennero rilasciati fino all’amnistia generale del 1986.
Anche dopo la revoca della legge marziale, rimase in vigore, per diversi anni,
una serie di restrizioni che riducevano drasticamente le libertà civili delle persone
che vivevano in Polonia. Questo portò a gravi conseguenze economiche. La giunta
militare al potere introdusse forti rincari con le cosiddette “riforme economiche”,
che provocarono una riduzione del reddito della popolazione in termini reali del
20% o più. La risultante crisi economica portò al razionamento della maggior parte
dei prodotti e dei materiali, compresi gli alimenti di base. Tutto questo ebbe delle
enormi ripercussioni sull’inflazione polacca facendo sı̀ che essa toccasse i 103,55
punti percentuali. Le difficoltà economiche provocarono un esodo di manodopera
polacca; infatti, dal 1981 al 1986, circa 700.000 persone lasciarono il paese. Anche
se la fornitura di beni alimentari migliorò leggermente negli anni ’80, la carenza
divenne particolarmente grave.
Il 1990 è l’anno in cui l’inflazione esplose; non vi è un avvenimento storico cruciale per sottolineare questo dato enorme del 555,38%; l’economia polacca funzionava
male e il livello d’inflazione era incrementato negli anni; lo stato polacco era come
un malato che non era stato curato: l’economia funzionava male e questo ha avuto
ricadute sull’inflazione. L’inizio del cambio di marcia che avrebbe portato alla crescita dell’economia polacca avvenne già nel 1988 quando fu emanata la prima legge
sulla libertà economica e, successivamente, nel 1989, con le prime libere elezioni
dopo la seconda guerra mondiale.
Nel 1990 vi è stato un processo di riforme radicali che avrebbe portato alla formazione di moderne strutture di economia di mercato. Grazie a queste trasformazioni,
l’economia polacca ha iniziato a recuperare terreno rispetto ai paesi occidentali,
almeno per quanto riguarda il reddito pro capite, ad un ritmo mai visto prima nella
storia. All’inizio degli anni ’90 il reddito medio pro capite dei polacchi era circa un
quarto di quello dei tedeschi: attualmente è la metà.
Da allora il tasso medio di crescita economica del paese è stato di circa tre punti
percentuali più alto rispetto alla Germania. Sono stati tre i fattori chiave che hanno
permesso all’economia polacca di crescere velocemente. In primo luogo, negli anni
novanta, la partecipazione statale all’economia è stata presto ridotta a favore del
settore privato. Si è trattato del ricorso alle privatizzazioni, del rapido sviluppo
dell’imprenditoria privata e dell’afflusso di investimenti esteri.
La Polonia si è dotata di un buon quadro normativo per ampliare la sfera della proprietà privata, grazie, soprattutto, alla tripartizione democratica dei poteri
e alla presenza di mass media indipendenti, nonché di regolamenti tutto sommato affidabili. Una politica macroeconomica stabile, basata sulla graduale riduzione
dell’inflazione e sull’adozione di un tasso di cambio flessibile, ha giocato un ruolo
fondamentale per consentire alla Polonia di attrarre capitali stranieri. Il terzo fattore chiave per lo sviluppo del paese è stata l’apertura al mondo esterno attraverso
l’eliminazione graduale delle barriere che ostacolavano il flusso di merci e servizi. Il
governo polacco ha abolito progressivamente dazi e altre limitazioni che pesavano
sugli scambi commerciali, aprendo il paese alla concorrenza mondiale e assicurando
un rapido aumento dell’efficienza.
100
6 Analisi Diagnostica
Romania, 1993
In Romania lo squilibrio avviene nel 1993. In quell’anno, il livello delle esportazioni
rumene era la metà di quello del 1989; nello stesso periodo anche il PIL calava del
25%, soprattutto per il crollo della produzione industriale, mentre l’inflazione si
manteneva su livelli altissimi, vicini al 200% annuo.
Il primo programma di privatizzazione avviato dal governo, e basato su un sistema misto (le 6000 maggiori aziende statali dovevano essere vendute per un terzo
a un azionariato popolare e per i restanti due terzi a società private) non portava
miglioramenti immediati, e il grosso delle aziende continuava a vivere soprattutto di
sussidi statali. Anche la riforma agraria, che nel Novanta aveva restituito ai proprietari d’un tempo o ai loro eredi le terre espropriate all’inizio del regime comunista,
provocava inizialmente un calo della produzione agricola, dato che moltissimi dei
“nuovi” titolari non erano in grado di occuparsi delle terre ricevute.
Fra il 1993 e il 1994, tuttavia, emergevano alcuni segnali positivi che indicavano
un significativo mutamento nel quadro generale dell’economia: per la prima volta,
dal 1988, si registrava un incremento, seppur minimo, del PIL. Alla fine del 1994 la
pressione dell’inflazione si riduceva notevolmente (62%) e le esportazioni riprendevano ad aumentare. In virtù di questi risultati, che già si erano delineati nella prima
metà dell’anno, il Fondo Monetario Internazionale accordava alla Romania un prestito di 720 milioni di dollari (maggio 1994), nell’ambito di un accordo di più ampio
respiro, i cui elementi di maggior rilievo si identificavano nell’imposizione di una
politica monetaria restrittiva, di una prudente politica fiscale e di un’accelerazione
delle riforme strutturali, incluse le privatizzazioni.
Nel 1995, tuttavia, solo l’8% del capitale delle 6000 imprese per le quali era
prevista la privatizzazione era effettivamente posseduto da privati e, nel complesso,
il settore privato incideva sulla produzione industriale soltanto nella misura del 14%.
Maggiore era la sua influenza nel terziario (44%) e ancor di più nell’agricoltura (80%); tuttavia, le difficoltà di accesso al credito, la scarsa meccanizzazione e,
soprattutto, la perdurante incertezza sui titoli formali di proprietà della terra rendevano ancora molto lento lo sviluppo di questo settore, nonostante alcune buone
annate metereologiche. Nel complesso, il PIL del 1995 registrava un incremento del
6,9%, uno dei più rilevanti a livello europeo, con un forte apprezzamento della moneta nazionale e una parallela crescita delle importazioni; su questa base il governo
avviava un nuovo programma di riforme liberalizzatrici che avevano, tuttavia, un
risultato negativo: il PIL nel 1996 registrava una crescita del 4%, che l’anno successivo diventava una perdita del 6,6%, nel 1998 del 7,3% e nel 1999 del 4,5%; la
completa liberalizzazione dei prezzi portava, anche, a una risalita dell’inflazione,
fino al 50% annuo del 1999.
6.2.3
Africa
L’Africa, vittima ricorrente delle colonizzazioni straniere, ha registrato, nel settore
finanziario, numerosi valori fuori dalla norma. I Paesi da noi esaminati sono stati
Algeria, Kenya e Libia. Eccetto per Algeria e Libia, è stato il petrolio la causa
comune dello sconvolgimento economico. Si era pensato che lo scarso coinvolgimento
internazionale dell’economia Africana nel suo complesso l’avrebbe in qualche modo
6.2 Diagnostic Analytics
101
protetta dagli effetti della crisi. Si pensava che la diminuzione dei flussi finanziari
privati avrebbe poco influito sulla salute delle banche africane, prevalentemente
finanziate da fonti locali (nazionali o regionali).
La realtà è ben diversa, perchè, se è vero che l’economia africana è lontana dalle
cause che hanno direttamente provocato la crisi finanziaria mondiale, è altrettanto
vero che essa è estremamente vulnerabile agli effetti di tale crisi. La diminuzione dei
consumi nei paesi ricchi deprime l’economia dei paesi africani, esportatori di materie
prime, sia agricole che minerarie. La diminuita domanda porta ad una diminuita
esportazione, con inevitabile depressione dell’economia nel suo complesso.
Algeria, 1992-1994
L’Algeria ha un picco critico nel triennio che va dal 1992 al 1994. Il Paese è notoriamente afflitto da uno dei più alti livelli di corruzione al mondo, da nepotismo,
crisi economica, paralisi sociale, stallo legislativo. Se questo è il quadro viene da
chiedersi perché l’Algeria finora non è esplosa. Due i fattori che hanno arginato il
contagio dei Paesi vicini: le risorse energetiche e il trauma del “Decennio nero”.
Le prime, di cui il Paese è riccamente dotato (gas e petrolio rappresentano il 95%
dell’export), hanno sussidiato la vita degli algerini e comprato la pace sociale, reso
sconveniente il dissenso, comprato i nemici e accontentato gli amici. Paradossalmente, il problema dell’Algeria è proprio, il petrolio, con le sue quotazioni in caduta
libera che hanno ridotto di circa il 50% i proventi della vendita di idrocarburi.
Nel 1991 il Fronte Islamico di Salvezza vinse le prime elezioni libere del Paese
dopo l’indipendenza. Il colpo di Stato militare che ne è seguito (definito dall’allora
capo dello stato come “necessario per evitare la deriva islamica del Paese”) ha
causato oltre 200 mila morti e la decretazione dello Stato d’emergenza rimosso solo
nel 2011. In nome del pericolo jihadista l’Algeria si è trasformata in una democrazia
autoritaria nelle mani del pouvoir. Un vero e proprio Stato nello Stato, il pouvoir
è una rete oscura e impenetrabile di connivenze, connessioni, fedeltà claniche fra
mondo militare e mondo politico, monopolizzata dal Fronte di Liberazione Nazionale
(FLN) che, in nome della continuità storica e della narrazione pubblica ufficiale, ha
conservato invariato il suo nome dai tempi della guerra di indipendenza.
Il regime totalitario, il terrorismo, la crisi petrolifera sono state le cause degli
squilibri economici, che ancora oggi si ripercuotono sullo Stato.
L’Algeria, infatti, ha uno dei sistemi economici più dinamici (benché poco diversificato) del continente africano; tuttavia, il tasso di inflazione, fino al 2011 al 4%,
è schizzato al 9% nel 2012, per poi ristabilizzarsi intorno al 4%.
Libia, 2008, 2011
In Libia i principali oulier sono presenti nel periodo di storia recente.
In questo Paese, il petrolio rappresenta la principale fonte di ricchezza. La Libia
oggi oggi vanta un elevato reddito, ma, sino alla metà degli anni Cinquanta, era uno
dei Paesi più poveri del mondo.
La Libia aveva allora un’economia tradizionalmente fondata su un’agricoltura e
un allevamento molto modesti; in pratica dipendeva dagli aiuti esteri e dalle entrate
valutarie connesse alla presenza delle basi militari britanniche e statunitensi. L’era
102
6 Analisi Diagnostica
del petrolio inizia nel 1955 con le prime prospezioni da parte delle grandi compagnie
americane; nel 1959 fu scoperto il colossale giacimento di Zelten, in Tripolitania,
cui fecero seguito numerosi altri rilevamenti. Vasti territori libici furono subito dati
in concessione alle multinazionali petrolifere, mentre le scoperte si susseguivano a
catena a opera dei tecnici della Esso, della Gulf, della Shell.
La vita economica del Paese cominciò a subire profonde trasformazioni, che inevitabilmente ebbero riflessi di natura anche politica, determinando, nel 1969, la
caduta della monarchia. L’avvento della Repubblica assunse, infatti, ben presto il
significato, per la Libia, di una riappropriazione delle risorse nazionali. Nel 1970
venne fondata la NOC (National Oil Corporation) e, man mano, furono rivisti i
rapporti con le società petrolifere operanti nel Paese, di cui talune vennero interamente nazionalizzate, altre associate sulla base di joint ventures, sempre però a
prevalente capitale libico. L’enorme afflusso valutario derivante dalla vendita del petrolio fu ampiamente destinato al miglioramento delle condizioni di vita del Paese;
non si volle, però, unicamente operare nell’ambito di realizzazioni strettamente vincolate a ideologie e a modelli occidentali, ma furono prescelte linee d’azione volte
a valorizzare, attraverso una via nazionale dell’economia, l’intero contesto panarabo. In effetti, dietro alla ricerca di una “via” socialista islamica, intermedia fra
capitalismo e comunismo, vi è anche la presa di coscienza della Libia di essere un
Paese ricchissimo di risorse naturali, ma troppo poco popolato per poter utilizzare
adeguatamente le proprie risorse.
Nel 2008 gli squilibri sono dovuti alla crisi del petrolio. Il prezzo del petrolio,
nel luglio 2008, ha raggiunto il valore di 147 dollari per barile, superando il picco
raggiunto nell’aprile 1980 (pari a circa 102 dollari per barile in valuta attuale). Il
prezzo è, successivamente, calato sotto i 40 dollari al barile nel dicembre 2008, con
l’acuirsi della crisi finanziaria, per poi attestarsi su livelli compresi tra 60 e 70 dollari
al barile nei mesi di maggio e giugno 2009.
Le cause principali del rialzo dei prezzi petroliferi sono identificate nei seguenti
fattori: forte crescita della domanda (e aspettative di ulteriore crescita) di beni di
consumo, quali automobili, mezzi di trasporto privati, elettrodomestici, e di servizi
energetici, quali trasporto, turismo, riscaldamento, effetti speculativi dovuti alla
progressiva finanziarizzazione dei mercati energetici, etc.
I prezzi delle altre fonti fossili sono cresciuti in maniera continua dal 2002 facendo registrare un picco di crescita nella prima metà del 2008, seguito da una
rapida caduta con l’avvento della crisi e da una risalita nei mesi recenti sui livelli
pur elevati del 2006. Nonostante il prezzo del gas naturale sia indicizzato a quello
del petrolio in molti contratti, le forniture di lungo periodo via gasdotto hanno risentito in misura più contenuta dei rialzi rispetto ai prezzi spot del mercato del Gas
Naturale Liquefatto (GNL), il cui prezzo resta mediamente superiore a quello del
gas consegnato via gasdotto. Anche il prezzo del carbone ha seguito, in generale,
quello del petrolio, con rialzi in termini relativi anche più pronunciati, pur partendo
da valori assoluti inferiori, e con un certo ritardo nella fase di discesa.
Nel 2011 gli squilibri sono dettati dal cambio di governo; infatti, in quell’anno,
si è aperto un conflitto tra le forze di Muammar Gheddafi (Dittatore, a capo del
governo libico dal 1969), e le forze ribelli che puntano alla caduta del regime in
favore di una repubblica democratica.
La ribellione, capeggiata da un governo ad interim di unità nazionale, è stata
6.2 Diagnostic Analytics
103
appoggiata da un intervento militare internazionale sotto l’egida dell’ONU, volto a
porre freno all’uccisione di civili da parte dell’esercito libico. Muammar Gheddafi,
dittatore della Libia per 42 anni, è stato ucciso la mattina del 20 ottobre 2011 nei
dintorni di Sirte dai guerriglieri della rivoluzione.
Questo forte cambiamento ha provocato ripercussioni anche in campo economico, vedendo, però, anche una crescita, in quell’anno, dell’indice relativo alla moneta
in senso ampio.
6.2.4
Asia
Giappone, 1974
Il Giappone registra dati fuori dalla norma nel 1974. Se, fino ad allora, la storia
del Giappone lo aveva definito come “miracolo economico”, perchè il Paese asiatico
seppe risollevarsi al meglio dalla situazione disastrosa del secondo dopoguerra, fino
a raggiungere alti picchi di crescita economica durante gli anni cinquanta e sessanta,
nel 1974 la storia cambiò.
La storia dello sviluppo economico giapponese nel dopoguerra può essere suddivisa in due fasi: dal 1950 al 1973 la crescita del Giappone fu impetuosa e disordinata fino a quando la crisi energetica del 1973 causò un improvviso rialzo dei
prezzi del petrolio, provocando una riduzione del tasso di sviluppo, ma anche una
razionalizzazione dell’intero sistema produttivo giapponese.
I primi anni settanta, comunque, videro il Giappone affermarsi come superpotenza mondiale, risultato raggiunto grazie alla determinazione del popolo giapponese,
il quale, oltre a voler uscire il prima possibile dal periodo post-bellico, voleva dimostrare al mondo intero le proprie potenzialità. Tutto ciò, unito a un governo
stabile e ad un’ottima organizzazione dell’industria, fece diventare il Paese asiatico
un esempio da seguire e un modello economico per tutte le economie mondiali. Questo decennio, inoltre, vide il consolidarsi della posizione predominante delle aziende
giapponesi nel settore elettronico, dopo il primo exploit degli anni sessanta. Difatti,
a livello mondiale, tra le prime nove imprese sette erano giapponesi; tra queste le
principali erano la Hitachi e la Toshiba, che producevano attrezzature elettroniche
di vario genere. In questi anni tali prodotti invasero anche il mercato internazionale,
e il “made in Japan” divenne sinonimo di qualità.
Tale vertiginosa crescita economica, comunque, finı̀ per causare non pochi problemi a livello socio-demografico. Infatti, le città, una su tutte Tokyo, iniziarono
a crescere a livelli incessanti (la capitale raggiunse gli 8 milioni di abitanti) costringendo il governo a fare ricorso alla costruzione di grattacieli; nel frattempo gli
appartamenti divennero sempre più piccoli, compromesso utilizzato per poter guadagnare più spazio possibile e abbattere i costi delle abitazioni. Di conseguenza, il
livello di inquinamento acustico e atmosferico crebbe a dismisura, permettendo la
diffusione di disturbi respiratori, soprattutto nella zona di Tokyo-Yokohama, Nagoya e Osaka-Kobe, oltre all’emergere di altre malattie connesse all’inquinamento,
quale la malattia di Minamata. Come contromisura a tale fenomeno, il governo del
Giappone emanò una serie di leggi sul controllo dell’inquinamento, divenendo l’unica nazione ad utilizzare tale sistema, il quale prevedeva sanzioni sia alle fabbriche
sia ai privati in possesso di mezzi inquinanti che avevano causato danni all’ambiente
o alle persone.
104
6 Analisi Diagnostica
A causa delle limitate risorse energetiche disponibili all’interno del territorio
giapponese, la prima crisi energetica degli anni settanta colpı̀ in modo importante
il Paese nipponico, che dipendeva dalle importazioni di petrolio per il suo sostentamento energetico. I Paesi arabi e i loro alleati, nell’ottobre 1973, bloccarono le
esportazioni di petrolio fino a quando l’OPEC (Organizzazione dei Paesi Esportatori di Petrolio) intervenne per sbloccare la situazione, decidendo, in pochi mesi, di
quadruplicare i prezzi di mercato (da 3 a 12 dollari al barile) e di ridurre l’offerta
sui mercati internazionali. A differenza di altri Paesi, che potevano contare su una
autosufficienza energetica, come, ad esempio, gli Stati Uniti, il Giappone si trovò
in grossa difficoltà, vedendo rallentare notevolmente il proprio prodotto nazionale
lordo per la prima volta dall’inizio della ripresa del dopoguerra. Un’altra conseguenza fu l’aumento dell’inflazione, che superò in questo periodo il 20%, causando
un’insufficienza di beni di consumo.
Tuttavia, i giapponesi furono capaci di riottenere il controllo della situazione
molto più velocemente degli altri Paesi industrializzati colpiti dalla crisi; il tasso di
crescita raggiunse nuovamente il 5-6% e, nonostante una nuova crisi petrolifera nel
1979 fece di nuovo aumentare i prezzi del petrolio, il tasso di crescita si stabilizzò
sul 3-4%. Il livello di crescita non era paragonabile a quello degli anni cinquanta e
sessanta, ma rimaneva, comunque, più alto di qualsiasi altro Paese industrializzato.
Vietnam, 2007-2008
Il Vietnam vede outlier nel biennio 2007-2008. Uno dei principali fattori che vanno
tenuti in considerazione nell’analisi dell’economia vietnamita riguarda lo scarso livello di sviluppo e il ritardo con cui il paese ha iniziato il processo di trasformazione
dalla pianificazione centrale verso il sistema a economia di mercato.
Il Vietnam, come lo conosciamo oggi, è emerso agli occhi dell’Occidente dopo
il periodo 1989-91. Come già si è compreso, esso è generalmente riconosciuto come
un esempio di successo. Durante gli anni ’90, l’economia ha mostrato una rapida
crescita, e questo andamento è proseguito, pur a tassi leggermente più lenti, anche
dopo la crisi finanziaria che ha colpito l’Asia, fino agli anni 2000. In questo periodo il
Vietnam si distingue da molti altri Paesi della stessa area geografica. A seguito della
partenza del processo di riforme economiche, le esportazioni di prodotti agricoli
(in particolare riso e caffè) decollarono, dal momento che i contadini reagirono
positivamente alle nuove opportunità. Negli anni il Vietnam è diventato il terzo
più grande esportatore di riso al mondo, e il secondo per produzione di caffè. La
produzione di riso ha contribuito in maniera significativa alla rapida ascesa delle
esportazioni. In seguito la composizione del prodotto dell’export si è spostata da
una prevalenza di prodotti agricoli (il cui livello di esportazioni è ancora in crescita)
a una maggiore incidenza di beni industriali e artigianali.
Questo avanzamento nell’economia è proseguito, nonostante il biennio 2007-2008
abbia visto il ritorno di un’impennata dell’inflazione, che aveva già colpito lo stato
nei tardi anni 80. Nonostante questo, i prezzi e altri indicatori hanno mostrato una
stabilità macroeconomica nel paese, sin dalla riunificazione. Gli sviluppi economici
degli ultimi anni hanno rivelato alcune debolezze strutturali profondamente radicate
nel sistema economico. Queste sono, innanzitutto, legate a una contraddizione tra
la bassa competitività del settore delle imprese statali “import-substituting” e le
nuove sfide poste dalla competizione internazionale sempre più dura.
6.2 Diagnostic Analytics
105
Infine, si può vedere come, sul piano inflattivo, date le sue consistenti fluttuazioni
del tasso nel tempo, sembrerebbe che il Vietnam non disponga di un meccanismo
efficace per controllare l’inflazione, e questo ha avuto ripercussioni anche sul valore
della moneta.
A causa del deterioramento delle condizioni macroeconomiche in Vietnam, le
agenzie di credit rating internazionali hanno declassato la valutazione del credito
sovrano vietnamita.
Korea del Sud, 1997-1998
La Korea del Sud vede squilibri economici nel biennio 1997-1998. La crisi finanziaria
asiatica fu una crisi finanziaria che interessò alcuni paesi del Sud-Est asiatico alla
fine del XX secolo. Causata da una serie di speculazioni finanziarie, che provocarono
una forte svalutazione della moneta e lo sganciamento delle divise interessate dal
valore del dollaro, la crisi fu causata dal pesante indebitamento del settore privato
(banche e imprese), che provocò il ritiro improvviso dei capitali (tecnicamente un
deflusso) da parte degli investitori stranieri e degli istituti di credito.
Il fattore scatenante risultò essere l’ancoraggio delle divise nazionali al dollaro
(dollarizzazione), che, dal 1995, andò incontro a una rivalutazione del cambio. La
relativa debolezza del dollaro aveva garantito la competitività delle merci di Indonesia, Malesia e Thailandia, fino a che queste non hanno visto erodere il proprio
export dall’alto livello dei prezzi determinato da un cambio eccessivamente rivalutato (rispetto allo yen giapponese, apprezzamento aggravato dalla svalutazione dello
yuan cinese). La crisi valutaria fu determinata, oltreché dalla natura degli investimenti esteri a breve termine (prontamente ritirati dagli investitori stranieri), dalla
conversione delle attività nazionali e dei portafogli delle imprese in valuta estera,
fattore che aggravò la crisi di liquidità dei governi.
La Korea del Sud era riuscita, dopo la guerra, a formulare una strategia di
crescita economica che le aveva permesso di incrementare di otto volte il reddito
pro capite in tre decenni. La riduzione dell’analfabetismo e i forti investimenti per
colmare il gap tecnologico con le principali economie mondiali le avevano permesso,
all’inizio degli anni novanta, di diventare membro stabile dell’OCSE e di divenire
una delle principali produttrici di microchip.
La crisi in questo paese fu innescata da problemi strutturali legati al forte indebitamento delle proprie grandi imprese con creditori esteri. Il livello di scambio dei
flussi di capitale raggiunse il 9 % del PIL. All’inizio del 1997, si ebbero i fallimenti
della Hanbo Steel e della Sammi Steel, due delle maggiori conglomerate del paese.
Nello stesso anno, mentre la Thailandia veniva risucchiata nel baratro della recessione, l’istituto di rating finanziario Moody’s decise di declassare la Korea dal livello
A1 al livello A3 e, successivamente, al livello B2. Alla base della decisione sembrava
esserci, oltre al trend negativo in cui i mercati asiatici si stavano incanalando, la
richiesta, da parte del colosso coreano Kia Motors, di un prestito di emergenza. Le
banche occidentali decisero quindi di non rinnovare i propri prestiti alle imprese
coreane, limitando fortemente l’afflusso vitale di capitali e paralizzando l’economia.
La borsa Koreana perse il 4% del proprio valore nella sola giornata del 7 novembre 1997, e il 7% il giorno successivo. Il 24 novembre le richieste di pesanti “riforme
strutturali”, formulate dal FMI a fronte di un prestito, fecero crollare i titoli Koreani del 7,2%. Samsung perse oltre 5 miliardi di dollari durante la crisi, e Daewoo
106
6 Analisi Diagnostica
fu assorbita dal gruppo americano GM. Il cambio passò da 800 won per dollaro ad
oltre 1800 (la svalutazione giunse al 110%). A distanza di alcuni anni, nonostante
la crisi abbia costretto alla bancarotta numerose compagnie nazionali, la Korea del
Sud è riuscita, dal 1997 ad oggi, a triplicare il proprio PIL, mantenendo il ruolo
di una tra le più attive e fiorenti economie mondiali. A tal proposito è sufficiente
notare come dal 1960 a oggi, il PIL pro capite sia passato, in termini nominali, da
80 dollari a 21.000 dollari.
Gli effetti maggiori della crisi si sono fatti sentire sul debito pubblico, quasi
triplicato, dal 13% al 30% negli ultimi 10 anni.
6.2.5
Sud America
I Paesi Latino-Americani sono stati, storicamente, sempre visti dagli esperti come indicatori di squilibri economici, dettati da situazioni politiche e sociali molto
instabili.
Venezuela, 1975, 1995, 2003
In Venezuela sono visibili outlier nel 1975, nel 1995 e nel 2003. Uno sguardo al
passato è necessario per meglio comprendere ciò che accade successivamente.
Agli inizi degli anni ’70, il paese si collocava al terzo posto della graduatoria
mondiale; autorevole membro dell’OPEC, esercitava un ruolo di primo piano nelle
decisioni di tale organizzazione che portavano nel 1973, al primo “shock” petrolifero,
con la riduzione della produzione e l’aumento del prezzo (da 3 dollari al barile, il
Venezuela lo portò a 14 dollari, contro gli 11 dei Paesi del Golfo Persico); nel 1976
il settore venne nazionalizzato. Se, in questo periodo, l’aumento dei prezzi aveva
accresciuto enormemente le rendite pro-capite, rendendole le più alte del continente,
non fu dato impulso all’industria nazionale, preferendo arricchire il clientelismo
statale e ampliare gli sprechi della classe media; il destino dei poveri passò, cosı̀, in
secondo piano.
Cosı̀, quando le rendite petrolifere diminuirono, livelli astronomici di corruzione
e spreco erano diventati routine per un estabilishment politico costituito da solo
due partiti, che si dividevano i profitti di un potere clientelistico.
Intorno alla metà degli anni ’90 il PIL aveva ormai raggiunto i livelli di un
trentennio prima ed i salari industriali erano diminuiti del 40% rispetto agli anni
ottanta. Sotto il livello di povertà viveva, nel 1984, il 36% della popolazione; nel
1993 la povertà era quasi raddoppiata (66%). La grande miseria di molti per la
gloria e la ricchezza di pochi, separati da una classe media in diminuzione: questa
è stata la situazione che Chàvez si è trovato davanti una volta al potere.
Cosı̀, nei primi due anni della sua presidenza, si è occupato di risistemare la
cornice politica dello stato varando una nuova costituzione, mettendo un po’ da
parte la situazione precaria della maggior parte della popolazione. Da quando, nel
2001, sono partiti dei provvedimenti a favore dei più poveri sono immediatamente
iniziate le proteste. La classe media si è opposta al metodo di Chàvez di adoperare
il denaro proveniente dalle esportazioni petrolifere per progetti che andassero a
beneficio dei più poveri; sono stati aumentati, infatti, i budget per l’istruzione, per
l’edilizia pubblica e i servizi e per la spesa sanitaria. Scelte che la classe media
6.2 Diagnostic Analytics
107
non ha accettato, visto che ci sono ormai molte strutture private che si occupano
di ciò, e, soprattutto, che questi soldi, adesso investiti nella spesa pubblica, prima
entravano nelle loro tasche.
A causa delle proteste, alcuni dei decreti relativi a politiche socio economiche
sono diventati leggi. Uno di questi riguarda il settore petrolifero. Abbiamo detto che
il settore è stato nazionalizzato; l’organo che lo gestisce è la PDVSA, fino ai primi
del 2000 gestita come uno stato a sé da un management altamente privilegiato che
è sempre stato ostile a qualsiasi tipo di strategia per lo sviluppo nazionale e sociale.
La PDVSA aveva massimizzato gli investimenti oltremare, per ridurre il valore delle commissioni da pagare allo stato venezuelano; non contenta di ciò, ha
spinto compagnie straniere a rientrare nel paese, cercato di ridurre le quote dell’OPEC e spianato la strade ad eventuali privatizzazioni. Attualmente, la nuova legge
petrolifera limita del 50% la partecipazione di compagnie straniere e raddoppia le
commissioni fisse da pagare allo stato per ogni barile estratto; essa contiene clausole
che consentono al governo di riorganizzare l’industria se necessario. Ciò ha causato
forti dissensi all’interno della PDVSA che, nel 2002, ha organizzato scioperi insieme
alla FEDERCAMERAS, oltre ad aver contribuito al colpo di stato di aprile.
In seguito a questi fatti PDVSA è stata riorganizzata per rispondere alle nuove
politiche economiche del governo, fino ai giorni nostri.
Argentina, 1976, 1989-1990, 2001
La situazione dell’Argentina comprende diversi valori fuori dalla norma; un primo
outlier si ha nel 1976, un secondo oulier risale al biennio 1989-1990, un ultimo outlier
si ha nel 2001.
L’economia Argentina è la terza più grande in America Latina, dopo il Brasile e
il Messico, e la seconda più grande in Sud America. Essa è orientata verso lo sfruttamento agricolo e l’esportazione di terziario e tecnologia avanzata, una potente e
diversificata base industriale, un notevole livello di sviluppo nel campo della scienza, e una popolazione a maggioranza alfabetizzata. Nella seconda metà del secolo
scorso, la Repubblica è stata una dei paesi con le migliori prospettive nel mondo.
Tuttavia, tra il 1974 e il 2002, diverse depressioni economiche hanno colpito il suo
sviluppo.
Le politiche economiche neoliberiste adottate dal 1976, anno in cui avvenne il
colpo di stato civile-militare, che segna un punto di partenza riguardo il declino
delle attività industriali e una progressiva concentrazione della ricchezza ha fatto
si che le persone perdessero il tenore di vita che era stato raggiunto nella metà del
XX secolo.
Nei 7 anni di dittatura militare la crescita del debito estero passò da 8 a 44
miliardi di dollari. Nel 1975 gli interessi del debito estero assorbivano solo il 5%
delle esportazioni; dieci anni dopo il 60% delle importazioni serviva per ripagare i
soli interessi. Il principale introito dello stato era dato dai dazi sulle esportazioni. La
povertà aumentò cosı̀ tanto che, nel 1975, il prodotto nazionale lordo per abitante
era di 3500 dollari, dopo 10 anni ammontava a solo 2950, senza contare i continui
tagli alla spesa pubblica per la sanità e la scuola. Nel 1982 il regime decise di avviare il conflitto con il Regno Unito per ottenere la sovranità sulle isole Falkland.
La spedizione si rivelò un disastro e, alla fine della guerra, si contavano 600 vittime
108
6 Analisi Diagnostica
fra i soldati argentini. Questo avvenimento rappresentò il colpo definitivo al regime militare, nonché il periodo più triste della storia del paese, periodo noto come
“guerra sporca”. Come nuovo presidente venne eletto il radicale Raùl Alfonsin che,
in sei anni di governo, non riuscı̀ né a risolvere i gravi problemi dell’economia del
paese, come inflazione e deficit pubblico, né ad attuare le riforme di cui il paese
aveva bisogno.
Alla fine degli anni Ottanta gli indici economici fecero registrare valori record.
In particolare, era l’inflazione a destare forti preoccupazioni. Infatti quest’ultima
arrivò a toccare livelli superiori al 1000% a partire dal 1987.
Il mese più difficile fu, certamente, il gennaio del 1989, mese nel quale il FMI
(Fondo Monetario Internazionale) revocò la linea di credito precedentemente messa
a disposizione del governo argentino per agevolare il piano di risanamento dell’economia attuato da Alfonsin. Il risultato fu il collasso della finanza pubblica e la
conseguente fuga di capitali verso paesi più solidi come gli Stati Uniti, la cui moneta
(il Dollaro) vide aumentare il proprio valore di 25 volte rispetto al peso argentino
in meno di un anno.
Inoltre, un altro grave problema minava la fiducia del popolo nel governo. Infatti,
oltre alla crisi economica, occorre considerare un altro tipo di crisi, ovvero quella
morale. In quegli anni molti politici vennero accusati di aver trasferito i propri
capitali all’estero ben prima che la crisi desse i segnali sconfortanti della fine degli
anni Ottanta. In seguito a queste polemiche, gli argentini si sentirono ancora una
volta traditi dalle istituzioni. Le rivolte popolari del 1989 portarono Alfonsin a
dimettersi 5 mesi prima della scadenza del mandato, sostituito da Carlos Menem,
il quale, già in campagna elettorale, annunciò una svolta epocale.
Il nuovo Presidente adottò misure economiche di emergenza; mise in atto un
piano di austerità economica con vari interventi di privatizzazione delle aziende
pubbliche, tagli alle spese sociali, deregulation in diversi settori, puntando anche
sull’arrivo di capitali stranieri. Menem dimostrò da subito un’incredibile docilità
nei confronti del FMI e degli Usa, e si lanciò in un politica decisamente neoliberista.
L’obiettivo di questa consisteva nel privatizzare il più possibile per eliminare la spesa
pubblica e, conseguentemente, per estinguere il debito estero. Egli riuscı̀ a riportare
l’inflazione a livelli impensabili pochi anni prima. Ma le riforme ebbero pesanti
costi sociali, ovvero l’aumento della disoccupazione e della povertà e il deficit della
bilancia commerciale. L’Argentina perse rapidamente la fiducia degli investitori e
la fuga di capitali aumentò.
Nel 2001 e nell’orlo di una nuova crisi iperinfazionistica; per evitare ciò, il team
di economisti del governo varò un progetto di legge, disegnato per preservare il regime di convertibilità, chiamato piano “Terza Valuta”. Esso consisteva nella creazione
di una nuova valuta non convertibile, chiamata “Argentino”, che avrebbe dovuto
coesistere con pesos e dollari statunitensi. Sarebbe dovuta circolare solo in contanti (assegni, cambiali ed altri strumenti sarebbero potuti essere emessi in pesos o
dollari, ma non in argentinos) e sarebbe stata garantita parzialmente con terreni
amministrati dallo stato federale; queste caratteristiche servivano a controbilanciare le tendenze inflazionistiche. Una volta che l’argentino avesse avuto lo status di
valuta legale, sarebbe stato usato per riscattare tutta la valuta complementare già
in circolazione. Si sperava che la conservazione della convertibilità ristabilisse la
fiducia popolare, mentre la natura non convertibile di questa valuta avrebbe per-
6.2 Diagnostic Analytics
109
messo di attuare misure di flessibilità fiscale (impensabili con il peso) che avrebbero
contrastato la devastante recessione economica.
I critici definirono questo piano una “svalutazione controllata”; i difensori del
progetto ribattevano che, siccome il controllo di una svalutazione è una procedura
delicatissima, questa era una lode travestita da critica. Il piano “Terza Valuta” raccolse consensi entusiastici tra famosi economisti; tuttavia esso non poté mai essere
implementato perché il governo di Rodrı́guez Saá mancava del supporto politico richiesto. Egli, completamente incapace di affrontare la crisi e criticato dal suo stesso
partito, dette le dimissioni prima della fine del 2001.
L’Argentina perse rapidamente la fiducia degli investitori e la fuga di capitali
aumentò. Nel 2001 la gente iniziò a temere il peggio e a ritirare grosse somme di
denaro dai propri conti correnti bancari, convertendo pesos in dollari e mandandoli
all’estero; si scatenò una corsa agli sportelli. Il governo adottò una serie di misure
(note come corralito) che congelarono effettivamente tutti i conti bancari per dodici
mesi, permettendo unicamente prelievi di piccole somme di denaro. Questo limite
ai prelievi, unito ai seri problemi che causò, esasperò il popolo argentino che, in
alcuni casi, si riversò nelle strade di importanti città, specialmente Buenos Aires. Si
svilupparono proteste popolari, note con il nome di cacerolazo, che consistevano nel
percuotere rumorosamente pentole e padelle. All’inizio i cacerolazos furono semplicemente manifestazioni rumorose, ma presto inclusero distruzioni di proprietà,
spesso nei confronti di banche e compagnie private straniere, specialmente grandi
imprese americane ed europee.
6.2.6
Stati Arabi
Gli Stati Arabi sono accomunati dalla loro forte produzione petrolifera, dalla quale deriva la loro ricchezza. Vediamo alcuni valori economici fuori dalla norma e,
soprattutto, le cause che li hanno comportati.
Kuwait, Iraq, 1991
Kuwait e Iraq presentano un comune outlier, di natura inflattiva, nel 1991. In questo caso non si può dare al petrolio la motivazione dell’aumento improvviso dei
prezzi dei beni, che arriva a quota 192,23%; esso è causato dalla Guerra del Golfo
che, nel biennio 1990-1991, investı̀ l’area del Kuwait; esso venne invaso dalle truppe
dell’Iraq, e il regime di Saddam, prostrato economicamente dalla guerra con l’Iran,
accampando delle rivendicazioni territoriali rispetto ai confini tra Iraq e Kuwait,
attaccò il regno devastandolo e macchiandosi di crimini di guerra e contro l’umanità. Il Kuwait venne liberato a febbraio del 1991 da una coalizione internazionale
guidata dagli Stati Uniti d’America e incaricata dal Consiglio di Sicurezza delle
Nazioni Unite di ricostituire lo stato di diritto internazionale violato dall’aggressione delle truppe di Saddam Hussein. Successivamente, la situazione si stabilizzò e,
progressivamente, anche l’economia si stabilizzò.
Iran, Iraq, 2013
Riguardo Iran e Iraq, ci troviamo in un periodo temporale molto recente. Le sanzioni emanate dall’Onu, dovute ai conflitti, hanno messo seriamente a rischio l’eco-
110
6 Analisi Diagnostica
nomia di Teheran. Secondo il presidente Iraniano Ahmadinejad (e altri funzionari
iraniani), l’economia del paese rimane forte. Molti Stati e multinazionali, a loro
dire, sono ancora disponibili a trattare affari con le imprese iraniane, nonostante la
disapprovazione di Washington.
La situazione, dati alla mano, è però ben diversa. Da fine 2012, infatti, i prezzi dei
beni di prima necessità sono aumentati drasticamente in tutto il paese, soprattutto
nella capitale. Anche il trasporto pubblico è in crisi. La compagnia di autobus
di Teheran ha recentemente interrotto il servizio a Tajrish Terminal, invitando i
residenti a utilizzare la metropolitana. Ma nella capitale molti quartieri popolari
non vi hanno accesso. Il governo ha annunciato che, a partire dal prossimo marzo,
le tariffe dei taxi aumenteranno di 20 centesimi di rial iniziali, e 15 centesimi ogni
100 metri percorsi.
Nella prima settimana di agosto 2013 il prezzo della carne a Teheran era passato da 120000 a 180000 rial (12-18 dollari) al kilogrammo; tra settembre e ottobre è
raddoppiato a 350000 rial (35 dollari), e le stime dicono che nel mese di novembre potrebbe addirittura triplicare. L’inflazione è travolgente anche a Tabriz, importante
centro nel nord-ovest del paese. Da tempo la città è stata colpita dalla disoccupazione e da una profonda crisi immobiliare. Quasi tutti i lavoratori ricevono gli stipendi
in ritardo; alcuni non lo ricevono da mesi. Nei grandi centri, l’esasperazione della
gente traspare ad ogni angolo di strada.
Sono sempre di più i cittadini convinti che le sanzioni imposte all’Iran per invitarlo a desistere dal programma nucleare siano solo un mantra ripetuto dal governo
per giustificare l’inflazione galoppante degli ultimi tempi. Nel Paese si desta ovunque un’aria di preoccupazione per il futuro e le persone sono in attesa di vedere
quale impatto avranno sulla loro vita i piani di riduzione dei sussidi annunciati dal
regime.
Nel sistema di sostegno dei prezzi precedente alle sanzioni, secondo il Fondo
Monetario Internazionale, una famiglia su quattro riceveva dal governo in media
l’equivalente di quasi 4000 dollari all’anno in benzina, energia elettrica e beni di
prima necessità. Questi sussidi costano complessivamente circa 100 miliardi di dollari alle finanze di Teheran. Il taglio delle forniture di gas, praticamente dimezzate
tra giugno e luglio, ha causato l’immediato rincaro dei prezzi di benzina ed energia elettrica. Sembra un controsenso, ma il paese (quarto produttore mondiale di
petrolio) soffre di un’endemica carenza di carburanti, a causa di un’insufficiente
industria di raffinazione, e la domanda interna di tali beni dipende pesantemente
dalle importazioni.
A soffrire per le sanzioni è anche il sistema finanziario. Da giugno, infatti, decine
e decine di banche e aziende internazionali hanno interrotto i loro rapporti d’affari
con l’Iran, mettendo a rischio la stessa stabilità del sistema bancario nazionale.
La moneta nazionale, il rial, ha subito una svalutazione del 10% nel giro di poche
settimane e, per i commercianti, è sempre più difficile procurarsi valuta estera.
Secondo il dipartimento di Statistica, 10 milioni di iraniani vivono sotto la soglia di
povertà assoluta e 30 milioni sotto quella di povertà relativa.
6.2 Diagnostic Analytics
6.2.7
111
BRICS
Nonostante i Paesi appartenenti al BRICS siano caratterizzati da una forte crescita
economica, questi sono stati soggetti di diverse crisi finanziarie, dalle quali derivano
i valori di outlier.
Brasile, 1989-1990, 1993-1994
Il Brasile è stato sempre un paese caratterizzato da un elevato tasso d’inflazione che
è esploso raggiungendo un tasso molto elevato in due momenti storici, ovvero negli
anni 1989 - 1990, raggiungendo, nel secondo anno, quota 2947,73 punti percentuali,
e nel periodo 1993-1994 raggiungendo il picco più alto di sempre al secondo anno
toccando 2075,88 punti percentuali. Successivamente, nel 1995, vi è un drastico calo
dell’inflazione la cui spiegazione economica sarà data successivamente.
Le cause della crescita dell’inflazione brasiliana furono strutturali; facendo un
passo indietro, tra il 1960 e il 1985 si registra un crescente deficit pubblico, una
perdita di controllo dell’inflazione e un aumento successivo della stessa. Con l’indicizzazione avvenuta dopo il 1964 gli effetti si fanno ancora più visibili. Non si
può fare a meno di menzionare il fatto che il cosiddetto Plano Cruzado e i suoi
annessi furono un errore della politica economica. Ricorrere a un piano palesemente
destinato al fallimento condusse gli operatori economici a non prendere sul serio
i congelamenti, a farsene gioco e ad anticiparli. Questi piani ebbero come effetto
la recrudescenza dell’inflazione, insieme al movimento di uscita dai congelamenti,
elevando oltremodo il grado di indicizzazione dell’economia, provocando la crescita continua dell’inerzia inflazionistica e riducendo, cosı̀, l’ipotesi di un probabile
cambiamento delle regole di formazione delle aspettative dopo il 1986.
Contraddicendo lo scenario caratteristico dei piani precedenti, venne presentato
il Plano Real che, oltre a ridurre il tasso d’inflazione a livelli bassi, riduceva costantemente il grado di inerzia inflazionistica dell’economia. Per questo il periodo
seguente venne detto del post-Real.
Il Brasile si è impegnato per lunghi anni nel tentativo di ideare un piano capace di
controllare l’inflazione e fare in modo che il suo regime finanziario fosse considerato
stabile e sano. Di fatto, però, fin quando non è stata raggiunta una soddisfacente
normalità, vari problemi dovettero essere affrontati. Questi furono causa di veri
disastri rispetto agli scopi della politica anti-inflazionistica tra i periodi del Plano
Cruzado e Cruzeiro, creando le premesse per i piani futuri fino all’arrivo del Real.
È necessario evidenziare il fatto che il deficit pubblico in Brasile esercita un’intensa
pressione sulla domanda aggregata, per il suo notevole costo. Cosı̀ il finanziamento
di tale costo produce un impatto espansionista sulla domanda aggregata generando
tensioni inflazionistiche permanenti che, alla fine, diventano croniche; ciò avviene
anche quando il Brasile presenta uno scenario inflazionistico relativamente basso,
tra il 1970 e il 1973, quando l’inflazione media valutata dall’indice geral de precos
(IGP) si aggirava intorno al 17%.
La conseguenza di tutto ciò fu un crescente, accelerato e incontrollato scenario
inflazionistico che ha portato l’economia brasiliana ad attraversare un periodo di
caos. Esso è stato talora incentivato per mancanza di volontà politica, ma, per altri
versi, è stato combattuto con proposte choc di origine sia interna che esterna, venute
a svilupparsi insieme ai deficit pubblici.
112
6 Analisi Diagnostica
Tra il 1986 e il 1994 furono impiantati sei programmi eterodossi di stabilizzazione
basati sul congelamento dei prezzi: il piano Cruzado 1 (febbraio 1986) e 2 (novembre
1986). Seguirono il piano Bresser (1987), Verao (1988), Collor 1 (1990) e 2 (1991).
I risultati furono disastrosi e condussero ad un’inflazione superiore a 1000% l’anno, causando cosı̀ incessanti tentativi di stabilizzazione. Lo scenario drammatico, al
momento dell’entrata del piano Cruzado, era di inflazione al 350% l’anno. Controllare i tassi e ottenere credibilità tanto interna quanto esterna era, certamente, una
sfida da affrontare.
Il Plano Real, impiantato nel 1994, consentı̀ una diminuzione inflattiva drastica;
esso fu segnato dalla progressiva quotazione dei prezzi in URV, un’unità reale di
valore, ossia un punto di riferimento stabile di valore. Successivamente cominciò
l’emissione di nuova moneta, il Real, che sostituı̀ il nuovo Cruzeiro. L’URV fu la
levatrice del nascente Real.
Con il mantenimento del tasso reale d’interesse a livelli elevati e dell’eccesso di
liquidità nel mercato internazionale, il flusso di capitali stranieri continuò. In questo scenario il Banco Central Brasileiro (BACEN) si ritirò dal mercato dei cambi
provocando forte credibilità e valorizzazione del Real, cosı̀ come un volume significativo di riserve e un economia aperta, che favorı̀ l’interesse dell’importazione di
una generale risalita economica.
Russia, 1990
L’economia della Russia è profondamente segnata non solo dal patrimonio dell’Unione delle Repubbliche Socialiste Sovietiche (URSS), da cui ha ereditato il 62%
delle potenzialità, ma anche da riforme neoliberiste praticate nel paese dal 1990.
La caratteristica principale dell’economia Russa è l’interdipendenza profonda e
l’integrazione con altri paesi membri della CSI (Comunità degli Stati Indipendenti),
che è formata dalla maggior parte delle ex Repubbliche Sovietiche. Questa situazione
si verifica per il fatto che, durante la guerra fredda, l’Unione Sovietica ha cercato di
distribuire e settorizzare la maggior parte della produzione industriale del paese, al
fine di fornire una maggiore democratizzazione della produzione, facilitando il flusso,
espandendo la rete di infrastrutture in tutto il territorio sovietico e, soprattutto, per
proteggere il settore produttivo sull’orlo di una guerra nucleare. Un esempio comune
per spiegare questa integrazione è la dipendenza dall’industria pesante degli Urali
russi verso la produzione di minerale di ferro e carbone, proveniente dal Kazakistan.
Inoltre, il processo di privatizzazione industriale intensa e disordinata gestito dal
1991, insieme all’aumento della corruzione nel paese, ha consolidato il processo di
formazione di grandi monopoli privati. Tale configurazione ha consentito la caratterizzazione della produzione russa contrassegnata dal deterioramento delle condizioni
di lavoro dal massiccio sfruttamento delle risorse naturali del paese.
Dal 1960 l’ex URSS si sentiva forte in dipendenza in relazione alla produzione di
cibo. Inoltre, la maggior parte della produzione non si trovava nel territorio russo.
Per questo motivo, attualmente, il paese importa circa un quinto del cibo totale
consumato dalla popolazione.
Si può dire che il periodo post Guerra Fredda è stato estremamente difficile, dal
punto di vista economico, per la Russia, che ha visto una diminuzione di circa il 40%
della sua economia nel 1990. La crisi è stata il risultato, soprattutto, della privatizzazione senza controllo intrapresa dal governo di Boris Eltsin. La fine dell’Unione
6.2 Diagnostic Analytics
113
Sovietica significò l’indipendenza dalla Russia, ma portò rovina economica, miseria
ed emigrazione di massa, perdita di una patria e di un’appartenenza e formazione
di regimi autocrati nelle ex repubbliche sovietiche del Caucaso e dell’Asia centrale.
Ci sono due punti di vista in vigore nel paese sulle difficoltà economiche in Russia:
da un lato, i neoliberisti sostengono che i problemi dell’economia derivano dalla
difficoltà del paese ad aprirsi pienamente alla economia di mercato capitalistica;
dall’altro, i fronti di sinistra accusano le riforme liberali di essere state responsabili
del collasso economico della Russia e il suo recupero difficile.
Ad aggravare questa situazione, nel 1998, ci fu una grave crisi finanziaria e la
conseguente fuoriuscita di capitale nazionale e internazionale. Durante il governo di
Vladimir Putin, il PIL del paese è tornato a crescere a tassi elevati, con una media
del 6% all’anno. Tuttavia, ad oggi, l’economia russa è estremamente dipendente
dalle esportazioni di petrolio, che rappresentano circa l’80% delle esportazioni.
Cina, 1994
Durante gli anni novanta l’economia della Cina continuò a crescere rapidamente
con una media del 10,43%; tuttavia, essa ha subito una forte inflazione, la quale
superò il 20% nel 1994.
La crisi finanziaria asiatica colpı̀ il Paese solo marginalmente, per via dei forti controlli sui capitali investiti nel Paese ed, in particolare, della inconvertibilità
internazionale dello Yuan. Ciò permise al paese di crescere nonostante il forte rallentamento delle economie della regione. Tuttavia, in questo periodo, la Cina fu affetta
da forti livelli di disoccupazione, causati dalla privatizzazione massiccia delle aziende statali. Nonostante il successo e la crescita della economia cinese nel ventennio
che va dal 1990 ai giorni nostri, rimanevano molti nodi, quali la modernizzazione
del settore finanziario e del settore statale.
L’accelerazione dell’attività economica, e in particolare della spesa in beni di
investimento (che aumentò dal 25% al 35% del PIL nei primi cinque anni del decennio), determinò ulteriori pressioni inflazionistiche, enfatizzate dalla decisione di
abbandonare il sistema dei prezzi duale. Questa decisione, adottata dalla Cina per
9 anni, comportava il rischio di inflazione “strutturale”, causata dal riallineamento
dei prezzi pianificati ai rispettivi livelli di equilibrio di mercato.
Per questo motivo, esso fu affiancato da un piano di austerità, adottato il 3 luglio
del 1993, in concomitanza con l’insediamento di Zhou Rongji a capo della Phoe, con
lo scopo dichiarato di raffreddare l’attività economica favorendone un “atterraggio
morbido” (soft landing), cioè evitando brusche cadute della produzione.
Le misure intraprese comprendevano una stretta monetaria, realizzata mediante
restrizioni creditizie e l’aumento dei tassi di interesse, e la destinazione dei flussi
di investimento a nuove priorità, fra le quali la creazione di infrastrutture nelle
aree interne, volte a favorirne l’allentamento delle strozzature dal lato dell’offerta.
Il piano fu coronato da successo: fra il 1994 e il 1996 il tasso di inflazione si ridusse
di circa 17 punti (dal 23,2% al 6,5%), a fronte di un rallentamento della crescita
di soli 4,4 punti, dal 13,3% all’8,9%. Il 1994 vide due importanti riforme in campo
valutario: l’abolizione del sistema di ritenzione dei guadagni in valuta estera, e
quella del mercato duale dei cambi, previa svalutazione del tasso di cambio ufficiale
al valore di 8,70 yuan per dollaro.
114
6 Analisi Diagnostica
I dati della Banca Mondiale segnalano che, nel 1994, la Cina sperimentò una rivalutazione in termini reali di circa l’8,5%. Questo dato non ha nulla di paradossale,
giacchè la svalutazione nominale, pari a circa il 10%, compensava solo in parte l’incremento dei prezzi interni, che, nel 1994, era stato del 23%. Del resto, soffermarsi
sulle dinamiche del cambio nominale ha poco senso: agli acquirenti esteri interessa
il costo dei beni, costo del quale il cambio (cioè il costo della valuta) è solo una
componente (l’altra essendo il prezzo dei beni in valuta locale). È, quindi, piuttosto
difficile che l’incremento significativo delle esportazioni sperimentato nel 1994 (in
misura pari al 25%) sia da attribuire alla contemporanea svalutazione nominale;
è semmai più plausibile che esso dipenda dalla svalutazione reale verificatasi nei
quattro anni precedenti ai ritmi del 10% dell’anno. Infatti, si denota che i flussi
commerciali reagiscono con ritardo a variazioni dei prezzi relativi, provocando, in
questo caso, una forte leva inflattiva.
7
Analisi Predittiva
In questo capitolo verrà illustrata la terza e ultima fase di analisi, ovvero quella
predittiva. In particolare, verranno analizzate le linee di tendenza di alcuni Paesi e
le relative previsioni sui diversi indici economici presi in considerazione dal nostro
case study.
7.1 Premessa
Come già illustrato nei precedenti capitoli, la previsione di ciò che accadrà nel futuro è affidata all’Analisi Predittiva. Essa permette di migliorare la comprensione dei
dati, contribuendo a prevedere il comportamento dei soggetti principali del case study. Inoltre, rappresenta le fondamenta per un’ulteriore analisi più approfondita, la
Prescriptive Analytics, che definisce i provvedimenti per arginare determinati comportamenti negativi e per favorire determinati comportamenti positivi visualizzati
nelle precedenti fasi.
7.2 Trend e Forecast
Il trending viene utilizzato per prevedere il proseguimento di alcuni andamenti di
una variabile, mentre il forecasting si occupa della vera e propria predizione, con la
caratteristica di mostrare, oltretutto, una “fascia di confidenza”, che indica entro
quale range di valori, nel caso di limitati stravolgimenti, si troverà il dato nel futuro.
Nella creazione delle linee di tendenza, è importante scegliere, tra le quattro
disponibili (lineare, logaritmica, esponenziale, polinomiale), la tipologia giusta per
la misura che si sta prendendo in considerazione. Per eseguire in maniera corretta
tale operazione, ricorriamo al comando “Describe trend model”, che riporta i valori
di “R-Squared” e di “P-Value”, cioè i principali indicatori per eseguire la scelta
corretta (Figura 7.1). Essa può essere effettuata anche solo analizzando la forma
della spezzata di cui vogliamo predire l’andamento; tuttavia, le due grandezze consentono di passare da un’analisi sull’adeguatezza di tipo qualitativo ad un’analisi di
tipo quantitativo.
116
7 Analisi Predittiva
Figura 7.1. Schermata delle opzioni per gestire al meglio le linee di tendenza.
L’R-squared, in statistica, prende il nome di coefficiente di determinazione; esso
è una proporzione tra la variabilità dei dati e la correttezza del modello statistico
utilizzato. Più si avvicina a 1 questa grandezza, maggiore è l’affidabilità del modello
utilizzato.
In statistica, il valore p (o p-value, in inglese) indica la probabilità di ottenere un
risultato uguale o “più estremo” di quello osservato, supposta vera l’ipotesi nulla.
Più si avvicina allo 0 questo valore, migliore sarà la possibilità che non ci siano
errori nella previsione. Solitamente, deve essere inferiore al tasso di soglia, spesso
fissato a 0.05.
Esiste inoltre una fase preliminare, dove si “addestra” il sistema a svolgere i
calcoli in maniera adeguata (Figura 7.2). Tale procedimento consiste nell’omettere i
dati fino a un certo periodo di tempo, e selezionare trend e forecast con impostazioni
adeguate, riproducendo i dati reali in maniera quanto più fedele possibile.
Quando quest’operazione volge al termine, si può iniziare con la vera e propria
Predictive Analytics. La durata delle previsioni, per ogni indice, è stata effettuata
di lunghezza pari a 7 anni, cioè fino al 2022.
7.2.1
Inflazione
Per l’indice relativo all’inflazione, effettuiamo l’analisi predittiva sulla Germania.
In primo luogo è stato necessario definire il modello statistico utilizzato per visualizzare le linee di tendenza. Dai valori statistici, le cui definizioni sono esplicate in
precedenza, selezioniamo la tipologia “polinomiale” (Figura 7.3). Successivamente,
il forecasting avviene automaticamente, trascinando il comando sul worksheet e impostando la durata della previsione. Si evince come l’intervallo di confidenza riesca a
gestire i valori entro il quale rientrerà il dato inflattivo, che si delinea in decremento
(Figura 7.4).
7.2 Trend e Forecast
117
Figura 7.2. Schermata delle opzioni per gestire al meglio il forecasting.
Figura 7.3. Schermata che descrive i dettagli analitici della trend line sull’inflazione.
118
7 Analisi Predittiva
Figura 7.4. Dashboard che visualizza i risultati di trend e forecasting sull’inflazione.
7.2.2
Crediti bancari deteriorati sul totale dei prestiti lordi
Per l’indice relativo al rapporto tra i crediti bancari deteriorati e il totale dei prestiti lordi, l’analisi predittiva viene effettuata sulla Germania. Come visto nel caso
precedente, in primo luogo, è stato necessario definire il modello statistico utilizzato
per visualizzare le linee di tendenza. Dai valori statistici, ma soprattutto dalla semplice visualizzazione del grafico, ci rendiamo conto che il modello più adatto è quello
“lineare” (Figura 7.5). Successivamente il forecasting avviene automaticamente, trascinando il comando sul worksheet e impostando la durata della previsione. Anche
in questo caso si nota l’intervallo di confidenza, che, con un’accuratezza del 90%,
indica il dato in lieve decrescita nei prossimi 7 anni (Figura 7.6).
Figura 7.5. Schermata che descrive i dettagli analitici della trend line dei crediti bancari
deteriorati sul totale dei prestiti lordi.
7.2 Trend e Forecast
119
Figura 7.6. Dashboard che visualizza i risultati di trend e forecasting dei crediti bancari
deteriorati sul totale dei prestiti lordi.
7.2.3
Capitale bancario sul totale delle attività bancarie
Per l’indice relativo al capitale bancario sul totale delle attività bancarie, effettuiamo
l’analisi predittiva sulla Germania. Il procedimento è analogo ai casi precedenti; il
primo passo è relativo alla scelta accurata del modello statistico di riferimento, in
questo caso quello “polinomiale” (Figura 7.7). È molto importante, in questo caso, la
funzione della trend line, perchè, nonostante non sia presente nel database il valore
nell’anno 2004, tramite la linea di tendenza si permette ugualmente di fornire un
preciso riferimento per il forecasting, che vede il dato in lieve crescita (Figura 7.8).
Figura 7.7. Schermata che descrive i dettagli analitici della trend line del capitale bancario
sul totale delle attività bancarie.
120
7 Analisi Predittiva
Figura 7.8. Dashboard che visualizza i risultati di trend e forecasting del capitale bancario
sul totale delle attività bancarie.
7.2.4
Differenziale sul tasso di interesse
Per l’indice relativo al differenziale sul tasso d’interesse, effettuiamo l’analisi predittiva sulla Russia. In primo luogo è stato necessario definire il modello statistico
utilizzato per visualizzare le linee di tendenza. Dai valori statistici, ma soprattutto dalla semplice visualizzazione del grafico, ci rendiamo conto che il modello più
adatto è quello “esponenziale” (Figura 7.9). Successivamente il forecasting avviene
automaticamente, trascinando il comando sul worksheet e impostando la durata
della previsione. Anche in questo caso, si nota l’intervallo di confidenza, il quale riesce a gestire i valori entro il quale rientrerà il dato relativo allo spread. Esso delinea,
dopo una iniziale crescita, un assestamento verso un valore costante (Figura 5.5).
Figura 7.9. Schermata che descrive i dettagli analitici della trend line del differenziale
sul tasso d’interesse.
7.2 Trend e Forecast
121
Figura 7.10. Dashboard che visualizza i risultati di trend e forecasting del differenziale
sul tasso d’interesse.
7.2.5
Tasso di interesse reale
Per l’indice relativo al tasso di interesse reale, effettuiamo l’analisi predittiva sul
Vietnam. In primo luogo, è stato necessario definire il modello statistico utilizzato
per visualizzare le linee di tendenza. Dai valori statistici, ma soprattutto dalla semplice visualizzazione del grafico, rendiamo conto che il modello più adeguato è quello
“polinomiale” (Figura 7.11). Successivamente, riguardo il forecasting, notiamo una
forte crescita, che segue pari passo ciò che descrive la trend line (Figura 7.12).
Figura 7.11. Schermata che descrive i dettagli analitici della trend line sul tasso di
interesse reale.
122
7 Analisi Predittiva
Figura 7.12. Dashboard che visualizza i risultati di trend e forecasting sul tasso di
interesse reale.
7.2.6
Tasso di interesse sui depositi
Per l’indice relativo al tasso di interesse sui depositi, effettuiamo l’analisi predittiva
sull’Olanda. L’andamento, che non segue una linea retta è, secondo i valori di RSquared e p-value, di tipo “polinomiale” (Figura 7.13). Con la funzione di forecasting
si nota come il dato è perfettamente in linea con la tendenza, assumendo valori quasi
affini, in leggera decrescita (Figura 7.14).
Figura 7.13. Schermata che descrive i dettagli analitici della trend line sul tasso di
interesse sui depositi.
7.2 Trend e Forecast
123
Figura 7.14. Dashboard che visualizza i risultati di trend e forecasting sul tasso di
interesse sui depositi.
7.2.7
Tasso di interesse sui prestiti
Per l’indice relativo al tasso di interesse sui prestiti, effettuiamo l’analisi predittiva
sul Sud Africa. Visto l’andamento dei valori, facilmente si può intuire che il modello
più adatto è quello “polinomiale”; i valori di R-squared e p-value confermano la
scelta effetuata (Figura 7.15). Il forecasting predice l’indice lievemente in crescita
(Figura 7.16).
Figura 7.15. Schermata che descrive i dettagli analitici della trend line sul tasso di
interesse sui prestiti.
124
7 Analisi Predittiva
Figura 7.16. Dashboard che visualizza i risultati di trend e forecasting sul tasso di
interesse sui prestiti.
7.2.8
Premio per il rischio sui prestiti
Per l’indice relativo al premio per il rischio sui prestiti, effettuiamo l’analisi predittiva sul Brasile. L’andamento più in linea è, anche in questo caso, quello “polinomiale”, che delinea valori di R-squared e p-value ottimi per il proseguimento dello
studio (Figura 7.17). Il risultato della predizione segue l’andamento decrescente e
discontinuo dei dati, che delineano l’indice in diminuzione (Figura 7.18).
Figura 7.17. Schermata che descrive i dettagli analitici della trend line sul premio per il
rischio sui prestiti.
7.2 Trend e Forecast
125
Figura 7.18. Dashboard che visualizza i risultati di trend e forecasting sul premio per il
rischio sui prestiti.
8
Conclusioni e uno sguardo al futuro
Durante la stesura della tesi è stata discussa l’importanza dei Big Data nella società
attuale. I Big Data offrono la possibilità di sviluppare nuove tecnologie e modelli
matematici per poter estrarre l’effettivo valore dai dati, e danno la possibilità di
perseguire nuovi modelli di business. Essi consentono di individuare i trend e, inoltre,
portano vantaggi economici alle aziende che hanno deciso di sfruttare le informazioni
ottenibili dai dati in loro possesso. Grazie alla Big Data Analytics è possibile usare
l’informazione ottenibile dai dati per fini predittivi e decisionali.
Molti sono i contesti applicativi che beneficiano dei Big Data: sanità, sicurezza,
istruzione, marketing e social network sono solo alcuni dei settori che sfruttano il
grande potere dei Big Data. Tuttavia, è importante sfruttare questo potere derivante
da essi con cautela, in quanto, oltre ad offrire grandi potenzialità, vi sono alcuni
aspetti critici relativi ai Big Data che è bene prendere in considerazione; basti
pensare ad esempio alle problematiche legate alla qualità e all’affidabilità dei dati
e a quelle relative alla privacy degli stessi.
Esistono numerosi software che consentono di operare con grandi quantità dei
dati; nel presente elaborato di tesi è stato utilizzato Tableau Desktop, il leader
del settore nel mondo della Data Analytics. Sfruttando tale software, dalle enormi
potenzialità e dalle innumerevoli funzionalità, è stato possibile effettuare analisi
descrittive, in una prima fase, diagnostiche in una seconda fase e predittive in una
terza e ultima fase.
Dopo aver prelevato dal database della World Bank i dati di natura economofinanziaria messi liberamente a disposizione dell’utenza, sotto forma di Open Data,
è stata necessaria una fase preliminare di manipolazione degli stessi, definita ETL.
Solo dopo tale attività, è stato possibile procedere con il vero e proprio lavoro di
Big Data Analytics. Gli indici economici studiati e le predizioni effettuate, possono
rappresentare per un esperto di economia, uno strumento essenziale per intuire la
nascita di squilibri e crisi finanziarie.
In futuro abbiamo valutato la possibilità di approfondire ed espandere l’aspetto analitico di questo studio, concentrandosi sulle analisi prescrittive e preventive,
possibili grazie alla sintesi dei dati e all’utilizzo congiunto di scienze matematiche,
regole di business e tecnologie di Machine Learning. In questo modo è possibile
analizzare scientificamente i dati e, quindi, arricchirli di significato; l’obiettivo non
è generare dei report su ciò che è accaduto, ma comprendere come l’informazione
128
8 Conclusioni e uno sguardo al futuro
estraibile dai dati possa aiutare a prendere decisioni migliori in merito a ciò che
avverrà.
Riferimenti bibliografici
1. Crisi del Vietnam. http://www.asianews.it/notizie-it/A-Hanoi-l’inflazionepu-annullare-20-anni-di-crescita-economica-12833.html, 2008.
2. Trend Line.
http://www.dummies.com/programming/big-data/big-datavisualization/how-to-add-trend-lines-in-tableau/, 2013.
3. Bankpedia.
http://www.bankpedia.org/index.php/it/121-italian/p/21761pricing-dei-prestiti-bancari, 2015.
4. Crisi Economica Argentina. https://it.wikipedia.org/wiki/Crisi_economica_
argentina, 2015.
5. ForexInfo. https://www.forexinfo.it/Banche-e-crediti-deteriorati-istituticon-piu-sofferenze, 2015.
6. Measuring Inflation. http://www.economist.com/news/finance-and-economics/
21695097-big-data-provide-new-ways-gauge-price-rises-how-much-doggy,
2015.
7. Inflazione Russa.
http://eurasiatx.com/inflazione-in-russia-i-dati-delgoverno/?lang=it, 2016.
8. Big Data. https://www.sas.com/it_it/insights/big-data/what-is-big-data.
html, 2017.
9. Index Mundi. http://www.indexmundi.com/g/g.aspx?c=ro&v=71&l=it, 2017.
10. Inflation. http://greeneconomics.blogspot.it/2016/03/taming-inflation-inacademic-economics.html, 2017.
11. Interest Rate. http://www.investopedia.com/terms/i/interestrate.asp, 2017.
12. Interest Rate and Inflation. http://businessmagazinegainesville.com/bondsinterest-rates-impact-inflation/, 2017.
13. Non Performing Loan. https://en.wikipedia.org/wiki/Non-performing_loan,
2017.
14. Predictive Analytics. http://www.webopedia.com/TERM/P/predictive_analytics.
html, 2017.
15. Tableau Help.
http://onlinehelp.tableau.com/current/pro/desktop/en-us/
help.html, 2017.
16. B. Baesens. Analytics in a Big Data World: The Essential Guide to Data Science and
its Applications. Wiley, 2014.
17. A. Bahga and V. Madisetti. Big Data Science & Analytics: An Hands-On Approach.
2015.
18. D. Baldwin. Mastering Tableau. Packt, 2016.
19. J. Dean. Big Data, Data Mining, and Machine Learning. Garzanti, 2014.
20. T. Erl and W. Khattak P. Buhler. Big Data Fundamentals. Prenctice Hall, 2015.
130
Riferimenti bibliografici
21. H. Ishikawa. Social Big Data Mining. CRC Press Taylor & Francis Group, 2015.
22. B. Jones. Communicating Data with Tableau: Designing, Developing, and Delivering
Data Visualizations. O’Reilly Media, 2014.
23. A. Maheshwari. Big Data Essentials. 2016.
24. J.N. Milligan. Learning Tableau. Packt, 2016.
25. D.G. Murray. Tableau Your Data! Fast and easy visual analysis with Tableau software.
Wiley, 2013.
26. O. Radar. Big Data Now: current perspectives. O’Reilly Media, 2010.
27. V. Reynolds. Big Data For Beginners: Understanding SMART Big Data, Data Mining
& Data Analytics For improved Business Performance, Life Decisions & More! 2016.
28. A. Rezzani. Big data. Architettura, tecnologie e metodi per l’utilizzo di grandi basi di
dati. Maggioli, 2013.
29. V.M. Schonberger and K.N. Cukier. Big data. Una rivoluzione che trasformerà il
nostro modo di vivere e già minaccia la nostra libertà. Garzanti, 2013.
30. J. Smith. Data Analytics: What Every Business Must Know About Big Data And Data
Science. Pinnacle publishers, 2016.
Ringraziamenti
Alla fine di questo mio percorso universitario, desidero ringraziare tutti coloro che
mi sono stati vicini.
Un ringraziamento speciale va al prof. Domenico Ursino, per il suo supporto, per
la sua disponibilità e per tutto l’aiuto che mi ha dato durante la stesura di questa
tesi.
Ringrazio i miei genitori e mia sorella, che mi sono sempre stati accanto e non
mi hanno mai fatto mancare il loro sostegno durante tutti questi anni, nonostante
i momenti difficili.
Ringrazio i miei nonni, perchè senza di loro non sarei mai diventato quello che
sono e non avrei potuto raggiungere questo obiettivo.
Ringrazio la mia fidanzata, che nel percorso universitario, oltre che nella vita,
si è dimostrata la principale fonte di coraggio nei momenti difficili, senza dubitare
mai di me.
Ringrazio i miei colleghi, che hanno reso anche i più duri esami un gioco, facendo
passare le ore di studio sempre con il sorriso.
Infine, ringrazio tutti coloro che mi sono stati accanto e continuano ogni giorno
a dimostrarmi il loro affetto.
Scarica