Università degli Studi Mediterranea di Reggio Calabria Dipartimento di Ingegneria dell’Informazione, delle Infrastrutture e dell’Energia Sostenibile Corso di Laurea Triennale in Ingegneria dell’Informazione Tesi di Laurea Utilizzo di Tableau per analisi di tipo descrittivo, diagnostico e predittivo relative al settore finanziario a partire dagli open data della Banca Mondiale Relatore Candidato Prof. Domenico Ursino Francesco Attinà Anno Accademico 2015-2016 Alla mia famiglia. Indice Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 La Big Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1 I Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Caratteristiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Principali contesti applicativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Finanza e Business . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Istruzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Settore energetico e dei trasporti . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.4 Medicina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.5 Social Network . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.6 Sicurezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 La Data Analysis e la Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Categorie di Big Data Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 Pianificazione di uno studio sui Big Data . . . . . . . . . . . . . . . . . . . . . . . . 1.4.1 Analisi e acquisizione dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4.2 Big Data Analytics Lifecycle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 7 8 11 11 12 12 13 13 14 14 14 17 18 19 Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1 Descrizione dell’applicazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1 Caratteristiche del software . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.2 Creazione di un foglio di lavoro . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.3 Tipi di grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Calcoli in Tableau . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Operatori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Creazione di un campo di calcolo . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Espressioni LOD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Ulteriori funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.1 Filtri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.2 Creazione di una dashboard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.3 Creazione di una storia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.4 Trend . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3.5 Previsioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 23 24 25 26 28 29 29 30 30 31 33 33 34 35 VI Indice 2.4 Salvataggio dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 Descrizione dei dati a disposizione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1 Sorgente dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Caratteristiche del dataset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Descrizione dei dati di interesse per la tesi . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Crescita moneta in senso ampio . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . . 3.2.4 Capitale bancario sul totale delle attività bancarie . . . . . . . . . . 3.2.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.6 Tasso d’interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.8 Differenziale del tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . . 3.2.9 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Paesi di interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 37 38 39 40 41 42 43 43 44 44 45 45 45 Attività di ETL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1 Nozioni di ETL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.1 Estrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.2 Trasformazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.1.3 Caricamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Attività svolte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1 Verifica dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.2 Rimozione dei campi non di interesse . . . . . . . . . . . . . . . . . . . . . 4.2.3 Modifica dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.4 Trasformazione delle tabelle in tabelle pivot . . . . . . . . . . . . . . . 4.2.5 Caricamento dei dati puliti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 49 50 51 52 52 53 53 53 55 58 Analisi Descrittiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Visualizzazione dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.2 Crescita della moneta in senso ampio . . . . . . . . . . . . . . . . . . . . . 5.2.3 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . . 5.2.4 Capitale bancario sul totale delle attività bancarie . . . . . . . . . . 5.2.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.6 Tasso di interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.8 Differenziale del tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . . 5.2.9 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Ricerca di outlier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2 Crescita della moneta in senso ampio . . . . . . . . . . . . . . . . . . . . . 5.3.3 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . . 5.3.4 Capitale bancario sul totale delle attività bancarie . . . . . . . . . . 5.3.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.6 Tasso d’interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 59 59 59 63 66 69 73 76 80 83 87 90 90 91 91 91 92 92 Indice VII 5.3.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92 5.3.8 Differenziale del tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . . 93 5.3.9 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . 93 Analisi Diagnostica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2 Diagnostic Analytics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2.1 Europa Occidentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 6.2.2 Europa Orientale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 6.2.3 Africa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 6.2.4 Asia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 6.2.5 Sud America . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 6.2.6 Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 6.2.7 BRICS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 Analisi Predittiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 7.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 7.2 Trend e Forecast . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115 7.2.1 Inflazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 7.2.2 Crediti bancari deteriorati sul totale dei prestiti lordi . . . . . . . 118 7.2.3 Capitale bancario sul totale delle attività bancarie . . . . . . . . . . 119 7.2.4 Differenziale sul tasso di interesse . . . . . . . . . . . . . . . . . . . . . . . . . 120 7.2.5 Tasso di interesse reale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 7.2.6 Tasso di interesse sui depositi . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 7.2.7 Tasso di interesse sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 7.2.8 Premio per il rischio sui prestiti . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Conclusioni e uno sguardo al futuro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127 Riferimenti bibliografici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129 Ringraziamenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 Elenco delle figure 1.1 1.2 1.3 1.4 1.5 1.6 7 8 9 9 10 1.14 Il mondo dei Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I cinque tratti che caratterizzano i Big Data . . . . . . . . . . . . . . . . . . . . . . Dati generati in un minuto da vari social media . . . . . . . . . . . . . . . . . . . Andamento del valore in relazione alla veracità e al tempo . . . . . . . . . . Differenza tra tipologie di dati strutturati e non strutturati . . . . . . . . . Percentuali dei settori che operano con i Big Data. “Fonte Osservatorio Big Data Analytics e Business Intelligence della School of Management del Politecnico di Milano” . . . . . . . . . . . . . . . . . . . . . . . . Panoramica dei principali social network che utilizzano i big data . . . . Grafico che mostra l’andamento crescente della complessità al variare dell’analisi da svolgere . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Struttura di un sistema di descriptive analytics . . . . . . . . . . . . . . . . . . . . Struttura di un sistema di diagnostic analytics . . . . . . . . . . . . . . . . . . . . Struttura di un sistema di predictive analytics . . . . . . . . . . . . . . . . . . . . Struttura di un sistema di prescriptive analytics . . . . . . . . . . . . . . . . . . . Fasi che riguardano la memorizzazione delle informazioni sulla provenienza del dato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le nove fasi che compongono il ciclo di vita della Big Data Analytics 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 2.10 2.11 2.12 2.13 2.14 Il logo dell’azienda Tableau Software. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le diverse varianti della piattaforma Tableau. . . . . . . . . . . . . . . . . . . . . . La schermata del foglio di lavoro vuoto. . . . . . . . . . . . . . . . . . . . . . . . . . . L’elenco dei grafici ottenibili, visualizzato nel campo “Show Me”. . . . . Esempio di grafico a linee. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esempio di grafico a bolle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esempio di grafico a mappa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esempio di diagramma di Gantt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . L’editor di calcolo in Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La schermata di creazione filtri. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Le diverse tipologie di filtri per le misure. . . . . . . . . . . . . . . . . . . . . . . . . Le diverse tipologie di filtri per le misure. . . . . . . . . . . . . . . . . . . . . . . . . Esempio di Dashboard. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Esempio di storia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 24 25 26 27 27 28 29 30 31 32 32 33 33 1.7 1.8 1.9 1.10 1.11 1.12 1.13 11 13 15 16 16 17 17 18 19 X Elenco delle figure 2.15 Esempio di grafico con linee di tendenza. . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.16 Tipologie di modelli matematici da poter utilizzare per la creazione del trend. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.17 Esempio di grafico con aggiunta di previsioni. . . . . . . . . . . . . . . . . . . . . . 35 3.1 3.2 3.3 3.4 3.5 3.6 3.7 4.1 4.2 4.3 4.4 4.5 4.6 4.7 4.8 4.9 4.10 4.11 4.12 4.13 4.14 5.1 5.2 5.3 5.4 5.5 5.6 5.7 5.8 5.9 Logo della Banca Mondiale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Il Data Catalog messo a disposizione dalla Banca Mondiale. . . . . . . . . Schermata relativa al download del dataset, inclusa di impostazioni di filtraggio. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Totalità dei dataset riguardanti il settore finanziario. . . . . . . . . . . . . . . . Schermata della tabella ottenuta dal download. . . . . . . . . . . . . . . . . . . . Esempio di Mappa economica, relativa al Prodotto Interno Lordo. . . . Principali punti comuni relativi allo sviluppo dei Paesi appartenenti al BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 38 Schema di un database oggetto di un lavoro di ETL. . . . . . . . . . . . . . . . Schema che evidenzia le differenza tra ETL e ELT. . . . . . . . . . . . . . . . . Schema di esempio di un’operazione di estrazione di dati aziendali. . . Schema di esempio di un’operazione di estrazione e trasformazione di dati aziendali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Schema di esempio di un’operazione di estrazione, trasformazione e caricamento di dati aziendali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabella alla quale non è stata applicata alcuna attività di ETL. . . . . . Tabella trattata con operazione di rimozione dei campi di non interesse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabella trasformata con delle operazioni di modifica di dati. . . . . . . . . Esempio di tabella e di grafico corrispondente. . . . . . . . . . . . . . . . . . . . . Esempio di tabella trasformata in pivot e di grafico corrispondente. . . Schermata di come si presenta su Excel il componente aggiuntivo che consente l’attivazione di Tableau. . . . . . . . . . . . . . . . . . . . . . . . . . . . . Tabella pulita, ma non ancora pronta all’operazione di caricamento. . Tabella pivot pronta ad essere utilizzata per il caricamento. . . . . . . . . . Schermata di caricamento dei dati su Tableau. . . . . . . . . . . . . . . . . . . . . 49 50 51 Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grafico a linee relativo alla situazione inflattiva dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grafico a linee relativo alla situazione inflattiva dei Paesi Asiatici. . . . Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Africa. . Grafico a linee relativo alla situazione inflattiva degli Stati Arabi. . . . . Grafico a linee relativo alla situazione inflattiva dei Paesi BRICS. . . . . Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 40 41 46 47 52 53 54 54 55 56 56 56 57 57 58 60 60 61 61 62 62 63 63 64 Elenco delle figure 5.10 Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.11 Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.12 Grafico a linee relativo alla crescita della moneta in senso ampio degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.13 Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.14 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . 5.15 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . 5.16 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.17 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.18 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.19 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.20 Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.21 Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . 5.22 Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . 5.23 Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.24 Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.25 Grafico a linee relativo al capitale bancario sul totale delle attività bancarie degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.26 Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.27 Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.28 Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.29 Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.30 Grafico a linee relativo al tasso di interesse reale dei Paesi Asiatici. . . 5.31 Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Africa. 5.32 Grafico a linee relativo al tasso di interesse reale dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.33 Grafico a linee relativo al tasso di interesse reale degli Stati Arabi . . . 5.34 Grafico a linee relativo al tasso di interesse reale dei Paesi BRICS. . . . XI 64 65 65 66 66 67 67 68 68 69 69 70 70 71 71 72 72 73 73 74 74 75 75 76 76 XII Elenco delle figure 5.35 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.36 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.37 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.38 Grafico a linee relativo al tasso di interesse sui depositi degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.39 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.40 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.41 Grafico a linee relativo al tasso di interesse sui depositi dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.42 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.43 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.44 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.45 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.46 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.47 Grafico a linee relativo al tasso di interesse sui prestiti degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.48 Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.49 Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.50 Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.51 Grafico a linee relativo allo spread del tasso di interesse dei Paesi Sudamericani. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.52 Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.53 Grafico a linee relativo allo spread del tasso di interesse degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.54 Grafico a linee relativo allo spread del tasso di interesse dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.55 Grafico a linee relativo allo spread del tasso di interesse dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.56 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi dell’Europa Occidentale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.57 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi dell’Europa Orientale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 77 78 78 79 79 80 80 81 81 82 82 83 83 84 84 85 85 86 86 87 87 88 Elenco delle figure 5.58 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi dell’Africa. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.59 Grafico a linee relativo al premio per il rischio sui prestiti degli Stati Arabi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.60 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi Asiatici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.61 Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi BRICS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 7.11 7.12 7.13 7.14 7.15 7.16 7.17 7.18 1 88 89 89 90 Schermata delle opzioni per gestire al meglio le linee di tendenza. . . . . 116 Schermata delle opzioni per gestire al meglio il forecasting. . . . . . . . . . 117 Schermata che descrive i dettagli analitici della trend line sull’inflazione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Dashboard che visualizza i risultati di trend e forecasting sull’inflazione. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 Schermata che descrive i dettagli analitici della trend line dei crediti bancari deteriorati sul totale dei prestiti lordi. . . . . . . . . . . . . . . . . . . . . . 118 Dashboard che visualizza i risultati di trend e forecasting dei crediti bancari deteriorati sul totale dei prestiti lordi. . . . . . . . . . . . . . . . . . . . . . 119 Schermata che descrive i dettagli analitici della trend line del capitale bancario sul totale delle attività bancarie. . . . . . . . . . . . . . . . . . 119 Dashboard che visualizza i risultati di trend e forecasting del capitale bancario sul totale delle attività bancarie. . . . . . . . . . . . . . . . . . 120 Schermata che descrive i dettagli analitici della trend line del differenziale sul tasso d’interesse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Dashboard che visualizza i risultati di trend e forecasting del differenziale sul tasso d’interesse. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Schermata che descrive i dettagli analitici della trend line sul tasso di interesse reale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 Dashboard che visualizza i risultati di trend e forecasting sul tasso di interesse reale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Schermata che descrive i dettagli analitici della trend line sul tasso di interesse sui depositi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Dashboard che visualizza i risultati di trend e forecasting sul tasso di interesse sui depositi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Schermata che descrive i dettagli analitici della trend line sul tasso di interesse sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Dashboard che visualizza i risultati di trend e forecasting sul tasso di interesse sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Schermata che descrive i dettagli analitici della trend line sul premio per il rischio sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 Dashboard che visualizza i risultati di trend e forecasting sul premio per il rischio sui prestiti. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Introduzione Il termine “Big Data” è traducibile, letteralmente, con “grandi quantità di dati”. In realtà, esso riveste un significato più ampio, in quanto si riferisce a diversi ambiti. Quando si parla di Big Data non si intendono solo i dati, ma anche la loro analisi e il loro utilizzo, cercando di trovare modelli e algoritmi capaci di trattare cosı̀ tante variabili in poco tempo e con una quantità adeguata di risorse computazionali. La rivoluzione dei Big Data presuppone nuove capacità di collegare fra loro le informazioni per fornire un approccio visuale ai dati, suggerendo pattern e modelli di interpretazione finora inimmaginabili. La Data Analytics fornisce, dunque, un supporto alle decisioni sulla base di dati di fatto e non sulla base di intuizioni o decisioni passate. In genere, la Big Data Analytics viene utilizzata dalle organizzazioni per vari scopi. Ad esempio, in ambito aziendale, è usata per facilitare la presa di decisioni strategiche; in ambiente scientifico, i risultati ottenuti con la Data Analytics possono essere usati per dimostrare l’accuratezza delle previsioni e per identificare la causa di determinati fenomeni; nel settore dei servizi, ad esempio nella Pubblica Amministrazione, la Data Analytics può essere usata per comprendere come mantenere alta la qualità dei servizi abbassandone i costi. Dunque, visto il supporto che la Big Data Analytics può fornire a livello aziendale, è facile capire come essa sia legata, in generale, al settore economico e bancario. In questo determinato campo di utilizzo esiste un’autorità fondamentale per la gestione di informazioni: la World Bank (WB). La Banca Mondiale nasce nel 1945 con l’obiettivo di lottare contro la povertà e organizzare aiuti e finanziamenti ai Paesi in difficoltà. Essa è stata creata principalmente per aiutare Europa e Giappone nella loro ricostruzione dopo la seconda guerra mondiale. In seguito alla decolonizzazione degli anni sessanta, essa iniziò ad occuparsi anche dello sviluppo economico dei Paesi dell’Africa, dell’Asia e dell’America Latina. La Banca Mondiale è costituita da due istituzioni internazionali: la Banca internazionale per la ricostruzione e lo sviluppo (IBRD - International Bank for Reconstruction and Development) e l’Agenzia internazionale per lo sviluppo (IDA - International Development Association) e fa parte delle istituzioni specializzate dell’Organizzazione delle Nazioni Unite. A disposizione degli utenti, tramite il sito di riferimento, è messa un’enorme quantità di dati sotto forma di Open Data. Il corrispettivo database è composto 4 Introduzione da un insieme molto ampio di variabili, raggruppate a seconda della materia di riferimento (finanziaria, sanitaria, infrastrutture, etc.), dell’area geografica e della periodicità dei dati (annuali, settimanali, giornalieri). Inoltre il Data Catalog contiene tabelle pre-formattate, studi svolti, commenti, e altre informazioni utili ad ulteriori analisi. Il dataset della WB è facilmente manipolabile direttamente dal sito. Infatti, esso consente, seppure in maniera limitata, la creazione di query nocnhè la visualizzazione di tabelle e grafici di diverse tipologie a seconda dei dati di interesse. Esso comprende inoltre la possibilità di effettuare il download dei dati in vari formati (XML, CSV, Tabbed TXT, SDMX), anche applicando un filtraggio preventivo, cosı̀ da eliminare le variabili che non saranno utilizzate nello studio. Questo lavoro di tesi nasce dall’idea di analizzare gli Open Data finanziari della World Bank, con lo scopo di produrre analisi di tipo descrittivo, diagnostico e predittivo. Il lavoro consiste in diverse fasi; la prima fase, denominata ETL, si occupa della manipolazione dei dati, al fine di renderli “puliti” e ottimizzati per l’elaborazione sul software di Big Data Analytics. Solo dopo aver effettuato tale operazione, si procede al caricamento del dataset su Tableau, il leader del mercato nel settore di Data Analytics e Business Intelligence. La seconda fase consiste nell’analisi descrittiva, che si occupa di illustrare ciò che accade e di presentare le informazioni in modo opportuno, servendosi di strumenti di Business Intelligence e di visualizzazione. In particolare, essa si occupa di analizzare gli eventi passati, per riassumere e chiarire le dinamiche e le performance delle metriche di interesse e per ricavarne indicazioni su come approcciarsi alle prossime attività. Durante questa fase vengono, altresı̀, individuati i dati che si discostano notevolmente rispetto alla normale tendenza; si parla. in questo caso, di outlier. La terza fase consiste nell’analisi diagnostica, che si basa sulla ricerca delle cause che hanno portato lo scenario di interesse alla situazione attuale. Conoscere questo stato, però, non è sufficiente per comprendere la situazione corrente e adottare strategie mirate; analisi diagnostiche permettono di individuare i motivi di determinate tendenze o avvenimenti, per valorizzare e ripetere le azioni più efficaci e ottimizzare le attività che non hanno portato ai risultati previsti. La quarta e ultima fase consiste nell’analisi predittiva, che si occupa delle previsioni su ciò che accadrà in futuro. Essa permette di migliorare la comprensione dei dati, contribuendo a prevedere il comportamento dei soggetti principali del case study. Tale operazione avviene tramite l’utilizzo di opzioni di trending e forecasting, cioè la creazione di linee di tendenza e linee di previsione, che, attraverso particolari grandezze statistiche, consentono di impostare in maniera ottimale il sistema per predire, nel modo più accurato possibile, l’evoluzione dello scenario di riferimento. Il presente elaborato di tesi è articolato come di seguito specificato: • Il Capitolo 1 si occupa di illustrare il crescente fenomeno dei Big Data, la descrizione delle caratteristiche e la loro importanza nei diversi contesti applicativi. • Il Capitolo 2 introduce Tableau, un potente software per la visualizzazione e l’analisi di grandi quantità di dati. Nella trattazione vengono illustrate le principali caratteristiche e potenzialità di Tableau. • Il Capitolo 3 ha lo scopo di fornire un’ampia descrizione della sorgente dei dati, utilizzata in seguito per implementare le analisi. Introduzione • • • • • 5 Il Capitolo 4 ha lo scopo di illustrare una delle operazioni preliminari fondamentali per la realizzazione di uno studio di Big Data Analysis, ovvero l’ETL. In particolare ci soffermeremo sulle attività di ETL svolte sui dati di nostro interesse. Il Capitolo 5 mostra la prima fase di analisi, ovvero la Descriptive Analytics. Verranno visualizzate, analizzate e descritte le informazioni derivanti dal dataset oggetto del case study. Il Capitolo 6 illustra la seconda fase di analisi, ovvero la Diagnostic Analytics. Verranno analizzate tutte le cause, dalle quali derivano gli squilibri visti nell’analisi descrittiva. Il Capitolo 7 contiene la terza e ultima fase di analisi, la Predictive Analytics. Verranno analizzate le linee di tendenza di alcuni Paesi e le relative previsioni sui diversi indici economici presi in considerazione dal nostro case study. Il Capitolo 8 ha il compito di trarre le conclusioni relative al lavoro svolto e di gettare le basi per eventuali progetti futuri. 1 La Big Data Analytics Questo capitolo illustra il crescente fenomeno dei Big Data e la loro importanza nei diversi contesti applicativi. Verranno descritte le caratteristiche e, infine, verranno illustrati i passi principali necessari all’avvio e all’esecuzione di uno studio di Big Data Analytics. 1.1 I Big Data Il termine “Big Data” è traducibile letteralmente con “grandi quantità di dati”. In realtà, esso riveste un significato più ampio, in quanto si riferisce a diversi ambiti. Quando si parla di Big Data (Figura 1.1) non si intendono solo i dati, ma anche la loro analisi e il loro utilizzo, cercando di trovare modelli e algoritmi capaci di trattare cosı̀ tante variabili in poco tempo e con poche risorse computazionali. La rivoluzione dei Big Data presuppone nuove capacità di collegare fra loro le informazioni per fornire un approccio visuale ai dati, suggerendo pattern e modelli di interpretazione finora inimmaginabili. Figura 1.1. Il mondo dei Big Data 8 1 La Big Data Analytics Le informazioni sono contenute in dei dataset. Con questo termine intendiamo delle collezioni di dati correlati tra loro; in altre parole, ogni elemento del dataset possiede gli stessi attributi o proprietà di tutti gli altri elementi. Esempi di dataset sono i dati memorizzati in file CSV e XML, oppure i dati memorizzati in file contenuti in cartelle. 1.1.1 Caratteristiche Affinchè un problema rientri nella categoria dei Big Data, il dataset deve possedere una o più caratteristiche che richiedono un adattamento nella progettazione e nell’architettura. L’obiettivo è fare analisi di dati al fine di ottenere risultati di alta qualità e disponibili tempestivamente. I cinque tratti caratteristici dei Big Data sono noti come le 5 V (Figura 1.2). Figura 1.2. I cinque tratti che caratterizzano i Big Data Essi sono: • Velocità (Figura 1.3); nel contesto dei Big Data i dati possono arrivare a velocità elevate, ed enormi dataset possono essere accumulati in tempi molto brevi. Ciò implica che aumenta, anche, il tempo necessario per analizzare i dati. La velocità dipende, comunque, dal contesto in cui vengono generati i dati. • Volume; il volume di dati è consistente e sempre in crescita. Grandi moli di dati implicano diversi metodi di elaborazione e di memorizzazione. Le sorgenti di imponenti volumi di dati sono transazioni online, esperimenti scientifici e di ricerca, sensori e social media. • Varietà; con questo termine si intende la diversità del formato e del tipo di dati supportati da soluzioni di Big Data. La varietà dei dati implica per l’impresa la necessità di integrare, trasformare, processare ed immagazzinare i dati. • Veracità; è un parametro che indica la fedeltà dei dati. In un ambiente con i Big Data è importante che i dati siano di qualità; in caso contrario, è necessario avviare dei processi di pulizia per rimuovere i dati non validi e il rumore. Un dataset contiene, infatti, dati puliti e rumore; quest’ultimo rappresenta dati da cui non è possibile ricavare informazioni. In genere, i dati ricavati da processi controllati sono meno rumorosi dei dati acquisiti in modo non controllato. La 1.1 I Big Data 9 Figura 1.3. Dati generati in un minuto da vari social media • rumorosità dei dati dipende dalle sorgenti da cui essi provengono. Un’ampia varietà nei dati significa dover integrare, trasformare ed elaborare gli stessi prima di poterli analizzare. Valore; esso definisce quanto i dati siano utili per l’azienda. Il valore è, ovviamente, legato alla veracità dei dati (Figura 1.4); infatti più è alta la fedeltà dei dati e più cresce il loro valore. Inoltre, il valore dei dati dipende anche dal tempo richiesto dalla loro elaborazione: più tempo è richiesto, e minore è il valore dei dati poichè, data l’alta velocità con cui vengono generati gli stessi, più è alto il tempo di elaborazione e più il risultato ottenuto si riferisce a dati distanti nel tempo. Figura 1.4. Andamento del valore in relazione alla veracità e al tempo I dati che generalmente vengono elaborati dalle soluzioni di Big Data possono essere generati dall’uomo o dalle macchine; tuttavia, i risultati analitici dell’elaborazione possono essere generati solo da macchine. I dati generati dall’uomo derivano dell’interazione con dispositivi digitali. I dati generati dalle macchine sono ricavati da sensori, GPS, database e server. I dati provengono, quindi, da diverse sorgenti, e ciò si traduce in una forte varietà degli stessi; essi, infatti, possono essere suddivisi in diverse tipologie: strutturati, non strutturati (Figura 1.5), semi-struttuati e, infine, metadati. 10 1 La Big Data Analytics • Dati strutturati ; che sono conformi ad un modello o schema di dati e, spesso, sono memorizzati sotto forma di tabelle. I dati strutturati consentono di rappresentare relazioni tra diverse entità e possono essere memorizzati, anche, in database relazionali, per cui è raro che sia necessario creare soluzioni ad hoc per l’elaborazione e la memorizzazione. I dati strutturati possono essere generati, ad esempio dai sistemi ERP e CRM. • Dati non strutturati ; sono dati non conformi a modelli o schemi ed, in genere, costituiscono l’80% dei dati di qualsiasi organizzazione. Solitamente sono dati che non hanno una struttura propria e sono memorizzati in file di testo o file binari. Poichè non hanno una propria struttura, sono memorizzati in DBMS relazionali sotto forma di BLOB (Binary Large Object), oppure in DBMS NoSQL (NotOnly SQL); questi ultimi sono DBMS non relazionali in cui i dati non devono necessariamente avere una struttura definita. Esempi di dati non strutturati sono file video, audio e immagini. Figura 1.5. Differenza tra tipologie di dati strutturati e non strutturati • Dati semi-strutturati ; comprendono dati con una certa struttura e una data consistenza; tuttavia queste ultime non sono cosı̀ ben definite come nel caso dei DBMS relazionali. In genere, sono dati con struttura gerarchica o a grafo, memorizzati in file di testo, come i file XML o i file JSON. I dati provenienti da sensori, RSS feed, fogli elettronici e file EDI sono dati semi-strutturati e, spesso, richiedono una pre-elaborazione ed una memorizzazione particolari. • Metadati. Questi sono particolari tipi di dati che forniscono informazioni sulla struttura e sulle caratteristiche del dataset. In genere, vengono affiancati ai dati e forniscono informazioni sull’origine degli stessi; tali informazioni possono risultare di fondamentale importanza nella scelta delle tecniche di elaborazione ed analisi dei dati. 1.2 Principali contesti applicativi 11 1.2 Principali contesti applicativi L’importanza dei Big Data non deve essere sottovalutata. Essi hanno un impatto nello studio del comportamento umano simile all’introduzione del microscopio o del telescopio nei campi della biologia e dell’astronomia, in quanto sono in grado di misurare e prevedere crisi economiche, epidemie, diffusione di opinioni, distribuzione delle risorse energetiche. I Big Data consentono di capire la società in cui viviamo, offrono la possibilità di sviluppare nuove tecnologie e modelli matematici per poter estrarre l’effettivo valore e danno la possibilità di perseguire nuovi modelli di business. Essi, inoltre portano vantaggi economici alle aziende che hanno deciso di sfruttare l’informazione ottenibile dai dati in loro possesso. Per questo motivo gli investimenti crescenti nei Big Data possono portare a interessanti scoperte in campo scientifico, ad esempio nella medicina, vantaggi e guadagni nel settore ICT (Information and Communication Technology) e, in contesti Business, nuovi servizi e opportunità per gli utenti web. Nelle prossime sottosezioni daremo uno sguardo ad alcuni contesti applicativi che possono beneficiare dei Big Data (figura 1.6). Figura 1.6. Percentuali dei settori che operano con i Big Data. “Fonte Osservatorio Big Data Analytics e Business Intelligence della School of Management del Politecnico di Milano” 1.2.1 Finanza e Business L’uso diffuso di Personal Computer e tecnologie di rete ha creato grandi repository elettronici che memorizzano numerose transazioni commerciali. Questi dati possono essere analizzati per: • • • definire previsioni sul comportamento degli utenti; identificare modelli di acquisto di clienti singoli o di gruppi di clienti; fornire nuovi servizi personalizzati. 12 1 La Big Data Analytics In campo finanziario, invece, si possono creare piani di investimento e di business grazie a modelli predittivi, oppure è possibile scoprire modelli interessanti e significativi dai dati aziendali. I progetti di Big Data analytics possono essere impiegati trasversalmente su tutte le aree di attività, ma oggi le applicazioni in ambito finanziario a livello internazionale sono prevalentemente solo nel marketing e nella relazioni con la clientela (quasi il 63% dei progetti). Sono ancora pochi (20%) i progetti che coinvolgono attività cardine del business bancario e finanziario, come il Risk Management, l’erogazione di credito o il supporto alle decisioni di investimento. 1.2.2 Istruzione I nuovi modelli di insegnamento sfruttano le potenzialità dell’informatica e della tecnologia, combinate con tecniche di analisi dei dati. L’obiettivo è quello di risolvere le problematiche considerando aspetti pedagogici, meccanismi psicologici e di apprendimento, e, quindi, definire un’istruzione personalizzata, soddisfacendo le esigenze dei singoli o di gruppi di studenti. Un altro campo di interesse in questo contesto è l’e-learnig, ovvero l’apprendimento basato sull’uso delle tecnologie multimediali e di Internet, per migliorarne la qualità e facilitare l’accesso alle risorse e ai servizi. In questo contesto sono definite due principali tipologie di utenti: learner e learning provider. Nei database vengono memorizzati tutti i dettagli personali dei learner nonchè le informazioni fornite dai learning provider. 1.2.3 Settore energetico e dei trasporti Gli spostamenti delle persone (trasporto pubblico e privato) tra e all’interno delle aree metropolitane rappresentano uno dei fattori chiave relativamente alla qualità della vita e coinvolgono una grande varietà e quantità di dati; tra questi citiamo: • • • • • • i dati relativi all’organizzazione del servizio di treni,tram e autobus; le informazioni GPS (autobus, taxi, infopoint, etc.); le informazioni temporanee su interruzioni del traffico; i dati meteorologici; i sensori di parcheggio e i servizi di sharing mobility; gli orari di apertura/chiusura di attività e servizi. Attraverso l’analisi e la visualizzazione di dati dettagliati della rete stradale, e mediante l’uso di un modello predittivo, è possibile realizzare un ambiente di trasporto intelligente. Per quanto riguarda l’ottimizzazione delle risorse energetiche e il monitoraggio ambientale, molto importanti sono i dati relativi ai consumi energetici: elettricità, gas, acqua, emissioni CO2. Appropriate tecniche di analisi e la costruzione di modelli predittivi a partire da questi dati portano a definire strategie intelligenti di distribuzione dell’energia con l’obiettivo di ridurre i costi e aumentare la qualità della vita. 1.2 Principali contesti applicativi 1.2.4 13 Medicina Tra i numerosi campi di applicazione dei Big Data la sanità ricopre un ruolo molto importante. In questo caso l’obiettivo principale è, insieme alla possibilità di tracciare una mappa sanitaria completa di ogni paziente, quello di sapere, in un determinato lasso di tempo più o meno lungo, quali saranno, presumibilmente, le prestazioni sanitarie e i farmaci di cui la popolazione di una data zona avrà bisogno. Questo permetterebbe di adeguare i servizi al reale e concreto bisogno dei pazienti, migliorando l’efficenza e riducendo i costi sanitari. Nella ricerca medica riveste un ruolo importante l’analisi delle sequenze genomiche. La conoscenza dell’intero genoma permette di identificare più facilmente i geni coinvolti e osservare come questi interagiscono, in particolare nel caso di malattie complesse come tumori. Questi dati permettono di definire un’ampia base di conoscenza con la quale è possibile effettuare studi predittivi sull’incidenza di alcune malattie. I Big Data stanno anche aiutando a combattere la diffusione di epidemie. In Africa, per esempio, i dati di localizzazione degli smartphone vengono impiegati per tracciare i movimenti della popolazione e, quindi, prevedere la propagazione del virus Ebola, dando, inoltre, indicazioni su dove realizzare centri per le cure. 1.2.5 Social Network Il volume di dati generati dai servizi Internet, dai siti web, dalle applicazioni mobili e dai social network è grande. Da queste grandi quantità di dati (figura 1.7), raccolti in particolare attraverso i social network, aziende e ricercatori cercano di prevedere il comportamento collettivo e analizzare i trend. Figura 1.7. Panoramica dei principali social network che utilizzano i big data Ai social network viene applicata la cosiddetta “sentiment analysis”, che si basa sull’ascolto e permette di capire quello che pensano gli utenti su determinate questioni, senza sollecitazione. Essa è più efficace dei classici sondaggi telefonici, nei quali, il più delle volte, non vengono date delle risposte sincere. Le applicazioni della sentiment analysis non si fermano alla politica o ai temi di attualità, ma consentono, anche, di interpretare il grado di benessere della nostra società. 14 1 La Big Data Analytics Uno dei social media che sfrutta al meglio il ruolo di dataset è Twitter. Il flusso di dati costante relativo a tutti i tweet che vengono inviati nel web ha, anche, un suo nome preciso: firehose (letteralmente “idrante antincendio”). Il fatto che Twitter fornisca i propri dati in maniera cosı̀ diversa, e seguendo regole precise, lo ha reso il social media più studiato con approcci che usano algoritmi o altre tecniche di analisi di tipo informatico. Ad esempio, attraverso il monitoraggio degli hashtag di Twitter, è possibile identificare dei modelli di influenza. 1.2.6 Sicurezza I Big Data vengono anche usati nel campo dell’intelligence, della sorveglianza e del riconoscimento. Le fonti di dati per i sistemi di intelligence sono: • immagini satellitari; • comunicazioni intercettate (civili e militari), tra cui voce, e-mail, registri delle transazioni e altri dati elettronici; • dati di tracciamento radar; • dati biometrici (immagini facciali, DNA, impronte digitali, scansioni dell’occhio, registrazione del portamento); • dati di sensori (dati meteorologici, oceanografici, riprese di telecamere di sicurezza); • sorgenti di dominio pubblico e informazioni fornite da aziende e organizzazioni. L’obiettivo è quello di trovare dei modelli significativi in maniera tempestiva tra le diverse informazioni provenienti da fonti multiple. Inoltre, è necessario fare attenzione a non generare dei falsi positivi, in modo che non emergano allarmi laddove non esistono. 1.3 La Data Analysis e la Data Analytics La Data Analysis è un processo che verifica la presenza di pattern, relazioni, intuizioni e/o tendenze esaminando i dataset, allo scopo di fornire supporto alle decisioni. La Data Analytics è, invece, una disciplina che gestisce il ciclo di vita dei dati e, dunque, comprende la raccolta, la pulizia, l’organizzazione, la memorizzazione e l’analisi dei dati grazie a metodi scientifici. La Data Analysis è, quindi, un processo della Data Analytics, nata, appunto, con lo scopo di fornire alla Data Analysis dei metodi in grado di lavorare con grandi volumi di dati in ambienti distribuiti e scalabili. 1.3.1 Categorie di Big Data Analytics In genere la Big Data Analytics viene utilizzata dalle organizzazioni per vari scopi. In ambiente aziendale, è usata per abbassare i costi operazionali e per facilitare la presa di decisioni strategiche; in ambiente scientifico, i risultati ottenuti con la Data Analytics possono essere usati per dimostrare l’accuratezza delle previsioni identificando la causa di determinati fenomeni; infine, nel settore dei servizi, ad esempio 1.3 La Data Analysis e la Data Analytics 15 nella Pubblica Amministrazione, può essere usata per capire come mantenere alta la qualità dei servizi abbassandone i costi. Essa fornisce, pertanto, un supporto alle decisioni sulla base di dati di fatto e non sulla base di intuizioni o decisioni passate. Ci sono quattro tipologie di Data Analytics: • • • • Descriptive analytics; Diagnostic analytics; Predictive analytics; Prescriptive analytics. A seconda della tipologia vengono adottate diverse tecniche di analisi, variando quindi, anche i metodi di acquisizione, memorizzazione e elaborazione dei dati in base ai risultati che si vogliono ottenere (Figura 1.8). Figura 1.8. Grafico che mostra l’andamento crescente della complessità al variare dell’analisi da svolgere Vediamo queste quattro tipologie più nello specifico. La descriptive analytics riguarda eventi che sono già accaduti, e che vengono contestualizzati in modo da ricavare informazioni. Domande tipiche sono: “Quante vendite ci sono state negli ultimi 12 mesi?” oppure “Quanti bambini sono nati tra il 2000 e il 2010 nelle regioni italiane?”. In genere l’80% delle analisi hanno natura descrittiva. Come possiamo notare in Figura 1.9, le analisi vengono effettuate su dati operazionali, memorizzati in sistemi ERP (Enterprise Resourse Planning), CRM (Customer Relationship Management) oppure OLTP (OnLine Transaction Processing). I risultati della descriptive analytics vengono visualizzati tramite report statici o dashboard, col supporto di griglie e grafici. La diagnostic analytics ha lo scopo di capire quali sono state le cause di eventi passati. Domande tipiche sono: “Perchè il prodotto X ha venduto meno del prodotto Y?” oppure “Perchè nello stato A sono aumentati i casi della malattia B negli 16 1 La Big Data Analytics Figura 1.9. Struttura di un sistema di descriptive analytics ultimi 15 anni?”. Come mostra la Figura 1.10, la dignostic analytics, in genere, analizza dati multidimensionali provenienti da diverse sorgenti e gestiti da sistemi OLAP (On-Line Analytical Processing). I risultati sono ottenuti tramite tool di visualizzazione interattivi, che consentono di effettuare operazioni di roll-up e drilldown sui dati. Rispetto alla descriptive analytics, la diagnostic analytics richiede competenze più avanzate, anche a causa della maggiore complessità delle query. Figura 1.10. Struttura di un sistema di diagnostic analytics La predictive analytics viene usata per determinare il probabile esito di un evento futuro. Essa lega, quindi, l’informazione al suo significato, e questa associazione consente di creare un modello che effettua predizioni sul futuro sulla base di eventi accaduti nel passato in certe condizioni. Se queste condizioni cambiano, cambia anche il modello di predizione, poichè la predizione si basa su pattern, trend ed eccezioni ricavate dai dati. Domande tipiche delle predictive analytics sono: “Se un cliente ha acquistato i prodotti A e B, qual è la probabilità che acquisti anche il prodotto C?” oppure “Qual è la probabilità di guarigione per il paziente X se viene curato col farmaco A piuttosto che con il farmaco B?”. Dalla Figura 1.11 si evince che la predictive analytics usa grandi dataset sia interni che esterni e varie tecniche di analisi. I risultati sono visualizzati tramite strumenti statistici con interfaccia user-friendly. La prescriptive analytics si basa sui risultati della predictive analytics per consigliare le azioni da intraprendere, focalizzandosi su quale sia la migliore a seconda del contesto. Per questo motivo la prescriptive analytics viene utilizzata nei casi in cui bisogna prendere una decisione per ottenere un vantaggio o per ridurre un rischio. 1.4 Pianificazione di uno studio sui Big Data 17 Figura 1.11. Struttura di un sistema di predictive analytics Domande tipiche sono: “Tra quattro farmaci, quale consente di ottenere i risultati migliori?” oppure “Qual è il miglior momento per immettere sul mercato un nuovo prodotto?”. Per ogni query vengono calcolati vari risultati nei diversi contesti ed, infine, si determina l’azione migliore da intraprendere. Nella Figura 1.12 vediamo che questo tipo di analisi viene svolta su dati provenienti da sorgenti interne (dati su vendite, informazioni sui consumatori, sui prodotti, etc.) ed esterne (dati da social media, dati demografici, previsioni meteo, etc.). Anche in questo caso i risultati sono visualizzati tramite strumenti statistici con interfaccia user-friendly. Figura 1.12. Struttura di un sistema di prescriptive analytics Come si nota dalla descrizione dei diversi tipi di analisi, ciascuna ha un livello di complessità e un valore diverso; entrambi crescono dall’analisi descrittiva fino a quella prescrittiva. Essere in grado di conoscere le azioni da compiere, date alcune circostanze, in un tempo futuro, è il più grande valore che lo studio dei Big Data può darci. 1.4 Pianificazione di uno studio sui Big Data Come già detto, l’adozione di tecniche di Big Data è utile per consentire alle aziende di pianificare al meglio nuove strategie, e può contribuire a cambiamenti per lo più innovativi. Le attività di trasformazione sono, in genere, a basso rischio e mirano ad aumentare l’efficienza dei processi aziendali. Le attività innovative, invece, vanno ad alterare le dinamiche aziendali, dai prodotti ai servizi e, dunque, richiedono, 18 1 La Big Data Analytics una maggiore apertura mentale. Tale cambiamento è reso possibile dall’adozione di approcci basati sui Big Data. L’uso di tecniche proprie dei Big Data non è immediato, ed è necessario pianificare fin dall’inizio lo studio da intraprendere, anche a causa dei problemi che potrebbero insorgere. Un’analisi basata su Big Data inizia con la definizione del business case e finisce quando i risultati analitici consentono all’azienda di ricavarne il massimo valore. Prima di svolgere le analisi, i dati devono essere identificati, procurati, filtrati, estratti, puliti e aggregati. 1.4.1 Analisi e acquisizione dei dati Per poter effettuare delle analisi sui dati, le organizzazioni devono possedere degli strumenti di gestione degli stessi; il personale che utilizzerà le soluzioni di Big Data deve avere delle abilità specifiche, e la qualità dei dati da analizzare deve essere valutata adeguatamente. Infatti dati non validi, vecchi o poveri sono di bassa qualità e non possono che produrre risultati di bassa qualità, nonostante l’adozione di tecniche di Big Data. Potrebbero essere necessari dei fondi per recuperare dati esterni, anche se alcune tipologie di dati sono gratuiti, come quelli forniti dalla Pubblica Amministrazione, dati geografici, dati finanziari. I dati potrebbero contenere delle informazioni confidenziali, di aziende o di individui, per cui è necessario analizzare i dataset e separare le informazioni confidenziali, in modo da evitare l’eventuale violazione di leggi sulla privacy. Un fattore fondamentale per lo studio riguarda la sicurezza. Questa, nel contesto dei Big Data, è garantita da diversi livelli di accesso a seconda degli utenti, grazie a meccanismi di autenticazione e di autorizzazione. Le informazioni sulla provenienza dei dati contengono notizie sulle sorgenti e su come i dati sono stati elaborati. In altre parole, esse forniscono informazioni sull’autenticità e la qualità dei dati, anche se l’acquisizione, la combinazione e la memorizzazione dei dati stessi attraverso più processi (Figura 1.13) può rendere complesso il mantenimento delle informazioni di provenienza. Figura 1.13. Fasi che riguardano la memorizzazione delle informazioni sulla provenienza del dato 1.4 Pianificazione di uno studio sui Big Data 19 Per venire incontro a esigenze riguardanti grandi quantità di memoria è possibile utilizzare il cloud computing, cioè un insieme di servizi che vengono erogati in hosting in Rete. L’innovazione apportata da questa tecnologia consiste nella possibilità di accedere a risorse facilmente configurabili secondo le proprie esigenze e accessibili direttamente da Internet e, quindi, di usare infrastrutture, capacità di calcolo e di memoria fornite da questi sistemi ed implementare soluzioni di Big Data per svolgere processi su larga scala. In genere, l’uso del cloud computing a supporto dei Big Data è giustificabile nel caso in cui le risorse proprietarie siano insufficienti e non siano disponibili risorse finanziare per migliorarle, nel caso in cui i dati da analizzare si trovino già sul cloud o nel caso in cui il progetto di analisi deve essere isolato rispetto al resto dei processi aziendali, in modo da non influenzarli. 1.4.2 Big Data Analytics Lifecycle Come mostrato in Figura 1.14, la Big Data Analytics ha un ciclo di vita composto da nove fasi: 1. 2. 3. 4. 5. 6. 7. 8. 9. valutazione del business case; identificazione dei dataset; acquisizione e filtraggio dei dati; estrazione dei dati; convalida e pulizia dei dati; unione e rappresentazione dei dati; analisi dei dati; visualizzazione dei dati; utilizzo dei risultati di analisi. Figura 1.14. Le nove fasi che compongono il ciclo di vita della Big Data Analytics 20 1 La Big Data Analytics Nel seguito di questa sezione vedremo più in dettaglio ciascuna di queste fasi. La prima fase consiste nella valutazione del business case, che deve essere ben definito e deve contenere le motivazioni e gli obiettivi da ottenere dall’analisi. Tale procedimento deve essere creato, valutato e approvato prima dell’inizio della prima fase, in modo da capire quali risorse aziendali usare e quali sfide dovranno essere affrontate durante il progetto. Inoltre, la definizione di un parametro capace di misurare le prestazioni aiuta a valutare la bontà dei risultati delle analisi. Affinchè i problemi siano classificabili come problemi di Big Data, essi devono possedere una delle caratteristiche dei Big Data stessi, ossia volume, velocità o varietà. Un risultato di questa fase è l’identificazione del budget richiesto per eseguire il progetto di analisi; infatti, ogni acquisto deve essere preventivato in modo da essere pesato rispetto ai benefici che si stima di ottenere dal raggiungimento degli obiettivi. La seconda fase è costituita dall’identificazione dei dataset necessari per il proseguimento delle analisi. Identificare sorgenti di dati molto variabili aumenta la probabilità di trovare pattern nascosti e correlazioni tra dati. I dati possono essere interni e/o esterni, a seconda dei problemi aziendali e dello scopo delle analisi da condurre. In genere i dati interni provengono da data warehouse e sistemi operazionali, mentre i dati esterni possono essere dati di mercato e pubblicità. La terza fase prevede l’acquisizione e il filtraggio dei dati provenienti dalle sorgenti identificate al passo precedente. Dei filtri automatici rimuovono i dati corrotti, che non hanno valore per l’analisi. In genere, i dati corrotti sono costituiti da valori mancanti, non significativi o non validi. Durante questa fase è possibile affiancare ai dati, sia interni che esterni, i metadati, in modo da mantenere informazioni sulla sorgente dei dati, sulla loro struttura ed, eventualmente, su una loro classificazione. La quarta fase consiste nell’estrazione dei dati per trasformarli e renderli compatibili con i formati previsti dalle soluzioni di Big Data. Questa fase è molto legata agli strumenti di Big Data utilizzati; ad esempio, in alcuni casi, non è necessario effettuare operazioni di selezione di campi se il tool di analisi è in grado di effettuare in seguito questa operazione. La quinta fase prevede la convalida e la pulizia dei dati in modo approfondito. Infatti, dati non validi possono falsificare i risultati delle analisi e inoltre, avere dati da diversi dataset può portare a ridondanza, che può essere sfruttata per capire le interconnessioni tra dataset e per completare i dati mancanti. Le operazioni di questa fase possono essere effettuate tramite operazioni di estrazione, trasformazione e caricamento offline, nel caso di analisi non in realtime. In caso contrario, i dati devono essere validati e puliti non appena arrivano dalla sorgente. La sesta fase consiste nell’aggregazione e nella rappresentazione dei dati, integrando vari dataset tramite campi in comune in modo da avere una vista unificata dei dati. Potrebbero esserci differenze nella struttura e nella semantica dei dati, risolvibili tramite una logica complessa eseguita automaticamente senza bisogno che ci sia l’intervento umano. La settima fase è quella di analisi dei dati, in cui vengono svolti i compiti di analisi. Questa fase ha natura iterativa, soprattutto se l’analisi è esplorativa e mira a scoprire correlazioni o pattern. I risultati di questa fase possono essere ottenuti da semplici interrogazioni sui dataset oppure da una combinazione di tecniche di data mining e analisi statistiche complesse. Vi sono due tipologie di risultati: confermativi, nel caso in cui si usa un approccio deduttivo per capire le cause dei fenomeni 1.4 Pianificazione di uno studio sui Big Data 21 con l’obiettivo di affermare o negare l’ipotesi e di fornire una risposta definitiva ad una specifica domanda; esplorativi, nel caso in cui si usa un approccio induttivo strettamente legato al data mining; in questo caso non vengono formulate ipotesi e i dati vengono semplicemente analizzati per scoprire le cause dei fenomeni. Anche se non fornisce risposte definitive, questo tipo di analisi consente di scoprire facilmente pattern e anomalie. L’ottava fase consiste nella visualizzazione dei dati tramite tecniche e tool che espongono graficamente i risultati delle analisi, in modo che siano comprensibili per ottenere risposte a domande su questioni aziendali. Lo stesso risultato può essere presentato, e quindi interpretato, in molti modi diversi. La nona e ultima fase è quella di utilizzo dei risultati di analisi ed è dedicata a determinare come e dove i dati elaborati possono essere ulteriormente sfruttati. Infatti, l’analisi dei dati può portare a trovare pattern e relazioni tra dati prima ignote; da ciò può scaturire la realizzazione di un nuovo processo di business o di un nuovo sistema. 2 Tableau Questo capitolo introduce Tableau, un potente software per la visualizzazione e l’analisi di grandi quantità di dati. Nella trattazione vengono illustrate le principali caratteristiche e potenzialità di Tableau, tra cui la possibiltà di aggiungere filtri, creare previsioni e presentazioni accattivanti. Inoltre, sono descritti alcuni degli innumerevoli grafici che Tableau mette a disposizione per una visualizzazione personalizzata dei dati. 2.1 Descrizione dell’applicazione Tableau è un software realizzato dalla compagnia americana Tableau Software (Figura 2.1), specializzata nella creazione di prodotti di visualizzazione di dati basati sulla Business Intelligence. Figura 2.1. Il logo dell’azienda Tableau Software. Il prodotto è disponibile in diverse varianti (Figura 2.2): Tableau Desktop, che permette di realizzare e visualizzare dashboard interattive, Tableau Server, che permette di condividere le dashboard realizzate tramite Tableau Desktop con altri utenti e Tableau Online, che corrisponde alla versione cloud di Tableau Server. Inoltre, è disponibile una versione aggiuntiva, chiamata Tableau Public, che equivale ad una versione gratuita e pubblica di Tableau Server. Nel capitolo focalizzeremo l’attenzione su Tableau Desktop, un potente software di analisi dei dati che permette, tramite un’intuitiva interfaccia grafica, di connettersi a numerosi tipi di sorgenti, e 24 2 Tableau Figura 2.2. Le diverse varianti della piattaforma Tableau. di realizzare l’analisi dei dati in maniera estremamente semplice e veloce, attraverso una grafica accattivante. Tableau può collegarsi a: • file system: CSV, Excel, etc. ; • sistemi relazionali : Oracle, SQL Server, DB2, etc. ; • sistemi cloud : Windows Azure, Google BigQuery, etc. La funzione Live Connect viene utilizzata per l’analisi dei dati in tempo reale. In questo modo le ultime modifiche si riflettono sul risultato dell’analisi. Tableau può anche elaborare dati in memoria memorizzandoli in cache, e non essere più collegato alla sorgente durante l’analisi dei dati. Naturalmente ci sarà un limite alla quantità di dati memorizzati nella cache a seconda della disponibilità di memoria. Tableau può collegarsi contemporaneamente a diverse fonti di dati. Per esempio, in una singola cartella di lavoro, è possibile connettersi a un file non strutturato e ad una fonte di dati relazionale, definendo connessioni multiple. Questa operazione di fusione dei dati è una caratteristica unica in Tableau. 2.1.1 Caratteristiche del software La caratteristica di Tableau, come sottolineato in precedenza, è la sua interfaccia funzionante tramite il meccanismo di “Drag-and-Drop”, ovvero una successione di tre azioni consistenti nel selezionare un oggetto e trascinarlo in un’altra posizione in cui viene rilasciato (letteralmente, il termine vene tradotto con “trascina e rilascia”). Tableau può essere utilizzato da qualsiasi tipologia di utente. Infatti, grazie alla sua semplicità e velocità di analisi, chiunque può esplorare e analizzare i dati, utilizzando strumenti visivi come colori, linee di tendenza, diagrammi e grafici. Tableau ha una varietà molto ampia di opzioni di formattazione per modificare l’aspetto delle visualizzazioni create. È possibile modificare quasi ogni aspetto: in particolare è possibile scegliere il carattere desiderato, modificare l’orientamento e il formato degli assi, il colore e lo sfondo, nonchè i bordi, l’allineamento e l’ombreggiatura. Tableau, inoltre, offre la possibilità di creare una visualizzazione personalizzata dei dati, estendendo le normali visualizzazioni con alcune caratteristiche aggiuntive, in modo da creare diversi tipi di grafici per gli stessi dati. Ad esempio, è possibile effettuare operazioni di Drill-Down, in maniera tale da visualizzare i dati ad un livello di granularità più fine, e di Roll-Up, che al contrario consente di visualizzare i dati ad un livello di dettaglio minore. 2.1 Descrizione dell’applicazione 25 Un’altra caratteristica molto importante di Tableau è l’ordinamento dei dati dimensionali. Ci sono due modi con cui Tableau svolge tale attività; in particolare, attraverso l’ordinamento automatico è possibile scegliere un ordinamento ascendente o discendente; in alternativa è possibile effettuare l’ordinamento in maniera manuale. 2.1.2 Creazione di un foglio di lavoro La pagina iniziale di Tableau mostra le varie fonti di dati a cui è possibile connettersi. Sotto l’intestazione “Connect” sono presenti delle opzioni per scegliere un file, un server o una fonte di dati salvati. Nel caso in cui vengono aperti più schemi di dati, Tableau esegue l’operazione di Inner Join sugli attributi che hanno nome uguale. Tuttavia, è possibile modificare le impostazioni predefinite scegliendo la tipologia di join desiderata. Tableau mette a disposizione Inner Join, Left Join, Right Join e Full Outer Join. Per visualizzare il foglio di lavoro occorre selezionare la scheda “Sheet” che appare nella barra inferiore. Una volta aperto il foglio di lavoro, a destra, vengono visualizzate le dimensioni, ovvero i dati descrittivi, e le misure, che, invece, sono i dati numerici. Il foglio di lavoro (worksheet) è l’area in cui si lavora per l’analisi dei dati, creando grafici, effettuando calcoli e descrizioni. Per impostazione predefinita Tableau fornisce tre fogli di lavoro vuoti (Figura 2.3) quando si è stabilita una connessione alla sorgente dati (offline o online). Possiamo aggiungere più fogli di lavoro per visualizzare nella stessa schermata i diversi lavori. Figura 2.3. La schermata del foglio di lavoro vuoto. Per la creazione di un grafico è sufficiente trascinare dimensioni e misure all’interno dei campi “righe” e “colonne”. Automaticamente sarà generato un grafico attraverso il quale è possibile visualizzare l’andamento dei dati dimensionali rispetto a quelli numerici. 26 2 Tableau 2.1.3 Tipi di grafici Visto come strumento di visualizzazione avanzata dei dati, Tableau mette a disposizione svariate tipologie di grafici, fornendo tecniche di analisi senza la necessità di scrivere codice personalizzato. Ogni volta che viene creato un foglio di lavoro, sono disponibili, nel campo “Show me”, alcuni dei grafici possibili (Figura 2.4), in base alla natura dei dati selezionati. Figura 2.4. L’elenco dei grafici ottenibili, visualizzato nel campo “Show Me”. I dati possono essere visualizzati attraverso diverse tipologie di grafici, ovvero: • Grafico a torta; esso permette di rappresentare i dati all’interno di un cerchio, suddiviso in fette di diverse dimensioni e colori. Anche in questo caso occorre trascinare almeno una dimensione e una misura sui campi “righe” e “colonne”, per la creazione del grafico. All’interno del campo “Marks” è possibile modificare il colore e la dimensione delle fette a seconda dei dati. • Grafico a barre; esso permette di rappresentare i dati attraverso delle barre rettangolari la cui lunghezza risulta essere proporzionale al valore della variabile. Tableau produce automaticamente un grafico a barre ogni volta che si trascina una dimensione nel campo “righe” e una misura nel campo “colonne”, o viceversa. Inoltre è possibile applicare una gamma di colori alle barre in base al valore che assumono i dati. Ad esempio, è possibile attribuire tonalità più scure alle barre più lunghe, e tonalità più chiare alle barre più corte. Per fare questo, è necessario trascinare la misura desiderata all’interno del riquadro “Marks” e attribuire ad essa un colore. • Grafico a linee; per utilizzare questo tipo di rappresentazione sono necessarie una misura e una dimensione, i cui valori sono associati ai due assi del grafico (Figura 2.5). Ogni coppia di valori fornisce un punto nel grafico per ciascuna osservazione. L’unione di tutti i punti contribuisce a creare una linea che mostra la variazione, o il rapporto, tra le dimensioni e le misure scelte. 2.1 Descrizione dell’applicazione 27 Figura 2.5. Esempio di grafico a linee. • Grafico a bolle; esso consente la visualizzazione dei dati attraverso un raggruppamento di cerchi (Figura 2.6). Ciascuno dei valori descrittivi rappresenta un cerchio, mentre i valori di misura rappresentano le dimensioni di tali cerchi. Poichè i campi non devono essere disposti su righe o su colonne, è sufficiente trascinare i valori coinvolti all’interno della sezione “Marks”. Figura 2.6. Esempio di grafico a bolle. • Grafico di movimento; questa tipologia mostra i cambiamenti nel tempo dei dati, attraverso il movimento di punti all’interno dello spazio definito dagli assi cartesiani. Per effettuare ciò è necessario avere una dimensione temporale all’interno del campo “righe” o “colonne”; a seguito di ciò, effettuando un’operazione di drill-down, è necessario ricavare una dimensione a granularità più fine, che deve essere trascinata all’interno del campo “Pages”. Successivamente, nella sezione “Show History”, è sufficiente selezionare il tasto “play” per visualizzare come sono variati i dati all’interno di un intervallo temporale. Ad esempio, è possibile visualizzare come sono cambiati i profitti di un’azienda, simultaneamente, ad ogni mese, per tutti gli anni. 28 2 Tableau • Mappa; essa può essere creata quando, ogni volta che viene aperto un foglio di lavoro, vengono automaticamente generate le coordinate geografiche, ovvero latitudine e longitudine. Le mappe possono essere costruite a partire dalla presenza di dati geografici (Figura 2.7). Occorre assegnare un ruolo geografico a ciascun valore; a seguito di questa operazione, trascinando il dato nel campo “Marks”, vengono inserite, rispettivamente, sulle righe e sulle colonne, latitudine e longitudine. In questo modo viene creata la mappa dell’intero pianeta, e, attraverso sfumature di colori o punti, vengono visualizzati i dati delle zone desiderate. Figura 2.7. Esempio di grafico a mappa. Tableau ha la capacità di individuare paesi, stati, regioni, città, e persino codici postali, per costruire mappe dettagliate. Un’applicazione molto comune di questo tipo di grafico consiste nel mostrare le attività sismiche che sono state segnalate nel corso del tempo, il loro livello di intensità, e, conseguentemente, le zone a rischio, attraverso statistiche e analisi predittive. • Mappa ad albero; essa visualizza i dati in rettangoli annidati. Le dimensioni, come nel caso del grafico a bolle, servono per definire la struttura della mappa dell’albero, mentre le misure consentono di definire il formato o il colore del singolo rettangolo. Una mappa ad albero viene creata associando una o più dimensioni ad una o due misure. • Diagramma di Gantt; tale diagramma mostra l’avanzamento del valore di un’attività per un periodo di tempo (Figura 2.8). Esso, quindi, richiede una dimensione temporale e almeno una dimensione. In aggiunta a questi dati possono essere inserite anche una o due misure. 2.2 Calcoli in Tableau Per creare le visualizzazioni, oltre al meccanismo di Drag-and-drop, Tableau offre, agli utenti più esperti, la possibilità di effettuare query più complesse, mettendo a disposizione una grande varietà di operatori, e consentendo la creazione di fogli di calcolo. 2.2 Calcoli in Tableau 29 Figura 2.8. Esempio di diagramma di Gantt. 2.2.1 Operatori Tableau dispone di un certo numero di operatori, utilizzati per creare campi di calcolo e formule. Gli operatori possono essere suddivisi nelle seguenti categorie: • • • • Operatori generali ; questi comprendono le operazioni di addizione e sottrazione. L’addizione consente di sommare valori numerici, concatenare due stringhe e aggiungere giorni alle date. La sottrazione consente di sottrarre valori numerici e sottrarre giorni alle date. Operatori aritmetici ; essi agiscono solo sui dati numerici e comprendono le operazioni di moltiplicazione, divisione, modulo e potenza. Operatori relazionali ; questi vengono usati all’interno di espressioni per confrontare numeri, date o stringhe; essi restituiscono un valore booleano (vero o falso). Operatori logici ; essi sono utilizzati in espressioni il cui risultato è un booleano e, a loro volta, restituiscono un valore booleano. 2.2.2 Creazione di un campo di calcolo Per creare un campo di calcolo occorre selezionare “Create Calculated Field” dalla voce “Analysis” che compare nel menù. Si aprirà un editor di calcolo che elenca tutte le funzioni disponibili in Tableau (Figura 2.9) . Una volta scritta la formula, basta trascinare il campo creato sulle righe o sulle colonne, analogamente a quanto avviene per le misure e le dimensioni. Oltre alle espressioni più complesse, Tableau consente di aggiungere dei calcoli che vengono applicati ai valori dell’intera tabella, poichè alcune operazioni non possono essere eseguite solo su alcune righe selezionate. Percentuali, differenze e medie mobili sono solo alcune delle opzioni che possono essere applicate alle misure. Le operazioni da svolgere per questo tipo di calcolo sono le seguenti: 30 2 Tableau Figura 2.9. L’editor di calcolo in Tableau. 1. selezionare la misura su cui deve essere applicato il calcolo e trascinarlo sulle righe o sulle colonne; 2. fare click con il tasto destro del mouse sulla misura e scegliere l’opzione “Quick Table Calculation”; 3. scegliere una delle opzioni da applicare alla misura. 2.2.3 Espressioni LOD Con il termine “LOD” intendiamo il livello di dettaglio delle espressioni (Level of Detail) in Tableau. Essi sono utilizzati per eseguire query complesse, che coinvolgono molte dimensioni. Un semplice esempio è l’aggiunta di una dimensione per un valore aggregato già calcolato. Esistono tre tipi di espressioni LOD: • l’espressione “FIXED” seleziona i valori utilizzando le dimensioni specificate, senza riferimento ad eventuali altre dimensioni; • l’espressione “INCLUDE” consente di aggiungere dimensioni oltre a quelle già presenti nella visualizzazione; • l’espressione “EXCLUDE” consente di sottrarre dimensioni dal livello di visualizzazione dei dettagli. 2.3 Ulteriori funzioni Tableau Desktop, in qualità di prodotto utilizzato per individuare i trend e le opportunità, nonchè per prendere decisioni, consente di creare presentazioni interattive. Oltre alla creazione di dashboard e storie, è possibile trascinare, all’interno del grafico, delle linee di riferimento, effettuare previsioni ed applicare filtri. Nelle prossime sezioni esamineremo queste funzionalità del software. 2.3 Ulteriori funzioni 2.3.1 31 Filtri Il filtraggio è il processo di rimozione di alcuni valori o di un intervallo di valori da un set di risultati. I filtri vengono creati, in maniera molto semplice e intuitiva (Figura 2.10), trascinando il campo richiesto nello spazio “Filtri”, che si trova sopra la scheda “Marks”. Figura 2.10. La schermata di creazione filtri. Ci sono tre tipi di filtri di base disponibili in Tableau: • • • filtri per le dimensioni, che comprendono il filtraggio in base a categorie di testo o valori numerici con espressioni logiche regolate da eventuali condizioni; filtri per le misure, utilizzati, appunto, per filtrare particolari tipi di operazioni e calcoli basati su campi di misure; filtri per le date, necessari se si vuole restringere il range di date da visualizzare, o per soffermarsi su particolari anni ed eventi. A sua volta, Tableau offre i seguenti tipi di filtri per le misure (Figura 2.11): • • • • Range of values; consente di specificare i valori minimo e massimo da includere nella visualizzazione; At least; include tutti i valori che sono maggiori o uguali a un valore minimo specificato; At most; consente di includere tutti i valori che sono inferiori o uguali a un valore massimo specificato; Special ; è una particolare tipologia che consente di effettuare filtraggi che coinvolgono i valori NULL. Permette di includere solo i valori nulli, solo i valori non nulli, o tutti i valori. Molti tipi di filtro sono rapidamente disponibili selezionando, con il tasto destro del mouse, la dimensione o la misura di interesse. Questi filtri, noti come filtri rapidi, possiedono un numero di funzionalità sufficiente per soddisfare la maggior parte delle esigenze di filtraggio comuni. 32 2 Tableau Figura 2.11. Le diverse tipologie di filtri per le misure. Ci possono essere situazioni in cui è necessario che un secondo filtro venga applicato solo sui risultati restituiti da un primo filtro. In questo caso il secondo filtro è noto come filtro dipendente, in quanto elabora solo i dati che passano attraverso il primo filtro. Queste tipologie di filtri sono usate per migliorare le prestazioni, ad esempio quando si dispone di una grande quantità di dati che rallenta l’esecuzione delle query. Un’altra opzione è quella del cosiddetto “Top Filtro” (Figura 2.12), che viene utilizzata per limitare il set di risultati. I Top Filtri possono essere applicati spuntando i campi da escludere, oppure tramite l’uso di apposite formule. Figura 2.12. Le diverse tipologie di filtri per le misure. I filtri possono essere eliminati scegliendo l’opzione “Clear Filter”. 2.3 Ulteriori funzioni 2.3.2 33 Creazione di una dashboard Una dashboard (Figura 2.13) è una visualizzazione di molti fogli di lavoro all’interno di un unico foglio. Questo tipo di visualizzazione viene usato per confrontare e monitorare svariati dati simultaneamente. Figura 2.13. Esempio di Dashboard. Quando vengono create delle dashboard, queste vengono mostrate come schede nella parte inferiore della cartella di lavoro e vengono automaticamente aggiornate con i dati più recenti quando si modifica il foglio di lavoro. Per aggiungere dei fogli di lavoro ad una dashboard basta trascinarli nella posizione desiderata. Alla visualizzazione è possibile aggiungere molti oggetti di supporto, come le aree di testo, le pagine web e le immagini. 2.3.3 Creazione di una storia Una storia è una presentazione che contiene una sequenza di fogli di lavoro o dashboard (Figura 2.14), utilizzata per trasmettere informazioni e visualizzare le variazioni dei dati. Figura 2.14. Esempio di storia. 34 2 Tableau Grazie a questa funzionalità è possibile mostrare come i dati siano tra loro collegati, fornire risultati ed esporre decisioni. Per creare una storia è necessario selezionare la voce “New story”. Attraverso la sezione “New blank point” vengono aggiunti tutti i fogli di lavoro che, nel loro insieme, comporranno la storia. Una volta che la storia viene creata, è possibile ad essa assegnare un titolo e aggiungere una breve didascalia per ogni foglio di lavoro. Per presentare una storia, basta passare alla modalità di presentazione dalla barra degli strumenti. 2.3.4 Trend Il trend (Figura 2.15), o linee di tendenza, viene utilizzato per prevedere il proseguimento di alcuni andamenti di una variabile. I trend, inoltre, contribuiscono a identificare la correlazione tra due variabili, osservando simultaneamente l’andamento di entrambe. Tableau necessita della presenza di una dimensione temporale e di un campo di misura per creare una linea di tendenza. Figura 2.15. Esempio di grafico con linee di tendenza. Ci sono molti modelli matematici per stabilire le linee di tendenza. Tableau offre quattro opzioni(Figura 2.16): lineare, logaritmico, esponenziale e polinomiale. Figura 2.16. Tipologie di modelli matematici da poter utilizzare per la creazione del trend. È possibile, anche, ottenere una descrizione più dettagliata facendo click con il tasto destro del mouse all’interno del grafico e selezionando l’opzione “Describe Trend Line”; essa permette di mostrare i coefficienti e l’equazione matematica che indica la correlazione tra i diversi campi d’interesse. Questi dettagli possono essere copiati negli appunti e sottoposti ad ulteriore analisi. 2.4 Salvataggio dei dati 2.3.5 35 Previsioni Una funzionalità molto interessante di Tableau è quella che consente di creare delle previsioni (Figura 2.17), ovvero di prevedere il valore futuro di una misura. Le previsioni sono uno strumento molto utile, in quanto, sulla base di queste, molto spesso vengono prese decisioni importanti, ad esempio sul futuro di un’azienda, o in qualunque altro campo applicativo. Ci sono molti modelli matematici di previsione. Tableau utilizza il modello conosciuto come livellamento esponenziale. Attraverso il livellamento esponenziale viene dato più peso alle osservazioni recenti e meno peso a quelle più remote. Affinchè venga creata una previsione, è necessario avere una dimensione temporale e un campo di misura. Bisogna spostarsi nella sezione “Analytics” e trascinare il campo “Forecast” all’interno del grafico. Automaticamente verrà aggiunta al grafico una predizione, calcolata sui prossimi due anni. Tuttavia è possibile personalizzare la previsione, scegliendo l’intervallo temporale desiderato, anche escludendo alcuni periodi temporali, attraverso il campo “Forecast Options”. Per visualizzare i dettagli della previsione è sufficiente selezionare la voce “Describe Forecast”. Figura 2.17. Esempio di grafico con aggiunta di previsioni. 2.4 Salvataggio dei dati Il risultato di analisi dei dati in Tableau può essere salvato in vari formati per poi essere distribuito. Questi diversi tipi di file sono identificati da diverse estensioni. I loro formati dipendono dal modo in cui i dati vengono prodotti e dallo scopo per cui vengono utilizzati. Essi sono tutti memorizzati come file XML che possono essere aperti e modificati. La descrizione di ogni tipo di file e del rispettivo utilizzo è la seguente: 36 2 Tableau • Tableau Workbook (.twb): contiene informazioni su ciascun foglio e cruscotto presenti in una cartella di lavoro. Esso contiene anche le informazioni di connessione all’origine dei dati nonchè tutte le informazioni create per quella connessione. • Tableau Packaged Workbook (.twbx): contiene i dettagli di lavoro, nonchè i dati utilizzati nell’analisi. Il suo scopo è quello di condividere con altri utenti i risultati dell’analisi. • Tableau Data source(.tds): memorizza i dettagli della connessione utilizzata per creare i report. • Tableau Packaged Data source (.tdsx): è simile al file con estensione .tds, ma con l’aggiunta di dati relativi ai dettagli sulla connessione. • Tableau Data Extract (.tde): contiene i dati utilizzati in un file .twb altamente compressi. Questo aiuta l’ottimizzazione dello storage e dei calcoli che vengono applicati nell’analisi. • Tableau Bookmark (.tbm): contiene un unico foglio di lavoro che viene condiviso facilmente per essere copiato in altre cartelle di lavoro. • Tableau Preferences (.tps): memorizza la preferenza di colore utilizzato in tutte le cartelle di lavoro. Viene utilizzato principalmente per ottenere un aspetto uniforme tra gli utenti. 3 Descrizione dei dati a disposizione Questo capitolo ha lo scopo di fornire un’ampia descrizione della sorgente dei dati, utilizzata in seguito per implementare le analisi. In particolare, verranno illustrati i componenti del dataset oggetto del case study. 3.1 Sorgente dei dati Il nostro obbiettivo è quello di fornire diversi tipi di analisi, riguardanti principalmente dati di natura finanziaria, provenienti dall’Istituto Mondiale Bancario (WB - World Bank, Figura 3.1). Figura 3.1. Logo della Banca Mondiale. La WB è formalmente un’Agenzia specializzata delle Nazioni Unite, con l’obiettivo di lottare contro la povertà e organizzare aiuti e finanziamenti agli stati in difficoltà. A differenza del sistema ONU, il sistema di voto in seno alla WB è ponderato sulla base della quote di capitale versate dai suoi membri/azionisti; l’azionista maggioritario è il governo degli Stati Uniti d’America. La normativa sull’accesso alle informazioni, varata il 1 luglio 2010, è un punto di riferimento della politica informativa adottata dalla Banca Mondiale. A disposizione degli utenti, infatti, tramite il sito di riferimento, è messa un’enorme quantità di dato sotto forma di Open Data. Il corrispettivo database è composto di un insieme molto ampio di variabili (Figura 3.2), raggruppate a seconda della materia di riferimento 38 3 Descrizione dei dati a disposizione (finanziaria, sanitaria, infrastrutture, etc.), dell’area geografica e della periodicità dei dati (annuali, settimanali, giornalieri). Inoltre il Data Catalog contiene tabelle pre-formattate, studi svolti, commenti e altre informazioni utili ad ulteriori analisi. Figura 3.2. Il Data Catalog messo a disposizione dalla Banca Mondiale. 3.1.1 Caratteristiche del dataset Il dataset della WB è facilmente manipolabile direttamente dal sito. Infatti esso consente, seppur in maniera limitata, la creazione di query, la visualizzazione di tabelle e grafici di diverse tipologie a seconda dei dati di interesse. Esso comprende inoltre la possibilità di effettuare il download dei dati in vari formati (XML, CSV, Tabbed TXT, SDMX), anche applicando un filtraggio preventivo (Figura 3.3) cosı̀ da eliminare le variabili che non saranno utilizzate nello studio. Il database ha come caratteristica principale quella di fornire dati “puliti” ai quali, cioè, sono stati applicati operazioni di: • “parsing”, per suddividere il contenuto di un campo in più campi (ad esempio, il nome suddiviso nei campi nome e cognome); • “cleaning”, per correggere gli errori di ortografia più comuni; 3.2 Descrizione dei dati di interesse per la tesi 39 Figura 3.3. Schermata relativa al download del dataset, inclusa di impostazioni di filtraggio. • • “standardization”, per rendere omogeneo il contenuto dello stesso campo proveniente da fonti diverse (ad esempio, per tradurre nomi di città, stati, etc.); “deduplication”, per unificare sotto lo stesso identificativo i campi che contengono le stesse informazioni. 3.2 Descrizione dei dati di interesse per la tesi I dataset che saranno oggetto delle analisi relative alla presente tesi comprendono diverse tipologie di indici finanziari (Figura 3.4): • • • • • • • • • Inflazione (Inflation, consumer prices, annual %). Crescita della moneta in senso ampio (Broad money growth, %). Crediti bancari deteriorati sul totale dei prestiti lordi (Bank nonperforming loans to total gross loans, %). Capitale bancario sul totale delle attività bancarie (Bank capital to assets ratio, annual %). Tasso di interesse reale (Real interest rate, annual %). Tasso di interesse sui depositi (Deposit interest rate, %). Tasso di interesse sui prestiti (Lending interest rate , %). Differenziale sul tasso di interesse (Interest rate spread ,lending rate minus deposit rate, %). Premio per il rischio sui prestiti (Risk premium on lending, lending rate minus treasury bill rate, %). Le impostazioni dei dataset sono comuni a tutte le tipologie di indici. Come si nota in Figura 3.5, le prime due colonne delle tabelle sono relative al Paese d’interesse; la prima indica il nominativo per esteso, mentre la seconda la sigla dello stesso (codice riconosciuto globalmente). 40 3 Descrizione dei dati a disposizione Figura 3.4. Totalità dei dataset riguardanti il settore finanziario. Le successive due sono relative alla tipologia di indice da analizzare. Anche in questo caso, una contiene il nome per esteso e l’altro il codice (Indicator Code), utilizzato per riconoscere in maniera universale il settore oggetto degli studi. Le successive indicano i valori, suddivisi per anno. I dataset contengono le informazioni registrate dall’anno 1960 all’anno 2016. Nelle prossime sottosezioni illustreremo più in dettaglio gli indici finanziari di nostro interesse. 3.2.1 Inflazione L’inflazione (Indicator Code FP.CPI.TOTL.ZG) è il progressivo aumento del livello medio generale dei prezzi, o, anche, la diminuzione progressiva del potere di acquisto della moneta, detta svalutazione monetaria. Si parla, spesso, di inflazione in senso generico.Tuttavia, in realtà, è necessario distinguere due macroclassi: • Strisciante (Creaping inflation), quando il fenomeno inflativo si sviluppa in modo persistente, ma contenuto. • Galoppante (Run Away inflation), quando essa, ampliandosi in maniera progressiva, tramite il fenomeno della spirale inflazionistica, genera aumenti elevati del livello generale dei prezzi; ne consegue lo svilimento del valore monetario. 3.2 Descrizione dei dati di interesse per la tesi 41 Figura 3.5. Schermata della tabella ottenuta dal download. Le principali cause che determinano una situazione inflattiva possono essere classificate in: cause endogene al sistema economico, quando dipendono da fenomeni interni al paese e possono o meno fare riferimento al mercato di beni, e cause esogene al sistema economico, quando sono da ricercarsi all’estero, in quelle nazioni che intrattengono rapporti economici, monetari e finanziari con il paese in questione. È necessario definire i fenomeni inflattivi, interni ed esterni, perchè i primi creano la cosidetta inflazione da domanda (demand pull), determinata da un’eccessiva richiesta globale di servizi e beni rispetto a quanti ne può offrire il mercato. I secondi generano l’inflazione da costi (inflazione da offerta), cioè quando le cause inflattive sono estranee al mercato dei beni e dei prodotti finali. I fenomeni inflattivi esterni (esogeni) a una nazione possono essere causati da una quantità eccessiva di moneta estera che viene ceduta alla nazione in questione in cambio di corrispettivi non monetari. Gli strumenti attraverso cui è possibile controllare le varie situazioni inflattive sono essenzialmente rappresentati dalle politiche fiscali e monetarie che i competenti organi governativi possono attuare. 3.2.2 Crescita moneta in senso ampio La moneta in senso ampio è il metodo più inclusivo per calcolare la liquidità monetaria di un dato paese. Per poter comprendere al meglio la crescita, nel tempo, di tale indice (Indicator Code FM.LBL.BMNY.ZG), dobbiamo rendere note alcune definizioni monetarie. La liquidità monetaria è la totalità dei beni che le famiglie e le imprese possono utilizzare per effettuare pagamenti o tenere come investimenti a breve termine; essa comprende, per esempio, la valuta, fondi nei conti bancari, e qualcosa di valore che sia simile a denaro. Non è un compito semplice per gli economisti definire quanto denaro vi sia attualmente in una data economia. Questi sono, quindi, soliti raggruppare la moneta e i suoi simili nei cosiddetti “aggregati monetari”, cioè insiemi di attività patrimoniali 42 3 Descrizione dei dati a disposizione caratterizzati da un grado via via decrescente di liquidità. Questi aggregati vengono normalmente indicati utilizzando una lettera maiuscola “M” seguita da un numero che si riferisce al calcolo che stanno utilizzando nel determinato contesto (M1, M2 ed M3) . Ci si riferisce, invece, a M0 come alla cosiddetta base monetaria. Con M0, la “base monetaria”, si intende la somma di tutte le banconote e le monete metalliche (cioè tutto il circolante) esistente nel sistema economico, compreso quel circolante che è tenuto dalle banche come forma di riserva. Pertanto, si dice che M0 è composto dalla somma del circolante detenuto dal pubblico, più le riserve detenute dalle banche commerciali. Con M1 si intende la somma di tutto il circolante (monete e banconote) più i depositi a vista, cioè i depositi bancari pagabili su richiesta (ad esempio, i conti correnti). M1 è l’aggregato più liquido (escluso, ovviamente, M0), cioè quello comprendente quelle forme di attività immediatamente “spendibili”. I depositi a vista hanno tre principali caratteristiche: possono essere rapidamente convertiti in contanti dalla banca emittente; possono essere trasferiti con assegni o bonifici; pagano un tasso di interesse prossimo a zero. M2 è composto dalla somma di M1 (cioè il circolante più i depositi a vista) con i depositi a risparmio a breve termine (fino a 2 anni). Si comprende già che questo aggregato, più ampio di M1, è anche meno “liquido”. Infine, il terzo aggregato, M3, si caratterizza per l’aggiunta ad M2 di tutta una serie di attività finanziarie ancora meno liquide: obbligazioni con scadenza originaria inferiore a 2 anni e i titoli del mercato monetario. È, proprio, M3 che indica il concetto di moneta in senso ampio. 3.2.3 Crediti bancari deteriorati sul totale dei prestiti lordi L’indice relativo ai crediti bancari deteriorati sul totale dei prestiti lordi (Indicator Code FB.AST.NPER.ZS) è formato da due tipi di parametri: • Crediti bancari deteriorati; • Prestiti lordi. I crediti bancari deteriorati sono i crediti che la banca vanta nei confronti dei suoi debitori, ma dei quali non è più sicura di riscuoterne l’importo, sia in termini di rispetto delle scadenze, sia per l’intero ammontare dell’esposizione di capitale. I debitori, per difficoltà economiche, non riescono più a ripagare regolarmente, o del tutto, il debito nei confronti della banca. I prestiti lordi sono i soldi che la banca centrale fornisce come crediti alle banche commerciali e ad altri istituti di credito, quando le banche hanno completamente esaurito le proprie risorse interne e non sono in grado di mantenere la loro solvibilità attraverso altri mezzi. L’indice complessivo va, quindi, a misurare l’esposizione finanziaria della banca, ossia la qualità dei crediti che vanta e l’esposizione debitoria nei confronti della Banca Centrale. 3.2 Descrizione dei dati di interesse per la tesi 3.2.4 43 Capitale bancario sul totale delle attività bancarie L’indice relativo al capitale bancario sul totale delle attività bancarie (Indicator Code FB.BNK.CAPA.ZS) ha lo scopo di andare la percentuale di patrimonializzazione di una banca, ossia calcola con quale solidità patrimoniale l’operatore opera rispetto al totale delle sue attività, che comportano ovviamente vari rischi. Per rendere più chiara questa descrizione abbiamo la necessità di definire i due parametri che compongono l’indice, ovvero: • • capitale bancario; attività bancarie. Per capitale bancario intendiamo la componente primaria del capitale di una banca, riassumibile nella sigla “Tier 1 capital”, ovvero “Patrimonio di classe 1”. In base agli accordi di Basilea, che gestiscono le normative finanziarie, il patrimonio di una banca può essere distinto in due classi: una classe principale (Tier 1), composta dal capitale azionario e dalle riserve di bilancio provenienti da utili non distribuiti, al netto delle imposte, e da una classe supplementare composta da elementi aggiuntivi. Il Comitato di Basilea, per evitare che il Tier 1 capital venisse reso meno solido dall’uso di strumenti innovativi creati nel tempo dalle banche, decise di stabilire che il Tier 1 capitale potesse comprendere al più il 15 % del totale. Il capitale bancario è formato, anche, dal Tier 2, che presenta un livello di seniority decrescente, ovvero minore garanzia di rimborso per l’investitore. Esso è scomponibile in Upper Tier 2 (che accoglie obbligazioni di durata superiore a 10 anni e utilizzabili per coprire perdite derivanti dall’operatività dell’ente, che non le consentirebbero la prosecuzione dell’attività) e in Lower Tier 2 (contenente obbligazioni della durata superiore ai 5 anni). Per attività bancarie intendiamo le varie attività nell’intermediazione del credito che la banca offre, oltre ad offrire un numero sempre più ampio di servizi. Possiamo distinguere diversi tipi di attività; in particolare, possiamo considerare operazioni bancarie passive e attive. Le operazioni passive sono quelle in cui la banca riconosce degli interessi ai clienti; esse sono: i conti correnti, i depositi a risparmio, e altre forme, come i certificati di depositi. Le operazioni attive sono i finanziamenti che la banca dà ai suoi clienti. Esempi di finanziamenti bancari sono l’erogazione di un mutuo o di un prestito. 3.2.5 Tasso di interesse reale Il tasso d’interesse reale (Indicator Code FR.INR.RINR) è il saggio d’interesse al netto del tasso d’inflazione vigente in una data economia. Dal punto di vista concettuale il tasso d’interesse reale è dato dalla differenza tra il tasso d’interesse nominale e il tasso d’inflazione, anche se la formula corretta da applicare per trovare la misura precisa, e non approssimata, del valore è la seguente: rr + 1 = 1+i 1 + p∗ Dove rr è il tasso d’interesse reale, i è il tasso d’interesse sul debito e p∗ è il tasso d’inflazione. 44 3 Descrizione dei dati a disposizione Il tasso d’interesse è il prezzo pagato da chi riceve capitali e incassato da chi li offre. Tuttavia, per effetto dell’inflazione, diminuisce la quantità di beni acquistabili con la stessa quantità di denaro. Bisogna, quindi, tener conto del rendimento di un’attività finanziaria al netto della perdita di capacità d’acquisto causata dall’inflazione. Nel caso in cui il tasso d’inflazione sale e il tasso nominale d’interesse è basso è possibile che il tasso d’interesse reale sia negativo. Chi percepisce il tasso d’interesse rischia di credere di incassare un reddito positivo, che, in realtà, tenuto conto dell’inflazione, è negativo. 3.2.6 Tasso d’interesse sui depositi Il tasso d’interesse sui depositi (Indicator Code FR.INR.DPST ) è uno degli indici bancari più a stretto contatto con il cittadino. Esso è presente in conti correnti e conti deposito. Il primo (spesso abbreviato con la sigla C/C) è uno strumento tecnico che indica, generalmente, il deposito di denaro, da parte del titolare/possessore del conto, comunemente detto correntista, all’interno dell’istituto di credito, e che consente l’utilizzo di moneta bancaria, del cosiddetto denaro elettronico, ed altri strumenti finanziari da parte del titolare stesso. Il secondo è un contratto bancario, che si distingue dal conto corrente per essere solo un deposito di denaro remunerato. Con esso si possono, generalmente, effettuare solo operazioni di prelievo e versamento, ossia sono inibite operazioni tipiche bancarie quali bonifico verso conti non predefiniti, il pagamento di assegni, il prelievo con bancomat o carta di credito. Questo tipo di tasso è considerato interesse “attivo”, perchè la banca corrisponde al titolare del conto gli interessi bancari per aver ricevuto in deposito del capitale, che può essere, a sua volta, utilizzato per altre operazioni. 3.2.7 Tasso di interesse sui prestiti Il tasso d’interesse sui prestiti (Indicator Code FR.INR.LEND), considerato interesse “passivo”, viene espresso come una percentuale per un dato periodo di tempo; esso indica quanta parte della somma prestata debba essere corrisposta come interesse al termine del tempo considerato o, da un altro punto di vista, indica il costo del denaro. Il debitore, infatti, ricevendo una somma di denaro, si impegna a pagare una somma superiore a quella ricevuta. La differenza costituisce l’interesse, che viene solitamente calcolato in percentuale sulla somma prestata. Il tasso d’interesse è variabile anche in funzione della moneta di riferimento, del rischio connesso alla solvibilità del debitore e della lunghezza del periodo di riferimento. Oltre che dalla percentuale, i tassi d’interesse sono caratterizzati dal cosiddetto regime di capitalizzazione degli interessi, che può essere semplice o composto. Se la durata del prestito è superiore al periodo di tempo per cui l’interesse viene conteggiato, si parla di tasso di interesse composto, perché vengono conteggiati nel calcolo dell’interesse finale anche gli interessi parziali già maturati per ogni periodo. Qualsiasi sia l’operazione, l’erogazione di un mutuo ad una famiglia o un prestito ad una impresa, il debitore dovrà pagare una percentuale sul totale della somma erogata a prestito dai soggetti finanziatori. 3.3 Paesi di interesse 3.2.8 45 Differenziale del tasso di interesse Il differenziale (Spread) del tasso d’interesse (Indicator Code FR.INR.LNDP) è, semplicemente, definito come la differenza tra il tasso sui prestiti e il tasso sui depositi. In altri termini, consiste nella differenza tra il costo del denaro per finanziamenti, presenti in uno stato, e la remunerazione sui depositi che un risparmiatore ottiene depositando i suoi soldi in banca o presso altri intermediari finanziari. 3.2.9 Premio per il rischio sui prestiti Il premio per il rischio sui prestiti (Indicator Code FR.INR.RISK) è la differenza tra il tasso d’interesse sui prestiti e il tasso sui buoni del tesoro. Più nello specifico, esso indica la differenza tra il rendimento atteso dalla banca o dall’intermediario finanziario a seguito dell’erogazione del finanziamento, quindi un credito soggetto a rischi di solvenza e di riscossione (che può riguardare una qualsiasi attività finanziaria), e, appunto, il tasso d’interesse applicato nella collocazione sul mercato dei buoni del tesoro da parte dello stato, che rappresentano, generalmente, un finanziamento più sicuro da riscuotere da parte dell’operatore pubblico, e con un rischio di mercato quasi nullo. Viene chiamato premio, appunto perché, a fronte dell’attività più rischiosa riguardante qualsiasi tipo di finanziamento a prestito, la banca viene premiata con una remunerazione maggiore rispetto all’emissione dei buoni del tesoro, più sicuri ma meno remunerativi. 3.3 Paesi di interesse Nonostante, in linea di principio, i dati a disposizione riguardino tutte le nazioni del mondo, il nostro studio si è concentrato, principalmente, su alcune categorie di Paesi. Esiste una disciplina, la Geografia Economica, che analizza le connessioni economiche globali (Figura 3.6), occupandosi di fenomeni come la macroeconomia, la globalizzazione, o di entità sovranazionali, come l’ASEAN (Associazione delle Nazioni del Sud-est asiatico), il MERCOSUR (Mercato comune dell’America meridionale), l’Unione Europea, il NAFTA (Accordo nordamericano per il libero scambio), l’APEC (Cooperazione Economica Asiatico-Pacifica), l’ALCA (Zona di libero scambio delle Americhe), l’OPEC (Organizzazione dei Paesi esportatori di petrolio). Rispetto alla geografia classica, quella economica approfondisce questioni che dalla prima vengono soltanto sfiorate: l’economia, la geopolitica, le dinamiche socioeconomiche, l’andamento dei settori primario, secondario, terziario e quaternario, i flussi di persone, capitali, beni ed informazioni, la differenza tra Nord e Sud, e le più moderne tendenze in atto, vedendo le trasformazioni anche da un punto di vista storico. 46 3 Descrizione dei dati a disposizione Figura 3.6. Esempio di Mappa economica, relativa al Prodotto Interno Lordo. Il nostro studio, in linea con alcune analisi tipiche della Geografia Economica, si occupa di analisi di tipo descrittivo, predittivo e diagnostico su alcuni gruppi di Paesi; questi sono: • • • • • • • Europa Occidentale; Europa Orientale; America Latina; Asia; Africa; Stati Arabi; BRICS. Tale elenco, può essere al meglio esplicato con un’ulteriore suddivisione. Per quanto riguarda l’Europa Occidentale ci soffermeremo su Germania, Italia, Grecia, Spagna, Francia, Olanda; per l’Europa Orientale studieremo Polonia e Romania; per l’America Latina le nazioni di interesse sono Argentina e Venezuela; per l’Asia sono Giappone, Corea del Sud, Vietnam; per quanto riguarda l’Africa ci soffermiamo su Egitto, Libia, Marocco, Algeria, Tunisia, Burkina Faso, Etiopia, Kenya; per gli Stati Arabi analizzeremo Iran, Iraq, Kuwait, Qatar. Brasile, Russia, India, Cina, Sud Africa compongono, in economia internazionale, un’associazione delle maggiori economie emergenti. Il nome è l’acronimo delle iniziali dei cinque stati: BRICS. Solo pochi anni fa le economie di questi Paesi venivano considerate marginali; adesso sono caratterizzate da alti tassi di crescita del Prodotto Interno Lordo (PIL), da ampie quote del commercio internazionale, da risorse e disponibilità di fattori produttivi tali da poter influenzare, con il loro incremento, gli equilibri economici e di potere mondiali (Figura 3.7). Queste economie sono caratterizzate da una storia economica comune, da ricercare in una fase di specializzazione nella produzione dei beni primari (1870-1913), nella industrializzazione per sostituzione delle importazioni (1945-1980), nel processo di liberalizzazione (1991-1992) e nel ruolo predominante dello Stato come motore dello sviluppo. 3.3 Paesi di interesse 47 Figura 3.7. Principali punti comuni relativi allo sviluppo dei Paesi appartenenti al BRICS. Il BRICS non rappresenta un’organizzazione internazionale, ma è piuttosto, uno strumento di collaborazione tra le principali potenze che ne fanno parte. I Paesi appartenenti al BRICS si riuniscono annualmente in incontri in cui si discute su accordi di cooperazione multilaterale, di partenariato strategico, di utilizzo delle riserve valutarie e, nell’ultima conferenza a Durban in Sud Africa, della creazione di una Banca di sviluppo BRICS simile alla Banca Mondiale. 4 Attività di ETL Questo capitolo ha lo scopo di illustrare una delle operazioni preliminari fondamentali per la realizzazione di uno studio di Big Data Analysis, ovvero l’ETL. In particolare ci soffermeremo sulle attività di ETL svolte sul case study. 4.1 Nozioni di ETL Nella gestione dei database, Extract, Transform and Load (ETL) si riferisce a tre funzioni separate, combinate in un unico strumento di programmazione (Figura 4.1). Figura 4.1. Schema di un database oggetto di un lavoro di ETL. 50 4 Attività di ETL Innanzitutto, la funzione di estrazione consiste nel leggere i dati da una fonte specifica ed estrarne da essa il sottoinsieme desiderato. Successivamente, la funzione di trasformazione lavora con i dati acquisiti, utilizzando regole o tabelle di ricerca, oppure sfrutta la creazione di combinazioni con altri dati, per convertirli fino ad ottenere lo stato desiderato. Infine, la funzione di caricamento viene utilizzata per scrivere i dati risultanti (sia tutto il sottoinsieme o solo le modifiche) per un database di destinazione, che può o non può esistere in precedenza. Le operazioni di ETL possono essere in contrasto con quelle di ELT (Extract, Load, Transform), che si utilizzano per trasferire dati grezzi da una determinata sorgente di dati (Server) a un data Warehouse, sfruttando un server di destinazione, preparando, cosı̀, le informazioni per l’operazione finale di caricamento (Figura 4.2). Figura 4.2. Schema che evidenzia le differenza tra ETL e ELT. Nelle prossime sottosezioni illustreremo le operazioni più nello specifico. 4.1.1 Estrazione L’estrazione, ovvero la prima fase del processo, implica la predisposizione di routine in grado di leggere i record contenuti nel database sorgente e di predisporli per la successiva fase di trasformazione (Figura 4.3). Tre sono le alternative che è possibile seguire durante fase di estrazione dei dati: gli sviluppatori potranno scrivere programmi ad hoc, scegliere di affidarsi ai tool di ETL presenti sul mercato, o utilizzare entrambe le soluzioni. Gli strumenti software presenti sul mercato hanno l’indubbio vantaggio di non forzare gli utilizzatori a dover scrivere righe di codice di infrastruttura per far eseguire al sistema funzionalità quali l’apertura dei file o la lettura dei tracciati record, tutte attività svolte automaticamente dai tool ETL in commercio. La maggior parte di essi prevede routine di estrazione specifiche per i più noti sistemi ERP o i più diffusi applicativi; questo consente di ridurre al minimo il lavoro del personale incaricato della gestione dei dati. 4.1 Nozioni di ETL 51 Figura 4.3. Schema di esempio di un’operazione di estrazione di dati aziendali. 4.1.2 Trasformazione La seconda fase del processo (Figura 4.4) è l’insieme di due operazioni: • • Preparare e trasformare i dati. Dopo aver raccolto i dati, le routine di trasformazione provvedono a prepararli per la loro nuova collocazione. L’aggregazione è una delle tecniche principali che consente di rimpiazzare numerosi record dettagliati con pochi riassuntivi immagazzinati nelle soluzioni di Business Intelligence. I data mart e i data warehouse sono dei database di dimensioni diverse che consentono agli utenti di analizzare insiemi di dati preventivamente aggregati e riassunti sulla base di criteri definiti, presentandoli secondo modalità piuttosto intuitive, allo scopo di verificare trend, macro-tendenze e caratteri salienti di un determinato fenomeno. I data mart sono di dimensioni minori e possono includere non informazioni dettagliate, ma dati aggregati, in modo da poter essere utilizzati direttamente dal responsabile decisionale. Filtrare e pulire. Gli applicativi ETL aggregano i dati con pochi sforzi. L’utente può, infatti, impostare filtri che permettono di selezionare e riassumere con pochi click le informazioni salienti relative al fenomeno analizzato, senza dover scrivere alcuna riga di codice. La traduzione in valori espliciti dei codici è un’altra tecnica di trasformazione utilizzata di frequente. I database operativi, infatti, immagazzinano informazioni codificate, allo scopo di ridurre al minimo lo spazio occupato. Tuttavia, i data mart contengono informazioni riassunte e sono pensati per un facile utilizzo; quindi, i programmatori generalmente rimpiazzano i dati codificati con le descrizioni degli stessi. Un’altra opzione per la trasformazione dei dati è la derivazione delle informazioni dal campo. Questa tecnica permette di creare nuove informazioni direttamente utilizzabili dagli utenti finali. Se, ad esempio, un database contiene due campi distinti, uno relativo alle quantità di vendita e l’altro al prezzo unitario, sarà possibile creare un campo unitario (ad esempio “fatturato”) durante la fase di trasformazione dei dati, in modo da semplificare l’analisi del fenomeno vendite. Oltre a derivare campi in modo semplice, dall’unione di due o più campi precedenti, i software di ETL permettono, anche, di crearne di nuovi, attraverso l’impiego di funzioni matematiche o statistiche e analisi logiche. L’altra routine di trasformazione consiste nella “pulitura”, ovvero nell’utilizzo di algoritmi per eliminare dal sistema i dati non accurati o non consistenti rispetto al fenomeno da valutare. Le funzionalità di pulitura possono 52 4 Attività di ETL essere utilizzate anche per sostituire con un singolo valore i dati che figurano in molteplici modalità all’interno del database. Figura 4.4. Schema di esempio di un’operazione di estrazione e trasformazione di dati aziendali. 4.1.3 Caricamento L’ultima fase del processo di ETL è il caricamento delle informazioni nella base di dati di destinazione (Figura 4.5). Durante questa fase, il programmatore dovrà decidere come impostare il caricamento della base di dati, se in forma periodica o continuativa (in tempo reale). La maggior parte degli applicativi ETL supporta entrambe le opzioni, anche se la seconda (continuativa) richiede reti dedicate ad alta velocità, risultando piuttosto costosa. Per ovviare a questi limiti i tool oggi in commercio, tuttavia, supportano anche funzionalità avanzate che permettono di diffondere in rete solo le modifiche intervenute nei dati. Nella fase di caricamento, inoltre, all’utente si impone la scelta tra due modelli distinti di replicazione dei dati. Nella replicazione “push”, l’applicativo spinge i dati trasformati sul database di destinazione. Nella replicazione “pull”, al contrario, l’applicazione o il database di destinazione richiedono i dati, in conformità alle esigenze specifiche del momento. È, infine, anche possibile utilizzare una modalità mista. Qualunque sia la scelta effettuata, è importante selezionare una soluzione di estrazione, validazione, trasformazione e caricamento dei dati. I sistemi ETL rappresentano, infatti, l’infrastruttura chiave per il supporto decisionale dei sistemi di Business Intelligence. 4.2 Attività svolte Il dataset messo a disposizione dalla Banca Mondiale, nonostante contenga un’enorme quantità di informazioni, le rende disponibili all’utenza sotto forma di dati puliti. Ciò significa che essi sono stati già sottoposti a delle operazioni di ETL, con lo scopo di essere facilmente leggibili per tutti (o gran parte) gli utilizzatori. 4.2 Attività svolte 53 Figura 4.5. Schema di esempio di un’operazione di estrazione, trasformazione e caricamento di dati aziendali. Il download può essere eseguito sotto forma di file .xml, .csv, .xms, .txt; tutte queste sono estensioni riconosciute da software diffusi nella stragrande maggioranza dei Personal Computer, ad esempio Microsoft Excel; nel caso di metadati, è necessario un semplice lettore di appunti di testo. Nonostante ciò, per rendere il dataset facilmente utilizzabile nella piattaforma Tableau, sono state necessarie ulteriori operazioni; queste saranno illustrate in dettaglio nelle prossime sottosezioni. 4.2.1 Verifica dei dati La prima attività a cui è stato sottoposto il dataset consiste nella verifica dei dati. Questa è, fondamentalmente, una fase di controllo per verificare che tutte le voci delle tabelle abbiano una struttura formale corretta al fine di evitare che, nel successivo processo di analisi, si possano riscontrare errori. Tale procedimento è stato reso facile grazie al lavoro preliminare della Banca Mondiale; a noi è rimasto il compito di controllare che la formattazione delle tabelle (Figura 4.6) fosse comune a tutte, e, in caso contrario, di modificarla. 4.2.2 Rimozione dei campi non di interesse Per poter usufruire al meglio dei dati su Tableau, è necessario eliminare i dati di non interesse. Come si nota dalla Figura 4.6, i campi relativi a “Data Source”, “Last Updated Date”, “Country Code”, “Indicator Name”, “Indicator Code” contengono informazioni che non sono utili al fine dell’analisi; tali campi, pertanto, saranno rimossi. Oltretutto, è necessario eliminare eventuali righe o colonne completamente vuote, affinchè non compaiano voci “null” durante lo studio su Tableau. Di seguito, in Figura 4.7, si nota il risultato della tabella sottoposta a operazioni di rimozione. 4.2.3 Modifica dei dati Sporadicamente, all’interno di database, si possono trovare voci che, nonostante siano formalmente corrette, non sono utilizzabili in tutta completezza nei software adatti a svolgere le analisi. 54 4 Attività di ETL Figura 4.6. Tabella alla quale non è stata applicata alcuna attività di ETL. Figura 4.7. Tabella trattata con operazione di rimozione dei campi di non interesse. Nelle tabelle messe a disposizione dalla Banca Mondiale, notiamo alcune incompatibilità da correggere in maniera opportuna. Esse riguardano, principalmente,le voci relative alle date. In particolare, notiamo che la forma “1960”, “1961”, etc. (cioè “YYYY”), contenente solo l’anno, non è riconoscibile dal software Tableau come data, ma solo come sequenza di caratteri; perciò, è stato necessario modificare i campi con una sequenza “DD/MM/YYYY”. Tali sequenze saranno, quindi, immesse su Tableau e, dopo l’immissione e il successivo riconoscimento, si selezionerà solo il campo “YYYY”. Ulteriori controlli sono stati effettuati nella lista dei Paesi, verificando che tutti i campi siano correttamente visualizzabili su mappa come “Geographic Role”. In Figura 4.8 viene mostrata la tabella ottenuta a seguito dell’operazione di modifica. 4.2 Attività svolte 55 Figura 4.8. Tabella trasformata con delle operazioni di modifica di dati. 4.2.4 Trasformazione delle tabelle in tabelle pivot Una tabella pivot è uno strumento analitico e di reporting necessario alla creazione di tabelle riassuntive. Uno dei fini principali di queste tabelle è l’organizzazione di dati complessi tramite una scelta opportuna dei campi e degli elementi che devono comporla. Una tabella pivot può descrivere un numero anche molto elevato di variabili, dette caratteristiche o dimensioni di analisi; in parole più semplici, la tabella sorgente su cui viene calcolata la tabella pivot può avere un numero alto di righe e di colonne. Per poter generare una tabella pivot, la tabella sorgente deve essere formattata secondo alcune semplici regole: ogni cella della prima riga della tabella pivot deve contenere un nome testuale che rappresenta la colonna sottostante (detto “etichetta di colonna” o “intestazione di campo”), non devono esserci colonne prive di intestazione, non devono esserci righe o colonne con tutte le celle vuote (prive di valori), i valori presenti nelle celle di ciascuna colonna devono essere tra loro omogenei (stesso comune formato di cella, tipo numero, di data, valuta, testo) perché, poi, nel pivot sono oggetto di operazioni matematiche o raggruppamenti di valori che, chiaramente, non sono possibili fra celle di tipo diverso. La formattazione della tabella sorgente e la creazione/aggiornamento della tabella pivot, se è una attività svolta di frequente senza importanti variazioni, può essere resa veloce ed automatica registrando una macro. La trasformazione in tabella pivot è necessaria per visualizzare più dati riferiti ad uno stesso attributo temporale. In Figura 4.9 notiamo come vengono visualizzati, tramite grafico a barre, dei dati riferiti ad un classico tipo di tabella; essi sono divisi per anno, ma non sono raggruppati, nonostante si utilizzi l’operazione somma (SUM). In Figura 4.10, invece, notiamo come i dati si possono visualizzare, nello stesso scenario, più situazioni contemporaneamente. 56 4 Attività di ETL Figura 4.9. Esempio di tabella e di grafico corrispondente. Figura 4.10. Esempio di tabella trasformata in pivot e di grafico corrispondente. Per aiutarci nel compito di “pivottizzazione”, Tableau software ha messo a disposizione dell’utenza un’estensione compatibile con le più recenti versioni di Excel (Figura 4.11). Figura 4.11. Schermata di come si presenta su Excel il componente aggiuntivo che consente l’attivazione di Tableau. Tale componente aggiuntivo, tramite il comando “Reshape data”, selezionando le celle di interesse, permette di convertire la tabella in tabella pivot, eliminando oltrettutto i campi contenenti valori nulli, quindi semplificando ulteriormente il 4.2 Attività svolte 57 processo di ETL. Tramite il comando “Pivot to table” si ottiene il procedimento inverso, ovvero la conversione da tabella pivot in tabella classica. In Figura 4.12 vediamo una delle tabelle del nostro dataset prima e dopo l’operazione di pivot (Figura 4.13), con i campi opportunamente rinominati. Figura 4.12. Tabella pulita, ma non ancora pronta all’operazione di caricamento. Figura 4.13. Tabella pivot pronta ad essere utilizzata per il caricamento. 58 4.2.5 4 Attività di ETL Caricamento dei dati puliti L’ultima fase consiste nel caricamento dei dati che, tramite le operazioni viste precedentemente, sono stati ottimizzati “ad hoc” per il software di Data Analytics. Quest’ultima operazione si effettua, come mostrato in Figura 4.14, direttamente dall’applicativo. Figura 4.14. Schermata di caricamento dei dati su Tableau. A questo punto, il dataset è pronto per le analisi. Queste ultime verranno illustrate in dettaglio nei prossimi capitoli. 5 Analisi Descrittiva In questo capitolo verrà illustrata la prima fase di analisi, ovvero la Descriptive Analytics. In particolare, verranno visualizzate, analizzate e descritte le informazioni derivanti dal dataset oggetto del case study. 5.1 Premessa Come già illustrato nei capitoli precedenti, l’analisi descrittiva si occupa di illustrare ciò che accade e di presentare informazioni servendosi di strumenti di Business Intelligence e di visualizzazione. In particolare, essa si occupa di analizzare gli eventi passati per riassumere e chiarire le dinamiche e le performance delle metriche di interesse e per ricavarne indicazioni su come approcciarsi alle prossime attività. 5.2 Visualizzazione dei dati In questa fase iniziamo ad usare Tableau. Dopo il caricamento dei dati inizia l’operazione di analisi. Tramite il meccanismo di drag-and-drop creiamo i presupposti per la visualizzazione e, tramite il comando “Filtri”, vediamo divisi per Paese, nelle sottosezioni successive, i diversi scenari. 5.2.1 Inflazione Per quanto riguarda i Paesi dell’Europa Occidentale, al fine di garantire un’ottimale comprensione dei valori, la visualizzazione è divisa in due grafici (Figura 5.1). Il primo, riguardante Italia, Spagna e Francia, delinea un andamento comune per questi tre stati, compreso il picco inflattivo nella decade che va dal 1973 al 1983. Nel secondo grafico, riguardante Germania, Olanda e Grecia, notiamo un andamento comune solo per gli anni dal 1999 al 2015. 60 5 Analisi Descrittiva Figura 5.1. Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa Occidentale. Per quanto riguarda i Paesi dell’Europa Orientale, Polonia e Romania assumono un comportamento inflattivo molto diverso tra loro (Figura 5.2) fino agli anni 2000; successivamente si riportano a un valore costante fino ai giorni nostri. Figura 5.2. Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Europa Orientale. Per quanto riguarda i Paesi dell’America Latina, Argentina e Venezuela (Figura 5.3) necessitano di due grafici separati, a causa del diverso comportamento, in particolare a causa di valori elevati rispetto alla normalità, che non consentirebbero una comprensione corretta del grafico. 5.2 Visualizzazione dei dati 61 Figura 5.3. Grafico a linee relativo alla situazione inflattiva dei Paesi Sudamericani. Per quanto riguarda i Paesi dell’Asia, a illustrare la situazione inflattiva è la Figura 5.4. Tale grafico delinea un comportamento simile per Giappone e Korea, ma per il Vietnam, i cui dati sono presenti solo dal 1997, notiamo un andamento molto diverso in quanto i valori, anche solo nell’arco temporale di un quinquennio, presentano più picchi inflattivi. Figura 5.4. Grafico a linee relativo alla situazione inflattiva dei Paesi Asiatici. Per quanto riguarda i Paesi dell’Africa, a causa dell’elevato numero di Nazioni considerate, necessitiamo di tre differenti grafici (Figura 5.5). Il primo di essi, riguardante Algeria, Tunisia ed Egitto, evidenzia una situazione inflattiva turbolenta, con diversi valori di picco nel quinquennio che va dal 1992 al 1997. Il grafico relativo a Etiopia, Kenya e Marocco delinea un comportamento simile e molto discontinuo per i primi due Paesi; per il terzo l’andamento è più costante. Il grafico relativo a Burkina Faso e Libia, evidenzia un andamento complessivo affine. 62 5 Analisi Descrittiva Figura 5.5. Grafico a linee relativo alla situazione inflattiva dei Paesi dell’Africa. Per quanto riguarda i Paesi Arabi, notiamo, in Figura 5.6, una situazione inflattiva simile per Kuwait e Qatar, mentre per Iran e Iraq si nota un andamento discontinuo; in particolare, per quest’ultimo, vediamo un picco nel quinquennio che va dal 1990 al 1995. Figura 5.6. Grafico a linee relativo alla situazione inflattiva degli Stati Arabi. Per quanto riguarda i Paesi appartenenti al BRICS (Figura 5.7), il Brasile delinea un andamento, negli anni antecedenti al 1998, molto discontinuo con alcuni valori fuori dalla norma. La Russia, presenta nel primo triennio posteriore al 1993, dei valori elevati, che poi si andranno a normalizzare fino ai giorni nostri. India, Cina e Sud Africa, nonostante non presentino un comportamento comune (a causa di svariati valori di picco), mantengono l’indice inflattivo entro un range limitato di valori. 5.2 Visualizzazione dei dati 63 Figura 5.7. Grafico a linee relativo alla situazione inflattiva dei Paesi BRICS. 5.2.2 Crescita della moneta in senso ampio Per quanto riguarda la crescita della moneta in senso ampio, i dati graficati, relativi a Polonia e Romania (Figura 5.8) evidenziano un andamento non costante; in particolare, per la Polonia, si nota un picco fuori norma nel triennio che va dal 1987 al 1990. Figura 5.8. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi dell’Europa Orientale. Per quanto concerne ai Paesi Africani (Figura 5.9), notiamo che l’andamento complessivo è a “dente di sega”, ma, eccetto per alcuni valori di picco registrati dall’Algeria nel biennio 2000 - 2001, dal Kenya negli anni che vanno dal 1976 al 1978, dal Burkina Faso negli anni che vanno dal 2002 al 2004, si mantengono in un range di valori nella norma. 64 5 Analisi Descrittiva Figura 5.9. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi dell’Africa. I paesi del Sud America (Figura 5.10), invece, evidenziano un comportamento discorde tra loro. In particolare, l’Argentina presenta alcuni valori di picco negli anni antecedenti al 1990; proprio in quell’anno notiamo una crescita esponenziale della moneta in senso ampio, che supera la soglia del 2000%. Il Venezuela, invece, evidenzia un andamento instabile che, però, non raggiunge mai valori simili a quelli registrati del Brasile. Figura 5.10. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi Sudamericani. Per quanto riguarda i Paesi dell’Asia (Figura 5.11), si nota che fino al 1995 l’andamento complessivo è simile, compresi i valori di picco nel quinquennio che va dal 1967 al 1972; successivamente si nota un momento in cui i valori sono comple- 5.2 Visualizzazione dei dati 65 tamente opposti, con una crescita improvvisa per la Korea e una decrescita per il Giappone. Successivamente il valore ritorna nella norma. Figura 5.11. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi Asiatici. I Paesi Arabi (Figura 5.12) presentano un andamento analogo, ma che possiamo visualizzare in due sottogruppi; uno è formato da Iran e Iraq, l’altro è formato da Kuwait e Qatar. Figura 5.12. Grafico a linee relativo alla crescita della moneta in senso ampio degli Stati Arabi Il comportamento che riguarda i Paesi appartenenti al BRICS (Figura 5.13) può essere rappresentato separatamente per Brasile e Russia, che presentano andamenti diversi rispetto alla norma, il primo con valori di picco che superano l’ordine del 3000% nella decade che va dal 1985 al 1995; il secondo che mostra una tendenza decrescente, con un picco iniziale e poi un decremento fino a un valore quasi costante. Per Cina, India e Sud Africa, non sono presenti dati che spiccano rispetto agli altri. 66 5 Analisi Descrittiva Figura 5.13. Grafico a linee relativo alla crescita della moneta in senso ampio dei Paesi BRICS. 5.2.3 Crediti bancari deteriorati sul totale dei prestiti lordi Il dataset che riguarda tale indice è quello di installazione più recente, in quanto le informazioni fornite riguardano solo gli anni successivi al 1998. Per quanto riguarda l’Europa Occidentale (Figura 5.14) l’andamento è pressochè simile per Francia, Spagna, Olanda, Germania. Per l’Italia, e in misura maggiore per la Grecia, si nota un andamento crescente. Figura 5.14. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi dell’Europa Occidentale. In Europa Orientale (Figura 5.15) l’andamento mostrato è simile, cioè un valore iniziale crescente con una successiva stabilizzazione ad un valore costante che rispecchia gli standard. 5.2 Visualizzazione dei dati 67 Figura 5.15. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi dell’Europa Orientale. Per quanto riguarda l’Africa (Figura 5.16), le informazioni delineano un comportamento comune, di natura decrescente. Figura 5.16. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi dell’Africa. Anche Argentina e Venezuela (Figura 5.17) presentano valori simili che, negli ultimi anni, si mantengono costanti con percentuali tra lo 0% e il 5%. 68 5 Analisi Descrittiva Figura 5.17. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi Sudamericani. I dati dei Paesi Asiatici (Figura 5.18) sono pressochè analoghi, con percentuali che si mantengono sotto al 9%. Figura 5.18. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi Asiatici. Per quanto concerne gli Stati Arabi (Figura 5.19), il Qatar presenta dati solo dal 2008, con un andamento di natura costante; il Kuwait presenta due valori di picco nel 2000 e nel triennio tra il 2008 al 2011, ma che si mantengono entrambi sotto la soglia del 20%. 5.2 Visualizzazione dei dati 69 Figura 5.19. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti degli Stati Arabi I Paesi del BRICS (Figura 5.20) sono divisi in due sottografici solo per questioni di visualizzazione, ma presentano un comportamento comune, con valori iniziali elevati che, negli ultimi anni, vanno a stabilizzarsi con percentuali sotto al 10%. Figura 5.20. Grafico a linee relativo ai crediti bancari deteriorati sul totale dei prestiti dei Paesi BRICS. 5.2.4 Capitale bancario sul totale delle attività bancarie I grafici relativi al capitale bancario sul totale delle attività bancarie, per quanto concerne agli stati dell’Europa Occidentale (Figura 5.21), si presenta con un andamento comune, con valori compresi tra il 5% e il 10%. 70 5 Analisi Descrittiva Figura 5.21. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi dell’Europa Occidentale. Anche per Polonia e Romania (Figura 5.22) la tendenza è simile e, negli ultimi anni, si nota una leggera crescita. Figura 5.22. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi dell’Europa Orientale. Per quanto riguarda i Paesi Africani (Figura 5.23), notiamo per Algeria e Tunisia un comportamento, per gli ultimi anni, crescente; mentre per Egitto, Kenya e Marocco esso è costante, con valori massimi (Kenya) intorno al 15%. 5.2 Visualizzazione dei dati 71 Figura 5.23. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi dell’Africa. I dati riguardanti i Paesi Asiatici (Figura 5.24), nonostante evidenti mancanze nel quinquennio 2003-2008, mostrano un andamento costante, con valori che si mantengono sotto al 10%. Figura 5.24. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi Asiatici. L’unico Stato Arabo di cui disponiamo informazioni relative a tale parametro è il Kuwait (Figura 5.25), che presenta valori tra il 10% e il 13%. 72 5 Analisi Descrittiva Figura 5.25. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie degli Stati Arabi Argentina e Venezuela delineano due andamenti diversi (Figura 5.26); ovvero costante per il primo (con valori nell’intorno del 12%), inizialmente elevato per il secondo che tende ad un assestamento sotto l’11% negli ultimi anni. Figura 5.26. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi Sudamericani. I Paesi appartenenti al BRICS (Figura 5.27) hanno dei valori che vanno a stabilizzarsi tra l’8% e il 10%. Di questi, solo il Brasile ha uno “starting value” elevato rispetto alla norma che, successivamente, si riconduce a quello tipico degli altri Paesi. 5.2 Visualizzazione dei dati 73 Figura 5.27. Grafico a linee relativo al capitale bancario sul totale delle attività bancarie dei Paesi BRICS. 5.2.5 Tasso di interesse reale L’andamento grafico relativo al tasso di interesse reale dei Paesi Europei (Figura 5.28), fino all’anno 2000, è pressochè comune, con valori inferiori al 10% per Francia, Italia, Spagna, Olanda, Germania. Solo la Grecia si discosta dalla comunità con percentuali che arrivano al -10% (nel 1973) e sucessivamente, in maniera progressiva raggiunge un tasso fino al +15% (1994). Figura 5.28. Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Europa Occidentale. Per quanto riguarda l’Est Europa (Figura 5.29), Polonia e Romania presentano comportamenti diversi; in particolare, negli anni antecedenti al 1998, la Romania delinea valori impprovisamente bassi(fino al -25%), seguiti da un assestamento che, negli ultimi anni, si maniene nell’intorno del 5%. 74 5 Analisi Descrittiva Figura 5.29. Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Europa Orientale. Gli Stati Asiatici (Figura 5.30) evidenziano un comportamento discontinuo, ma che, negli ultimi anni, per Giappone e Repubblica Koreana è di natura decrescente; per il Vietnam è, invece, di natura crescente. Figura 5.30. Grafico a linee relativo al tasso di interesse reale dei Paesi Asiatici. Per quanto concerne i Paesi dell’Africa (Figura 5.31), gli andamenti sono piuttosto discostanti, con valori di picco per la Libia che raggiungono il 40%. 5.2 Visualizzazione dei dati 75 Figura 5.31. Grafico a linee relativo al tasso di interesse reale dei Paesi dell’Africa. I Paesi dell’America Latina (Figura 5.32) assumono comportamenti differenti: l’Argentina, dopo un picco, presenta un decremento e una successiva stabilizzazione fino ai giorni nostri. Il Venezuela presenta due percentuali inferiori alla norma (nel 1988 e nel 1996), che raggiungono il -35%. Nell’ultimo tratto si intuisce un leggero indice decrescente per il Venezuela e un lieve innalzamento per l’Argentina. Figura 5.32. Grafico a linee relativo al tasso di interesse reale dei Paesi Sudamericani. Gli Stati Arabi (Figura 5.33) sono divisi in due sottogruppi; il primo è formato da Iran e Iraq, con un complessivo andamento comune, eccetto un valore di picco nell’anno 2009 per l’Iraq; il secondo, composto da Kuwait e Qatar, presenta un andamento comune anche negli anni con improvvisi incrementi in percentuale (2009). 76 5 Analisi Descrittiva Figura 5.33. Grafico a linee relativo al tasso di interesse reale degli Stati Arabi Per quanto riguarda i Paesi appartenenti al BRICS (Figura 5.34), Russia e Brasile, dopo una fase iniziale di decremento, si stabilizzano nell’intorno del 30% per il Brasile, e nell’intorno dello 0% per la Russia. Cina, India e Sud Africa hanno comportamenti, invece, molto scostanti, che, però, si mantengono tra lo 0% e il 15% e nella fase finale delineano un leggero innalzamento di valore comune. Figura 5.34. Grafico a linee relativo al tasso di interesse reale dei Paesi BRICS. 5.2.6 Tasso di interesse sui depositi L’indice sul tasso d’interesse sui depositi delinea, per i Paesi Europei (Figura 5.35), un andamento comune di natura decrescente fino ai giorni nostri, che si mantiene tra lo 0% e il 5%. Solo il grafico relativo alla Grecia denota una crescita progressiva fino ad arrivare ad un valore di poco superiore al 20% (1991), con un successivo decremento che si riporta alla situazione comune. 5.2 Visualizzazione dei dati 77 Figura 5.35. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Europa Occidentale. Polonia e Romania delineano comportamenti di natura simile (Figura 5.36), decrescente, ma con valori iniziali ben differenti: il 57% per la Romania e ben il 240% per la Polonia. In seguito, fino ai giorni nostri, si mantengono tra lo 0% e il 5% Figura 5.36. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Europa Orientale. Per quanto riguarda Argentina e Venezuela (Figura 5.37), si evidenziano comportamenti scostanti; in particolare, si può osservare un picco del 18000% per l’Argentina (1989). 78 5 Analisi Descrittiva Figura 5.37. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi Sudamericani. Negli gli Stati Arabi (Figura 5.38), Kuwait e Qatar presentano un andamento simile, con una stabilizzazione nell’intorno del 2% fino ai giorni nostri; l’Iran, i cui dati sono presenti solo dal 2003, delinea, negli ultimi anni, una sostanziale crescita, fino al 17%. Figura 5.38. Grafico a linee relativo al tasso di interesse sui depositi degli Stati Arabi La situazione Africana (Figura 5.39) presenta più differenze: Algeria, Egitto, Etiopia e Kenya assumono un andamento costante, dopo un lieve picco di valore nel 1995 (Algeria) e 1998 (Kenya). Burkina Faso e Libia hanno un andamento lineare, con valori tra il 2% e il 6%. 5.2 Visualizzazione dei dati 79 Figura 5.39. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi dell’Africa. Per quanto riguarda l’Asia (Figura 5.40); Giappone, Korea e Vietnam hanno un comportamento finale comune, di natura decrescente, ma presentano, nei primi anni di presenza dei dati, differenze di valore, elevate per la Korea (23%), più nella norma per il Giappone (sotto il 5%). Figura 5.40. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi Asiatici. I Paesi appartenenti al BRICS (Figura 5.41) sono divisi in tre sottografici. Cina e Sud Africa presentano un comportamento lineare simile, al quale si riporta l’indice Russo dopo un valore iniziale elevato (101%); il Brasile, invece, presenta due picchi negli anni tra il 1988 e il 1995, con percentuali che sfiorano la soglia del 10000% e del 5000%. 80 5 Analisi Descrittiva Figura 5.41. Grafico a linee relativo al tasso di interesse sui depositi dei Paesi BRICS. 5.2.7 Tasso di interesse sui prestiti L’indice sul tasso d’interesse sui prestiti delinea, per i Paesi Europei (Figura 5.42), un andamento comune di natura decrescente fino ai giorni nostri. La Grecia si discosta inizialmente, con una crescita progressiva fino ad arrivare ad un valore di quasi 30% (1991), con un successivo decremento che si riporta alla situazione comune. Figura 5.42. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Europa Occidentale. Polonia e Romania (Figura 5.43) delineano comportamenti di natura simile, decrescente, ma con un picco di valore per il primo che supera i 600 punti (1990). 5.2 Visualizzazione dei dati 81 Figura 5.43. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Europa Orientale. Gli Stati Africani (Figura 5.44) presentano valori elevati nella decade 1989-1999 (35% in Kenya, 20% in Algeria e Egitto), seguiti da un decremento che li riporta a una situazione lineare fino ai giorni nostri. Figura 5.44. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi dell’Africa. I Paesi dell’America Latina (Figura 5.45) presentano un simile andamento discontinuo, con incrementi fino al 60% (1993) per il Venezuela e fino al 50% (2002) per l’Argentina. Si delinea una crescita di valore negli ultimi anni. 82 5 Analisi Descrittiva Figura 5.45. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi Sudamericani. Gli Stati Asiatici (Figura 5.46) assumono un comportamento decrescente, con alcuni innalzamenti di valori improvvisi nel 1998, per la Korea del Sud, e nel 2009 e nel 2012, per il Vietnam. Figura 5.46. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi Asiatici. Per quanto riguarda le Nazioni Arabe (Figura 5.47), Iran e Iraq assumono un andamento lineare con valori tra il 10% e il 20%; Kuwait e Qatar mostrano, invece, un andamento discontinuo ma comune, con un decremento negli ultimi anni. 5.2 Visualizzazione dei dati 83 Figura 5.47. Grafico a linee relativo al tasso di interesse sui prestiti degli Stati Arabi Per quanto riguarda i Paesi del BRICS (Figura 5.48); il Brasile presenta, dopo un progressivo abbassamento della percentuale, che lo porta da oltre l’80% fino al 30%, una lieve crescita negli ultimi due anni; la Russia ha un comportamento decrescente, con elevati valori iniziali (sopra i 300 punti); India, Cina e Sud Africa hanno un comportamento comune, con valori al di sotto del 20%. Figura 5.48. Grafico a linee relativo al tasso di interesse sui prestiti dei Paesi BRICS. 5.2.8 Differenziale del tasso di interesse Il valore differenziale del tasso di interesse per i Paesi Europei (Figura 5.49) presenta, per Francia, Spagna, Germania e Italia un andamento pressochè comune, con valori, nell’ultimo periodo temporale, costanti tra lo 0% e il 5%; la Grecia assume 84 5 Analisi Descrittiva inizialmente una crescita, fino ad arrivare a percentuali nell’intorno dell’8%, successivamente si ha un decremento fino ai giorni nostri; anche l’Olanda presenta un andamento in discesa, ma con un dato iniziale di circa il 10%. Figura 5.49. Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Europa Occidentale. Polonia e Romania (Figura 5.50) hanno un andamento inizialmente opposto, con valori che raggiungono un picco positivo nel 1990 per il primo (circa 550%), e una decrescita per il secondo; in un secondo momento i due andamenti diventano comuni diventando pressochè costanti in un intervallo tra lo 0% e il 10%. Figura 5.50. Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Europa Orientale. I Paesi Latino-Americani (Figura 5.51) si mantengono, con un andamento non 5.2 Visualizzazione dei dati 85 lineare, in un intervallo di valori tra il 2% e il 16% (si può osservare un valore di picco per il Venezuela nel 1995) Figura 5.51. Grafico a linee relativo allo spread del tasso di interesse dei Paesi Sudamericani. La situazione Africana (Figura 5.52) è illustrabile in due sottografici; il primo mostra il comportamento complessivamente comune di Algeria, Egitto e Tunisia, in un range di valori tra il 3% e l’8%; il secondo evidenzia, in modo particolare, l’andamento decrescente del Kenya. Figura 5.52. Grafico a linee relativo allo spread del tasso di interesse dei Paesi dell’Africa. Gli Stati Arabi (Figura 5.53) evidenziano l’andamento comune di Kuwait e Qatar, costante tra i 2 e i 4 punti percentuali; l’Iran, invece, mostra un andamento 86 5 Analisi Descrittiva decrescente, che raggiunge il valore di -4%. Figura 5.53. Grafico a linee relativo allo spread del tasso di interesse degli Stati Arabi Per quanto riguarda l’Asia (Figura 5.54), notiamo un andamento decrescente per il Giappone, mentre per Korea del Sud e Vietnam, dopo una crescita ripida, i valori si assestano entro percentuali comprese tra l’1% e il 3%. Figura 5.54. Grafico a linee relativo allo spread del tasso di interesse dei Paesi Asiatici. I Paesi del BRICS presentano tre grafici separati (Figura 5.55). Il Brasile assume un andamento che tende a decrescere leggermente nel tempo; la Russia assume il picco più alto nel 1995 e rapidamente decresce mantenendosi, poi, costante; Cina e Sud Africa assumono valori con percentuali inferiori al 5%, con un comportamento lineare. 5.2 Visualizzazione dei dati 87 Figura 5.55. Grafico a linee relativo allo spread del tasso di interesse dei Paesi BRICS. 5.2.9 Premio per il rischio sui prestiti Nell’illustrare i valori relativi al premio per il rischio sui prestiti, i Paesi Europei sono divisi in due grafici (Figura 5.56). Il primo illustra l’andamento comune di Italia e Spagna; nel secondo grafico vi sono Olanda, Francia e Germania; questi ultimi due presentano un comportamento complessivamente simile con natura, per gli ultimi anni, crescente. Figura 5.56. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi dell’Europa Occidentale. Romania e Polonia (Figura 5.57) assumono un andamento che va dallo 0% al 10%, eccetto per un valore di picco negativo registrato nel 1997 dalla Romania (-13%). 88 5 Analisi Descrittiva Figura 5.57. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi dell’Europa Orientale. Esaminando l’andamento dei Paesi Africani (Figura 5.58), notiamo che questo risulta essere costante negli anni per il Kenya, a eccezione del triennio che va dal 1992 al 1994, dove vi è la presenza di un picco negativo (-20%). L’andamento di Algeria ed Etiopia, dopo un’iniziale discesa, tende ad incrementarsi e a rendersi costante. L’Egitto presenta un comportamento decrescente e discostante. Figura 5.58. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi dell’Africa. I Paesi Arabi (Figura 5.59), Iraq e Kuwait, delineano due andamenti totalmente diversi. Mentre quello del Kuwait, dopo un decremento, si presenta complessivamente crescente, quello dell’Iraq, nello spazio di soli tre anni, denota ripidi innalzamenti e abbassamenti di percentuale. 5.2 Visualizzazione dei dati 89 Figura 5.59. Grafico a linee relativo al premio per il rischio sui prestiti degli Stati Arabi Per quanto riguarda i Paesi Asiatici (Figura 5.60), il Giappone ha un andamento che, nonostante sia frastagliato, si mantiene tra l’1% e il 3%; Il Vietnam ha un andamento discontinuo, con valori tra il 2% e il 7%. Figura 5.60. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi Asiatici. I tre Paesi del BRICS (Brasile, Russia e Sud Africa) presentano tre grafici separati (Figura 5.61). Il Brasile assume un andamento che tende a decrescere leggermente nel tempo; la Russia assume il picco più alto nel 1995 e rapidamente arriva a raggiungere quello più basso nel 1997, per poi diventare strettamente costante. Il Sud Africa, invece, ha un andamento discontinuo, ma che si mantiene su valori tra il 2% e il 6%. 90 5 Analisi Descrittiva Figura 5.61. Grafico a linee relativo al premio per il rischio sui prestiti dei Paesi BRICS. 5.3 Ricerca di outlier Outlier è un termine utilizzato in statistica per definire, in un insieme di osservazioni, un valore anomalo e aberrante; un valore quindi chiaramente distante dalle altre osservazioni disponibili. Gli outlier costituiscono un problema, perché tendono a distorcere i risultati delle analisi dei dati, in particolare le statistiche descrittive e le correlazioni. In linea di principio dovrebbero essere individuati nella fase di data cleaning (se derivano da errori di estrazione), ma possono essere trattati anche nella fase successiva di analisi dei dati. In realtà, negli ultimi anni, accanto ad un’accezione negativa associata al termine “outlier” si può osservare un’accezione positiva che vede negli outlier porzioni di informazione inaspettata che, se confermata essere veritiera, diventa estremamente preziosa. Nelle successive sottosezioni saranno illustrate le entità di questi dati che si discostano dalla norma. 5.3.1 Inflazione I grafici inflattivi denotano diversi punti che si discostano dalla normalità del Paese in questione. Per quanto riguarda l’Europa Occidentale, individuiamo per l’Italia degli outlier: nel 1974 (19,40%) e nel 1980 (21,27%); per la Grecia sempre nel 1974 (26,86%); per la Spagna nel 1977 (24,52%). In Europa Orientale, la Polonia presenta due valori inflattivi importanti: 103,55% nel 1982 e 555,38% nel 1990; la Romania presenta outlier nel 1993 (255,16%) e nel 1997 (154,76%). In America Latina si nota l’Argentina nel 1976 (443,96%) e nel biennio 1989-1990 (3079,81%; 2313,96%). 5.3 Ricerca di outlier 91 In Asia individuiamo outlier in Giappone nel 1974 (23,17%), in Korea del Sud nel 1980 (28,70%), in Vietnam nel 2008 (23,11%). Le Nazioni Africane mostrano i seguenti outlier sull’inflazione: Algeria nel 1992 (31,66%) e nel 1994 (29,04%); Libia nel 1978 (29,37%); Burkina Faso nel 1977 (29,98%) e nel 1994 (25,17%); Etiopia nel 1976 (28,53%), nel 1991 (35,72%), nel 2008 (44,39%), nel 2011 (33,22%); Kenya nel 1993 (45,97%). Per gli Stati arabi notiamo outlier in Iraq nel 1994 (448,5%) e in Iran nel 1995 (49,65%) e nel 2013 (39,26%) Nei Paesi del BRICS, il Brasile presenta nel quinquennio che va dal 1989 al 1994 diversi outlier, con valori che vanno dal 1430,72% al 2075,88%; la Russia mostra outlier nel 1993 (874,62%) e nel 1999 (85,74%); la Cina nel 1994 (24,23%); l’India nel 1974 (28,60%). 5.3.2 Crescita della moneta in senso ampio Per quanto riguarda l’Europa Orientale si registrano oulier in Polonia nel 1989 (509,48%) e in Romania nel 1993 (172,16%). In America Latina notiamo come la situazione Argentina sia molto turbolenta; qui abbiamo più outlier: nel 1972 (110%), 1976 (353,48%), 1977 (227,17%), 1983 (410,19%), 1984 (654,96%), 1985 (428,25%), 1989 (2235,18%), 1990 (1113,27%). In Venezuela possiamo evidenziare outlier nel 1975 (53,28%), nel 1990 (64,88 %) e nel 2003 (62,40%). La situazione asiatica delinea anche un outlier negativo (Giappone, 2001, 17,23%). Gli altri valori comprendono outlier per il Giappone nel 1962 (61,02%) e nel 1970 (67,39%); per la Korea del Sud nel 2001 (85,20%); per il Vietnam nel 1999 (66,45%) e nel 2007 (49,10%). In Africa i valori sono presenti in Egitto nel 1980 (51,41%); in Libia nel 1965 (50,94%), nel 1974 (56,45%), nel 2008 (49,19%); in Algeria nel 2001 (54,05%); in Burkina Faso nel 2003 (69,07%); in Kenya nel 1977 (48,89%). Negli Stati Arabi evidenziamo i valori di Qatar nel 1975 (66,74%), nel 1976 (54,67%) e Kuwait nel 1966 (41,36%) e nel 1981 (41,43%). Per i Paesi del BRICS notiamo numerosi punti fuori dalla norma, in particolare in Brasile nel 1988 (2732,95%), 1989 (1904,88%), 1992 (1749,38%), 1993 (3280,65%), 1994 (1102,38%); in Russia nel 1994 (216,54%), 1995 (112,57%); in Cina nel 1979 (49,24%), e nel 1993 (46,66%). 5.3.3 Crediti bancari deteriorati sul totale dei prestiti lordi In Europa Occidentale notiamo valori fuori dalla norma solo per la Grecia, in particolare nel 2012 (23,27%) e 2013 (31,89%). Per la situazione dell’Europa Orientale abbiamo outlier in Romania nel 1997 (65%) e nel 1998 (71,7%). Per l’Africa, abbiamo un outlier in Etiopia nel biennio 2002-2003 (43,8%; 40,5%) e in Kenya nel 2003 (34,9%). 5.3.4 Capitale bancario sul totale delle attività bancarie Per questo indice i valori si mantengono nella norma per tutti i Paesi in oggetto. 92 5.3.5 5 Analisi Descrittiva Tasso di interesse reale Riguardo il tasso di interesse reale, in Europa Occidentale solo la Grecia presenta un outlier negativo nel 1973 (-9,85%). In Europa Orientale vediamo outlier in Romania nel 1994 (-20,34%) e 1997 (-26,72%). Anche in America notiamo numerosi outlier: uno soltanto in Argentina, nel 2001 (29,12%); mentre in Venezuela abbiamo outlier nel 1987 (-18,61%), 1989 (-35,07%), 1993 (21,46%), 1996 (-35,31%), 1998 (23,09%), 2010 (-18,90%). In Asia sono presenti due dati di picco in negativo in Giappone nel 1970 (12,22%) e nel 1974 (-9,78%). Per quanto riguarda l’Africa, si registrano outlier: in Libia nel 2009 (41,92%); in Marocco nel 1980 (-19,56%); in Algeria nel 2009 (21,56%); in Etiopia nel 1985 (-17,67%), 2001 (17,63%), 2008 (-17,12%); in Kenya nel 1971 (20,06%) e 1998 (21,09%). Negli stati Arabi notiamo outlier in Qatar nel 2005 (-18,30%), 2009 (41,25%), 2015 (35,45%); in Iran nel 2013 (-17,37%); in Iraq nel 2005 (-14,1%) e 2009 (43,67%); in Kuwait nel 1979 (-24,50%), 1980 (25,08%), 1986 (46,20%), 1998 (31,47%), 2009 (28,23%), 2015 (43,24%). Per i Paesi appartenenti al BRICS notiamo variazioni di valore improvvise in Brasile nel 1998 (77,61%); in Russia nel 1995 (72,25%), 1996 (69,27%), 1999 (18,95%) e in Sud Africa nel 1980 (-12,34%). 5.3.6 Tasso d’interesse sui depositi Per quanto concerne l’indice relativo al tasso d’interesse sui depositi in Europa Orientale, notiamo un outlier in Polonia nel 1989 (246,87%). Nelle nazioni del Sud America, registramo in Argentina un valore incredibile (17235,81%) nel 1989, e un valore appena meno clamoroso (1517,87%) nel 1990; in Venezuela si riscontra un outlier nel 1993 (53,74%). Dei Paesi appartenenti al BRICS notiamo dati improvvisamente elevati in Brasile nel 1989 (5844,98%), 1990 (9394,29%), 1993 (3293,50%), 1994 (5175,24%) e in Russia nel 1995 (101,95%). 5.3.7 Tasso di interesse sui prestiti L’indice relativo al tasso di interesse sui prestiti registra forti squilibri per alcuni Paesi del Globo. In Europa Orientale vediamo tali outlier in Polonia nel 1990 (644,49%). In America Latina notiamo outlier per l’Argentina nel 2002 (51,67%); in Venezuela nel 1993 (59,90%), 1998 (46,36%) e 2002 (36,57%). In Asia si vede un picco in Vietnam nel 1993 (32,18%). Per quanto riguarda i Paesi Africani, vediamo due outlier in Kenya nel 1994 (36,24%) e 1996 (33,78%). Dei Paesi appartenenti al BRICS evidenziamo i valori della Russia nel 1995 (320,30%). 5.3 Ricerca di outlier 5.3.8 93 Differenziale del tasso di interesse I dati relativi allo Spread del tasso di interesse registrano squilibri per l’Europa Orientale in Polonia nel 1989 (-165,06%) e 1990 (541,63%) e in Romania nel 1994 (33,39%). In America Latina registriamo dati fuori dalla norma in Venezuela nel 1989 (-6,41%). In Asia solo il Vietnam presenta un outlier nell 1993 (10,14%). La situazione dei Paesi apparenenti al BRICS è pressochè costante, eccetto per la Russia nel 1995 (218,35%) e 1996 (91,75%). 5.3.9 Premio per il rischio sui prestiti Il premio per il rischio sui prestiti evidenzia andamenti discostanti dalla norma in diversi Paesi. In Europa Occidentale si nota nella Spagna un outlier nel 1983 (-4,79%). Per l’Europa Orientale vediamo outlier in Romania nel 1997 (-13.19%) e 2003 (10,36%). Dei Paesi africani registriamo il dato del Kenya che presenta un outlier nel 1993 (-25,71%). Per quanto riguarda i Paesi del BRICS, è la Russia che presenta outlier nel 1995 (152,26%) e nel 1996 (60,74%). 6 Analisi Diagnostica In questo capitolo verrà illustrata la seconda fase di Big Data Analytics, ovvero la Diagnostic Analytics. In particolare, verranno analizzate tutte le cause dalle quali derivano gli squilibri visti nell’analisi descrittiva. 6.1 Premessa Come già illustrato nei capitoli precedenti, l’analisi diagnostica si basa sulla ricerca delle cause che hanno portato alla situazione attuale. Conoscere lo stato attuale però non è sufficiente per comprendere la situazione corrente e adottare strategie mirate: analisi diagnostiche permettono di individuare i motivi di determinate tendenze o avvenimenti, per valorizzare e ripetere le azioni più efficaci e ottimizzare le attività che non hanno portato i risultati previsti. 6.2 Diagnostic Analytics In questa fase di analisi, illustriamo le cause e le problematiche che, come abbiamo visto con la Descriptive Analytics, hanno portato alla creazione di outlier. Inoltre vedremo i collegamenti tra i Paesi, sia appartenenti allo stesso gruppo che a gruppi differenti. 6.2.1 Europa Occidentale Gli outlier registrati in Europa Occidentale riguardano l’Italia, la Grecia e la Spagna. Italia, 1974, 1990 In Italia, il 1974 è passato alla storia come l’anno dell’inflazione galoppante; si tratta di un’inflazione distruttrice e sperequatrice. Le categorie più povere e più deboli ne soffrono di più di quelle ricche e più robuste. Le regioni meno sviluppate sono le più sacrificate rispetto a quelle più progredite. L’indice del costo della vita per il mese 96 6 Analisi Diagnostica di settembre 1974 segna un incremento del 24,6% rispetto allo stesso mese dell’anno precedente. Il potere d’acquisto della moneta, in termini di prezzi al minuto, ha, quindi, perso un quarto del suo valore. Un taglio gravissimo verificatosi nel giro di soli dodici mesi, più elevato di quello subito negli anni di guerra, un periodo di pace che, però, ha visto un periodo di guerra dei prezzi. La crisi petrolifera del periodo ’73-’76 sconvolge il quadro economico del Paese; la dipendenza della nostra economia dagli idrocarburi rivela tutto il suo costo e la sua pericolosità. Si tenta una programmazione industriale, ma alle chiacchiere non seguono i fatti, se non nel salvataggio di imprese e banche in crisi. Nella politica di salvataggio viene coinvolta principalmente la chimica di base (Montedison, Sir e Liquichimica finiscono all’Eni per strade diverse); l’Efim persegue autonome politiche espansive creando gravi squilibri economici e finanziari; i fondi di dotazione raggiungono, nel 1978, quasi il 25% dei trasferimenti complessivi alle imprese. L’intervento di sostegno alle imprese si caratterizza, quindi, per una forte componente “assistenziale” a società non più remunerative, in settori obsoleti. Le stime sui ritorni economici che sarebbero entrati nelle casse dello stato dalla nazionalizzazione del settore elettrico si rivelano utopistiche, anzi, anche l’Enel entra in una crisi finanziaria di tale gravità che impone, nel 1973, la costituzione di un fondo di dotazione. Il settore elettrico, in mano privata produceva “vergognosi” utili per gli azionisti, in mano pubblica produce “democratici” debiti a carico del Paese. Il 1980 è l’anno record per l’inflazione italiana dal 1960 ad oggi, un’inflazione che tocca 21.27 punti; si tratta un aggravarsi della malattia inflazionistica nata nel 1974. Pose rimedio al problema l’allora neo governatore della Banca d’Italia; infatti, Carlo Azeglio Ciampi sostenne che, per curare la malattia inflazionistica italiana, bisognava sostenere con maggiore determinazione l’applicazione di una politica monetaria restrittiva, funzionale agli accordi dello SME, cioè di un sistema di cambi semifissi con le altre valute europee che il nostro paese sottoscrisse nel 1979, al fine di ridurre il gap inflazionistico tra l’Italia e gli altri paesi europei. Col divorzio tra Tesoro e Banca d’Italia, sancito in maniera consensuale tra l’allora Ministro del Tesoro Beniamino Andreatta e Carlo Azeglio Ciampi, la nostra Banca Centrale non fu più costretta ad acquistare in asta primaria i titoli invenduti. Ciò fu applicato gradualmente ed ebbe un effetto benefico per il calo dell’inflazione italiana, unito, appunto, ad una più determinata politica monetaria restrittiva. Grecia, 1974, 2012 Il 1974 è un anno di svolta epocale per la Grecia; vi è la fine della dittatura dei colonnelli iniziata il 21 aprile 1967 e terminata il 24 luglio 1974. Si ritorna al voto e alla democrazia; questo è un anno di iperinflazione come, del resto, in altri paesi europei come, l’Italia. La causa dell’aumento dell’inflazione fu monetaria. Partı̀ tutto dagli anni ’60 quando la Federal Reserve aumentò la base monetaria ad un ritmo sostenuto per aiutare il Governo a finanziare sia la Guerra del Vietnam sia le nuove politiche di welfare proposte dal presidente Johnson. Questo contribuı̀ alla fine degli accordi di Bretton Woods nell’agosto del 1971, lasciando mano libera alla creazione di moneta ad un ritmo ancora maggiore. L’inevitabile conseguenza di tali azioni fu un maggiore tasso d’inflazione. Inoltre, per 6.2 Diagnostic Analytics 97 evitare che la propria valuta si apprezzasse troppo rispetto al dollaro americano, molti paesi adottarono una politica monetaria ugualmente espansiva, e perciò iperinflazionistica, ed è quello che fece anche la Grecia. L’aumento dell’inflazione degli anni ’70 fu dovuta, anche, alle crisi petrolifere di quel periodo dovute all’embargo delle esportazioni da parte dell’OPEC (ottobre 1973 - marzo 1974) ed al calo della produzione in seguito alla rivoluzione iraniana (1979 - 1983). In pratica, si sostiene che l’aumento del prezzo del petrolio abbia aumentato tutti gli altri prezzi; infatti è ragionevole sostenere che un calo della produzione petrolifera, e perciò energetica, portare alla diminuzione della la produzione di altri beni. Se tutti i beni diventano più scarsi, è lecito aspettarsi un aumento nel livello generale dei prezzi. Un’altra epoca finanziaria che ha sconvolto la Grecia è nel 2012. Ma per arrivare a quel punto bisogna procedere per gradi, illustrando la situazione politicoeconomica di pochi anni prima. Quando la crisi finanziaria ha colpito il mondo, la Grecia già era poco preparata. Il debito pubblico, dopo anni di spreco, dopo il colpo di grazia sui conti dato dalle costosissime Olimpiadi ospitate nel 2004, e dopo che il governo non era riuscito a colmare la voragine degli sperperi, era cresciuto enormemente nel 2009 fino ad inghiottire, prima il 120% del Prodotto Interno Lordo (PIL), e poi, negli anni successivi, fino al 160%. Fin dall’inizio della crisi economica il paese era già stato individuato come bersaglio dagli speculatori che hanno iniziato a scommettere su un suo crollo finanziario. Successimamente, la crisi greca, nel 2012, ha fatto lievitare il costo del denaro preso in prestito dagli altri stati in condizioni di bilancio simili a quelle greche, inclusa l’Italia. Questo significa, in sostanza, che gli stati devono pagare interessi più alti sui loro prestiti e, di conseguenza, sono costretti a inasprire le politiche, riducendo le spese e aumentando le tasse. Il caso greco è considerato, dall’Unione Europea, una questione molto importante vista la possibilità che tale situazione si ripercuota negli altri mercati della zona euro. Per tale motivo, al fine di scongiurare il default della stessa, l’UE, assieme al Fondo Monetario Internazionale, ha concesso alla Grecia un prestito per la somma di 45 miliardi di Euro. Tale prestito è stato concesso a seguito di un piano economico approvato dal governo ellenico, volto a ridurre il proprio debito pubblico attraverso tagli significativi della spesa. Parte dell’opinione pubblica è contraria a tale finanziaria e ciò ha portato a numerosi scontri ad Atene tra manifestanti e forze dell’ordine, in occasione della festività del primo maggio 2010. Quindi, senza mezzi termini, la troika di creditori (Fmi-Unione Europea-Bce), nel 2012, pose come condizione, per sbloccare il pacchetto di aiuti internazionali, l’attuazione, da parte del governo greco, di nuove misure strutturali e di austerità. Fra esse spiccava la proposta/pretesa di ridurre del 22 per cento i salari minimi, per dare uno slancio alla competitività dei prodotti greci. Per la Grecia, per la prima volta nell’Eurozona, si è concesso l’aiuto sotto forma di prestito europeo (in passato erano stati impiegati fondi Europei per aiutare l’Ungheria e la Lettonia). Sebbene, in termini di dimensioni sul mercato mondiale, il peso della Grecia appaia insignificante, la sua crisi ricorda agli investitori che i governi non possono fare affidamento su prestiti concessi a buon mercato e che una crisi in un solo paese UE rischia di destabilizzare l’euro e di generare un crollo monetario a livello internazionale. Anche gli altri Paesi dell’area Europea risentono di 98 6 Analisi Diagnostica ciò. Spagna, 1977 Per quanto riguarda la Spagna notiamo outlier nel 1977. Siamo nel periodo della transizione spagnola, quel periodo storico in cui la Spagna abbandonava il regime dittatoriale del generale Francisco Franco, passando ad una Costituzione che consacrava uno Stato sociale, democratico e di diritto. La maggior parte degli storici fissano la data della transizione al 20 novembre 1975, data della morte del dittatore Francisco Franco. Il cambiamento radicale avvenne il 15 giugno 1977, con le prime elezioni democratiche spagnole con la vittoria del partito UCD, L’Unione del Centro Democratico di Adolfo Suarez. La soluzione della crisi economica e la stesura di una nuova Costituzione sono i due grandi obbiettivi del nuovo Governo. Nel 1977 la situazione economica è esplosiva: in un paese in cui il 66% dell’energia è importata, la crisi petrolifera del 1973 è passata inavvertita. Gli ultimi Governi di Franco non hanno preso nessuna misura di fronte al barile di petrolio che passa, in dodici mesi, da 1,63 a 14 dollari. Le esportazioni coprono il 45% delle importazioni, il paese e carente di risorse per mantenere il suo interscambio con l’estero e perde 100 milioni di dollari al giorno di riserve esterne. Si accumulano, tra il 1973 e il 1977, 14000 milioni di dollari di debito estero, il che rappresenta un importo superiore al triplo delle riserve auree e di divisa del Banco di Spagna. L’inflazione è a livelli quasi sudamericani: dal 20% del 1976, si passa a mediamente al 44% del 1977. Le imprese hanno debiti per un centinaio di migliaia di milioni di pesetas; la disoccupazione raggiunge una larghissima crescita, toccando 2 milioni di disoccupati. Le forze politiche, di comune accordo, approvarono, il 27 ottobre del 1977, i patti di Moncloa (un accordo tra tutte le forze politiche parlamentari per combattere l’allarmante situazione economica), con il loro contenuto che si divide in misure urgenti contro l’inflazione e lo squilibrio esterno e riforme necessarie a medio termine per ripartire i costi della crisi. Gli effetti dei patti di Moncloa sono positivi in alcuni versi e meno in altri: l’inflazione crolla, nell’anno, al 26,4% contro le previsioni del 80% e chiuderà, nel 1978 al 16%; le riserve di divise duplicano; i conti delle imprese cominciano a migliorare e comincia il cammino verso un bilancio in attivo. 6.2.2 Europa Orientale Polonia e Romania subiscono diversi squilibri economici, come vedremo nelle prossime sottosezioni. Polonia, 1982, 1990 In Polonia si registrano due importanti outlier, nell’anno 1982 e nell’anno 1990. Questo è il periodo della legge marziale, un periodo di tempo che va dal 13 dicembre 1981 al 22 luglio 1983, quando il governo comunista della Repubblica Popolare polacca limitò drasticamente la vita quotidiana con l’introduzione della legge marziale, nel tentativo di schiacciare l’opposizione politica, guidata dal movimento Solidarnosc. 6.2 Diagnostic Analytics 99 Migliaia di attivisti dell’opposizione furono internati senza accuse formali, e fino a 100 persone vennero uccise. Anche se la legge marziale fu revocata nel 1983, molti dei prigionieri politici non vennero rilasciati fino all’amnistia generale del 1986. Anche dopo la revoca della legge marziale, rimase in vigore, per diversi anni, una serie di restrizioni che riducevano drasticamente le libertà civili delle persone che vivevano in Polonia. Questo portò a gravi conseguenze economiche. La giunta militare al potere introdusse forti rincari con le cosiddette “riforme economiche”, che provocarono una riduzione del reddito della popolazione in termini reali del 20% o più. La risultante crisi economica portò al razionamento della maggior parte dei prodotti e dei materiali, compresi gli alimenti di base. Tutto questo ebbe delle enormi ripercussioni sull’inflazione polacca facendo sı̀ che essa toccasse i 103,55 punti percentuali. Le difficoltà economiche provocarono un esodo di manodopera polacca; infatti, dal 1981 al 1986, circa 700.000 persone lasciarono il paese. Anche se la fornitura di beni alimentari migliorò leggermente negli anni ’80, la carenza divenne particolarmente grave. Il 1990 è l’anno in cui l’inflazione esplose; non vi è un avvenimento storico cruciale per sottolineare questo dato enorme del 555,38%; l’economia polacca funzionava male e il livello d’inflazione era incrementato negli anni; lo stato polacco era come un malato che non era stato curato: l’economia funzionava male e questo ha avuto ricadute sull’inflazione. L’inizio del cambio di marcia che avrebbe portato alla crescita dell’economia polacca avvenne già nel 1988 quando fu emanata la prima legge sulla libertà economica e, successivamente, nel 1989, con le prime libere elezioni dopo la seconda guerra mondiale. Nel 1990 vi è stato un processo di riforme radicali che avrebbe portato alla formazione di moderne strutture di economia di mercato. Grazie a queste trasformazioni, l’economia polacca ha iniziato a recuperare terreno rispetto ai paesi occidentali, almeno per quanto riguarda il reddito pro capite, ad un ritmo mai visto prima nella storia. All’inizio degli anni ’90 il reddito medio pro capite dei polacchi era circa un quarto di quello dei tedeschi: attualmente è la metà. Da allora il tasso medio di crescita economica del paese è stato di circa tre punti percentuali più alto rispetto alla Germania. Sono stati tre i fattori chiave che hanno permesso all’economia polacca di crescere velocemente. In primo luogo, negli anni novanta, la partecipazione statale all’economia è stata presto ridotta a favore del settore privato. Si è trattato del ricorso alle privatizzazioni, del rapido sviluppo dell’imprenditoria privata e dell’afflusso di investimenti esteri. La Polonia si è dotata di un buon quadro normativo per ampliare la sfera della proprietà privata, grazie, soprattutto, alla tripartizione democratica dei poteri e alla presenza di mass media indipendenti, nonché di regolamenti tutto sommato affidabili. Una politica macroeconomica stabile, basata sulla graduale riduzione dell’inflazione e sull’adozione di un tasso di cambio flessibile, ha giocato un ruolo fondamentale per consentire alla Polonia di attrarre capitali stranieri. Il terzo fattore chiave per lo sviluppo del paese è stata l’apertura al mondo esterno attraverso l’eliminazione graduale delle barriere che ostacolavano il flusso di merci e servizi. Il governo polacco ha abolito progressivamente dazi e altre limitazioni che pesavano sugli scambi commerciali, aprendo il paese alla concorrenza mondiale e assicurando un rapido aumento dell’efficienza. 100 6 Analisi Diagnostica Romania, 1993 In Romania lo squilibrio avviene nel 1993. In quell’anno, il livello delle esportazioni rumene era la metà di quello del 1989; nello stesso periodo anche il PIL calava del 25%, soprattutto per il crollo della produzione industriale, mentre l’inflazione si manteneva su livelli altissimi, vicini al 200% annuo. Il primo programma di privatizzazione avviato dal governo, e basato su un sistema misto (le 6000 maggiori aziende statali dovevano essere vendute per un terzo a un azionariato popolare e per i restanti due terzi a società private) non portava miglioramenti immediati, e il grosso delle aziende continuava a vivere soprattutto di sussidi statali. Anche la riforma agraria, che nel Novanta aveva restituito ai proprietari d’un tempo o ai loro eredi le terre espropriate all’inizio del regime comunista, provocava inizialmente un calo della produzione agricola, dato che moltissimi dei “nuovi” titolari non erano in grado di occuparsi delle terre ricevute. Fra il 1993 e il 1994, tuttavia, emergevano alcuni segnali positivi che indicavano un significativo mutamento nel quadro generale dell’economia: per la prima volta, dal 1988, si registrava un incremento, seppur minimo, del PIL. Alla fine del 1994 la pressione dell’inflazione si riduceva notevolmente (62%) e le esportazioni riprendevano ad aumentare. In virtù di questi risultati, che già si erano delineati nella prima metà dell’anno, il Fondo Monetario Internazionale accordava alla Romania un prestito di 720 milioni di dollari (maggio 1994), nell’ambito di un accordo di più ampio respiro, i cui elementi di maggior rilievo si identificavano nell’imposizione di una politica monetaria restrittiva, di una prudente politica fiscale e di un’accelerazione delle riforme strutturali, incluse le privatizzazioni. Nel 1995, tuttavia, solo l’8% del capitale delle 6000 imprese per le quali era prevista la privatizzazione era effettivamente posseduto da privati e, nel complesso, il settore privato incideva sulla produzione industriale soltanto nella misura del 14%. Maggiore era la sua influenza nel terziario (44%) e ancor di più nell’agricoltura (80%); tuttavia, le difficoltà di accesso al credito, la scarsa meccanizzazione e, soprattutto, la perdurante incertezza sui titoli formali di proprietà della terra rendevano ancora molto lento lo sviluppo di questo settore, nonostante alcune buone annate metereologiche. Nel complesso, il PIL del 1995 registrava un incremento del 6,9%, uno dei più rilevanti a livello europeo, con un forte apprezzamento della moneta nazionale e una parallela crescita delle importazioni; su questa base il governo avviava un nuovo programma di riforme liberalizzatrici che avevano, tuttavia, un risultato negativo: il PIL nel 1996 registrava una crescita del 4%, che l’anno successivo diventava una perdita del 6,6%, nel 1998 del 7,3% e nel 1999 del 4,5%; la completa liberalizzazione dei prezzi portava, anche, a una risalita dell’inflazione, fino al 50% annuo del 1999. 6.2.3 Africa L’Africa, vittima ricorrente delle colonizzazioni straniere, ha registrato, nel settore finanziario, numerosi valori fuori dalla norma. I Paesi da noi esaminati sono stati Algeria, Kenya e Libia. Eccetto per Algeria e Libia, è stato il petrolio la causa comune dello sconvolgimento economico. Si era pensato che lo scarso coinvolgimento internazionale dell’economia Africana nel suo complesso l’avrebbe in qualche modo 6.2 Diagnostic Analytics 101 protetta dagli effetti della crisi. Si pensava che la diminuzione dei flussi finanziari privati avrebbe poco influito sulla salute delle banche africane, prevalentemente finanziate da fonti locali (nazionali o regionali). La realtà è ben diversa, perchè, se è vero che l’economia africana è lontana dalle cause che hanno direttamente provocato la crisi finanziaria mondiale, è altrettanto vero che essa è estremamente vulnerabile agli effetti di tale crisi. La diminuzione dei consumi nei paesi ricchi deprime l’economia dei paesi africani, esportatori di materie prime, sia agricole che minerarie. La diminuita domanda porta ad una diminuita esportazione, con inevitabile depressione dell’economia nel suo complesso. Algeria, 1992-1994 L’Algeria ha un picco critico nel triennio che va dal 1992 al 1994. Il Paese è notoriamente afflitto da uno dei più alti livelli di corruzione al mondo, da nepotismo, crisi economica, paralisi sociale, stallo legislativo. Se questo è il quadro viene da chiedersi perché l’Algeria finora non è esplosa. Due i fattori che hanno arginato il contagio dei Paesi vicini: le risorse energetiche e il trauma del “Decennio nero”. Le prime, di cui il Paese è riccamente dotato (gas e petrolio rappresentano il 95% dell’export), hanno sussidiato la vita degli algerini e comprato la pace sociale, reso sconveniente il dissenso, comprato i nemici e accontentato gli amici. Paradossalmente, il problema dell’Algeria è proprio, il petrolio, con le sue quotazioni in caduta libera che hanno ridotto di circa il 50% i proventi della vendita di idrocarburi. Nel 1991 il Fronte Islamico di Salvezza vinse le prime elezioni libere del Paese dopo l’indipendenza. Il colpo di Stato militare che ne è seguito (definito dall’allora capo dello stato come “necessario per evitare la deriva islamica del Paese”) ha causato oltre 200 mila morti e la decretazione dello Stato d’emergenza rimosso solo nel 2011. In nome del pericolo jihadista l’Algeria si è trasformata in una democrazia autoritaria nelle mani del pouvoir. Un vero e proprio Stato nello Stato, il pouvoir è una rete oscura e impenetrabile di connivenze, connessioni, fedeltà claniche fra mondo militare e mondo politico, monopolizzata dal Fronte di Liberazione Nazionale (FLN) che, in nome della continuità storica e della narrazione pubblica ufficiale, ha conservato invariato il suo nome dai tempi della guerra di indipendenza. Il regime totalitario, il terrorismo, la crisi petrolifera sono state le cause degli squilibri economici, che ancora oggi si ripercuotono sullo Stato. L’Algeria, infatti, ha uno dei sistemi economici più dinamici (benché poco diversificato) del continente africano; tuttavia, il tasso di inflazione, fino al 2011 al 4%, è schizzato al 9% nel 2012, per poi ristabilizzarsi intorno al 4%. Libia, 2008, 2011 In Libia i principali oulier sono presenti nel periodo di storia recente. In questo Paese, il petrolio rappresenta la principale fonte di ricchezza. La Libia oggi oggi vanta un elevato reddito, ma, sino alla metà degli anni Cinquanta, era uno dei Paesi più poveri del mondo. La Libia aveva allora un’economia tradizionalmente fondata su un’agricoltura e un allevamento molto modesti; in pratica dipendeva dagli aiuti esteri e dalle entrate valutarie connesse alla presenza delle basi militari britanniche e statunitensi. L’era 102 6 Analisi Diagnostica del petrolio inizia nel 1955 con le prime prospezioni da parte delle grandi compagnie americane; nel 1959 fu scoperto il colossale giacimento di Zelten, in Tripolitania, cui fecero seguito numerosi altri rilevamenti. Vasti territori libici furono subito dati in concessione alle multinazionali petrolifere, mentre le scoperte si susseguivano a catena a opera dei tecnici della Esso, della Gulf, della Shell. La vita economica del Paese cominciò a subire profonde trasformazioni, che inevitabilmente ebbero riflessi di natura anche politica, determinando, nel 1969, la caduta della monarchia. L’avvento della Repubblica assunse, infatti, ben presto il significato, per la Libia, di una riappropriazione delle risorse nazionali. Nel 1970 venne fondata la NOC (National Oil Corporation) e, man mano, furono rivisti i rapporti con le società petrolifere operanti nel Paese, di cui talune vennero interamente nazionalizzate, altre associate sulla base di joint ventures, sempre però a prevalente capitale libico. L’enorme afflusso valutario derivante dalla vendita del petrolio fu ampiamente destinato al miglioramento delle condizioni di vita del Paese; non si volle, però, unicamente operare nell’ambito di realizzazioni strettamente vincolate a ideologie e a modelli occidentali, ma furono prescelte linee d’azione volte a valorizzare, attraverso una via nazionale dell’economia, l’intero contesto panarabo. In effetti, dietro alla ricerca di una “via” socialista islamica, intermedia fra capitalismo e comunismo, vi è anche la presa di coscienza della Libia di essere un Paese ricchissimo di risorse naturali, ma troppo poco popolato per poter utilizzare adeguatamente le proprie risorse. Nel 2008 gli squilibri sono dovuti alla crisi del petrolio. Il prezzo del petrolio, nel luglio 2008, ha raggiunto il valore di 147 dollari per barile, superando il picco raggiunto nell’aprile 1980 (pari a circa 102 dollari per barile in valuta attuale). Il prezzo è, successivamente, calato sotto i 40 dollari al barile nel dicembre 2008, con l’acuirsi della crisi finanziaria, per poi attestarsi su livelli compresi tra 60 e 70 dollari al barile nei mesi di maggio e giugno 2009. Le cause principali del rialzo dei prezzi petroliferi sono identificate nei seguenti fattori: forte crescita della domanda (e aspettative di ulteriore crescita) di beni di consumo, quali automobili, mezzi di trasporto privati, elettrodomestici, e di servizi energetici, quali trasporto, turismo, riscaldamento, effetti speculativi dovuti alla progressiva finanziarizzazione dei mercati energetici, etc. I prezzi delle altre fonti fossili sono cresciuti in maniera continua dal 2002 facendo registrare un picco di crescita nella prima metà del 2008, seguito da una rapida caduta con l’avvento della crisi e da una risalita nei mesi recenti sui livelli pur elevati del 2006. Nonostante il prezzo del gas naturale sia indicizzato a quello del petrolio in molti contratti, le forniture di lungo periodo via gasdotto hanno risentito in misura più contenuta dei rialzi rispetto ai prezzi spot del mercato del Gas Naturale Liquefatto (GNL), il cui prezzo resta mediamente superiore a quello del gas consegnato via gasdotto. Anche il prezzo del carbone ha seguito, in generale, quello del petrolio, con rialzi in termini relativi anche più pronunciati, pur partendo da valori assoluti inferiori, e con un certo ritardo nella fase di discesa. Nel 2011 gli squilibri sono dettati dal cambio di governo; infatti, in quell’anno, si è aperto un conflitto tra le forze di Muammar Gheddafi (Dittatore, a capo del governo libico dal 1969), e le forze ribelli che puntano alla caduta del regime in favore di una repubblica democratica. La ribellione, capeggiata da un governo ad interim di unità nazionale, è stata 6.2 Diagnostic Analytics 103 appoggiata da un intervento militare internazionale sotto l’egida dell’ONU, volto a porre freno all’uccisione di civili da parte dell’esercito libico. Muammar Gheddafi, dittatore della Libia per 42 anni, è stato ucciso la mattina del 20 ottobre 2011 nei dintorni di Sirte dai guerriglieri della rivoluzione. Questo forte cambiamento ha provocato ripercussioni anche in campo economico, vedendo, però, anche una crescita, in quell’anno, dell’indice relativo alla moneta in senso ampio. 6.2.4 Asia Giappone, 1974 Il Giappone registra dati fuori dalla norma nel 1974. Se, fino ad allora, la storia del Giappone lo aveva definito come “miracolo economico”, perchè il Paese asiatico seppe risollevarsi al meglio dalla situazione disastrosa del secondo dopoguerra, fino a raggiungere alti picchi di crescita economica durante gli anni cinquanta e sessanta, nel 1974 la storia cambiò. La storia dello sviluppo economico giapponese nel dopoguerra può essere suddivisa in due fasi: dal 1950 al 1973 la crescita del Giappone fu impetuosa e disordinata fino a quando la crisi energetica del 1973 causò un improvviso rialzo dei prezzi del petrolio, provocando una riduzione del tasso di sviluppo, ma anche una razionalizzazione dell’intero sistema produttivo giapponese. I primi anni settanta, comunque, videro il Giappone affermarsi come superpotenza mondiale, risultato raggiunto grazie alla determinazione del popolo giapponese, il quale, oltre a voler uscire il prima possibile dal periodo post-bellico, voleva dimostrare al mondo intero le proprie potenzialità. Tutto ciò, unito a un governo stabile e ad un’ottima organizzazione dell’industria, fece diventare il Paese asiatico un esempio da seguire e un modello economico per tutte le economie mondiali. Questo decennio, inoltre, vide il consolidarsi della posizione predominante delle aziende giapponesi nel settore elettronico, dopo il primo exploit degli anni sessanta. Difatti, a livello mondiale, tra le prime nove imprese sette erano giapponesi; tra queste le principali erano la Hitachi e la Toshiba, che producevano attrezzature elettroniche di vario genere. In questi anni tali prodotti invasero anche il mercato internazionale, e il “made in Japan” divenne sinonimo di qualità. Tale vertiginosa crescita economica, comunque, finı̀ per causare non pochi problemi a livello socio-demografico. Infatti, le città, una su tutte Tokyo, iniziarono a crescere a livelli incessanti (la capitale raggiunse gli 8 milioni di abitanti) costringendo il governo a fare ricorso alla costruzione di grattacieli; nel frattempo gli appartamenti divennero sempre più piccoli, compromesso utilizzato per poter guadagnare più spazio possibile e abbattere i costi delle abitazioni. Di conseguenza, il livello di inquinamento acustico e atmosferico crebbe a dismisura, permettendo la diffusione di disturbi respiratori, soprattutto nella zona di Tokyo-Yokohama, Nagoya e Osaka-Kobe, oltre all’emergere di altre malattie connesse all’inquinamento, quale la malattia di Minamata. Come contromisura a tale fenomeno, il governo del Giappone emanò una serie di leggi sul controllo dell’inquinamento, divenendo l’unica nazione ad utilizzare tale sistema, il quale prevedeva sanzioni sia alle fabbriche sia ai privati in possesso di mezzi inquinanti che avevano causato danni all’ambiente o alle persone. 104 6 Analisi Diagnostica A causa delle limitate risorse energetiche disponibili all’interno del territorio giapponese, la prima crisi energetica degli anni settanta colpı̀ in modo importante il Paese nipponico, che dipendeva dalle importazioni di petrolio per il suo sostentamento energetico. I Paesi arabi e i loro alleati, nell’ottobre 1973, bloccarono le esportazioni di petrolio fino a quando l’OPEC (Organizzazione dei Paesi Esportatori di Petrolio) intervenne per sbloccare la situazione, decidendo, in pochi mesi, di quadruplicare i prezzi di mercato (da 3 a 12 dollari al barile) e di ridurre l’offerta sui mercati internazionali. A differenza di altri Paesi, che potevano contare su una autosufficienza energetica, come, ad esempio, gli Stati Uniti, il Giappone si trovò in grossa difficoltà, vedendo rallentare notevolmente il proprio prodotto nazionale lordo per la prima volta dall’inizio della ripresa del dopoguerra. Un’altra conseguenza fu l’aumento dell’inflazione, che superò in questo periodo il 20%, causando un’insufficienza di beni di consumo. Tuttavia, i giapponesi furono capaci di riottenere il controllo della situazione molto più velocemente degli altri Paesi industrializzati colpiti dalla crisi; il tasso di crescita raggiunse nuovamente il 5-6% e, nonostante una nuova crisi petrolifera nel 1979 fece di nuovo aumentare i prezzi del petrolio, il tasso di crescita si stabilizzò sul 3-4%. Il livello di crescita non era paragonabile a quello degli anni cinquanta e sessanta, ma rimaneva, comunque, più alto di qualsiasi altro Paese industrializzato. Vietnam, 2007-2008 Il Vietnam vede outlier nel biennio 2007-2008. Uno dei principali fattori che vanno tenuti in considerazione nell’analisi dell’economia vietnamita riguarda lo scarso livello di sviluppo e il ritardo con cui il paese ha iniziato il processo di trasformazione dalla pianificazione centrale verso il sistema a economia di mercato. Il Vietnam, come lo conosciamo oggi, è emerso agli occhi dell’Occidente dopo il periodo 1989-91. Come già si è compreso, esso è generalmente riconosciuto come un esempio di successo. Durante gli anni ’90, l’economia ha mostrato una rapida crescita, e questo andamento è proseguito, pur a tassi leggermente più lenti, anche dopo la crisi finanziaria che ha colpito l’Asia, fino agli anni 2000. In questo periodo il Vietnam si distingue da molti altri Paesi della stessa area geografica. A seguito della partenza del processo di riforme economiche, le esportazioni di prodotti agricoli (in particolare riso e caffè) decollarono, dal momento che i contadini reagirono positivamente alle nuove opportunità. Negli anni il Vietnam è diventato il terzo più grande esportatore di riso al mondo, e il secondo per produzione di caffè. La produzione di riso ha contribuito in maniera significativa alla rapida ascesa delle esportazioni. In seguito la composizione del prodotto dell’export si è spostata da una prevalenza di prodotti agricoli (il cui livello di esportazioni è ancora in crescita) a una maggiore incidenza di beni industriali e artigianali. Questo avanzamento nell’economia è proseguito, nonostante il biennio 2007-2008 abbia visto il ritorno di un’impennata dell’inflazione, che aveva già colpito lo stato nei tardi anni 80. Nonostante questo, i prezzi e altri indicatori hanno mostrato una stabilità macroeconomica nel paese, sin dalla riunificazione. Gli sviluppi economici degli ultimi anni hanno rivelato alcune debolezze strutturali profondamente radicate nel sistema economico. Queste sono, innanzitutto, legate a una contraddizione tra la bassa competitività del settore delle imprese statali “import-substituting” e le nuove sfide poste dalla competizione internazionale sempre più dura. 6.2 Diagnostic Analytics 105 Infine, si può vedere come, sul piano inflattivo, date le sue consistenti fluttuazioni del tasso nel tempo, sembrerebbe che il Vietnam non disponga di un meccanismo efficace per controllare l’inflazione, e questo ha avuto ripercussioni anche sul valore della moneta. A causa del deterioramento delle condizioni macroeconomiche in Vietnam, le agenzie di credit rating internazionali hanno declassato la valutazione del credito sovrano vietnamita. Korea del Sud, 1997-1998 La Korea del Sud vede squilibri economici nel biennio 1997-1998. La crisi finanziaria asiatica fu una crisi finanziaria che interessò alcuni paesi del Sud-Est asiatico alla fine del XX secolo. Causata da una serie di speculazioni finanziarie, che provocarono una forte svalutazione della moneta e lo sganciamento delle divise interessate dal valore del dollaro, la crisi fu causata dal pesante indebitamento del settore privato (banche e imprese), che provocò il ritiro improvviso dei capitali (tecnicamente un deflusso) da parte degli investitori stranieri e degli istituti di credito. Il fattore scatenante risultò essere l’ancoraggio delle divise nazionali al dollaro (dollarizzazione), che, dal 1995, andò incontro a una rivalutazione del cambio. La relativa debolezza del dollaro aveva garantito la competitività delle merci di Indonesia, Malesia e Thailandia, fino a che queste non hanno visto erodere il proprio export dall’alto livello dei prezzi determinato da un cambio eccessivamente rivalutato (rispetto allo yen giapponese, apprezzamento aggravato dalla svalutazione dello yuan cinese). La crisi valutaria fu determinata, oltreché dalla natura degli investimenti esteri a breve termine (prontamente ritirati dagli investitori stranieri), dalla conversione delle attività nazionali e dei portafogli delle imprese in valuta estera, fattore che aggravò la crisi di liquidità dei governi. La Korea del Sud era riuscita, dopo la guerra, a formulare una strategia di crescita economica che le aveva permesso di incrementare di otto volte il reddito pro capite in tre decenni. La riduzione dell’analfabetismo e i forti investimenti per colmare il gap tecnologico con le principali economie mondiali le avevano permesso, all’inizio degli anni novanta, di diventare membro stabile dell’OCSE e di divenire una delle principali produttrici di microchip. La crisi in questo paese fu innescata da problemi strutturali legati al forte indebitamento delle proprie grandi imprese con creditori esteri. Il livello di scambio dei flussi di capitale raggiunse il 9 % del PIL. All’inizio del 1997, si ebbero i fallimenti della Hanbo Steel e della Sammi Steel, due delle maggiori conglomerate del paese. Nello stesso anno, mentre la Thailandia veniva risucchiata nel baratro della recessione, l’istituto di rating finanziario Moody’s decise di declassare la Korea dal livello A1 al livello A3 e, successivamente, al livello B2. Alla base della decisione sembrava esserci, oltre al trend negativo in cui i mercati asiatici si stavano incanalando, la richiesta, da parte del colosso coreano Kia Motors, di un prestito di emergenza. Le banche occidentali decisero quindi di non rinnovare i propri prestiti alle imprese coreane, limitando fortemente l’afflusso vitale di capitali e paralizzando l’economia. La borsa Koreana perse il 4% del proprio valore nella sola giornata del 7 novembre 1997, e il 7% il giorno successivo. Il 24 novembre le richieste di pesanti “riforme strutturali”, formulate dal FMI a fronte di un prestito, fecero crollare i titoli Koreani del 7,2%. Samsung perse oltre 5 miliardi di dollari durante la crisi, e Daewoo 106 6 Analisi Diagnostica fu assorbita dal gruppo americano GM. Il cambio passò da 800 won per dollaro ad oltre 1800 (la svalutazione giunse al 110%). A distanza di alcuni anni, nonostante la crisi abbia costretto alla bancarotta numerose compagnie nazionali, la Korea del Sud è riuscita, dal 1997 ad oggi, a triplicare il proprio PIL, mantenendo il ruolo di una tra le più attive e fiorenti economie mondiali. A tal proposito è sufficiente notare come dal 1960 a oggi, il PIL pro capite sia passato, in termini nominali, da 80 dollari a 21.000 dollari. Gli effetti maggiori della crisi si sono fatti sentire sul debito pubblico, quasi triplicato, dal 13% al 30% negli ultimi 10 anni. 6.2.5 Sud America I Paesi Latino-Americani sono stati, storicamente, sempre visti dagli esperti come indicatori di squilibri economici, dettati da situazioni politiche e sociali molto instabili. Venezuela, 1975, 1995, 2003 In Venezuela sono visibili outlier nel 1975, nel 1995 e nel 2003. Uno sguardo al passato è necessario per meglio comprendere ciò che accade successivamente. Agli inizi degli anni ’70, il paese si collocava al terzo posto della graduatoria mondiale; autorevole membro dell’OPEC, esercitava un ruolo di primo piano nelle decisioni di tale organizzazione che portavano nel 1973, al primo “shock” petrolifero, con la riduzione della produzione e l’aumento del prezzo (da 3 dollari al barile, il Venezuela lo portò a 14 dollari, contro gli 11 dei Paesi del Golfo Persico); nel 1976 il settore venne nazionalizzato. Se, in questo periodo, l’aumento dei prezzi aveva accresciuto enormemente le rendite pro-capite, rendendole le più alte del continente, non fu dato impulso all’industria nazionale, preferendo arricchire il clientelismo statale e ampliare gli sprechi della classe media; il destino dei poveri passò, cosı̀, in secondo piano. Cosı̀, quando le rendite petrolifere diminuirono, livelli astronomici di corruzione e spreco erano diventati routine per un estabilishment politico costituito da solo due partiti, che si dividevano i profitti di un potere clientelistico. Intorno alla metà degli anni ’90 il PIL aveva ormai raggiunto i livelli di un trentennio prima ed i salari industriali erano diminuiti del 40% rispetto agli anni ottanta. Sotto il livello di povertà viveva, nel 1984, il 36% della popolazione; nel 1993 la povertà era quasi raddoppiata (66%). La grande miseria di molti per la gloria e la ricchezza di pochi, separati da una classe media in diminuzione: questa è stata la situazione che Chàvez si è trovato davanti una volta al potere. Cosı̀, nei primi due anni della sua presidenza, si è occupato di risistemare la cornice politica dello stato varando una nuova costituzione, mettendo un po’ da parte la situazione precaria della maggior parte della popolazione. Da quando, nel 2001, sono partiti dei provvedimenti a favore dei più poveri sono immediatamente iniziate le proteste. La classe media si è opposta al metodo di Chàvez di adoperare il denaro proveniente dalle esportazioni petrolifere per progetti che andassero a beneficio dei più poveri; sono stati aumentati, infatti, i budget per l’istruzione, per l’edilizia pubblica e i servizi e per la spesa sanitaria. Scelte che la classe media 6.2 Diagnostic Analytics 107 non ha accettato, visto che ci sono ormai molte strutture private che si occupano di ciò, e, soprattutto, che questi soldi, adesso investiti nella spesa pubblica, prima entravano nelle loro tasche. A causa delle proteste, alcuni dei decreti relativi a politiche socio economiche sono diventati leggi. Uno di questi riguarda il settore petrolifero. Abbiamo detto che il settore è stato nazionalizzato; l’organo che lo gestisce è la PDVSA, fino ai primi del 2000 gestita come uno stato a sé da un management altamente privilegiato che è sempre stato ostile a qualsiasi tipo di strategia per lo sviluppo nazionale e sociale. La PDVSA aveva massimizzato gli investimenti oltremare, per ridurre il valore delle commissioni da pagare allo stato venezuelano; non contenta di ciò, ha spinto compagnie straniere a rientrare nel paese, cercato di ridurre le quote dell’OPEC e spianato la strade ad eventuali privatizzazioni. Attualmente, la nuova legge petrolifera limita del 50% la partecipazione di compagnie straniere e raddoppia le commissioni fisse da pagare allo stato per ogni barile estratto; essa contiene clausole che consentono al governo di riorganizzare l’industria se necessario. Ciò ha causato forti dissensi all’interno della PDVSA che, nel 2002, ha organizzato scioperi insieme alla FEDERCAMERAS, oltre ad aver contribuito al colpo di stato di aprile. In seguito a questi fatti PDVSA è stata riorganizzata per rispondere alle nuove politiche economiche del governo, fino ai giorni nostri. Argentina, 1976, 1989-1990, 2001 La situazione dell’Argentina comprende diversi valori fuori dalla norma; un primo outlier si ha nel 1976, un secondo oulier risale al biennio 1989-1990, un ultimo outlier si ha nel 2001. L’economia Argentina è la terza più grande in America Latina, dopo il Brasile e il Messico, e la seconda più grande in Sud America. Essa è orientata verso lo sfruttamento agricolo e l’esportazione di terziario e tecnologia avanzata, una potente e diversificata base industriale, un notevole livello di sviluppo nel campo della scienza, e una popolazione a maggioranza alfabetizzata. Nella seconda metà del secolo scorso, la Repubblica è stata una dei paesi con le migliori prospettive nel mondo. Tuttavia, tra il 1974 e il 2002, diverse depressioni economiche hanno colpito il suo sviluppo. Le politiche economiche neoliberiste adottate dal 1976, anno in cui avvenne il colpo di stato civile-militare, che segna un punto di partenza riguardo il declino delle attività industriali e una progressiva concentrazione della ricchezza ha fatto si che le persone perdessero il tenore di vita che era stato raggiunto nella metà del XX secolo. Nei 7 anni di dittatura militare la crescita del debito estero passò da 8 a 44 miliardi di dollari. Nel 1975 gli interessi del debito estero assorbivano solo il 5% delle esportazioni; dieci anni dopo il 60% delle importazioni serviva per ripagare i soli interessi. Il principale introito dello stato era dato dai dazi sulle esportazioni. La povertà aumentò cosı̀ tanto che, nel 1975, il prodotto nazionale lordo per abitante era di 3500 dollari, dopo 10 anni ammontava a solo 2950, senza contare i continui tagli alla spesa pubblica per la sanità e la scuola. Nel 1982 il regime decise di avviare il conflitto con il Regno Unito per ottenere la sovranità sulle isole Falkland. La spedizione si rivelò un disastro e, alla fine della guerra, si contavano 600 vittime 108 6 Analisi Diagnostica fra i soldati argentini. Questo avvenimento rappresentò il colpo definitivo al regime militare, nonché il periodo più triste della storia del paese, periodo noto come “guerra sporca”. Come nuovo presidente venne eletto il radicale Raùl Alfonsin che, in sei anni di governo, non riuscı̀ né a risolvere i gravi problemi dell’economia del paese, come inflazione e deficit pubblico, né ad attuare le riforme di cui il paese aveva bisogno. Alla fine degli anni Ottanta gli indici economici fecero registrare valori record. In particolare, era l’inflazione a destare forti preoccupazioni. Infatti quest’ultima arrivò a toccare livelli superiori al 1000% a partire dal 1987. Il mese più difficile fu, certamente, il gennaio del 1989, mese nel quale il FMI (Fondo Monetario Internazionale) revocò la linea di credito precedentemente messa a disposizione del governo argentino per agevolare il piano di risanamento dell’economia attuato da Alfonsin. Il risultato fu il collasso della finanza pubblica e la conseguente fuga di capitali verso paesi più solidi come gli Stati Uniti, la cui moneta (il Dollaro) vide aumentare il proprio valore di 25 volte rispetto al peso argentino in meno di un anno. Inoltre, un altro grave problema minava la fiducia del popolo nel governo. Infatti, oltre alla crisi economica, occorre considerare un altro tipo di crisi, ovvero quella morale. In quegli anni molti politici vennero accusati di aver trasferito i propri capitali all’estero ben prima che la crisi desse i segnali sconfortanti della fine degli anni Ottanta. In seguito a queste polemiche, gli argentini si sentirono ancora una volta traditi dalle istituzioni. Le rivolte popolari del 1989 portarono Alfonsin a dimettersi 5 mesi prima della scadenza del mandato, sostituito da Carlos Menem, il quale, già in campagna elettorale, annunciò una svolta epocale. Il nuovo Presidente adottò misure economiche di emergenza; mise in atto un piano di austerità economica con vari interventi di privatizzazione delle aziende pubbliche, tagli alle spese sociali, deregulation in diversi settori, puntando anche sull’arrivo di capitali stranieri. Menem dimostrò da subito un’incredibile docilità nei confronti del FMI e degli Usa, e si lanciò in un politica decisamente neoliberista. L’obiettivo di questa consisteva nel privatizzare il più possibile per eliminare la spesa pubblica e, conseguentemente, per estinguere il debito estero. Egli riuscı̀ a riportare l’inflazione a livelli impensabili pochi anni prima. Ma le riforme ebbero pesanti costi sociali, ovvero l’aumento della disoccupazione e della povertà e il deficit della bilancia commerciale. L’Argentina perse rapidamente la fiducia degli investitori e la fuga di capitali aumentò. Nel 2001 e nell’orlo di una nuova crisi iperinfazionistica; per evitare ciò, il team di economisti del governo varò un progetto di legge, disegnato per preservare il regime di convertibilità, chiamato piano “Terza Valuta”. Esso consisteva nella creazione di una nuova valuta non convertibile, chiamata “Argentino”, che avrebbe dovuto coesistere con pesos e dollari statunitensi. Sarebbe dovuta circolare solo in contanti (assegni, cambiali ed altri strumenti sarebbero potuti essere emessi in pesos o dollari, ma non in argentinos) e sarebbe stata garantita parzialmente con terreni amministrati dallo stato federale; queste caratteristiche servivano a controbilanciare le tendenze inflazionistiche. Una volta che l’argentino avesse avuto lo status di valuta legale, sarebbe stato usato per riscattare tutta la valuta complementare già in circolazione. Si sperava che la conservazione della convertibilità ristabilisse la fiducia popolare, mentre la natura non convertibile di questa valuta avrebbe per- 6.2 Diagnostic Analytics 109 messo di attuare misure di flessibilità fiscale (impensabili con il peso) che avrebbero contrastato la devastante recessione economica. I critici definirono questo piano una “svalutazione controllata”; i difensori del progetto ribattevano che, siccome il controllo di una svalutazione è una procedura delicatissima, questa era una lode travestita da critica. Il piano “Terza Valuta” raccolse consensi entusiastici tra famosi economisti; tuttavia esso non poté mai essere implementato perché il governo di Rodrı́guez Saá mancava del supporto politico richiesto. Egli, completamente incapace di affrontare la crisi e criticato dal suo stesso partito, dette le dimissioni prima della fine del 2001. L’Argentina perse rapidamente la fiducia degli investitori e la fuga di capitali aumentò. Nel 2001 la gente iniziò a temere il peggio e a ritirare grosse somme di denaro dai propri conti correnti bancari, convertendo pesos in dollari e mandandoli all’estero; si scatenò una corsa agli sportelli. Il governo adottò una serie di misure (note come corralito) che congelarono effettivamente tutti i conti bancari per dodici mesi, permettendo unicamente prelievi di piccole somme di denaro. Questo limite ai prelievi, unito ai seri problemi che causò, esasperò il popolo argentino che, in alcuni casi, si riversò nelle strade di importanti città, specialmente Buenos Aires. Si svilupparono proteste popolari, note con il nome di cacerolazo, che consistevano nel percuotere rumorosamente pentole e padelle. All’inizio i cacerolazos furono semplicemente manifestazioni rumorose, ma presto inclusero distruzioni di proprietà, spesso nei confronti di banche e compagnie private straniere, specialmente grandi imprese americane ed europee. 6.2.6 Stati Arabi Gli Stati Arabi sono accomunati dalla loro forte produzione petrolifera, dalla quale deriva la loro ricchezza. Vediamo alcuni valori economici fuori dalla norma e, soprattutto, le cause che li hanno comportati. Kuwait, Iraq, 1991 Kuwait e Iraq presentano un comune outlier, di natura inflattiva, nel 1991. In questo caso non si può dare al petrolio la motivazione dell’aumento improvviso dei prezzi dei beni, che arriva a quota 192,23%; esso è causato dalla Guerra del Golfo che, nel biennio 1990-1991, investı̀ l’area del Kuwait; esso venne invaso dalle truppe dell’Iraq, e il regime di Saddam, prostrato economicamente dalla guerra con l’Iran, accampando delle rivendicazioni territoriali rispetto ai confini tra Iraq e Kuwait, attaccò il regno devastandolo e macchiandosi di crimini di guerra e contro l’umanità. Il Kuwait venne liberato a febbraio del 1991 da una coalizione internazionale guidata dagli Stati Uniti d’America e incaricata dal Consiglio di Sicurezza delle Nazioni Unite di ricostituire lo stato di diritto internazionale violato dall’aggressione delle truppe di Saddam Hussein. Successivamente, la situazione si stabilizzò e, progressivamente, anche l’economia si stabilizzò. Iran, Iraq, 2013 Riguardo Iran e Iraq, ci troviamo in un periodo temporale molto recente. Le sanzioni emanate dall’Onu, dovute ai conflitti, hanno messo seriamente a rischio l’eco- 110 6 Analisi Diagnostica nomia di Teheran. Secondo il presidente Iraniano Ahmadinejad (e altri funzionari iraniani), l’economia del paese rimane forte. Molti Stati e multinazionali, a loro dire, sono ancora disponibili a trattare affari con le imprese iraniane, nonostante la disapprovazione di Washington. La situazione, dati alla mano, è però ben diversa. Da fine 2012, infatti, i prezzi dei beni di prima necessità sono aumentati drasticamente in tutto il paese, soprattutto nella capitale. Anche il trasporto pubblico è in crisi. La compagnia di autobus di Teheran ha recentemente interrotto il servizio a Tajrish Terminal, invitando i residenti a utilizzare la metropolitana. Ma nella capitale molti quartieri popolari non vi hanno accesso. Il governo ha annunciato che, a partire dal prossimo marzo, le tariffe dei taxi aumenteranno di 20 centesimi di rial iniziali, e 15 centesimi ogni 100 metri percorsi. Nella prima settimana di agosto 2013 il prezzo della carne a Teheran era passato da 120000 a 180000 rial (12-18 dollari) al kilogrammo; tra settembre e ottobre è raddoppiato a 350000 rial (35 dollari), e le stime dicono che nel mese di novembre potrebbe addirittura triplicare. L’inflazione è travolgente anche a Tabriz, importante centro nel nord-ovest del paese. Da tempo la città è stata colpita dalla disoccupazione e da una profonda crisi immobiliare. Quasi tutti i lavoratori ricevono gli stipendi in ritardo; alcuni non lo ricevono da mesi. Nei grandi centri, l’esasperazione della gente traspare ad ogni angolo di strada. Sono sempre di più i cittadini convinti che le sanzioni imposte all’Iran per invitarlo a desistere dal programma nucleare siano solo un mantra ripetuto dal governo per giustificare l’inflazione galoppante degli ultimi tempi. Nel Paese si desta ovunque un’aria di preoccupazione per il futuro e le persone sono in attesa di vedere quale impatto avranno sulla loro vita i piani di riduzione dei sussidi annunciati dal regime. Nel sistema di sostegno dei prezzi precedente alle sanzioni, secondo il Fondo Monetario Internazionale, una famiglia su quattro riceveva dal governo in media l’equivalente di quasi 4000 dollari all’anno in benzina, energia elettrica e beni di prima necessità. Questi sussidi costano complessivamente circa 100 miliardi di dollari alle finanze di Teheran. Il taglio delle forniture di gas, praticamente dimezzate tra giugno e luglio, ha causato l’immediato rincaro dei prezzi di benzina ed energia elettrica. Sembra un controsenso, ma il paese (quarto produttore mondiale di petrolio) soffre di un’endemica carenza di carburanti, a causa di un’insufficiente industria di raffinazione, e la domanda interna di tali beni dipende pesantemente dalle importazioni. A soffrire per le sanzioni è anche il sistema finanziario. Da giugno, infatti, decine e decine di banche e aziende internazionali hanno interrotto i loro rapporti d’affari con l’Iran, mettendo a rischio la stessa stabilità del sistema bancario nazionale. La moneta nazionale, il rial, ha subito una svalutazione del 10% nel giro di poche settimane e, per i commercianti, è sempre più difficile procurarsi valuta estera. Secondo il dipartimento di Statistica, 10 milioni di iraniani vivono sotto la soglia di povertà assoluta e 30 milioni sotto quella di povertà relativa. 6.2 Diagnostic Analytics 6.2.7 111 BRICS Nonostante i Paesi appartenenti al BRICS siano caratterizzati da una forte crescita economica, questi sono stati soggetti di diverse crisi finanziarie, dalle quali derivano i valori di outlier. Brasile, 1989-1990, 1993-1994 Il Brasile è stato sempre un paese caratterizzato da un elevato tasso d’inflazione che è esploso raggiungendo un tasso molto elevato in due momenti storici, ovvero negli anni 1989 - 1990, raggiungendo, nel secondo anno, quota 2947,73 punti percentuali, e nel periodo 1993-1994 raggiungendo il picco più alto di sempre al secondo anno toccando 2075,88 punti percentuali. Successivamente, nel 1995, vi è un drastico calo dell’inflazione la cui spiegazione economica sarà data successivamente. Le cause della crescita dell’inflazione brasiliana furono strutturali; facendo un passo indietro, tra il 1960 e il 1985 si registra un crescente deficit pubblico, una perdita di controllo dell’inflazione e un aumento successivo della stessa. Con l’indicizzazione avvenuta dopo il 1964 gli effetti si fanno ancora più visibili. Non si può fare a meno di menzionare il fatto che il cosiddetto Plano Cruzado e i suoi annessi furono un errore della politica economica. Ricorrere a un piano palesemente destinato al fallimento condusse gli operatori economici a non prendere sul serio i congelamenti, a farsene gioco e ad anticiparli. Questi piani ebbero come effetto la recrudescenza dell’inflazione, insieme al movimento di uscita dai congelamenti, elevando oltremodo il grado di indicizzazione dell’economia, provocando la crescita continua dell’inerzia inflazionistica e riducendo, cosı̀, l’ipotesi di un probabile cambiamento delle regole di formazione delle aspettative dopo il 1986. Contraddicendo lo scenario caratteristico dei piani precedenti, venne presentato il Plano Real che, oltre a ridurre il tasso d’inflazione a livelli bassi, riduceva costantemente il grado di inerzia inflazionistica dell’economia. Per questo il periodo seguente venne detto del post-Real. Il Brasile si è impegnato per lunghi anni nel tentativo di ideare un piano capace di controllare l’inflazione e fare in modo che il suo regime finanziario fosse considerato stabile e sano. Di fatto, però, fin quando non è stata raggiunta una soddisfacente normalità, vari problemi dovettero essere affrontati. Questi furono causa di veri disastri rispetto agli scopi della politica anti-inflazionistica tra i periodi del Plano Cruzado e Cruzeiro, creando le premesse per i piani futuri fino all’arrivo del Real. È necessario evidenziare il fatto che il deficit pubblico in Brasile esercita un’intensa pressione sulla domanda aggregata, per il suo notevole costo. Cosı̀ il finanziamento di tale costo produce un impatto espansionista sulla domanda aggregata generando tensioni inflazionistiche permanenti che, alla fine, diventano croniche; ciò avviene anche quando il Brasile presenta uno scenario inflazionistico relativamente basso, tra il 1970 e il 1973, quando l’inflazione media valutata dall’indice geral de precos (IGP) si aggirava intorno al 17%. La conseguenza di tutto ciò fu un crescente, accelerato e incontrollato scenario inflazionistico che ha portato l’economia brasiliana ad attraversare un periodo di caos. Esso è stato talora incentivato per mancanza di volontà politica, ma, per altri versi, è stato combattuto con proposte choc di origine sia interna che esterna, venute a svilupparsi insieme ai deficit pubblici. 112 6 Analisi Diagnostica Tra il 1986 e il 1994 furono impiantati sei programmi eterodossi di stabilizzazione basati sul congelamento dei prezzi: il piano Cruzado 1 (febbraio 1986) e 2 (novembre 1986). Seguirono il piano Bresser (1987), Verao (1988), Collor 1 (1990) e 2 (1991). I risultati furono disastrosi e condussero ad un’inflazione superiore a 1000% l’anno, causando cosı̀ incessanti tentativi di stabilizzazione. Lo scenario drammatico, al momento dell’entrata del piano Cruzado, era di inflazione al 350% l’anno. Controllare i tassi e ottenere credibilità tanto interna quanto esterna era, certamente, una sfida da affrontare. Il Plano Real, impiantato nel 1994, consentı̀ una diminuzione inflattiva drastica; esso fu segnato dalla progressiva quotazione dei prezzi in URV, un’unità reale di valore, ossia un punto di riferimento stabile di valore. Successivamente cominciò l’emissione di nuova moneta, il Real, che sostituı̀ il nuovo Cruzeiro. L’URV fu la levatrice del nascente Real. Con il mantenimento del tasso reale d’interesse a livelli elevati e dell’eccesso di liquidità nel mercato internazionale, il flusso di capitali stranieri continuò. In questo scenario il Banco Central Brasileiro (BACEN) si ritirò dal mercato dei cambi provocando forte credibilità e valorizzazione del Real, cosı̀ come un volume significativo di riserve e un economia aperta, che favorı̀ l’interesse dell’importazione di una generale risalita economica. Russia, 1990 L’economia della Russia è profondamente segnata non solo dal patrimonio dell’Unione delle Repubbliche Socialiste Sovietiche (URSS), da cui ha ereditato il 62% delle potenzialità, ma anche da riforme neoliberiste praticate nel paese dal 1990. La caratteristica principale dell’economia Russa è l’interdipendenza profonda e l’integrazione con altri paesi membri della CSI (Comunità degli Stati Indipendenti), che è formata dalla maggior parte delle ex Repubbliche Sovietiche. Questa situazione si verifica per il fatto che, durante la guerra fredda, l’Unione Sovietica ha cercato di distribuire e settorizzare la maggior parte della produzione industriale del paese, al fine di fornire una maggiore democratizzazione della produzione, facilitando il flusso, espandendo la rete di infrastrutture in tutto il territorio sovietico e, soprattutto, per proteggere il settore produttivo sull’orlo di una guerra nucleare. Un esempio comune per spiegare questa integrazione è la dipendenza dall’industria pesante degli Urali russi verso la produzione di minerale di ferro e carbone, proveniente dal Kazakistan. Inoltre, il processo di privatizzazione industriale intensa e disordinata gestito dal 1991, insieme all’aumento della corruzione nel paese, ha consolidato il processo di formazione di grandi monopoli privati. Tale configurazione ha consentito la caratterizzazione della produzione russa contrassegnata dal deterioramento delle condizioni di lavoro dal massiccio sfruttamento delle risorse naturali del paese. Dal 1960 l’ex URSS si sentiva forte in dipendenza in relazione alla produzione di cibo. Inoltre, la maggior parte della produzione non si trovava nel territorio russo. Per questo motivo, attualmente, il paese importa circa un quinto del cibo totale consumato dalla popolazione. Si può dire che il periodo post Guerra Fredda è stato estremamente difficile, dal punto di vista economico, per la Russia, che ha visto una diminuzione di circa il 40% della sua economia nel 1990. La crisi è stata il risultato, soprattutto, della privatizzazione senza controllo intrapresa dal governo di Boris Eltsin. La fine dell’Unione 6.2 Diagnostic Analytics 113 Sovietica significò l’indipendenza dalla Russia, ma portò rovina economica, miseria ed emigrazione di massa, perdita di una patria e di un’appartenenza e formazione di regimi autocrati nelle ex repubbliche sovietiche del Caucaso e dell’Asia centrale. Ci sono due punti di vista in vigore nel paese sulle difficoltà economiche in Russia: da un lato, i neoliberisti sostengono che i problemi dell’economia derivano dalla difficoltà del paese ad aprirsi pienamente alla economia di mercato capitalistica; dall’altro, i fronti di sinistra accusano le riforme liberali di essere state responsabili del collasso economico della Russia e il suo recupero difficile. Ad aggravare questa situazione, nel 1998, ci fu una grave crisi finanziaria e la conseguente fuoriuscita di capitale nazionale e internazionale. Durante il governo di Vladimir Putin, il PIL del paese è tornato a crescere a tassi elevati, con una media del 6% all’anno. Tuttavia, ad oggi, l’economia russa è estremamente dipendente dalle esportazioni di petrolio, che rappresentano circa l’80% delle esportazioni. Cina, 1994 Durante gli anni novanta l’economia della Cina continuò a crescere rapidamente con una media del 10,43%; tuttavia, essa ha subito una forte inflazione, la quale superò il 20% nel 1994. La crisi finanziaria asiatica colpı̀ il Paese solo marginalmente, per via dei forti controlli sui capitali investiti nel Paese ed, in particolare, della inconvertibilità internazionale dello Yuan. Ciò permise al paese di crescere nonostante il forte rallentamento delle economie della regione. Tuttavia, in questo periodo, la Cina fu affetta da forti livelli di disoccupazione, causati dalla privatizzazione massiccia delle aziende statali. Nonostante il successo e la crescita della economia cinese nel ventennio che va dal 1990 ai giorni nostri, rimanevano molti nodi, quali la modernizzazione del settore finanziario e del settore statale. L’accelerazione dell’attività economica, e in particolare della spesa in beni di investimento (che aumentò dal 25% al 35% del PIL nei primi cinque anni del decennio), determinò ulteriori pressioni inflazionistiche, enfatizzate dalla decisione di abbandonare il sistema dei prezzi duale. Questa decisione, adottata dalla Cina per 9 anni, comportava il rischio di inflazione “strutturale”, causata dal riallineamento dei prezzi pianificati ai rispettivi livelli di equilibrio di mercato. Per questo motivo, esso fu affiancato da un piano di austerità, adottato il 3 luglio del 1993, in concomitanza con l’insediamento di Zhou Rongji a capo della Phoe, con lo scopo dichiarato di raffreddare l’attività economica favorendone un “atterraggio morbido” (soft landing), cioè evitando brusche cadute della produzione. Le misure intraprese comprendevano una stretta monetaria, realizzata mediante restrizioni creditizie e l’aumento dei tassi di interesse, e la destinazione dei flussi di investimento a nuove priorità, fra le quali la creazione di infrastrutture nelle aree interne, volte a favorirne l’allentamento delle strozzature dal lato dell’offerta. Il piano fu coronato da successo: fra il 1994 e il 1996 il tasso di inflazione si ridusse di circa 17 punti (dal 23,2% al 6,5%), a fronte di un rallentamento della crescita di soli 4,4 punti, dal 13,3% all’8,9%. Il 1994 vide due importanti riforme in campo valutario: l’abolizione del sistema di ritenzione dei guadagni in valuta estera, e quella del mercato duale dei cambi, previa svalutazione del tasso di cambio ufficiale al valore di 8,70 yuan per dollaro. 114 6 Analisi Diagnostica I dati della Banca Mondiale segnalano che, nel 1994, la Cina sperimentò una rivalutazione in termini reali di circa l’8,5%. Questo dato non ha nulla di paradossale, giacchè la svalutazione nominale, pari a circa il 10%, compensava solo in parte l’incremento dei prezzi interni, che, nel 1994, era stato del 23%. Del resto, soffermarsi sulle dinamiche del cambio nominale ha poco senso: agli acquirenti esteri interessa il costo dei beni, costo del quale il cambio (cioè il costo della valuta) è solo una componente (l’altra essendo il prezzo dei beni in valuta locale). È, quindi, piuttosto difficile che l’incremento significativo delle esportazioni sperimentato nel 1994 (in misura pari al 25%) sia da attribuire alla contemporanea svalutazione nominale; è semmai più plausibile che esso dipenda dalla svalutazione reale verificatasi nei quattro anni precedenti ai ritmi del 10% dell’anno. Infatti, si denota che i flussi commerciali reagiscono con ritardo a variazioni dei prezzi relativi, provocando, in questo caso, una forte leva inflattiva. 7 Analisi Predittiva In questo capitolo verrà illustrata la terza e ultima fase di analisi, ovvero quella predittiva. In particolare, verranno analizzate le linee di tendenza di alcuni Paesi e le relative previsioni sui diversi indici economici presi in considerazione dal nostro case study. 7.1 Premessa Come già illustrato nei precedenti capitoli, la previsione di ciò che accadrà nel futuro è affidata all’Analisi Predittiva. Essa permette di migliorare la comprensione dei dati, contribuendo a prevedere il comportamento dei soggetti principali del case study. Inoltre, rappresenta le fondamenta per un’ulteriore analisi più approfondita, la Prescriptive Analytics, che definisce i provvedimenti per arginare determinati comportamenti negativi e per favorire determinati comportamenti positivi visualizzati nelle precedenti fasi. 7.2 Trend e Forecast Il trending viene utilizzato per prevedere il proseguimento di alcuni andamenti di una variabile, mentre il forecasting si occupa della vera e propria predizione, con la caratteristica di mostrare, oltretutto, una “fascia di confidenza”, che indica entro quale range di valori, nel caso di limitati stravolgimenti, si troverà il dato nel futuro. Nella creazione delle linee di tendenza, è importante scegliere, tra le quattro disponibili (lineare, logaritmica, esponenziale, polinomiale), la tipologia giusta per la misura che si sta prendendo in considerazione. Per eseguire in maniera corretta tale operazione, ricorriamo al comando “Describe trend model”, che riporta i valori di “R-Squared” e di “P-Value”, cioè i principali indicatori per eseguire la scelta corretta (Figura 7.1). Essa può essere effettuata anche solo analizzando la forma della spezzata di cui vogliamo predire l’andamento; tuttavia, le due grandezze consentono di passare da un’analisi sull’adeguatezza di tipo qualitativo ad un’analisi di tipo quantitativo. 116 7 Analisi Predittiva Figura 7.1. Schermata delle opzioni per gestire al meglio le linee di tendenza. L’R-squared, in statistica, prende il nome di coefficiente di determinazione; esso è una proporzione tra la variabilità dei dati e la correttezza del modello statistico utilizzato. Più si avvicina a 1 questa grandezza, maggiore è l’affidabilità del modello utilizzato. In statistica, il valore p (o p-value, in inglese) indica la probabilità di ottenere un risultato uguale o “più estremo” di quello osservato, supposta vera l’ipotesi nulla. Più si avvicina allo 0 questo valore, migliore sarà la possibilità che non ci siano errori nella previsione. Solitamente, deve essere inferiore al tasso di soglia, spesso fissato a 0.05. Esiste inoltre una fase preliminare, dove si “addestra” il sistema a svolgere i calcoli in maniera adeguata (Figura 7.2). Tale procedimento consiste nell’omettere i dati fino a un certo periodo di tempo, e selezionare trend e forecast con impostazioni adeguate, riproducendo i dati reali in maniera quanto più fedele possibile. Quando quest’operazione volge al termine, si può iniziare con la vera e propria Predictive Analytics. La durata delle previsioni, per ogni indice, è stata effettuata di lunghezza pari a 7 anni, cioè fino al 2022. 7.2.1 Inflazione Per l’indice relativo all’inflazione, effettuiamo l’analisi predittiva sulla Germania. In primo luogo è stato necessario definire il modello statistico utilizzato per visualizzare le linee di tendenza. Dai valori statistici, le cui definizioni sono esplicate in precedenza, selezioniamo la tipologia “polinomiale” (Figura 7.3). Successivamente, il forecasting avviene automaticamente, trascinando il comando sul worksheet e impostando la durata della previsione. Si evince come l’intervallo di confidenza riesca a gestire i valori entro il quale rientrerà il dato inflattivo, che si delinea in decremento (Figura 7.4). 7.2 Trend e Forecast 117 Figura 7.2. Schermata delle opzioni per gestire al meglio il forecasting. Figura 7.3. Schermata che descrive i dettagli analitici della trend line sull’inflazione. 118 7 Analisi Predittiva Figura 7.4. Dashboard che visualizza i risultati di trend e forecasting sull’inflazione. 7.2.2 Crediti bancari deteriorati sul totale dei prestiti lordi Per l’indice relativo al rapporto tra i crediti bancari deteriorati e il totale dei prestiti lordi, l’analisi predittiva viene effettuata sulla Germania. Come visto nel caso precedente, in primo luogo, è stato necessario definire il modello statistico utilizzato per visualizzare le linee di tendenza. Dai valori statistici, ma soprattutto dalla semplice visualizzazione del grafico, ci rendiamo conto che il modello più adatto è quello “lineare” (Figura 7.5). Successivamente il forecasting avviene automaticamente, trascinando il comando sul worksheet e impostando la durata della previsione. Anche in questo caso si nota l’intervallo di confidenza, che, con un’accuratezza del 90%, indica il dato in lieve decrescita nei prossimi 7 anni (Figura 7.6). Figura 7.5. Schermata che descrive i dettagli analitici della trend line dei crediti bancari deteriorati sul totale dei prestiti lordi. 7.2 Trend e Forecast 119 Figura 7.6. Dashboard che visualizza i risultati di trend e forecasting dei crediti bancari deteriorati sul totale dei prestiti lordi. 7.2.3 Capitale bancario sul totale delle attività bancarie Per l’indice relativo al capitale bancario sul totale delle attività bancarie, effettuiamo l’analisi predittiva sulla Germania. Il procedimento è analogo ai casi precedenti; il primo passo è relativo alla scelta accurata del modello statistico di riferimento, in questo caso quello “polinomiale” (Figura 7.7). È molto importante, in questo caso, la funzione della trend line, perchè, nonostante non sia presente nel database il valore nell’anno 2004, tramite la linea di tendenza si permette ugualmente di fornire un preciso riferimento per il forecasting, che vede il dato in lieve crescita (Figura 7.8). Figura 7.7. Schermata che descrive i dettagli analitici della trend line del capitale bancario sul totale delle attività bancarie. 120 7 Analisi Predittiva Figura 7.8. Dashboard che visualizza i risultati di trend e forecasting del capitale bancario sul totale delle attività bancarie. 7.2.4 Differenziale sul tasso di interesse Per l’indice relativo al differenziale sul tasso d’interesse, effettuiamo l’analisi predittiva sulla Russia. In primo luogo è stato necessario definire il modello statistico utilizzato per visualizzare le linee di tendenza. Dai valori statistici, ma soprattutto dalla semplice visualizzazione del grafico, ci rendiamo conto che il modello più adatto è quello “esponenziale” (Figura 7.9). Successivamente il forecasting avviene automaticamente, trascinando il comando sul worksheet e impostando la durata della previsione. Anche in questo caso, si nota l’intervallo di confidenza, il quale riesce a gestire i valori entro il quale rientrerà il dato relativo allo spread. Esso delinea, dopo una iniziale crescita, un assestamento verso un valore costante (Figura 5.5). Figura 7.9. Schermata che descrive i dettagli analitici della trend line del differenziale sul tasso d’interesse. 7.2 Trend e Forecast 121 Figura 7.10. Dashboard che visualizza i risultati di trend e forecasting del differenziale sul tasso d’interesse. 7.2.5 Tasso di interesse reale Per l’indice relativo al tasso di interesse reale, effettuiamo l’analisi predittiva sul Vietnam. In primo luogo, è stato necessario definire il modello statistico utilizzato per visualizzare le linee di tendenza. Dai valori statistici, ma soprattutto dalla semplice visualizzazione del grafico, rendiamo conto che il modello più adeguato è quello “polinomiale” (Figura 7.11). Successivamente, riguardo il forecasting, notiamo una forte crescita, che segue pari passo ciò che descrive la trend line (Figura 7.12). Figura 7.11. Schermata che descrive i dettagli analitici della trend line sul tasso di interesse reale. 122 7 Analisi Predittiva Figura 7.12. Dashboard che visualizza i risultati di trend e forecasting sul tasso di interesse reale. 7.2.6 Tasso di interesse sui depositi Per l’indice relativo al tasso di interesse sui depositi, effettuiamo l’analisi predittiva sull’Olanda. L’andamento, che non segue una linea retta è, secondo i valori di RSquared e p-value, di tipo “polinomiale” (Figura 7.13). Con la funzione di forecasting si nota come il dato è perfettamente in linea con la tendenza, assumendo valori quasi affini, in leggera decrescita (Figura 7.14). Figura 7.13. Schermata che descrive i dettagli analitici della trend line sul tasso di interesse sui depositi. 7.2 Trend e Forecast 123 Figura 7.14. Dashboard che visualizza i risultati di trend e forecasting sul tasso di interesse sui depositi. 7.2.7 Tasso di interesse sui prestiti Per l’indice relativo al tasso di interesse sui prestiti, effettuiamo l’analisi predittiva sul Sud Africa. Visto l’andamento dei valori, facilmente si può intuire che il modello più adatto è quello “polinomiale”; i valori di R-squared e p-value confermano la scelta effetuata (Figura 7.15). Il forecasting predice l’indice lievemente in crescita (Figura 7.16). Figura 7.15. Schermata che descrive i dettagli analitici della trend line sul tasso di interesse sui prestiti. 124 7 Analisi Predittiva Figura 7.16. Dashboard che visualizza i risultati di trend e forecasting sul tasso di interesse sui prestiti. 7.2.8 Premio per il rischio sui prestiti Per l’indice relativo al premio per il rischio sui prestiti, effettuiamo l’analisi predittiva sul Brasile. L’andamento più in linea è, anche in questo caso, quello “polinomiale”, che delinea valori di R-squared e p-value ottimi per il proseguimento dello studio (Figura 7.17). Il risultato della predizione segue l’andamento decrescente e discontinuo dei dati, che delineano l’indice in diminuzione (Figura 7.18). Figura 7.17. Schermata che descrive i dettagli analitici della trend line sul premio per il rischio sui prestiti. 7.2 Trend e Forecast 125 Figura 7.18. Dashboard che visualizza i risultati di trend e forecasting sul premio per il rischio sui prestiti. 8 Conclusioni e uno sguardo al futuro Durante la stesura della tesi è stata discussa l’importanza dei Big Data nella società attuale. I Big Data offrono la possibilità di sviluppare nuove tecnologie e modelli matematici per poter estrarre l’effettivo valore dai dati, e danno la possibilità di perseguire nuovi modelli di business. Essi consentono di individuare i trend e, inoltre, portano vantaggi economici alle aziende che hanno deciso di sfruttare le informazioni ottenibili dai dati in loro possesso. Grazie alla Big Data Analytics è possibile usare l’informazione ottenibile dai dati per fini predittivi e decisionali. Molti sono i contesti applicativi che beneficiano dei Big Data: sanità, sicurezza, istruzione, marketing e social network sono solo alcuni dei settori che sfruttano il grande potere dei Big Data. Tuttavia, è importante sfruttare questo potere derivante da essi con cautela, in quanto, oltre ad offrire grandi potenzialità, vi sono alcuni aspetti critici relativi ai Big Data che è bene prendere in considerazione; basti pensare ad esempio alle problematiche legate alla qualità e all’affidabilità dei dati e a quelle relative alla privacy degli stessi. Esistono numerosi software che consentono di operare con grandi quantità dei dati; nel presente elaborato di tesi è stato utilizzato Tableau Desktop, il leader del settore nel mondo della Data Analytics. Sfruttando tale software, dalle enormi potenzialità e dalle innumerevoli funzionalità, è stato possibile effettuare analisi descrittive, in una prima fase, diagnostiche in una seconda fase e predittive in una terza e ultima fase. Dopo aver prelevato dal database della World Bank i dati di natura economofinanziaria messi liberamente a disposizione dell’utenza, sotto forma di Open Data, è stata necessaria una fase preliminare di manipolazione degli stessi, definita ETL. Solo dopo tale attività, è stato possibile procedere con il vero e proprio lavoro di Big Data Analytics. Gli indici economici studiati e le predizioni effettuate, possono rappresentare per un esperto di economia, uno strumento essenziale per intuire la nascita di squilibri e crisi finanziarie. In futuro abbiamo valutato la possibilità di approfondire ed espandere l’aspetto analitico di questo studio, concentrandosi sulle analisi prescrittive e preventive, possibili grazie alla sintesi dei dati e all’utilizzo congiunto di scienze matematiche, regole di business e tecnologie di Machine Learning. In questo modo è possibile analizzare scientificamente i dati e, quindi, arricchirli di significato; l’obiettivo non è generare dei report su ciò che è accaduto, ma comprendere come l’informazione 128 8 Conclusioni e uno sguardo al futuro estraibile dai dati possa aiutare a prendere decisioni migliori in merito a ciò che avverrà. Riferimenti bibliografici 1. Crisi del Vietnam. http://www.asianews.it/notizie-it/A-Hanoi-l’inflazionepu-annullare-20-anni-di-crescita-economica-12833.html, 2008. 2. Trend Line. http://www.dummies.com/programming/big-data/big-datavisualization/how-to-add-trend-lines-in-tableau/, 2013. 3. Bankpedia. http://www.bankpedia.org/index.php/it/121-italian/p/21761pricing-dei-prestiti-bancari, 2015. 4. Crisi Economica Argentina. https://it.wikipedia.org/wiki/Crisi_economica_ argentina, 2015. 5. ForexInfo. https://www.forexinfo.it/Banche-e-crediti-deteriorati-istituticon-piu-sofferenze, 2015. 6. Measuring Inflation. http://www.economist.com/news/finance-and-economics/ 21695097-big-data-provide-new-ways-gauge-price-rises-how-much-doggy, 2015. 7. Inflazione Russa. http://eurasiatx.com/inflazione-in-russia-i-dati-delgoverno/?lang=it, 2016. 8. Big Data. https://www.sas.com/it_it/insights/big-data/what-is-big-data. html, 2017. 9. Index Mundi. http://www.indexmundi.com/g/g.aspx?c=ro&v=71&l=it, 2017. 10. Inflation. http://greeneconomics.blogspot.it/2016/03/taming-inflation-inacademic-economics.html, 2017. 11. Interest Rate. http://www.investopedia.com/terms/i/interestrate.asp, 2017. 12. Interest Rate and Inflation. http://businessmagazinegainesville.com/bondsinterest-rates-impact-inflation/, 2017. 13. Non Performing Loan. https://en.wikipedia.org/wiki/Non-performing_loan, 2017. 14. Predictive Analytics. http://www.webopedia.com/TERM/P/predictive_analytics. html, 2017. 15. Tableau Help. http://onlinehelp.tableau.com/current/pro/desktop/en-us/ help.html, 2017. 16. B. Baesens. Analytics in a Big Data World: The Essential Guide to Data Science and its Applications. Wiley, 2014. 17. A. Bahga and V. Madisetti. Big Data Science & Analytics: An Hands-On Approach. 2015. 18. D. Baldwin. Mastering Tableau. Packt, 2016. 19. J. Dean. Big Data, Data Mining, and Machine Learning. Garzanti, 2014. 20. T. Erl and W. Khattak P. Buhler. Big Data Fundamentals. Prenctice Hall, 2015. 130 Riferimenti bibliografici 21. H. Ishikawa. Social Big Data Mining. CRC Press Taylor & Francis Group, 2015. 22. B. Jones. Communicating Data with Tableau: Designing, Developing, and Delivering Data Visualizations. O’Reilly Media, 2014. 23. A. Maheshwari. Big Data Essentials. 2016. 24. J.N. Milligan. Learning Tableau. Packt, 2016. 25. D.G. Murray. Tableau Your Data! Fast and easy visual analysis with Tableau software. Wiley, 2013. 26. O. Radar. Big Data Now: current perspectives. O’Reilly Media, 2010. 27. V. Reynolds. Big Data For Beginners: Understanding SMART Big Data, Data Mining & Data Analytics For improved Business Performance, Life Decisions & More! 2016. 28. A. Rezzani. Big data. Architettura, tecnologie e metodi per l’utilizzo di grandi basi di dati. Maggioli, 2013. 29. V.M. Schonberger and K.N. Cukier. Big data. Una rivoluzione che trasformerà il nostro modo di vivere e già minaccia la nostra libertà. Garzanti, 2013. 30. J. Smith. Data Analytics: What Every Business Must Know About Big Data And Data Science. Pinnacle publishers, 2016. Ringraziamenti Alla fine di questo mio percorso universitario, desidero ringraziare tutti coloro che mi sono stati vicini. Un ringraziamento speciale va al prof. Domenico Ursino, per il suo supporto, per la sua disponibilità e per tutto l’aiuto che mi ha dato durante la stesura di questa tesi. Ringrazio i miei genitori e mia sorella, che mi sono sempre stati accanto e non mi hanno mai fatto mancare il loro sostegno durante tutti questi anni, nonostante i momenti difficili. Ringrazio i miei nonni, perchè senza di loro non sarei mai diventato quello che sono e non avrei potuto raggiungere questo obiettivo. Ringrazio la mia fidanzata, che nel percorso universitario, oltre che nella vita, si è dimostrata la principale fonte di coraggio nei momenti difficili, senza dubitare mai di me. Ringrazio i miei colleghi, che hanno reso anche i più duri esami un gioco, facendo passare le ore di studio sempre con il sorriso. Infine, ringrazio tutti coloro che mi sono stati accanto e continuano ogni giorno a dimostrarmi il loro affetto.