L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche Sergio Bedessi dirigente del Comune di Montopoli in Val d’Arno, Castelfranco di Sotto, Santa Maria a Monte (PI) L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche (abstract) Le reti neurali artificiali (ANN), il modello di elaborazione dell’informazione basato sul paradigma di funzionamento del cervello umano, possono effettuare la previsione dei fenomeni sociali con un margine di precisione ben superiore rispetto ai metodi statistici, arrivando addirittura ad essere l’unico metodo previsionale possibile per determinate tematiche. Nell’articolo, dopo aver mostrato come sia possibile effettuare la previsione delle presenze turistiche su un’area determinata (tematica di notevole interesse in paesi come l’Italia) grazie ad una rete neurale artificiale appositamente addestrata, viene illustrato come le ANN possano essere utilizzate per effettuare previsioni e simulazioni in svariati altri campi di interesse pubblico, andando così a costituire strumenti di grande utilità pratica per il supporto decisionale e la pianificazione strategica all’interno delle aziende pubbliche. (abstract) Artificial neural networks (ANN’s) mimic the ways in which human brain process information and are superior to traditional statistical methods in forecasting in social sciences. Sometimes they are the unique possible method to forecast some particular phenomenon. The objective of this paper is to show how an ANN is able to forecast demand for travel to a specific area (a very important matter for some country like Italy) and generally how ANN’s can be used as a powerful forecasting tool in order to support decision making and strategic planning in the public administration. Parole chiave: reti neurali artificiali, metodi previsionali, ANN L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche Sommario: 1. Premessa – 2. Che cosa sono le reti neurali artificiali? – 3. Come utilizzare le reti neurali per la previsione di fenomeni sociali – 4. La previsione delle presenze turistiche su una determinata zona – 5. L’utilità delle reti neurali artificiali per la pianificazione ed il decision making nelle aziende pubbliche – 6. Conclusioni 1. Premessa In questo articolo verrà mostrato come le reti neurali artificiali, il sistema di elaborazione dell’informazione basato sul paradigma di funzionamento del cervello umano, possano essere di grande utilità pratica per il supporto decisionale e la pianificazione strategica nelle aziende pubbliche. Le reti neurali artificiali sono in grado infatti di effettuare previsioni nell’ambito dei fenomeni sociali, i fenomeni sui quali le aziende pubbliche si trovano a lavorare, con un margine di precisione ben superiore rispetto ai metodi statistici, arrivando talvolta ad essere l’unico metodo previsionale possibile per determinate tematiche. Per dimostrare quanto asserito, verrà qui illustrato un esempio pratico, nel quale una rete neurale artificiale sarà utilizzata per prevedere le presenze turistiche su una determinata area; la previsione delle presenze turistiche, oltre ad essere una tematica di notevole interesse per paesi come l’Italia per i quali il turismo costituisce una importantissima risorsa economica, è proprio una delle tematiche nelle quali i metodi tradizionali (in genere statistici) non sono in grado di effettuare previsioni accurate, previsioni che sono invece indispensabili per una corretta programmazione strategica delle azioni che le varie agenzie pubbliche che lavorano in questo ambito (Province, Aziende Provinciali di Turismo, Istituti Provinciali di Statistica, Comuni, Associazioni Pro-Loco, Associazioni turistiche) portano avanti. L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche, oltre a fornire previsioni molto accurate1, consente di comprendere meglio il fenomeno studiato 2, con particolare riferimento a come le singole variabili analizzate influiscono sul fenomeno stesso; in questo senso le reti neurali artificiali possono costituire un potente supporto al decision making in ambito pubblico. Al di là dell’esempio pratico, nell’articolo si elencano altre tematiche di ambito pubblico nelle quali le reti neurali artificiali possono essere vantaggiosamente utilizzate, rivelandosi un metodo vincente ed altamente efficiente, utilizzabile con successo nella fase di programmazione strategica delle politiche pubbliche. 1 2 Nel caso qui illustrato con un margine di precisione del 7 per mille. Analizzando, a posteriori, i pesi sinaptici che connettono i vari neuroni della rete neurale artificiale. 2. Che cosa sono le reti neurali artificiali ? Prima di parlare delle possibilità che una rete neurale artificiale può offrire per prevedere l’afflusso turistico, è necessaria una brevissima introduzione alle reti neurali in generale; la tematica è molto complessa e pertanto verrà qui fornita una spiegazione molto sintetica e limitata. Per rete neurale artificiale (ANN – artificial neural network – nella letteratura in lingua inglese) si intende una replica artificiale (hardware o simulata via software) delle reti neurali naturali, quelle biologiche (Müller, Reinhardt, 1990), cioè dell’insieme delle cellule (i cosiddetti neuroni) che costituiscono il cervello umano o animale; gli studi hanno dimostrato che un determinato tipo di reti neurali artificiali, quelle con apprendimento supervisionato, a differenza dei normali computer che devono essere programmati con procedure algoritmiche, sono in grado di individuare la soluzione di problemi che vengono loro posti, apprendendo direttamente dall’esperienza che accumulano presentando loro ripetutamente una serie di esempi del problema da trattare, corredati delle relative soluzioni. Esse simulano quindi il funzionamento del cervello umano e animale, che riesce a trovare la soluzione ai vari problemi semplicemente basandosi sull’esperienza del passato. Le reti neurali artificiali si inseriscono in qualche modo nell’ampia tematica dell’intelligenza artificiale e ne costituiscono un’evoluzione innovativa; è innegabile che lo stimolo alla realizzazione delle reti neurali artificiali provenga dal desiderio di riprodurre sistemi di elaborazione “intelligenti”, simili, per prestazioni e comportamento, all’uomo, le cui azioni sono governate dal cervello. Questo organo (figura 1) è costituito per la maggior parte da cellule, così come le altre parti del corpo umano, e rispecchia in via generale la teoria cellulare di Rudolf Virchow; le cellule del cervello sono chiamate cellule nervose o neuroni. Nella figura 2 è possibile vedere l’immagine di un singolo neurone al microscopio elettronico, mentre lo schema funzionale di un generico neurone3 è quello riportato nella figura 3. Le reti neurali artificiali replicano l’organizzazione del cervello umano, essendo costituite da molti processori semplici (neuroni artificiali) interconnessi fra sé, come nella figura 4, che rappresenta una piccola rete neurale artificiale composta da 5 neuroni (2 di input, 2 nascosti, 1 di output). Ogni neurone artificiale, in modo sostanzialmente simile ad un neurone biologico, calcola il segnale in uscita come funzione4 della differenza fra il prodotto dei segnali di entrata per i rispettivi pesi sinaptici, ed un valore di soglia prefissato. A livello complessivo le reti neurali artificiali ricordano nelle loro prerogative il cervello (umano o animale) essenzialmente per due aspetti: 3 4 In realtà i neuroni non sono tutti uguali; nell’uomo esistono circa 50 tipi diversi di neurone. La funzione può essere di vario tipo; la più utilizzata è la funzione sigmoide. la conoscenza è acquisita attraverso un progressivo processo di apprendimento, e non è immessa tutto ad un tratto dall’esterno come invece avviene per i computer tradizionali; - la forza delle connessioni fra neuroni, conosciuta anche come peso sinaptico, è utilizzata per immagazzinare la conoscenza e per l’apprendimento. La ricerca nel campo della intelligenza artificiale si è indirizzata verso l’imitazione del sistema nervoso, ritenendo che fosse questo il modello più valido di funzionamento, operando su due versanti complementari: - da una parte, cercando di costruire macchine informatiche simili al cervello umano, nella speranza che avrebbero avuto potenzialità superiori alle macchine attuali; - dall’altra, nell’utilizzare modelli di programmazione e di ragionamento simili a quelli umani, ma facendoli funzionare sulle attuali macchine informatiche. E’ importante sottolineare che la caratteristica fondamentale e più interessante delle reti neurali, a differenza dei normali computer (che vengono “programmati” per determinati compiti), è che non devono essere programmate, ma semplicemente apprendono dall’esperienza, così come il cervello umano. I tipi di rete neurale artificiale sono molti e, considerate le varianti che ognuno può avere, abbiamo una panoramica di centinaia di tipi diversi (Peretto, 1992); in somma sintesi, da una parte vi sono le reti ad apprendimento supervisionato, che necessitano di un “istruttore” per poter apprendere, dall’altra quelle ad apprendimento non supervisionato. All’interno di queste due grandi classi le reti variano sia per architettura che per algoritimi di funzionamento per il calcolo dei pesi sinaptici corretti; ulteriori variazioni sono date da altri aspetti quali l’inizializzazione dei pesi sinaptici, le possibilità di variazione nel tempo in presenza di input costanti, ed altri parametri. L’uso di uno o l’altro tipo di rete dipende dal particolare problema sul quale vogliamo applicare la rete e, purtroppo, anche dalla maggiore o minore disponibilità di software di rete neurale5. Per una applicazione pratica come la previsione delle presenze turistiche si è ritenuto opportuno utilizzare una rete del tipo multi-layer perceptron (MLP), rete ad apprendimento supervisionato, in quanto: - è il tipo di rete che è stato più a lungo studiato e quindi più conosciuto, anche per quanto concerne la calibrazione dei vari elementi della rete6, e dunque il tipo di rete che può fornire risultati maggiormente attendibili, almeno allo stato attuale di studio delle reti neurali artificiali; - la rete MLP è una tipologia di rete meno critica di altre reti neurali artificiali (come per esempio la rete RBF7 che pure ha la stessa architettura), che consente valide generalizzazioni dei fenomeni a partire da input non perfettamente determinati; in particolare è in grado di fornire output corretti anche quando vengono presentati in input, insieme alle variabili veramente significative per il particolare fenomeno, altre variabili non significative. Inoltre, un po’ come tutte le - 5 In via teorica dovremmo, in base al problema da studiare, scegliere il tipo di rete neurale da utilizzare; nella realtà quasi tutti i ricercatori si riducono ad utilizzare un particolare tipo di rete in considerazione della disponibilità dello stesso sul mercato del software. 6 Nel caso della rete MLP: numero neuroni, architettura, pesi sinaptici iniziali, tasso di apprendimento, funzioni di output utilizzate, ecc.). 7 RBF sta per radial basis function, in quanto questa rete utilizza una funzione a base radiale per calcolare il segnale di uscita dei neuroni. reti neurali, accetta input corrotti da “rumore”8 senza modificare sensibilmente il proprio comportamento riguardo all’output (quando invece altri metodi, come quelli statistici, condurrebbero ad errori fatali per la previsione); - è il tipo di rete più facilmente implementato in software di simulazione ANN già disponibili sul mercato, anche con licenza freeware o shareware9, oppure messo a disposizione gratuitamente da Istituti Universitari; - le reti MLP possono essere considerate ottimi approssimatori universali di funzioni non lineari, con una serie di indiscutibili vantaggi rispetto ad altri metodi, in quanto: • consentono la presentazione contemporanea di input diversi per campo di variazione (per esempio: sia quantità rappresentate da un numero reale, come potrebbero essere dati macro-economici, come il PIL, sia valori di SI/NO rappresentati da 1 e 0, come le risposte ad alcune batterie di domande); • consentono di non doversi preoccupare dello specifico modello di funzionamento che utilizzeranno per l’approssimazione (sono una sorta di black box). Vanno precisati alcuni aspetti che riguardano in generale il fenomeno da studiare utilizzando una rete neurale artificiale MLP: - è necessario che per lo specifico problema siano disponibili serie di dati abbastanza lunghe (normalmente serie temporali), corredate dai rispettivi output, in modo da poter procedere sia all’addestramento della rete, sia al test della stessa utilizzando gli ultimi dati (input e relativi output), al fine di verificarne l’efficienza10 prima dell’uso in sede previsionale; - il problema studiato non deve aver subito modificazioni sostanziali né nel numero delle variabili di input, né nel funzionamento complessivo; per fare un esempio, se si decidesse di effettuare una predizione di risultati elettorali, facendo analizzare alla rete neurale i risultati delle elezioni precedenti, occorrerebbe che il sistema elettorale non si fosse, nel frattempo, modificato da proporzionale a maggioritario; - vanno individuate, utilizzando eventualmente altri studi già compiuti sullo stesso argomento, le variabili di input “chiave” per la specifica problematica; per fortuna l’utilizzazione di una rete neurale consente di utilizzare più variabili rispetto a quelle effettivamente significative, senza per questo inficiare il funzionamento della rete (che semplicemente, “ignorerà” le variabili che non sono significative). Oggigiorno le reti neurali artificiali sono utilizzate in svariate applicazioni pratiche, per lo più in ambito finanziario (per prevedere l’evoluzione dei titoli di borsa), industriale (come nel riconoscimento di pattern, nel controllo di processi), o anche 8 “Rumore” in questo senso si ha quando le misurazioni dei valori di una variabile sono disturbate da un’altra variabile, peraltro non influente sul fenomeno. 9 Per licenze freeware si intende la possibilità di utilizzare gratuitamente un software inviando un contributo libero all’autore; per licenze shareware si intende la possibilità di utilizzare gratuitamente un software per un periodo limitato, dopo di che si dovrà pagare il costo della licenza d’uso. 10 Questo in quanto in questa sede si vuole semplicemente verificare la funzionalità di una rete neurale artificiale per lo studio dei fenomeni sociali partendo da dati già disponibili, altrimenti si possono ipotizzare rilevazioni e campionamenti ad hoc per qualsiasi tipo di problema. casalingo (nel riconoscimento vocale utilizzato dai telefoni cellulari, nel riconoscimento dei caratteri utilizzato dagli scanner); al momento sono invece ancora molto limitate le applicazioni su fenomeni sociali. 3. Come utilizzare le reti neurali per la previsione di fenomeni sociali Il fenomeno dell’afflusso turistico su una determinata zona, qui utilizzato come esempio, fa indubbiamente parte dell’insieme più generale dei fenomeni sociali; ci si deve quindi chiedere quali siano i vantaggi nell’utilizzare una rete neurale artificiale rispetto ad altri metodi previsionali come, per esempio, quelli statistici. Gli indiscutibili vantaggi che una rete neurale artificiale fornisce rispetto agli ordinari metodi di previsione sono i seguenti: - è possibile operare previsioni efficienti anche nel caso di mancanza di una variabile di input. La rete tollera la mancanza di alcuni dati essenziali; - è possibile inserire fra le variabili di input anche variabili che non hanno influenza sul fenomeno in esame. La rete provvederà da sola a non prendere in esame, o a prenderle in esame nella misura dovuta, le variabili di input che non hanno influenza o che hanno influenza limitata sul fenomeno. Grazie a questo è possibile, in caso di dubbio sull’importanza o meno di una determinata variabile per il fenomeno che viene considerato, fornire comunque alla rete anche i dati corrispondenti alla variabile dubbia, senza per questo avere previsioni scorrette; - non sono necessarie conoscenze matematiche particolarmente approfondite; tutto quello che è necessario, oltre alla padronanza della tematica delle reti neurali artificiali, è un po’ di attenzione nella costruzione della rete (individuazione del tipo, dell’architettura, del numero dei nodi) e quindi molta pazienza nell’ottimizzare i parametri di lavoro della rete rispetto allo specifico fenomeno. Sicuramente una rete MLP (multi-layer perceptron) è quella che più si avvicina ai consueti sistemi previsionali basati su metodi statistici e dunque è quella che si presta maggiormente all’utilizzo da parte di chi compia studi e ricerche su fenomeni sociali. Per utilizzare una rete MLP è necessario essere in possesso di una serie abbastanza corposa di dati in input, correlati con i rispettivi output; tanto per fornire un criterio pratico, per seguire l’evoluzione di fenomeni che abbiano avuto una rilevazione su base annua, si può dire che è necessario avere almeno una serie storica di dieci anni al fine di poter ottenere una valida descrizione (in termini di accoppiamenti input / output) del fenomeno, così come per ottenere una previsione corretta. Lo studio di un fenomeno sociale tramite una rete neurale artificiale si conduce effettuando, dopo la fase di apprendimento, più fasi di previsione, modificando le variabili di input ed osservando la corrispondente variazione delle variabili di output; in questo senso si può dire che la rete neurale artificiale costituisce un modello del fenomeno sociale. In via generale, per studiare un fenomeno sociale tramite una rete neurale artificiale, al fine di poter ottenere previsioni utili per la pianificazione strategica di politiche pubbliche, ammesso che il fenomeno sia rappresentato da variabili di input ed output, si devono compiere i seguenti passi: - individuazione delle variabili di input che hanno una qualche influenza sul fenomeno in studio; in questa fase possono essere individuate anche variabili per le quali non siamo certi della reale influenza sul fenomeno. In parole povere è meglio inserire fra le variabili di input qualche variabile in più che in meno; - individuazione delle variabili di output che descrivono il fenomeno considerato; - reperimento delle serie di valori correlati input/output riferiti alle variabili di cui sopra. La serie deve essere costituita da almeno dieci set di valori perché la rete neurale artificiale possa procedere al corretto apprendimento; - prima strutturazione della rete MLP in termini di numero dei neuroni di input (che corrispondono alle variabili di input), di output (che corrispondono alle variabili di output), nascosti. In via molto generale, è da tenere presente che aumentando il numero di nodi nascosti la rete neurale artificiale aumenterà le propria precisione rispetto ai dati presentati, ma diminuirà la propria facoltà di generalizzazione a valori che non rispettano il trend precedente. All’opposto diminuendo i nodi nascosti si aumenteranno le facoltà di generalizzazione a nuovi valori, ma si diminuirà la precisione; - normalizzazione di tutti i valori delle variabili affinché possano essere trattati dalla rete neurale artificiale. Questa operazione si compie facendo una proporzione fra il range di ogni variabile (intendendo per range la differenza fra il massimo ed il minimo raggiungibili dalla variabile in considerazione e non il minimo ed il massimo attuali) ed i valori 1 e 0. Esistono metodi diversi per effettuare questa operazione, ognuno dei quali ha influenza sul funzionamento della rete neurale; - apprendimento iniziale della rete neurale utilizzando tutti i valori input/output, meno un set di valori, che servirà per la fase di test. Se si hanno a disposizioni serie di dati molto lunghe si può utilizzare in fase di test anche due o tre set, prima della previsione reale. Alla rete come strutturata in prima istanza verranno dunque presentati i valori (normalizzati) di input e di output, verificando se dopo la fase di apprendimento (che dovrebbe durare per almeno 10.000 epoche11) la rete abbia appreso correttamente. La verifica verrà compiuta per la prima volta semplicemente sui valori già presentati durante l’apprendimento; in pratica si verificherà che la rete sia effettivamente un buon approssimatore della funzione che descrive la serie di dati presentata nell’apprendimento. Se in fase di test (con gli stessi valori presentati) la rete funzionerà abbastanza correttamente (e dunque sarà un buon approssimatore della funzione descrittrice del fenomeno), si effettuerà una fase di test con i valori lasciati fuori dall’apprendimento e si verificherà che la rete compia una previsione abbastanza accurata rispetto a tali valori. Durante questa prima fase 11 Per “epoca” si intende la presentazione di una intera serie di valori di input corredati dei relativi output. l’errore (come differenza fra i dati reali e quelli prodotti in fase di funzionamento dalla rete neurale) potrà essere anche notevole. Quello che comunque interessa è che tendenzialmente la rete riesca ad effettuare una previsione; - ottimizzazione dei parametri di apprendimento (in particolare: tasso di apprendimento e momento), tenendo sempre sotto controllo la progressiva discesa dell’errore nel momento dell’apprendimento ed utilizzando questo per ottimizzare i vari parametri (che sono: tasso di apprendimento, pesi sinaptici iniziali, modalità di presentazione dei dati alla rete – sequenziale o random, ecc. ecc.); - varazione del numero dei neuroni nascosti, dapprima aumentandolo, e rifacendo una serie di prove modificando i parametri come prima, quindi diminuendolo, in modo da individuare il numero di neuroni nascosti ottimale per quel determinato problema; - effettuazione di prove utilizzando minimi e massimi diversi; in particolare se alcuni dei dati futuri (al momento purtroppo non conosciuti) fossero fuori tendenza le previsioni della rete potrebbero essere non corrette se la normalizzazione non avesse tenuto conto dei minimi e massimi possibili di questi valori fuori tendenza; - nuovo addestramento aumentando le epoche necessarie per l’addestramento, portandole fino a valori di 108, provando i vari algoritmi di propagazione dell’errore, individuando il migliore algoritmo di propagazione dell’errore fra quelli a disposizione con il particolare software (all’inizio può convenire utilizzare il più semplice); A questo punto la rete si trova nella configurazione migliore per procedere alle previsioni richieste. La metodologia di lavoro con una rete neurale può risultare più chiara riferendosi alla figura 5. 4. La previsione delle presenze turistiche su una determinata zona E’ già stato detto che la tematica della previsione delle presenze turistiche ha una grandissima importanza pratica per molte agenzie pubbliche (Province, Aziende Provinciali di Turismo, Istituti Provinciali di Statistica, Comuni, Associazioni Pro-Loco, Associazioni turistiche); il turismo è infatti una importantissima risorsa economica per determinate zone del nostro paese, una risorsa che può essere sfruttata al meglio solamente con accurate previsioni sugli arrivi e sulle presenze12. Tali previsioni sono necessarie per vari motivi, fra i quali: - le camere di albergo che rimangono vuote non sono beni traslabili su altri mercati, come invece è possibile fare per altri beni quando rimangono invenduti. Esse vanno dunque sfruttate al meglio calibrandone il prezzo in base anche alle previsioni della domanda; 12 Complessivamente gli arrivi e le presenze vengono denominati con il termine generico “afflussi turistici“. la calibrazione dei prezzi degli alberghi non può avvenire all’ultimo momento. I prezzi della ricettività alberghiera devono essere individuati molto prima dell’inizio stagione, in quanto devono essere pubblicizzati con un anticipo che talvolta può essere anche di sei mesi. Inoltre siccome è proprio tale pubblicità che influenza le scelte dei turisti, gli eventuali aggiustamenti dei prezzi effettuati dopo l’inizio stagione o immediatamente prima della stessa, non sarebbero in grado di modificare le scelte dei turisti stessi (cosa che invece ha minore influenza su luoghi turistici senza “stagioni”, come le città d’arte); - è possibile, sia per gli imprenditori privati, che per le aziende pubbliche, evitare spese inutili se si conosce preventivamente l’afflusso da un determinato paese straniero. Si pensi solo alla stampa di brochure in una particolare lingua; i rischi sono due: da una parte di stampare poche brochure, scontentando chi poi ne avesse necessità, dall’altra di stamparne troppe, con uno spreco di denaro che potrebbe invece essere investito in altre attività di marketing; - analogo discorso può essere fatto per le previsioni degli approvvigionamenti, così come per le assunzioni temporanee per la stagione turistica, che devono essere calibrate in relazione alle presenze previste; - le attività di marketing, effettuate sia dai singoli esercizi, che dalle agenzie pubbliche o semi-pubbliche che si occupano di turismo, hanno necessità di essere orientate adeguatamente proprio dalle previsioni di afflusso; - infine la corretta previsione dei flussi turistici di arrivo e delle presenze può aiutare le autorità locali nella predisposizione di adeguate attività di supporto al turismo, come l’organizzazione del sistema di trasporto, l’organizzazione delle manifestazioni artistiche e culturali e tutte le altre attività connesse. In definitiva, l’importanza di previsioni precise in questo campo è basilare, e riconosciuta come tale sia dai ricercatori che da attori politici (Sheldon, Var, 1985); l’accuratezza delle previsioni degli arrivi e delle presenze turistiche, oltre che aiutare i manager del settore turistico nelle loro decisioni strategiche e nella pianificazione operativa, fornisce un utile strumento conoscitivo agli investitori del settore. Purtroppo, malgrado il valore di questo tipo di previsioni sia unanimemente riconosciuto, non esistono al momento né procedure standard, né modelli previsionali che possano dirsi superiori per accuratezza ad altri; quasi tutti gli studi sulla previsione della domanda di turismo sono basati su metodi statistici che utilizzano serie storiche di variabili significative, per prevedere i valori futuri delle variabili stesse, oppure per effettuare la previsione diretta di arrivi e presenze, o di altre variabili a queste correlate, come la spesa per turismo in una determinata zona. Questi modelli presentano tutti il difetto che qualora non si riesca ad individuare correttamente le variabili chiave, si rischia di ottenere risultati fortemente discosti dalla realtà; inoltre tali modelli non hanno alcuna tolleranza rispetto a variabili indipendenti imprecise o affette da “rumore”. Lo studio qui riportato come esempio è stato rivolto alla previsione degli afflussi turistici, intesi in termini di presenze, sulla Provincia di Bolzano; è stata scelta questa particolare area per la disponibilità dell’Ufficio Statistiche Economiche dell’Istituto Provinciale di Statistica della Provincia Autonoma di Bolzano (Amt für Wirtschaftsstatistik - Landesinstitut für Statistik – ASTAT), che ha messo a disposizione i dati necessari per lo studio. - Va preliminarmente osservato come gli afflussi turistici sulla Provincia di Bolzano siano limitati solamente ad alcuni paesi europei quali (oltre chiaramente l’Italia), l’Austria, la Germania, la Svizzera, e pochissimi altri. In questo articolo è stato considerato, per semplicità di illustrazione, un solo paese di provenienza dell’afflusso turistico, l’Austria. E’ comunque possibile procedere con grande facilità alle previsioni per qualsiasi altro paese di provenienza dell’afflusso, in quanto il modello non cambia. Lo studio in questione è stato condotto come segue: - dapprima si è ricercata la migliore architettura di rete neurale artificiale per lo specifico problema, migliore in quanto ad architettura, connessioni, algoritmi e parametri; - successivamente, individuata la miglior configurazione di rete neurale artificiale per il problema speficico, si è utilizzato questo tipo di rete neurale artificiale per prevedere l’afflusso di turisti austriaci nella provincia di Bolzano. Questa parte è stata condotta utilizzando sia i dati messi specificamente a disposizione dall’Istituto di Statistica della Provincia di Bolzano, sia dati provenienti dalla Unione Europea. Per la simulazione è stata utilizzata una rete MLP (multi-layer-perceptron) con una serie di neuroni di input per le variabili chiave del fenomeno in studio, una serie di neuroni nascosti, ed un solo neurone di output per fornire direttamente il numero delle presenze straniere per l’anno richiesto. Le variabili di input normalmente utilizzate dai ricercatori che utilizzano modelli previsionali econometrici per previsioni di afflusso turistico, sono: - la popolazione della nazione di origine del flusso turistico; - il reddito della nazione di origine del flusso turistico; - il costo della vita della nazione (o della zona) di destinazione del flusso turistico; - il tasso di cambio (moneta straniera / moneta locale); - la spesa in marketing per attività promozionali nella zona di destinazione; - i prezzi dei servizi turistici nella nazione (o nella zona) di destinazione del flusso turistico (Lim, 1997); - i costi di trasporto nella nazione di destinazione, costi che peraltro è già stato riconosciuto (Qu, Lam, 1997) non essere la variabile maggiormente determinante nella domanda turistica. Nella presente applicazione pratica alcune variabili sono state sostituite da altre, considerate maggiormente significative per il fenomeno studiato. Dato che sia l’Italia che l’Austria utilizzano ormai come moneta l’euro, il tasso di cambio è stato sostituito dal rapporto fra il costo della vita nei due paesi, variabile che mantiene invece una certa significatività. Nel nostro esempio si sono individuate come segue le variabili di input relative ad ogni anno (su una serie temporale): - popolazione dell’Austria; - spesa pro-capite annua abitanti Austria; - costo medio degli alberghi nella Provincia di Bolzano; - rapporto fra costo della vita in Austria e nella Provincia di Bolzano. Mentre i dati del costo medio degli alberghi e le presenze turistiche del passato (necessarie per l’apprendimento ed il test della rete) sono stati resi disponibili direttamente dall’Istituto Provinciale di Statistica della Provincia di Bolzano, gli altri sono stati reperiti presso gli organismi preposti dell’Unione Europea. L’architettura della rete utilizzata per la previsione è stata quindi quella in figura 6 (4 nodi di input, 1 nodo di output, 10 nodi nascosti), con i parametri di cui alla figura 7, mentre i dati forniti alla rete sono stati ricavati dalla tabella in figura 8, dati che una volta normalizzati, sono risultati essere quelli riportati nella figura 9. Dobbiamo specificare che per “normalizzazione” intendiamo l’operazione che serve a far rientrare tutti i dati che la rete dovrà utilizzare, mantenendo le opportune proporzioni fra loro, in un range compreso fra 0 ed 1, in modo da poter essere trattati in modo corretto dalla rete neurale13. Chiaramente una volta ottenuto il dato in uscita, che sarà un valore compreso fra 0 ed 1, si dovrà compiere l’operazione inversa per recuperare un dato dimensionalmente corretto. Per compiere questa operazione si deve aver riguardo non tanto al valore massimo dei dati da sottoporre alla rete, quanto al valore massimo fra dati di input e dati di output presentati per l’addestramento e valori massimi possibili di input ed output. La rete è stata quindi addestrata con i parametri che si possono osservare nella figura 10 (learning rate = 0.05, momento = 0.01, cross-entropy come algoritmo di propagazione dell’errore, seed=32.000, training sequenziale, 100.000.000 di epoche di presentazione dei dati); è visibile in figura 11 l’ottima curva di discesa dell’errore ottenuta grazie ai parametri anzidetti. L’addestramento è stato condotto senza utilizzare l’ultimo dato disponibile (il 2003), che è stato invece utilizzato per il test della rete, che complessivamente ha fornito i valori indicati in figura 12. E’ possibile vedere dalla tabella in figura 12 come la rete neurale abbia manifestato buone qualità previsionali; successivamente si è ripetuto l’esperimento utilizzando anche l’anno 2003 per l’addestramento. Dopo una serie di prove, effettuate incrementando anche il numero delle epoche di presentazione dei dati, e l’ultima delle quali condotta con i parametri mostrati nelle figure 13 e 14, si sono ottenuti i valori riportati in figura 15. Questi valori sono stati riportati nella tabella in figura 16 per confrontarli con le presenze reali e quelle previste dalla rete che non usa il 2003 per l’addestramento. Dalla tabella si può osservare come i valori previsti dalla rete siano abbastanza vicini (in alcuni casi addirittura uguali) ai valori reali. La rete così addestrata è stata quindi utilizzata per effettuare la previsione relativa agli afflussi turistici (presenze) provenienti dall’Austria per l’anno 2004, dato che ancora non era disponibile al momento della previsione. I dati forniti in input alla rete sono stati quelli della tabella in figura 17 (con i prezzi espressi, al fine di poterli correlare ai dati del passato), in Lire italiane. 13 La rete neurale lavora su dati numerici compresi fra 0 ed 1; pertanto è sempre necessario riportare ogni dato in questo range, e successivamente all’elaborazione compiere il lavoro opposto. Con tali dati la rete ha previsto un totale di 653.637 presenze per l’anno 2004, come riportato nella tabella in figura 18 (insieme ai valori normalizzati), numero molto vicino alle presenze reali fornite successivamente dall’Istituto Provinciale di Statistica della Provincia di Bolzano, di 658.698. Va osservato come il dato delle presenze turistiche previsto dalla rete neurale artificiale sia notevolmente vicino al dato reale (con un errore del 7 per mille). Grazie a questo risultato possiamo concludere che la rete neurale è sicuramente un valido strumento di previsione relativamente agli afflussi turistici, strumento che può essere di grande ausilio ai manager che debbano prendere decisioni in questo settore. 5. L’utilità delle reti neurali artificiali per la pianificazione ed il decision making nelle aziende pubbliche Le reti neurali artificiali, oltre ad essere un concreto ausilio per la pianificazione degli aspetti concernenti il turismo, possono essere utilizzate per supportare la pianificazione ed il decision making all’interno delle aziende pubbliche, relativamente ad una serie di tematiche molto varie, quali: - le valutazioni relative alla vulnerabilità alle sostanze stupefacenti da parte di determinate fasce della popolazione giovanile. L’uso di una rete neurale artificiale può fornire un concreto ausilio nella individuazione dei fattori che aumentano la vulnerabilità dei giovani alle sostanze stupefacenti, consentendo di procedere a simulazioni che possono far comprendere, prima di attuarla, la validità di questa o quella determinata scelta politica (Speri et al., 1999); - la valutazione dei trattamenti terapeutici sulla popolazione giovanile con problemi di tossicodipendenza. In questo caso il vantaggio dell’uso di una rete neurale artificiale sta nel riuscire ad analizzare tutti quegli elementi che intervengono nel successo di un trattamento terapeutico di recupero, quali l’identità del soggetto (sesso, classe di età, educazione, religione, ecc.), il curriculum della tossicodipendenza (qual è stata la prima droga leggera assunta, quale la prima pesante, durata di utilizzo delle sostanze, possibile passato criminale, ecc.), lo stato di salute mentale (tentativi di suicidio, problemi fisici, problemi di salute mentale nella famiglia, ecc.). In questo modo chi è preposto alle decisioni può individuare le metodiche che possano ottenere discrete aspettative di successo (Massini, 1999); - la previsione della sicurezza di una determinata zona di una città, con l’elaborazione di “mappe” delle probabilità di incremento o decremento di determinati reati. Una rete neurale artificiale, utilizzando i dati storici relativi a variabili inerenti la sicurezza (dati sia geografici che numerici) raccolti dalle varie agenzie interessate, può fornire una mappa della sicurezza futura della zona, fornendo contemporaneamente un modello che può indicare quali fattori occorre modificare per ottenere un miglioramento della sicurezza stessa; - la previsione di flussi di traffico e di mobilità verso una determinata zona di una città. Partendo da una serie di dati in input, quali presenza di attività economiche, industriali, commerciali, di servizio, ed altre, è possibile per una rete neurale artificiale addestrata con tali dati, operare una previsione dei flussi di traffico futuri, eventualmente precisata per fasce orarie. La stessa rete neurale può fornire scenari di mobilità simulata in funzione delle possibili modificazioni di determinati valori, andando quindi a costituire una base per il decision making in materia di mobilità cittadina; - l’analisi e le previsioni relative al mercato del lavoro in una zona determinata. Utilizzando una serie di dati socioeconomici relativi ad una determinata area, è possibile per una rete neurale artificiale prevedere l’evoluzione del mercato del lavoro nell’area stessa, individuando quali saranno i settori economici trainanti e quali quelli penalizzati, conferendo ai decisori politici un concreto supporto per l’individuazione delle azioni da intraprendere; - la previsione dei risultati elettorali. A partire da una serie di dati in input, ottenuti quali risposta a determinate domande concernenti la politica del governo attualmente in corso, è possibile prevedere, grazie ad una rete neurale artificiale, l’esito delle successive elezioni, in termini di permanenza del governo in carica, oppure di presa di potere dell’opposizione (Borisyuk et al., 2001); - la previsione della possibilità di conflitto fra due o più stati. A partire da una serie di dati in input, fra i quali indicatori economici di vario tipo, indicatori sociali, indicatori di stabilità politica, è possibile per una rete neurale artificiale, fornire un modello revisionale sulla possibilità che avvenga un conflitto (dove per conflitto non si intende necessariamente una guerra aperta) fra due nazioni (Lagazio, Russett, 2003); - il supporto dell’azione formativa ai fini dell’individuazione di percorsi formativi ad hoc per determinati soggetti. Grazie ad una rete neurale artificiale è possibile analizzare a fondo i fattori di dispersione scolastica riconducibili a determinate situazioni di contesto familiare, a situazioni soggettive, a situazioni di contesto socio-economico, a situazioni di contesto scolastico, fornendo un modello che può adeguatamente supportare le decisioni strategiche delle istituzioni preposte (Carbone V., Piras G., 1999); - l’esplorazione di assetti urbani vincenti in ambito europeo. Con riferimento a modelli di città ecologica, città tecnologica, città con minimi costi socio-economici, città con massimi costi socio-economici, una rete neurale artificiale può elaborare un modello che lega l’influenza di determinati investimenti alla evoluzione di un determinato modello di città, in questo modo fornendo un supporto alla fase di pianificazione urbanistica. Generalmente una rete neurale artificiale appositamente addestrata è in grado di fornire un modello di qualsiasi fenomeno sociale, ottenendo previsioni ben più accurate dei metodi statistici, in quanto è in grado di lavorare su variabili non lineari. E’ grazie a questo aspetto che le reti neurali artificiali possono essere un validissimo supporto per le decisioni in tutti quegli ambiti nei quali non è possibile utilizzare altre metodologie, ovvero in quegli ambiti nei quali le metodologie attualmente in uso non consentono una grande precisione. 6. Conclusioni Nell’articolo si è dimostrato come le reti neurali artificiali siano in grado di effettuare precisioni accuratissime dell’afflusso turistico, mostrando poi come possano essere utilizzate, in via generale, per lo studio e la previsione di fenomeni sociali, e quindi come concreto supporto nella pianificazione strategica delle politiche pubbliche e al decision making. La caratteristica più interessante delle reti neurali artificiali è senza dubbio che esse apprendono dalla propria esperienza, per cui sono in grado di individuare autonomamente il modello di funzionamento di un determinato fenomeno, effettuando previsioni e fornendo la spiegazione di come le variabili indipendenti siano legate a quelle dipendenti. Purtroppo le reti neurali artificiali vengono guardate a volte solo come un mero tentativo di replicare il cervello umano ed il suo funzionamento, per cui vi sono una serie di pregiudizi da parte dei ricercatori per l’utilizzo di questa metodologia innovativa; il pregiudizio nasce probabilmente, oltre che da una scarsa conoscenza dell’argomento, dal fatto che la tematica delle reti neurali artificiali apre la strada a domande imbarazzanti sulla mente e la coscienza, domande per le quali allo stato attuale non vi è risposta, o le risposte sono inquietanti. Al momento attuale, per chi si occupa di fenomeni sociali, le reti neurali artificiali devono essere viste essenzialmente come una metodologia di lavoro innovativa, che in determinati casi può essere molto più proficua di altre; esse possono essere considerate un diverso modo di organizzazione della computazione che è ancora ancorata al metodo algoritmico e, quando effettuata con il computer, è condizionata dalla architettura cosiddetta Von Neumann14. Ma la metodologia non serve assolutamente a niente se non si hanno a disposizione dei dati sui quali lavorare; qualsiasi rete neurale artificiale infatti, alla pari di altri metodi, non potrà effettuare alcuna valutazione e previsione se non si hanno i dati relativi al fenomeno da studiare. L’auspicio è dunque che le reti neurali artificiali vengano utilizzate sempre più nella ricerca sociale, per la previsione di fenomeni complessi, nel supporto alla pianificazione delle aziende pubbliche, senza scordarsi che essendo un metodo di elaborazione della conoscenza esse formuleranno previsioni corrette solo in presenza di dati certi; qualora mancasse questo presupposto sconfineremmo nella magia. Riferimenti bibliografici BORISYUK R., BORISYUK G., RALLINGS C., THRASHER M., (2001), Forecasting the 2001 General Election Result: A Neural Network Approach, Plymouth, Centre for Neural and Adaptive System, University of Plymouth. CARBONE V., PIRAS G, (1999), “Orientamento e dispersione scolastica: le reti neurali artificiali come supporto dell’azione formativa”, in Buscema M. & Semeion Group (a cura di), Reti neurali artificiali e sistemi sociali complessi, Milano, Franco Angeli, pp. 170-199. LAGAZIO M., RUSSETT B., (2003), “A Neural Network Analysis of Militarized Disputes, 1885-1992: Temporal Stability and Causal Complexity”, in Paul Diehl, Toward a Scientific Understanding of War: Studies in Honor of J. David Singer, University of Nottingham and Yale University. LAW R., AU N., (1997), A neural network model to forecast Japanese demand for travel to Hong Kong, Tourism Management, 20, pp. 89-97. LIM, C., (1997), An econometric classification and review of international tourism demand models, Tourism Economics, 3(1), pp. 69-81. MASSINI G., (1999), “Uso di una rete constraint satisfaction per la valutazione del trattamento terapeutico”, in Buscema M. & Semeion Group (a cura di), Reti neurali artificiali e sistemi sociali complessi, Milano, Franco Angeli, pp. 96-118. MÜLLER B., REINHARDT J., (1990), Neural Networks: An Introduction, Springer-Verlag, Berlin 1990 P. PERETTO, (1992), An Introduction to the Modeling of Neural Networks, Cambridge, Aléa Saclay Cambridge University Press QU H., LAM S., (1997), A travel demand model for mainland Chinese tourists to Hong Kong, Tourism Management, 18(8), pp. 593-597. SHELDON, P. J., VAR, T., (1985), Tourism forecasting: A review of empirical research, Journal of Forecasting, 4(2), pp. 183-195. SPERI L., SCHILIRÒ G., BEZZETTO A., CIFELLI G., DE BATTISTI L., MARCHI S., MODENESE M., VARALTA F., CONSIGLIERE F., (1999), “Reti neurali artificiali nella valutazione della vulnerabilità da eroina in ambito militare”, in Buscema M. & Semeion Group (a cura di), Reti neurali artificiali e sistemi sociali complessi, Milano, Franco Angeli, pp. 15-39. Figura 1 Figura 2 Neurone al microscopio elettronico Figura 3 segnali di input segnale di output Figura 4 input layer middle layer (hidden layer) Una piccola rete neurale artificiale output layer individuazione variabili input/output Figura 5 ottenimento serie correlate input / output fra le variabili di input, in caso di dubbio, è possibile inserire variabili non influenti per un buon funzionamento della rete la serie dovrebbe avere almeno 10 / 15 valori correlati prima strutturazione rete MLP neuroni di input = variabili di input neuroni di output = variabili di output 2(variabili input) < neuroni nascosti < variabili input normalizzazione valori la normalizzazione si effettua tenendo conto non del minimo e massimo attuali, ma di quelli possibili fase di apprendimento (tutti i valori - 1, 2, ecc.) fase di test con i valori lasciati fuori modifica parametri di apprendimento variazione numero neuroni nascosti variazione normalizzazione la rete non generalizza bene (troppo specifica) la rete non è precisa (generalizza troppo) si diminuiscono i nodi nascosti si aumentano i nodi nascosti configurazione definitiva addestramento definitivo fase di test fase di lavoro per previsione: si forniscono input previsti per studio: si variano input reali Figura 6 Architettura di rete neurale utilizzata per la previsione sugli afflussi turistici Figura 7 Parametri relativi alla rete neurale utilizzata per la previsione sugli afflussi turistici Figura 8 anno popolazione Austria spesa complessiva annua Austria spesa procapite annua Austria costo medio alberghi Bolzano indice compenso compenso rapporto indice prezzi al prezzi al totale per totale per costo vita consumo consumo impiegato impiegato Austria Italia Austria Italia Austria Bolzano presenze annue da Austria 1990 7.677.900 77.500.000.000 10.094 48.304 75,20 85,60 25.540 19.470 0,5660 798315 1991 7.754.900 83.100.000.000 10.716 52.242 79,90 88,20 27.240 21.180 0,6369 819768 1992 7.840.700 89.400.000.000 11.402 57.108 83,80 91,30 28.890 22.400 0,7051 728462 1993 7.905.600 92.100.000.000 11.650 61.515 87,60 94,20 30.270 23.420 0,7623 689935 1994 7.936.100 97.700.000.000 12.311 68.921 91,30 96,70 31.500 24.130 0,8051 752391 1995 7.948.300 100.200.000.000 12.606 75.055 96,20 98,30 32.510 25.150 0,8355 838765 1996 7.959.000 105.600.000.000 13.268 83.513 100,00 100,00 32.840 26.680 0,8762 766527 1997 7.968.000 107.200.000.000 13.454 87.779 101,90 102,20 33.170 27.750 0,9232 609628 1998 7.976.800 109.200.000.000 13.690 89.911 103,90 102,00 33.950 27.320 0,9106 617758 1999 7.992.300 112.200.000.000 14.039 92.689 105,70 102,50 34.590 28.030 0,9402 615473 2000 8.011.600 119.500.000.000 14.916 96.813 108,40 104,50 35.230 28.890 0,9812 603931 2001 8.029.900 123.000.000.000 15.318 100.992 110,90 106,90 35.730 29.800 1,0263 628687 2002 8.053.100 124.300.000.000 15.435 106.278 113,80 108,80 36.350 30.560 1,0620 664231 2003 8.098.000 126.900.000.000 15.671 111.316 117,00 110,20 37.130 31.720 1,1093 651685 Dati di input utilizzati per l’addestramento della rete neurale artificiale Figura 9 Dati di input normalizzati utilizzati per l’addestramento della rete neurale artificiale Figura 10 Parametri di funzionamento della rete neurale artificiale Figura 11 Curva di discesa dell’errore durante l’apprendimento Figura 12 anno presenze presenze reali dalla ANN 1990 798315 1021281 1991 819768 1067181 1992 728462 870831 1993 689935 788381 1994 752391 922681 1995 838765 1107981 1996 766527 952431 1997 609628 615831 1998 617758 633681 1999 615473 628581 2000 603931 603931 2001 628687 656631 2002 664231 733131 2003 651685 619231 Presenze previste dalla rete neurale artificiale in fase di primo test Figura 13 Dati di addestramento normalizzati e parametri di architettura in fase finale Figura 14 Parametri di addestramento in fase finale Figura 15 Risultati definitivi (normalizzati) Figura 16 presenze dalla ANN presenze presenze che usa dalla ANN dalla ANN anche il che usa (val. presenze presenze 2003 (val. anche il REALI dalla ANN norm.) 2003 norm.) 0,7900 798315 798326 0,7900 798326 0,8770 819768 819734 0,8770 819734 0,5060 728462 728442 0,5060 728442 0,3500 689935 690055 0,3500 690055 0,6030 752391 752311 0,6030 752311 0,9540 838765 838681 0,9540 838681 0,6110 766527 754279 0,6610 766583 0,0230 609628 609591 0,0230 609591 0,0560 617758 617711 0,0560 617711 0,0470 615473 615496 0,0470 615496 0,0000 603931 603931 0,0000 603931 0,1010 628687 628784 0,1000 628538 0,2450 664231 664218 0,2450 664218 0,0470 651685 615496 0,1940 651668 Valori di presenza turistica previsti dalla rete neurale artificiale (con e senza l’ultimo anno) e confronto con i valori reali Figura 17 Anno Popolazione Austria Spesa procapite annua Austria 2004 8.129.400 16.114 Costo medio alberghi Bolzano 117.000 Rapporto costo vita Austria/Bolzano 1,0872 Valori di input utilizzati per la previsione da parte della rete neurale artificiale Figura 18 presenze dalla ANN che usa anche il presenze presenze 2003 dalla ANN presenze REALI dalla ANN (val. norm.) (val. norm.) 0,0030 653.637 604.669 0,2020 presenze dalla ANN che usa anche il 2003 653.637 Valore delle presenze turistiche previsto dalla rete neurale artificiale (ottenuto con e senza l’utilizzo del dato dell’anno precedente)