L`utilizzazione di una rete neurale artificiale per la

annuncio pubblicitario
L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche
Sergio Bedessi
dirigente del Comune di Montopoli in Val d’Arno, Castelfranco di Sotto, Santa Maria a Monte (PI)
L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche
(abstract)
Le reti neurali artificiali (ANN), il modello di elaborazione dell’informazione basato sul paradigma di funzionamento del cervello
umano, possono effettuare la previsione dei fenomeni sociali con un margine di precisione ben superiore rispetto ai metodi
statistici, arrivando addirittura ad essere l’unico metodo previsionale possibile per determinate tematiche.
Nell’articolo, dopo aver mostrato come sia possibile effettuare la previsione delle presenze turistiche su un’area determinata
(tematica di notevole interesse in paesi come l’Italia) grazie ad una rete neurale artificiale appositamente addestrata, viene
illustrato come le ANN possano essere utilizzate per effettuare previsioni e simulazioni in svariati altri campi di interesse
pubblico, andando così a costituire strumenti di grande utilità pratica per il supporto decisionale e la pianificazione strategica
all’interno delle aziende pubbliche.
(abstract)
Artificial neural networks (ANN’s) mimic the ways in which human brain process information and are superior to traditional
statistical methods in forecasting in social sciences. Sometimes they are the unique possible method to forecast some
particular phenomenon.
The objective of this paper is to show how an ANN is able to forecast demand for travel to a specific area (a very important
matter for some country like Italy) and generally how ANN’s can be used as a powerful forecasting tool in order to support
decision making and strategic planning in the public administration.
Parole chiave: reti neurali artificiali, metodi previsionali, ANN
L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche
Sommario: 1. Premessa – 2. Che cosa sono le reti neurali artificiali? – 3. Come utilizzare le reti neurali per la previsione di
fenomeni sociali – 4. La previsione delle presenze turistiche su una determinata zona – 5. L’utilità delle reti neurali artificiali per
la pianificazione ed il decision making nelle aziende pubbliche – 6. Conclusioni
1. Premessa
In questo articolo verrà mostrato come le reti neurali artificiali, il sistema di elaborazione dell’informazione basato sul
paradigma di funzionamento del cervello umano, possano essere di grande utilità pratica per il supporto decisionale e la
pianificazione strategica nelle aziende pubbliche.
Le reti neurali artificiali sono in grado infatti di effettuare previsioni nell’ambito dei fenomeni sociali, i fenomeni sui quali le
aziende pubbliche si trovano a lavorare, con un margine di precisione ben superiore rispetto ai metodi statistici, arrivando
talvolta ad essere l’unico metodo previsionale possibile per determinate tematiche.
Per dimostrare quanto asserito, verrà qui illustrato un esempio pratico, nel quale una rete neurale artificiale sarà utilizzata per
prevedere le presenze turistiche su una determinata area; la previsione delle presenze turistiche, oltre ad essere una tematica
di notevole interesse per paesi come l’Italia per i quali il turismo costituisce una importantissima risorsa economica, è proprio
una delle tematiche nelle quali i metodi tradizionali (in genere statistici) non sono in grado di effettuare previsioni accurate,
previsioni che sono invece indispensabili per una corretta programmazione strategica delle azioni che le varie agenzie
pubbliche che lavorano in questo ambito (Province, Aziende Provinciali di Turismo, Istituti Provinciali di Statistica, Comuni,
Associazioni Pro-Loco, Associazioni turistiche) portano avanti.
L’utilizzazione di una rete neurale artificiale per la previsione delle presenze turistiche, oltre a fornire previsioni molto
accurate1, consente di comprendere meglio il fenomeno studiato 2, con particolare riferimento a come le singole variabili
analizzate influiscono sul fenomeno stesso; in questo senso le reti neurali artificiali possono costituire un potente supporto al
decision making in ambito pubblico.
Al di là dell’esempio pratico, nell’articolo si elencano altre tematiche di ambito pubblico nelle quali le reti neurali artificiali
possono essere vantaggiosamente utilizzate, rivelandosi un metodo vincente ed altamente efficiente, utilizzabile con successo
nella fase di programmazione strategica delle politiche pubbliche.
1
2
Nel caso qui illustrato con un margine di precisione del 7 per mille.
Analizzando, a posteriori, i pesi sinaptici che connettono i vari neuroni della rete neurale artificiale.
2. Che cosa sono le reti neurali artificiali ?
Prima di parlare delle possibilità che una rete neurale artificiale può offrire per prevedere l’afflusso turistico, è necessaria una
brevissima introduzione alle reti neurali in generale; la tematica è molto complessa e pertanto verrà qui fornita una
spiegazione molto sintetica e limitata.
Per rete neurale artificiale (ANN – artificial neural network – nella letteratura in lingua inglese) si intende una replica
artificiale (hardware o simulata via software) delle reti neurali naturali, quelle biologiche (Müller, Reinhardt, 1990), cioè
dell’insieme delle cellule (i cosiddetti neuroni) che costituiscono il cervello umano o animale; gli studi hanno dimostrato che un
determinato tipo di reti neurali artificiali, quelle con apprendimento supervisionato, a differenza dei normali computer che
devono essere programmati con procedure algoritmiche, sono in grado di individuare la soluzione di problemi che vengono
loro posti, apprendendo direttamente dall’esperienza che accumulano presentando loro ripetutamente una serie di esempi del
problema da trattare, corredati delle relative soluzioni.
Esse simulano quindi il funzionamento del cervello umano e animale, che riesce a trovare la soluzione ai vari problemi
semplicemente basandosi sull’esperienza del passato.
Le reti neurali artificiali si inseriscono in qualche modo nell’ampia tematica dell’intelligenza artificiale e ne costituiscono
un’evoluzione innovativa; è innegabile che lo stimolo alla realizzazione delle reti neurali artificiali provenga dal desiderio di
riprodurre sistemi di elaborazione “intelligenti”, simili, per prestazioni e comportamento, all’uomo, le cui azioni sono governate
dal cervello.
Questo organo (figura 1) è costituito per la maggior parte da cellule, così come le altre parti del corpo umano, e
rispecchia in via generale la teoria cellulare di Rudolf Virchow; le cellule del cervello sono chiamate cellule nervose o neuroni.
Nella figura 2 è possibile vedere l’immagine di un singolo neurone al microscopio elettronico, mentre lo schema funzionale di
un generico neurone3 è quello riportato nella figura 3.
Le reti neurali artificiali replicano l’organizzazione del cervello umano, essendo costituite da molti processori semplici
(neuroni artificiali) interconnessi fra sé, come nella figura 4, che rappresenta una piccola rete neurale artificiale composta da 5
neuroni (2 di input, 2 nascosti, 1 di output).
Ogni neurone artificiale, in modo sostanzialmente simile ad un neurone biologico, calcola il segnale in uscita come
funzione4 della differenza fra il prodotto dei segnali di entrata per i rispettivi pesi sinaptici, ed un valore di soglia prefissato.
A livello complessivo le reti neurali artificiali ricordano nelle loro prerogative il cervello (umano o animale)
essenzialmente per due aspetti:
3
4
In realtà i neuroni non sono tutti uguali; nell’uomo esistono circa 50 tipi diversi di neurone.
La funzione può essere di vario tipo; la più utilizzata è la funzione sigmoide.
la conoscenza è acquisita attraverso un progressivo processo di apprendimento, e non è immessa tutto ad un tratto
dall’esterno come invece avviene per i computer tradizionali;
- la forza delle connessioni fra neuroni, conosciuta anche come peso sinaptico, è utilizzata per immagazzinare la
conoscenza e per l’apprendimento.
La ricerca nel campo della intelligenza artificiale si è indirizzata verso l’imitazione del sistema nervoso, ritenendo che fosse
questo il modello più valido di funzionamento, operando su due versanti complementari:
- da una parte, cercando di costruire macchine informatiche simili al cervello umano, nella speranza che avrebbero avuto
potenzialità superiori alle macchine attuali;
- dall’altra, nell’utilizzare modelli di programmazione e di ragionamento simili a quelli umani, ma facendoli funzionare
sulle attuali macchine informatiche.
E’ importante sottolineare che la caratteristica fondamentale e più interessante delle reti neurali, a differenza dei normali
computer (che vengono “programmati” per determinati compiti), è che non devono essere programmate, ma semplicemente
apprendono dall’esperienza, così come il cervello umano.
I tipi di rete neurale artificiale sono molti e, considerate le varianti che ognuno può avere, abbiamo una panoramica di
centinaia di tipi diversi (Peretto, 1992); in somma sintesi, da una parte vi sono le reti ad apprendimento supervisionato, che
necessitano di un “istruttore” per poter apprendere, dall’altra quelle ad apprendimento non supervisionato. All’interno di queste
due grandi classi le reti variano sia per architettura che per algoritimi di funzionamento per il calcolo dei pesi sinaptici corretti;
ulteriori variazioni sono date da altri aspetti quali l’inizializzazione dei pesi sinaptici, le possibilità di variazione nel tempo in
presenza di input costanti, ed altri parametri. L’uso di uno o l’altro tipo di rete dipende dal particolare problema sul quale
vogliamo applicare la rete e, purtroppo, anche dalla maggiore o minore disponibilità di software di rete neurale5.
Per una applicazione pratica come la previsione delle presenze turistiche si è ritenuto opportuno utilizzare una rete del
tipo multi-layer perceptron (MLP), rete ad apprendimento supervisionato, in quanto:
- è il tipo di rete che è stato più a lungo studiato e quindi più conosciuto, anche per quanto concerne la calibrazione dei
vari elementi della rete6, e dunque il tipo di rete che può fornire risultati maggiormente attendibili, almeno allo stato
attuale di studio delle reti neurali artificiali;
- la rete MLP è una tipologia di rete meno critica di altre reti neurali artificiali (come per esempio la rete RBF7 che pure ha
la stessa architettura), che consente valide generalizzazioni dei fenomeni a partire da input non perfettamente
determinati; in particolare è in grado di fornire output corretti anche quando vengono presentati in input, insieme alle
variabili veramente significative per il particolare fenomeno, altre variabili non significative. Inoltre, un po’ come tutte le
-
5
In via teorica dovremmo, in base al problema da studiare, scegliere il tipo di rete neurale da utilizzare; nella realtà quasi tutti i ricercatori si riducono ad
utilizzare un particolare tipo di rete in considerazione della disponibilità dello stesso sul mercato del software.
6
Nel caso della rete MLP: numero neuroni, architettura, pesi sinaptici iniziali, tasso di apprendimento, funzioni di output utilizzate, ecc.).
7
RBF sta per radial basis function, in quanto questa rete utilizza una funzione a base radiale per calcolare il segnale di uscita dei neuroni.
reti neurali, accetta input corrotti da “rumore”8 senza modificare sensibilmente il proprio comportamento riguardo
all’output (quando invece altri metodi, come quelli statistici, condurrebbero ad errori fatali per la previsione);
- è il tipo di rete più facilmente implementato in software di simulazione ANN già disponibili sul mercato, anche con
licenza freeware o shareware9, oppure messo a disposizione gratuitamente da Istituti Universitari;
- le reti MLP possono essere considerate ottimi approssimatori universali di funzioni non lineari, con una serie di
indiscutibili vantaggi rispetto ad altri metodi, in quanto:
• consentono la presentazione contemporanea di input diversi per campo di variazione (per esempio: sia quantità
rappresentate da un numero reale, come potrebbero essere dati macro-economici, come il PIL, sia valori di
SI/NO rappresentati da 1 e 0, come le risposte ad alcune batterie di domande);
• consentono di non doversi preoccupare dello specifico modello di funzionamento che utilizzeranno per
l’approssimazione (sono una sorta di black box).
Vanno precisati alcuni aspetti che riguardano in generale il fenomeno da studiare utilizzando una rete neurale artificiale MLP:
- è necessario che per lo specifico problema siano disponibili serie di dati abbastanza lunghe (normalmente serie
temporali), corredate dai rispettivi output, in modo da poter procedere sia all’addestramento della rete, sia al test della
stessa utilizzando gli ultimi dati (input e relativi output), al fine di verificarne l’efficienza10 prima dell’uso in sede
previsionale;
- il problema studiato non deve aver subito modificazioni sostanziali né nel numero delle variabili di input, né nel
funzionamento complessivo; per fare un esempio, se si decidesse di effettuare una predizione di risultati elettorali,
facendo analizzare alla rete neurale i risultati delle elezioni precedenti, occorrerebbe che il sistema elettorale non si
fosse, nel frattempo, modificato da proporzionale a maggioritario;
- vanno individuate, utilizzando eventualmente altri studi già compiuti sullo stesso argomento, le variabili di input “chiave”
per la specifica problematica; per fortuna l’utilizzazione di una rete neurale consente di utilizzare più variabili rispetto a
quelle effettivamente significative, senza per questo inficiare il funzionamento della rete (che semplicemente, “ignorerà”
le variabili che non sono significative).
Oggigiorno le reti neurali artificiali sono utilizzate in svariate applicazioni pratiche, per lo più in ambito finanziario (per
prevedere l’evoluzione dei titoli di borsa), industriale (come nel riconoscimento di pattern, nel controllo di processi), o anche
8
“Rumore” in questo senso si ha quando le misurazioni dei valori di una variabile sono disturbate da un’altra variabile, peraltro non influente sul
fenomeno.
9
Per licenze freeware si intende la possibilità di utilizzare gratuitamente un software inviando un contributo libero all’autore; per licenze shareware si
intende la possibilità di utilizzare gratuitamente un software per un periodo limitato, dopo di che si dovrà pagare il costo della licenza d’uso.
10
Questo in quanto in questa sede si vuole semplicemente verificare la funzionalità di una rete neurale artificiale per lo studio dei fenomeni sociali
partendo da dati già disponibili, altrimenti si possono ipotizzare rilevazioni e campionamenti ad hoc per qualsiasi tipo di problema.
casalingo (nel riconoscimento vocale utilizzato dai telefoni cellulari, nel riconoscimento dei caratteri utilizzato dagli scanner); al
momento sono invece ancora molto limitate le applicazioni su fenomeni sociali.
3. Come utilizzare le reti neurali per la previsione di fenomeni sociali
Il fenomeno dell’afflusso turistico su una determinata zona, qui utilizzato come esempio, fa indubbiamente parte
dell’insieme più generale dei fenomeni sociali; ci si deve quindi chiedere quali siano i vantaggi nell’utilizzare una rete neurale
artificiale rispetto ad altri metodi previsionali come, per esempio, quelli statistici.
Gli indiscutibili vantaggi che una rete neurale artificiale fornisce rispetto agli ordinari metodi di previsione sono i seguenti:
- è possibile operare previsioni efficienti anche nel caso di mancanza di una variabile di input. La rete tollera la mancanza
di alcuni dati essenziali;
- è possibile inserire fra le variabili di input anche variabili che non hanno influenza sul fenomeno in esame. La rete
provvederà da sola a non prendere in esame, o a prenderle in esame nella misura dovuta, le variabili di input che non
hanno influenza o che hanno influenza limitata sul fenomeno. Grazie a questo è possibile, in caso di dubbio
sull’importanza o meno di una determinata variabile per il fenomeno che viene considerato, fornire comunque alla rete
anche i dati corrispondenti alla variabile dubbia, senza per questo avere previsioni scorrette;
- non sono necessarie conoscenze matematiche particolarmente approfondite; tutto quello che è necessario, oltre alla
padronanza della tematica delle reti neurali artificiali, è un po’ di attenzione nella costruzione della rete (individuazione
del tipo, dell’architettura, del numero dei nodi) e quindi molta pazienza nell’ottimizzare i parametri di lavoro della rete
rispetto allo specifico fenomeno.
Sicuramente una rete MLP (multi-layer perceptron) è quella che più si avvicina ai consueti sistemi previsionali basati su metodi
statistici e dunque è quella che si presta maggiormente all’utilizzo da parte di chi compia studi e ricerche su fenomeni sociali.
Per utilizzare una rete MLP è necessario essere in possesso di una serie abbastanza corposa di dati in input, correlati
con i rispettivi output; tanto per fornire un criterio pratico, per seguire l’evoluzione di fenomeni che abbiano avuto una
rilevazione su base annua, si può dire che è necessario avere almeno una serie storica di dieci anni al fine di poter ottenere
una valida descrizione (in termini di accoppiamenti input / output) del fenomeno, così come per ottenere una previsione
corretta.
Lo studio di un fenomeno sociale tramite una rete neurale artificiale si conduce effettuando, dopo la fase di
apprendimento, più fasi di previsione, modificando le variabili di input ed osservando la corrispondente variazione delle
variabili di output; in questo senso si può dire che la rete neurale artificiale costituisce un modello del fenomeno sociale.
In via generale, per studiare un fenomeno sociale tramite una rete neurale artificiale, al fine di poter ottenere previsioni
utili per la pianificazione strategica di politiche pubbliche, ammesso che il fenomeno sia rappresentato da variabili di input ed
output, si devono compiere i seguenti passi:
- individuazione delle variabili di input che hanno una qualche influenza sul fenomeno in studio; in questa fase possono
essere individuate anche variabili per le quali non siamo certi della reale influenza sul fenomeno. In parole povere è
meglio inserire fra le variabili di input qualche variabile in più che in meno;
- individuazione delle variabili di output che descrivono il fenomeno considerato;
- reperimento delle serie di valori correlati input/output riferiti alle variabili di cui sopra. La serie deve essere costituita da
almeno dieci set di valori perché la rete neurale artificiale possa procedere al corretto apprendimento;
- prima strutturazione della rete MLP in termini di numero dei neuroni di input (che corrispondono alle variabili di input), di
output (che corrispondono alle variabili di output), nascosti. In via molto generale, è da tenere presente che
aumentando il numero di nodi nascosti la rete neurale artificiale aumenterà le propria precisione rispetto ai dati
presentati, ma diminuirà la propria facoltà di generalizzazione a valori che non rispettano il trend precedente.
All’opposto diminuendo i nodi nascosti si aumenteranno le facoltà di generalizzazione a nuovi valori, ma si diminuirà la
precisione;
- normalizzazione di tutti i valori delle variabili affinché possano essere trattati dalla rete neurale artificiale. Questa
operazione si compie facendo una proporzione fra il range di ogni variabile (intendendo per range la differenza fra il
massimo ed il minimo raggiungibili dalla variabile in considerazione e non il minimo ed il massimo attuali) ed i valori 1 e
0. Esistono metodi diversi per effettuare questa operazione, ognuno dei quali ha influenza sul funzionamento della rete
neurale;
- apprendimento iniziale della rete neurale utilizzando tutti i valori input/output, meno un set di valori, che servirà per la
fase di test. Se si hanno a disposizioni serie di dati molto lunghe si può utilizzare in fase di test anche due o tre set,
prima della previsione reale. Alla rete come strutturata in prima istanza verranno dunque presentati i valori
(normalizzati) di input e di output, verificando se dopo la fase di apprendimento (che dovrebbe durare per almeno
10.000 epoche11) la rete abbia appreso correttamente. La verifica verrà compiuta per la prima volta semplicemente sui
valori già presentati durante l’apprendimento; in pratica si verificherà che la rete sia effettivamente un buon
approssimatore della funzione che descrive la serie di dati presentata nell’apprendimento. Se in fase di test (con gli
stessi valori presentati) la rete funzionerà abbastanza correttamente (e dunque sarà un buon approssimatore della
funzione descrittrice del fenomeno), si effettuerà una fase di test con i valori lasciati fuori dall’apprendimento e si
verificherà che la rete compia una previsione abbastanza accurata rispetto a tali valori. Durante questa prima fase
11
Per “epoca” si intende la presentazione di una intera serie di valori di input corredati dei relativi output.
l’errore (come differenza fra i dati reali e quelli prodotti in fase di funzionamento dalla rete neurale) potrà essere anche
notevole. Quello che comunque interessa è che tendenzialmente la rete riesca ad effettuare una previsione;
- ottimizzazione dei parametri di apprendimento (in particolare: tasso di apprendimento e momento), tenendo sempre
sotto controllo la progressiva discesa dell’errore nel momento dell’apprendimento ed utilizzando questo per ottimizzare i
vari parametri (che sono: tasso di apprendimento, pesi sinaptici iniziali, modalità di presentazione dei dati alla rete –
sequenziale o random, ecc. ecc.);
- varazione del numero dei neuroni nascosti, dapprima aumentandolo, e rifacendo una serie di prove modificando i
parametri come prima, quindi diminuendolo, in modo da individuare il numero di neuroni nascosti ottimale per quel
determinato problema;
- effettuazione di prove utilizzando minimi e massimi diversi; in particolare se alcuni dei dati futuri (al momento purtroppo
non conosciuti) fossero fuori tendenza le previsioni della rete potrebbero essere non corrette se la normalizzazione non
avesse tenuto conto dei minimi e massimi possibili di questi valori fuori tendenza;
- nuovo addestramento aumentando le epoche necessarie per l’addestramento, portandole fino a valori di 108, provando
i vari algoritmi di propagazione dell’errore, individuando il migliore algoritmo di propagazione dell’errore fra quelli a
disposizione con il particolare software (all’inizio può convenire utilizzare il più semplice);
A questo punto la rete si trova nella configurazione migliore per procedere alle previsioni richieste.
La metodologia di lavoro con una rete neurale può risultare più chiara riferendosi alla figura 5.
4. La previsione delle presenze turistiche su una determinata zona
E’ già stato detto che la tematica della previsione delle presenze turistiche ha una grandissima importanza pratica per molte
agenzie pubbliche (Province, Aziende Provinciali di Turismo, Istituti Provinciali di Statistica, Comuni, Associazioni Pro-Loco,
Associazioni turistiche); il turismo è infatti una importantissima risorsa economica per determinate zone del nostro paese, una
risorsa che può essere sfruttata al meglio solamente con accurate previsioni sugli arrivi e sulle presenze12. Tali previsioni sono
necessarie per vari motivi, fra i quali:
- le camere di albergo che rimangono vuote non sono beni traslabili su altri mercati, come invece è possibile fare per altri
beni quando rimangono invenduti. Esse vanno dunque sfruttate al meglio calibrandone il prezzo in base anche alle
previsioni della domanda;
12
Complessivamente gli arrivi e le presenze vengono denominati con il termine generico “afflussi turistici“.
la calibrazione dei prezzi degli alberghi non può avvenire all’ultimo momento. I prezzi della ricettività alberghiera devono
essere individuati molto prima dell’inizio stagione, in quanto devono essere pubblicizzati con un anticipo che talvolta
può essere anche di sei mesi. Inoltre siccome è proprio tale pubblicità che influenza le scelte dei turisti, gli eventuali
aggiustamenti dei prezzi effettuati dopo l’inizio stagione o immediatamente prima della stessa, non sarebbero in grado
di modificare le scelte dei turisti stessi (cosa che invece ha minore influenza su luoghi turistici senza “stagioni”, come le
città d’arte);
- è possibile, sia per gli imprenditori privati, che per le aziende pubbliche, evitare spese inutili se si conosce
preventivamente l’afflusso da un determinato paese straniero. Si pensi solo alla stampa di brochure in una particolare
lingua; i rischi sono due: da una parte di stampare poche brochure, scontentando chi poi ne avesse necessità, dall’altra
di stamparne troppe, con uno spreco di denaro che potrebbe invece essere investito in altre attività di marketing;
- analogo discorso può essere fatto per le previsioni degli approvvigionamenti, così come per le assunzioni temporanee
per la stagione turistica, che devono essere calibrate in relazione alle presenze previste;
- le attività di marketing, effettuate sia dai singoli esercizi, che dalle agenzie pubbliche o semi-pubbliche che si occupano
di turismo, hanno necessità di essere orientate adeguatamente proprio dalle previsioni di afflusso;
- infine la corretta previsione dei flussi turistici di arrivo e delle presenze può aiutare le autorità locali nella
predisposizione di adeguate attività di supporto al turismo, come l’organizzazione del sistema di trasporto,
l’organizzazione delle manifestazioni artistiche e culturali e tutte le altre attività connesse.
In definitiva, l’importanza di previsioni precise in questo campo è basilare, e riconosciuta come tale sia dai ricercatori che da
attori politici (Sheldon, Var, 1985); l’accuratezza delle previsioni degli arrivi e delle presenze turistiche, oltre che aiutare i
manager del settore turistico nelle loro decisioni strategiche e nella pianificazione operativa, fornisce un utile strumento
conoscitivo agli investitori del settore.
Purtroppo, malgrado il valore di questo tipo di previsioni sia unanimemente riconosciuto, non esistono al momento né
procedure standard, né modelli previsionali che possano dirsi superiori per accuratezza ad altri; quasi tutti gli studi sulla
previsione della domanda di turismo sono basati su metodi statistici che utilizzano serie storiche di variabili significative, per
prevedere i valori futuri delle variabili stesse, oppure per effettuare la previsione diretta di arrivi e presenze, o di altre variabili a
queste correlate, come la spesa per turismo in una determinata zona. Questi modelli presentano tutti il difetto che qualora non
si riesca ad individuare correttamente le variabili chiave, si rischia di ottenere risultati fortemente discosti dalla realtà; inoltre
tali modelli non hanno alcuna tolleranza rispetto a variabili indipendenti imprecise o affette da “rumore”.
Lo studio qui riportato come esempio è stato rivolto alla previsione degli afflussi turistici, intesi in termini di presenze,
sulla Provincia di Bolzano; è stata scelta questa particolare area per la disponibilità dell’Ufficio Statistiche Economiche
dell’Istituto Provinciale di Statistica della Provincia Autonoma di Bolzano (Amt für Wirtschaftsstatistik - Landesinstitut für
Statistik – ASTAT), che ha messo a disposizione i dati necessari per lo studio.
-
Va preliminarmente osservato come gli afflussi turistici sulla Provincia di Bolzano siano limitati solamente ad alcuni
paesi europei quali (oltre chiaramente l’Italia), l’Austria, la Germania, la Svizzera, e pochissimi altri.
In questo articolo è stato considerato, per semplicità di illustrazione, un solo paese di provenienza dell’afflusso turistico,
l’Austria. E’ comunque possibile procedere con grande facilità alle previsioni per qualsiasi altro paese di provenienza
dell’afflusso, in quanto il modello non cambia.
Lo studio in questione è stato condotto come segue:
- dapprima si è ricercata la migliore architettura di rete neurale artificiale per lo specifico problema, migliore in quanto ad
architettura, connessioni, algoritmi e parametri;
- successivamente, individuata la miglior configurazione di rete neurale artificiale per il problema speficico, si è utilizzato
questo tipo di rete neurale artificiale per prevedere l’afflusso di turisti austriaci nella provincia di Bolzano. Questa parte è
stata condotta utilizzando sia i dati messi specificamente a disposizione dall’Istituto di Statistica della Provincia di
Bolzano, sia dati provenienti dalla Unione Europea.
Per la simulazione è stata utilizzata una rete MLP (multi-layer-perceptron) con una serie di neuroni di input per le variabili
chiave del fenomeno in studio, una serie di neuroni nascosti, ed un solo neurone di output per fornire direttamente il numero
delle presenze straniere per l’anno richiesto.
Le variabili di input normalmente utilizzate dai ricercatori che utilizzano modelli previsionali econometrici per previsioni
di afflusso turistico, sono:
- la popolazione della nazione di origine del flusso turistico;
- il reddito della nazione di origine del flusso turistico;
- il costo della vita della nazione (o della zona) di destinazione del flusso turistico;
- il tasso di cambio (moneta straniera / moneta locale);
- la spesa in marketing per attività promozionali nella zona di destinazione;
- i prezzi dei servizi turistici nella nazione (o nella zona) di destinazione del flusso turistico (Lim, 1997);
- i costi di trasporto nella nazione di destinazione, costi che peraltro è già stato riconosciuto (Qu, Lam, 1997) non essere
la variabile maggiormente determinante nella domanda turistica.
Nella presente applicazione pratica alcune variabili sono state sostituite da altre, considerate maggiormente significative per il
fenomeno studiato. Dato che sia l’Italia che l’Austria utilizzano ormai come moneta l’euro, il tasso di cambio è stato sostituito
dal rapporto fra il costo della vita nei due paesi, variabile che mantiene invece una certa significatività.
Nel nostro esempio si sono individuate come segue le variabili di input relative ad ogni anno (su una serie temporale):
- popolazione dell’Austria;
- spesa pro-capite annua abitanti Austria;
- costo medio degli alberghi nella Provincia di Bolzano;
- rapporto fra costo della vita in Austria e nella Provincia di Bolzano.
Mentre i dati del costo medio degli alberghi e le presenze turistiche del passato (necessarie per l’apprendimento ed il test della
rete) sono stati resi disponibili direttamente dall’Istituto Provinciale di Statistica della Provincia di Bolzano, gli altri sono stati
reperiti presso gli organismi preposti dell’Unione Europea.
L’architettura della rete utilizzata per la previsione è stata quindi quella in figura 6 (4 nodi di input, 1 nodo di output, 10
nodi nascosti), con i parametri di cui alla figura 7, mentre i dati forniti alla rete sono stati ricavati dalla tabella in figura 8, dati
che una volta normalizzati, sono risultati essere quelli riportati nella figura 9.
Dobbiamo specificare che per “normalizzazione” intendiamo l’operazione che serve a far rientrare tutti i dati che la rete
dovrà utilizzare, mantenendo le opportune proporzioni fra loro, in un range compreso fra 0 ed 1, in modo da poter essere
trattati in modo corretto dalla rete neurale13.
Chiaramente una volta ottenuto il dato in uscita, che sarà un valore compreso fra 0 ed 1, si dovrà compiere
l’operazione inversa per recuperare un dato dimensionalmente corretto. Per compiere questa operazione si deve aver
riguardo non tanto al valore massimo dei dati da sottoporre alla rete, quanto al valore massimo fra dati di input e dati di output
presentati per l’addestramento e valori massimi possibili di input ed output.
La rete è stata quindi addestrata con i parametri che si possono osservare nella figura 10 (learning rate = 0.05,
momento = 0.01, cross-entropy come algoritmo di propagazione dell’errore, seed=32.000, training sequenziale, 100.000.000
di epoche di presentazione dei dati); è visibile in figura 11 l’ottima curva di discesa dell’errore ottenuta grazie ai parametri
anzidetti.
L’addestramento è stato condotto senza utilizzare l’ultimo dato disponibile (il 2003), che è stato invece utilizzato per il
test della rete, che complessivamente ha fornito i valori indicati in figura 12.
E’ possibile vedere dalla tabella in figura 12 come la rete neurale abbia manifestato buone qualità previsionali;
successivamente si è ripetuto l’esperimento utilizzando anche l’anno 2003 per l’addestramento.
Dopo una serie di prove, effettuate incrementando anche il numero delle epoche di presentazione dei dati, e l’ultima
delle quali condotta con i parametri mostrati nelle figure 13 e 14, si sono ottenuti i valori riportati in figura 15.
Questi valori sono stati riportati nella tabella in figura 16 per confrontarli con le presenze reali e quelle previste dalla rete
che non usa il 2003 per l’addestramento.
Dalla tabella si può osservare come i valori previsti dalla rete siano abbastanza vicini (in alcuni casi addirittura uguali) ai
valori reali.
La rete così addestrata è stata quindi utilizzata per effettuare la previsione relativa agli afflussi turistici (presenze)
provenienti dall’Austria per l’anno 2004, dato che ancora non era disponibile al momento della previsione.
I dati forniti in input alla rete sono stati quelli della tabella in figura 17 (con i prezzi espressi, al fine di poterli correlare ai
dati del passato), in Lire italiane.
13
La rete neurale lavora su dati numerici compresi fra 0 ed 1; pertanto è sempre necessario riportare ogni dato in questo range, e successivamente
all’elaborazione compiere il lavoro opposto.
Con tali dati la rete ha previsto un totale di 653.637 presenze per l’anno 2004, come riportato nella tabella in figura 18
(insieme ai valori normalizzati), numero molto vicino alle presenze reali fornite successivamente dall’Istituto Provinciale di
Statistica della Provincia di Bolzano, di 658.698.
Va osservato come il dato delle presenze turistiche previsto dalla rete neurale artificiale sia notevolmente vicino al dato
reale (con un errore del 7 per mille).
Grazie a questo risultato possiamo concludere che la rete neurale è sicuramente un valido strumento di previsione
relativamente agli afflussi turistici, strumento che può essere di grande ausilio ai manager che debbano prendere decisioni in
questo settore.
5. L’utilità delle reti neurali artificiali per la pianificazione ed il decision making nelle aziende pubbliche
Le reti neurali artificiali, oltre ad essere un concreto ausilio per la pianificazione degli aspetti concernenti il turismo, possono
essere utilizzate per supportare la pianificazione ed il decision making all’interno delle aziende pubbliche, relativamente ad
una serie di tematiche molto varie, quali:
- le valutazioni relative alla vulnerabilità alle sostanze stupefacenti da parte di determinate fasce della popolazione
giovanile. L’uso di una rete neurale artificiale può fornire un concreto ausilio nella individuazione dei fattori che
aumentano la vulnerabilità dei giovani alle sostanze stupefacenti, consentendo di procedere a simulazioni che possono
far comprendere, prima di attuarla, la validità di questa o quella determinata scelta politica (Speri et al., 1999);
- la valutazione dei trattamenti terapeutici sulla popolazione giovanile con problemi di tossicodipendenza. In questo caso
il vantaggio dell’uso di una rete neurale artificiale sta nel riuscire ad analizzare tutti quegli elementi che intervengono nel
successo di un trattamento terapeutico di recupero, quali l’identità del soggetto (sesso, classe di età, educazione,
religione, ecc.), il curriculum della tossicodipendenza (qual è stata la prima droga leggera assunta, quale la prima
pesante, durata di utilizzo delle sostanze, possibile passato criminale, ecc.), lo stato di salute mentale (tentativi di
suicidio, problemi fisici, problemi di salute mentale nella famiglia, ecc.). In questo modo chi è preposto alle decisioni può
individuare le metodiche che possano ottenere discrete aspettative di successo (Massini, 1999);
- la previsione della sicurezza di una determinata zona di una città, con l’elaborazione di “mappe” delle probabilità di
incremento o decremento di determinati reati. Una rete neurale artificiale, utilizzando i dati storici relativi a variabili
inerenti la sicurezza (dati sia geografici che numerici) raccolti dalle varie agenzie interessate, può fornire una mappa
della sicurezza futura della zona, fornendo contemporaneamente un modello che può indicare quali fattori occorre
modificare per ottenere un miglioramento della sicurezza stessa;
- la previsione di flussi di traffico e di mobilità verso una determinata zona di una città. Partendo da una serie di dati in
input, quali presenza di attività economiche, industriali, commerciali, di servizio, ed altre, è possibile per una rete
neurale artificiale addestrata con tali dati, operare una previsione dei flussi di traffico futuri, eventualmente precisata per
fasce orarie. La stessa rete neurale può fornire scenari di mobilità simulata in funzione delle possibili modificazioni di
determinati valori, andando quindi a costituire una base per il decision making in materia di mobilità cittadina;
- l’analisi e le previsioni relative al mercato del lavoro in una zona determinata. Utilizzando una serie di dati socioeconomici relativi ad una determinata area, è possibile per una rete neurale artificiale prevedere l’evoluzione del
mercato del lavoro nell’area stessa, individuando quali saranno i settori economici trainanti e quali quelli penalizzati,
conferendo ai decisori politici un concreto supporto per l’individuazione delle azioni da intraprendere;
- la previsione dei risultati elettorali. A partire da una serie di dati in input, ottenuti quali risposta a determinate domande
concernenti la politica del governo attualmente in corso, è possibile prevedere, grazie ad una rete neurale artificiale,
l’esito delle successive elezioni, in termini di permanenza del governo in carica, oppure di presa di potere
dell’opposizione (Borisyuk et al., 2001);
- la previsione della possibilità di conflitto fra due o più stati. A partire da una serie di dati in input, fra i quali indicatori
economici di vario tipo, indicatori sociali, indicatori di stabilità politica, è possibile per una rete neurale artificiale, fornire
un modello revisionale sulla possibilità che avvenga un conflitto (dove per conflitto non si intende necessariamente una
guerra aperta) fra due nazioni (Lagazio, Russett, 2003);
- il supporto dell’azione formativa ai fini dell’individuazione di percorsi formativi ad hoc per determinati soggetti. Grazie ad
una rete neurale artificiale è possibile analizzare a fondo i fattori di dispersione scolastica riconducibili a determinate
situazioni di contesto familiare, a situazioni soggettive, a situazioni di contesto socio-economico, a situazioni di contesto
scolastico, fornendo un modello che può adeguatamente supportare le decisioni strategiche delle istituzioni preposte
(Carbone V., Piras G., 1999);
- l’esplorazione di assetti urbani vincenti in ambito europeo. Con riferimento a modelli di città ecologica, città tecnologica,
città con minimi costi socio-economici, città con massimi costi socio-economici, una rete neurale artificiale può
elaborare un modello che lega l’influenza di determinati investimenti alla evoluzione di un determinato modello di città,
in questo modo fornendo un supporto alla fase di pianificazione urbanistica.
Generalmente una rete neurale artificiale appositamente addestrata è in grado di fornire un modello di qualsiasi fenomeno
sociale, ottenendo previsioni ben più accurate dei metodi statistici, in quanto è in grado di lavorare su variabili non lineari.
E’ grazie a questo aspetto che le reti neurali artificiali possono essere un validissimo supporto per le decisioni in tutti quegli
ambiti nei quali non è possibile utilizzare altre metodologie, ovvero in quegli ambiti nei quali le metodologie attualmente in uso
non consentono una grande precisione.
6. Conclusioni
Nell’articolo si è dimostrato come le reti neurali artificiali siano in grado di effettuare precisioni accuratissime dell’afflusso
turistico, mostrando poi come possano essere utilizzate, in via generale, per lo studio e la previsione di fenomeni sociali, e
quindi come concreto supporto nella pianificazione strategica delle politiche pubbliche e al decision making.
La caratteristica più interessante delle reti neurali artificiali è senza dubbio che esse apprendono dalla propria esperienza, per
cui sono in grado di individuare autonomamente il modello di funzionamento di un determinato fenomeno, effettuando
previsioni e fornendo la spiegazione di come le variabili indipendenti siano legate a quelle dipendenti.
Purtroppo le reti neurali artificiali vengono guardate a volte solo come un mero tentativo di replicare il cervello umano ed il suo
funzionamento, per cui vi sono una serie di pregiudizi da parte dei ricercatori per l’utilizzo di questa metodologia innovativa; il
pregiudizio nasce probabilmente, oltre che da una scarsa conoscenza dell’argomento, dal fatto che la tematica delle reti
neurali artificiali apre la strada a domande imbarazzanti sulla mente e la coscienza, domande per le quali allo stato attuale non
vi è risposta, o le risposte sono inquietanti.
Al momento attuale, per chi si occupa di fenomeni sociali, le reti neurali artificiali devono essere viste essenzialmente come
una metodologia di lavoro innovativa, che in determinati casi può essere molto più proficua di altre; esse possono essere
considerate un diverso modo di organizzazione della computazione che è ancora ancorata al metodo algoritmico e, quando
effettuata con il computer, è condizionata dalla architettura cosiddetta Von Neumann14.
Ma la metodologia non serve assolutamente a niente se non si hanno a disposizione dei dati sui quali lavorare; qualsiasi rete
neurale artificiale infatti, alla pari di altri metodi, non potrà effettuare alcuna valutazione e previsione se non si hanno i dati
relativi al fenomeno da studiare.
L’auspicio è dunque che le reti neurali artificiali vengano utilizzate sempre più nella ricerca sociale, per la previsione di
fenomeni complessi, nel supporto alla pianificazione delle aziende pubbliche, senza scordarsi che essendo un metodo di
elaborazione della conoscenza esse formuleranno previsioni corrette solo in presenza di dati certi; qualora mancasse questo
presupposto sconfineremmo nella magia.
Riferimenti bibliografici
BORISYUK R., BORISYUK G., RALLINGS C., THRASHER M., (2001), Forecasting the 2001 General Election Result: A Neural
Network Approach, Plymouth, Centre for Neural and Adaptive System, University of Plymouth.
CARBONE V., PIRAS G, (1999), “Orientamento e dispersione scolastica: le reti neurali artificiali come supporto dell’azione
formativa”, in Buscema M. & Semeion Group (a cura di), Reti neurali artificiali e sistemi sociali complessi, Milano, Franco
Angeli, pp. 170-199.
LAGAZIO M., RUSSETT B., (2003), “A Neural Network Analysis of Militarized Disputes, 1885-1992: Temporal Stability and Causal
Complexity”, in Paul Diehl, Toward a Scientific Understanding of War: Studies in Honor of J. David Singer, University of
Nottingham and Yale University.
LAW R., AU N., (1997), A neural network model to forecast Japanese demand for travel to Hong Kong, Tourism Management,
20, pp. 89-97.
LIM, C., (1997), An econometric classification and review of international tourism demand models, Tourism Economics, 3(1),
pp. 69-81.
MASSINI G., (1999), “Uso di una rete constraint satisfaction per la valutazione del trattamento terapeutico”, in Buscema M. &
Semeion Group (a cura di), Reti neurali artificiali e sistemi sociali complessi, Milano, Franco Angeli, pp. 96-118.
MÜLLER B., REINHARDT J., (1990), Neural Networks: An Introduction, Springer-Verlag, Berlin 1990
P. PERETTO, (1992), An Introduction to the Modeling of Neural Networks, Cambridge, Aléa Saclay Cambridge University Press
QU H., LAM S., (1997), A travel demand model for mainland Chinese tourists to Hong Kong, Tourism Management, 18(8), pp.
593-597.
SHELDON, P. J., VAR, T., (1985), Tourism forecasting: A review of empirical research, Journal of Forecasting, 4(2), pp. 183-195.
SPERI L., SCHILIRÒ G., BEZZETTO A., CIFELLI G., DE BATTISTI L., MARCHI S., MODENESE M., VARALTA F., CONSIGLIERE F., (1999),
“Reti neurali artificiali nella valutazione della vulnerabilità da eroina in ambito militare”, in Buscema M. & Semeion Group (a
cura di), Reti neurali artificiali e sistemi sociali complessi, Milano, Franco Angeli, pp. 15-39.
Figura 1
Figura 2
Neurone al microscopio elettronico
Figura 3
segnali di input
segnale di output
Figura 4
input layer
middle layer
(hidden layer)
Una piccola rete neurale artificiale
output layer
individuazione variabili input/output
Figura 5
ottenimento serie correlate
input / output
fra le variabili di input, in caso di dubbio, è possibile
inserire variabili non influenti
per un buon funzionamento della rete la serie
dovrebbe avere almeno 10 / 15 valori correlati
prima strutturazione rete MLP
neuroni di input = variabili di input
neuroni di output = variabili di output
2(variabili input) < neuroni nascosti < variabili input
normalizzazione valori
la normalizzazione si effettua tenendo conto non
del minimo e massimo attuali, ma di quelli possibili
fase di apprendimento
(tutti i valori - 1, 2, ecc.)
fase di test con i valori lasciati fuori
modifica parametri di apprendimento
variazione numero neuroni nascosti
variazione normalizzazione
la rete non generalizza bene
(troppo specifica)
la rete non è precisa
(generalizza troppo)
si diminuiscono i nodi nascosti
si aumentano i nodi nascosti
configurazione definitiva
addestramento definitivo
fase di test
fase di lavoro
per previsione: si forniscono input previsti
per studio: si variano input reali
Figura 6
Architettura di rete neurale utilizzata per la previsione sugli afflussi turistici
Figura 7
Parametri relativi alla rete neurale utilizzata per la previsione sugli afflussi turistici
Figura 8
anno popolazione
Austria
spesa
complessiva
annua Austria
spesa
procapite
annua
Austria
costo
medio
alberghi
Bolzano
indice compenso compenso rapporto
indice
prezzi al prezzi al totale per totale per costo vita
consumo consumo impiegato impiegato
Austria
Italia
Austria
Italia
Austria
Bolzano
presenze
annue da
Austria
1990 7.677.900
77.500.000.000
10.094
48.304
75,20
85,60 25.540
19.470
0,5660
798315
1991 7.754.900
83.100.000.000
10.716
52.242
79,90
88,20 27.240
21.180
0,6369
819768
1992 7.840.700
89.400.000.000
11.402
57.108
83,80
91,30 28.890
22.400
0,7051
728462
1993 7.905.600
92.100.000.000
11.650
61.515
87,60
94,20 30.270
23.420
0,7623
689935
1994 7.936.100
97.700.000.000
12.311
68.921
91,30
96,70 31.500
24.130
0,8051
752391
1995 7.948.300
100.200.000.000 12.606
75.055
96,20
98,30 32.510
25.150
0,8355
838765
1996 7.959.000
105.600.000.000 13.268
83.513
100,00
100,00 32.840
26.680
0,8762
766527
1997 7.968.000
107.200.000.000 13.454
87.779
101,90
102,20 33.170
27.750
0,9232
609628
1998 7.976.800
109.200.000.000 13.690
89.911
103,90
102,00 33.950
27.320
0,9106
617758
1999 7.992.300
112.200.000.000 14.039
92.689
105,70
102,50 34.590
28.030
0,9402
615473
2000 8.011.600
119.500.000.000 14.916
96.813
108,40
104,50 35.230
28.890
0,9812
603931
2001 8.029.900
123.000.000.000 15.318
100.992
110,90
106,90 35.730
29.800
1,0263
628687
2002 8.053.100
124.300.000.000 15.435
106.278
113,80
108,80 36.350
30.560
1,0620
664231
2003 8.098.000
126.900.000.000 15.671
111.316
117,00
110,20 37.130
31.720
1,1093
651685
Dati di input utilizzati per l’addestramento della rete neurale artificiale
Figura 9
Dati di input normalizzati utilizzati per l’addestramento della rete neurale
artificiale
Figura 10
Parametri di funzionamento della rete neurale artificiale
Figura 11
Curva di discesa dell’errore durante l’apprendimento
Figura 12
anno
presenze presenze
reali dalla ANN
1990 798315 1021281
1991 819768 1067181
1992 728462 870831
1993 689935 788381
1994 752391 922681
1995 838765 1107981
1996 766527 952431
1997 609628 615831
1998 617758 633681
1999 615473 628581
2000 603931 603931
2001 628687 656631
2002 664231 733131
2003 651685 619231
Presenze previste dalla rete neurale artificiale in fase di primo test
Figura 13
Dati di addestramento normalizzati e parametri di architettura in fase finale
Figura 14
Parametri di addestramento in fase finale
Figura 15
Risultati definitivi (normalizzati)
Figura 16
presenze
dalla ANN presenze
presenze
che usa dalla ANN
dalla ANN
anche il che usa
(val.
presenze presenze 2003 (val. anche il
REALI dalla ANN norm.)
2003
norm.)
0,7900 798315 798326
0,7900 798326
0,8770 819768 819734
0,8770 819734
0,5060 728462 728442
0,5060 728442
0,3500 689935 690055
0,3500 690055
0,6030 752391 752311
0,6030 752311
0,9540 838765 838681
0,9540 838681
0,6110 766527 754279
0,6610 766583
0,0230 609628 609591
0,0230 609591
0,0560 617758 617711
0,0560 617711
0,0470 615473 615496
0,0470 615496
0,0000 603931 603931
0,0000 603931
0,1010 628687 628784
0,1000 628538
0,2450 664231 664218
0,2450 664218
0,0470 651685 615496
0,1940 651668
Valori di presenza turistica previsti dalla rete neurale artificiale (con e senza
l’ultimo anno) e confronto con i valori reali
Figura 17
Anno
Popolazione
Austria
Spesa procapite annua
Austria
2004
8.129.400
16.114
Costo
medio
alberghi
Bolzano
117.000
Rapporto costo
vita
Austria/Bolzano
1,0872
Valori di input utilizzati per la previsione da parte della rete neurale artificiale
Figura 18
presenze
dalla ANN
che usa
anche il
presenze
presenze
2003
dalla ANN presenze
REALI
dalla ANN (val. norm.)
(val. norm.)
0,0030
653.637
604.669
0,2020
presenze
dalla ANN
che usa
anche il
2003
653.637
Valore delle presenze turistiche previsto dalla rete neurale artificiale (ottenuto
con e senza l’utilizzo del dato dell’anno precedente)
Scarica