Analisi statistiche a supporto del monitoraggio della qualità dell'aria in Emilia Romagna Progetto SINA 10 9 8 7 6 5 4 3 2 1 0 1 3 5 7 9 11 13 15 17 19 21 23 1 3 5 7 9 11 13 15 17 19 21 23 1 3 5 7 9 11 13 15 17 19 21 23 Tempo (ore) Area di Epidemiologia Ambientale ARPA Emilia Romagna Coordinamento progetto: Stefano Zauli Sajani Paolo Lauriola Gruppo di lavoro: Fabiana Scotto Francesca Galassi Stefano Zauli Sajani Hanno collaborato: Angela Montanari (Dipartimento di Statistica – Università di Bologna) Analisi statistiche a supporto al monitoraggio della qualità dell'aria in Emilia Romagna Progetto SINA Sommario 1. Introduzione....................................................................................................................... 1 2. Le centraline e gli inquinanti analizzati............................................................................. 2 3. Andamenti tipici ................................................................................................................ 3 3.1 Andamenti giornalieri.............................................................................................................................. 4 3.2 Andamenti settimanali............................................................................................................................. 7 3.3 Andamenti annuali................................................................................................................................... 9 4. Statistiche descrittive generali e analisi della variabilità spaziale................................... 11 5. Relazioni tra statistiche univariate................................................................................... 16 6. Correlazioni lineari tra centraline .................................................................................... 18 7. Regressioni lineari tra centraline ..................................................................................... 21 7.1 Scelta del modello di regressione .......................................................................................................... 21 7.2 Stima degli errori................................................................................................................................... 22 8. Individuazione dei dati anomali ...................................................................................... 28 9. Ipotesi per un utilizzo integrato di centraline fisse, mezzi mobili e campionatori passivi. ............................................................................................................................................. 30 10. Correlazioni tra centraline a scala regionale.................................................................. 33 11. Correlazioni tra inquinanti............................................................................................. 35 12. Conclusioni.................................................................................................................... 37 Bibliografia.......................................................................................................................... 41 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 1. Introduzione Lo studio statistico qui presentato ha lo scopo di fornire un quadro delle relazioni tra i rilevamenti delle centraline fisse collocate all’interno degli ambiti urbani della regione Emilia Romagna. Si è scelto di privilegiare l’analisi degli ambiti urbani in quanto è questo il contesto ove maggiori sono le problematiche connesse con la valutazione del contenuto informativo dei sistemi di monitoraggio in continuo. Solo per la città di Bologna, per la quale la definizione di area urbana risulta difficoltosa sia da un punto di vista urbanistico che amministrativo, si è scelto di considerare anche le centraline collocate nei comuni che circondano il capoluogo, rispetto al quale costituiscono ormai un unico aggregato. La prospettiva in cui lo studio si inquadra è l’ottimizzazione della rete di monitoraggio della qualità dell’aria in Emilia Romagna. L’Emilia Romagna rappresenta una della aree d’Europa più critiche da un punto di vista ambientale a causa degli altissimi livelli di urbanizzazione e industrializzazione. Ciò ha portato nel tempo all’istallazione di una delle reti di monitoraggio della qualità dell’aria più ricche di dati e con la maggior risoluzione spaziale a livello europeo e mondiale. Occorre verificare se l’attuale rete di monitoraggio, molto dispendiosa sia in termini economici che di impiego di risorse umane, è in grado di soddisfare gli obiettivi del monitoraggio nel miglior rapporto costi-benefici. In tali obiettivi, oltre a quello prioritario del rispetto della legislazione vigente e prossima ventura, sono da comprendere anche le richieste delle amministrazioni locali e degli enti preposti alla difesa della salute della popolazione. Tali richieste sono indirizzate sia verso la definizione di indicatori ambientali a livello comunale, provinciale e regionale, sia verso l’identificazione, all’interno delle aree urbane, di zone e di gruppi di persone soggetti a particolari rischi ambientali. La programmazione del territorio ed i piani urbanistici e sanitari necessitano infatti di valutazioni di tipo ambientale a diverse scale spaziali, valutazioni a cui la rete di monitoraggio dovrebbe fornire un importante contributo. Tra gli scopi dello studio vi è quindi anche quello di analizzare in modo critico le modalità di utilizzo dei dati delle centraline fisse e suggerire strategie di integrazione con i dati di campionatori passivi e mezzi mobili. Tale processo di integrazione di dati sperimentali differenti rientra in un più generale processo di valutazione integrata della qualità dell’aria che comprende anche le simulazioni modellistiche e gli inventari delle emissioni. 1 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 2. Le centraline e gli inquinanti analizzati Gli inquinanti considerati nello studio sono quelli usualmente monitorati nelle aree urbane: monossido di carbonio (CO), ossidi di azoto (NO, NO2), ozono (O3), biossido di zolfo (SO2), benzene (C6H6), polveri totali sospsese (PTS) e polveri con diametro aerodinamico inferiore a 10 micron (PM10). L’arco temporale analizzato è l’intero anno 2000. La tabella 2.1 riporta le centraline e gli inquinanti monitorati per ogni città. Per le polveri è anche indicato il tipo di rilevatore in virtù dell’influenza della tipologia di strumento rispetto alla misura di tale categoria di inquinanti. I dati sono stati sottoposti a diversi controlli di qualità. Durante la fase di raccolta immediatamente successiva alla misura, i dati subiscono un primo controllo da parte degli operatori responsabili: Tale controllo, pur essendo abbastanza approfondito, non si basa su procedure automatizzate e/o uniformemente applicate a livello regionale ed è affetto quindi da un certo grado di discrezionalità. Si è quindi ritenuto opportuno procedere ad un ulteriore controllo dei dati che ha portato ad una minima riduzione della numerosità complessiva del database. E’ comunque probabile che non solo singoli dati ma addirittura interi periodi affetti da qualche forma di malfunzionamento degli strumenti siano tuttora presenti nel database. Nei casi infatti ove fosse opinabile l’eliminazione o non ci fossero notizie attendibili di danni strumentali, si è ritenuto di dover conservare il maggior numero possibile di dati. Talune centraline non sono state considerate nello studio per la scarsa numerosità dei dati forniti nel corso del 2000. Non è stato possibile accedere ad una stima affidabile dell’errore sperimentale associato alla misura dei diversi inquinanti per vari motivi: notevole varietà dei rilevatori, diversa anzianità strumentale, modifiche apportate nel tempo agli strumenti originari, carenti informazioni nei manuali di utilizzo. I dati sono stati raccolti alla miglior risoluzione temporale permessa dagli strumenti. Ove i dati fossero disponibili su base oraria si è provveduto a calcolare le medie giornaliere a condizione che fosse presente almeno il 75% dei dati per ogni giorno. Lo stesso criterio, salvo diversa indicazione, è stato tenuto anche per il calcolo di tutti i parametri statistici utilizzati nello studio. 2 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Tabella 2.1 – Prospetto degli inquinanti rilevati per ogni centralina BOLOGNA Borgo Panigale Casalecchio Castel Maggiore Fiera G. Margherita Malpighi S. Felice S. Lazzaro Zanardi Tipo B B B C A B C B C CO X X X X X X X X X NO X X X X X X X X X NO2 X X X X X X X X X O3 FERRARA Barco Bologna Isonzo Mizzana San Giovanni Tipo B C B D C CO X X X X NO X X X X X FORLI' - CESENA Giardini - FO Morgagni - FO Roma - FO Mulini - CE Bufalini - CE Emilia - CE Tipo A B C B A C CO X X X X X X MODENA Cavour Garibaldi Giardini Nonantolana XXsettembre Tipo B B B B A PARMA Cittadella Fratti Milazzo Montebello Spalato SO2 BEN PM10 PTS MPSI100 (beta) X MPSI100 (beta) MPSI100 (beta) X X X X MPSI100 (beta) X MPSI100 (beta) MPSI100 (beta) X X X X X NO2 X X X X X O3 SO2 BEN NO X X X X X X NO2 X X X X X X O3 X CO X X X X X NO X X X X X NO2 X X X X X O3 SO2 X X Tipo A B C B B CO NO2 X X X X X O3 X X X X X NO X X X X X PIACENZA Giordani Medaglie Passeggio Piatti Roma Tipo C C A C B CO X X X X X NO X X X X X NO2 X X X X X RAVENNA Caorle Brancaleone Stadio Zalamella Tipo B B B C CO X X X X NO X X X X NO2 X X X X O3 X X REGGIO EMILIA Ortolane Risorgimento XXsettembre San Lazzaro Timavo Tipo B B C A C CO X X X X X NO X X X X X NO2 X X X X X O3 RIMINI Abete Flaminia Marecchia Tipo B C A CO X X X NO X X X NO2 X X X O3 Adam (beta) Zambelli grav. MPSI100 (beta) PM10 PTS X X X X Zambelli grav. Adam (beta) SO2 BEN PM10 PTS Adm9000 (beta) Zambelli grav. X Zambelli grav. X X Adam (beta) Zambelli grav. Zambelli grav. BEN PM10 PTS Zambelli grav. Zambelli grav. X X SO2 X X Adam (beta) Zambelli grav. Teom (freq.) Zambelli grav. BEN PM10 PTS Tecora (grav.) X X Adam (beta) Tecora (grav.) O3 SO2 BEN PM10 PTS X X Adam (beta) MP101M (beta) X SO2 X X X SO2 X MP101M (beta) BEN PM10 PTS MP101M (beta) MP101M (beta) X Adam (beta) BEN PM10 Zambelli grav. PTS APM1(beta)/SEA(I.R.) APM1(beta)/SEA(I.R.) X X SO2 X Adam (beta) BENZ PM10 PTS Zambelli grav. X X Zambelli grav. MP101M (beta) MP101M (beta) 3 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 3. Andamenti tipici Nei paragrafi seguenti vengono riportati i risultati dell’analisi degli andamenti temporali medi ricavati da 5 anni di osservazioni (escluso il benzene per il quale sono disponibili solo 2 anni di dati) in una stazione di rilevamento di Modena. Questo periodo è stato ritenuto un arco temporale sufficiente per poter ottenere andamenti il meno possibile soggetti alla variabilità interannuale. I grafici seguenti si ritiene possano essere qualitativamente esemplificativi del comportamento di quasi tutte le centraline all’interno delle aree urbane. I grafici si riferiscono alla stazione di Via Nonantolana, nella immediata periferia di Modena, scelta in virtù dell’alto numero di inquinanti monitorati. E’ escluso dall’analisi il biossido di zolfo in quanto non misurato in tale stazione. 3.1 Andamenti giornalieri L'analisi degli andamenti medi giornalieri evidenzia la stretta dipendenza tra i flussi di traffico e i principali inquinanti primari. Le figure sopra riportate mostrano infatti due picchi di inquinamento corrispondenti ai massimi dei flussi stradali (alle 8/9 del mattino e alle 7/8 di sera). E’ utile notare come al marcato minimo di concentrazione degli inquinanti primari nelle ore centrali della giornata non corrisponda un altrettanto marcato minimo nei flussi di traffico. Ciò è dovuto principalmente alle migliori capacità dispersive dell’atmosfera nelle ore centrali del giorno. A questo proposito, occorre dire che gli andamenti riportati sono valori medi annuali. Se si analizzano gli andamenti medi giornalieri differenziati per stagione, si evidenzia un altro aspetto importante dovuto alle differenti proprietà dispersive dell’atmosfera nelle differenti condizioni meteorologiche e nelle diverse ore della giornata. Nei mesi autunnali ed invernali, quando il sole tramonta presto, il picco serale di inquinamento risulta sensibilmente più alto del picco mattutino. L’opposto succede nei mesi estivi e primaverili quando le giornate sono più lunghe e lo strato limite planetario conserva le proprietà dispersive proprie dei vortici convettivi fino alle ore serali. La figure successive esemplificano questo punto utilizzando come inquinante di riferimento il monossido di azoto. Il ruolo dell’accumulo giornaliero degli inquinanti sembra giocare un ruolo secondario anche se comunque evidenziabile nel valore più alto del picco serale di inquinamento nei mesi autunnali ed invernali: essendo infatti comparabili sia le intensità dei flussi di traffico che le proprietà dispersive dell’atmosfera, è lecito da questo dedurre che la differenza tra i picchi di inquinamento del mattino e della sera siano da imputare all’accumulo degli inquinanti primari nelle aree di emissione. Qualitativamente differente, come è logico aspettarsi, è l’andamento giornaliero dei valori medi di concentrazione dell’ozono per il quale si evidenzia un marcato picco nelle prime ore del pomeriggio. La natura di inquinante secondario fotochimico giustifica questo andamento. Questa variabilità intragiornaliera risulta molto marcata nel periodo estivo e molto meno rilevabile nei periodi invernali ed autunnali. 4 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 2,5 120 100 2,0 80 1,5 60 40 Media NO Media CO 1,0 ,5 1,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 20 0 21,00 19,00 1,00 5,00 23,00 3,00 ORA 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 23,00 ORA 80 70 60 70 50 60 40 50 Media O3 Media NO2 30 40 30 1,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 20 10 1,00 23,00 ORA 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 23,00 ORA 10 9 8 7 6 Media Benzene 5 4 3 2 1,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 23,00 ORA Figura 3.1 – Andamenti medi giornalieri delle concentrazioni dei principali inquinanti – Centralina “Nonantolana” (Modena) 5 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Andamento giornaliero traffico autoveicolare 2500 2000 lunedì 1500 martedì mercoledì giovedì venerdì sabato 1000 domenica 500 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Ora Figura 3.2 – Andamenti medi giornalieri dei flussi di traffico ricavati da una media di 7 strade all’interno dell’area urbana di Modena (Dati concessi dal Comune di Modena) STAGIONE: 1,00 Inverno STAGIONE: 200 2,00 Primavera 70 60 50 40 100 30 Media NO Media NO 20 0 1,00 5,00 3,00 9,00 7,00 STAGIONE: 13,00 11,00 17,00 15,00 10 0 21,00 19,00 1,00 23,00 5,00 3,00 3,00 Estate 9,00 7,00 STAGIONE: 50 13,00 11,00 17,00 15,00 21,00 19,00 23,00 4,00 Autunno 200 40 30 100 Media NO Media NO 20 10 0 1,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 0 1,00 23,00 5,00 3,00 9,00 7,00 13,00 11,00 17,00 15,00 21,00 19,00 23,00 Figura 3.3 – Andamenti medi giornalieri delle concentrazioni di NO differenziati per stagione – Centralina “Nonantolana” (Modena) 6 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 3.2 Andamenti settimanali Gli andamenti settimanali confermano la stretta dipendenza tra traffico ed inquinamento. (La scala settimanale è tra l’altro l’unica scala temporale dove l’effetto dell’altro determinante principale delle concentrazioni, la meteorologia, non ha alcuna influenza). E’ infatti evidente un sensibile decremento dell’inquinamento medio nel fine settimana dove i flussi di traffico sono nettamente inferiori. Per quanto riguarda gli inquinanti primari (CO, NO, NO2, Benzene, PTS) si può inoltre notare un costante aumento dell’inquinamento medio dal lunedì al venerdì. Questo effetto risulta legato all’accumulo dei vari inquinanti nell’atmosfera e non a variazioni dei flussi di traffico che, nei giorni feriali della settimana, si mantengono pressochè costanti. Il minimo di concentrazione si verifica la domenica e il massimo il venerdì. I grafici seguenti riportano gli andamenti settimanali tipici per i diversi inquinanti e per i flussi di traffico. Figura 3.4 – Andamenti medi settimanali delle concentrazioni dei principali inquinanti – Centralina “Nonantolana” (Modena) 7 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Andamento settimanale flussi traffico 35000 30000 25000 20000 15000 10000 domenica lunedì martedì mercoledì giovedì venerdì sabato Figura 3.5 – Andamento medio settimanale dei flussi di traffico ricavati da una media di 7 strade all’interno dell’area urbana di Modena (Dati concessi dal Comune di Modena) 8 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 3.3 Andamenti annuali La variazione delle emissioni rispetto ai mesi dell’anno si suppone essere ragionevolmente piccola e comunque limitata soprattutto ai mesi estivi quando l’influenza dei cambiamenti delle abitudini sociali e del numero di veicoli circolanti assume una qualche rilevanza. La variabilità delle concentrazioni nei diversi periodi dell’anno pare dunque da imputare in modo preponderante alla varrizione delle condizioni meteorologiche. L’analisi degli andamenti annuali evidenzia concentrazioni medie dei principali inquinanti più elevate nei periodi autunnali ed invernali. Il monossido di carbonio e gli ossidi di azoto hanno un comportamento molto regolare con rapporti tra massimo invernale e minimo estivo uguali a circa 3 per il monossido di carbonio, a circa 8 per il monossido di azoto e a circa 2 per il biossido di azoto. Forti analogie rispetto a questi andamenti presenta il benzene il cui andamento tipico è stato ricavato sulla base di soli due anni di dati. Questo periodo limitato potrebbe essere la causa del dato di gennaio che pare essere non molto coerente con l’andamento degli altri mesi. Assimilabili al benzene per il comportamento “anomalo” nel periodo autunnale, sono le polveri totali mentre coerente appare l’andamento del PM10. La variabilità stagionale delle polveri risulta paragonabile a quella del biossido di azoto. Differente, come di consueto, è il discorso per quanto riguarda l’ozono. Esso mostra un marcato picco nei mesi estivi salvo poi passare a concentrazioni trascurabili nei mesi invernali ed autunnali. Come già detto, questa peculiarità deriva dalla sua natura di inquinante secondario fotochimico che lo porta ad accumularsi nei periodi di massima insolazione. La tabella 3.1 sintetizza gli intervalli di variabilità dei rapporti “massimo/minimo” calcolati nelle 5 centraline di Modena per le diverse scale temporali e per i diversi inquinanti. La figura 3.6 illustra gli andamenti annuali tipici per i diversi inquinanti nella centralina “Nonantolana”. Tabella 3.1 – Intervalli di variabilità temporale degli andamenti medi degli inquinanti. I dati sono stati ottenuti dall’analisi di 5 stazioni fisse di monitoraggio all’interno dell’area urbana di Modena. Inquinante Max/min giornaliero Max/min settimanale Max/min annuale CO NO NO2 O3 PM10 TSP Benzene 2,5÷4,0 3,0÷4,6 1,5÷1,8 3,0÷6,4 / / / 1,2÷1,3 1,7÷2,1 1,3 1,1÷1,3 1,2 1,2÷1,3 1,1 2,4÷3,3 6,5÷10,0 1,6÷2,1 2,9÷12,1 4,0 1,9÷2,3 2,6 9 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Figura 3.6 – Andamenti medi giornalieri delle concentrazioni dei principali inquinanti – Centralina “Nonantolana” (Modena) 10 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 4. Statistiche descrittive generali e analisi della variabilità spaziale La prima fase dell’analisi dei rilevamenti delle centraline fisse ha riguardato il calcolo di alcune grandezze statistiche univariate di tipo descrittivo (numerosità, media, mediana, deviazione standard, minimo, massimo e 95º percentile). Tale parte dello studio ha permesso di mettere in evidenza la grande variabilità spaziale dei principali inquinanti primari da traffico (CO, NO, NO2). Le concentrazioni medie annue rilevate dalle centraline fisse variano fino a 3 volte tra una postazione e l’altra. Campionamenti ad alta risoluzione spaziale effettuati in alcune città emiliane (Modena, Bologna, Ferrara) hanno evidenziato come all’interno dei principali “canyon” stradali ed in prossimità degli incroci si raggiungano punte di inquinamento per tali inquinanti superiori anche di 5 volte rispetto ad altre aree. I dati delle centraline fisse forniscono quindi quasi sempre un quadro limitato della effettiva variabilità spaziale all’interno degli ambiti urbani. Marcata appare anche la variabilità delle polveri totali (PTS) mentre il quadro per il PM10 appare largamente incompleto rispetto ad una analisi di variabilità spaziale, in quanto tale inquinante è generalmente monitorato da una sola centralina per ogni ambito urbano. La letteratura ha messo in evidenza una variabilità spaziale per le polveri fini meno marcata rispetto agli altri inquinanti anche se tale diffusa opinione è stata contestata da alcune recenti pubblicazioni. Altrettanto dipendenti dal sito di misura appaiono le medie dell’ozono, che, negli ambiti urbani dove è monitorato da più centraline, risultano notevolmente più alte nelle centraline di tipo A. E’ emersa anche la scarsa significatività della tipologia della centralina (A,B,C,D). Le medie appaiono infatti estremamente variabili tra centraline dello stesso tipo nella stessa area urbana e spesso molto simili tra quelle di tipo diverso. Occorre però evidenziare come quelle di tipo A abbiano, relativamente agli inquinanti da traffico, medie generalmente più basse. Una centralina di una certa tipologia non è comunque rappresentativa di tutte quelle della stessa tipologia. Dalla grande variabilità spaziale delle concentrazioni degli inquinanti all’interno degli ambiti urbani deriva la difficoltà di ottenere un quadro completo dell’inquinamento atmosferico all’interno delle città. Nelle figure 4.1-4.4 sono riportate, per alcuni inquinanti, le medie annue nelle diverse centraline raggruppate per ambiti urbani, con evidenziata (in rosso) la media delle concentrazioni per ogni città. I grafici evidenziano graficamente la grande variabilità di concentrazione in ogni ambito urbano, variabilità che risulta maggiore della variabilità delle concentrazioni medie dei diversi ambiti urbani. Si evidenzia quindi la difficoltà di ricavare una concentrazione che sia indicativa dell’esposizione media della popolazione in ogni singolo ambito urbano. Anche utilizzando una qualche funzione dei valori ottenuti dalle centraline fisse (la centralina con valore mediano, la centralina con valore massimo, etc.) la comparazione tra i diversi ambiti urbani pare essere difficoltosa. Le centraline fisse difficilmente permettono quindi di ricavare in modo rigoroso, neppure dove sono in numero maggiore, né i livelli di inquinamento medi (in senso spaziale) nelle diverse città, né la distribuzione dei diversi inquinanti all’interno delle città stesse. Ciò è dovuto al fatto che la città (soprattutto la tipologia urbana italiana) è un ambito nel quale il raggio di rappresentatività del dato sperimentale è molto ristretto; è, anzi, un ambito nel quale il concetto stesso di raggio di rappresentatività tende a perdere di significato. Mentre in ambiti rurali un eventuale dato ambientale può essere rappresentativo di aree vaste (anche chilometri), in ambito urbano valori misurati all’interno di un canyon stradale e a poca distanza dietro gli edifici possono differire anche di alcuni fattori. Proprio il canyon stradale è probabilmente la scala spaziale tipica dell’inquinamento atmosferico in ambito urbano. Unica, importante eccezione dovrebbe essere rappresentata, sulla base dei dati 11 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna disponibili in letteratura, dalle polveri fini che rappresentano insieme a ozono e benzene gli inquinanti più critici. Si è anche verificata la significatività delle differenze riscontrate nelle concentrazioni medie proprie di ogni città (ottenute cioè dalla media dei rilevamenti di tutte le centraline collocate in ogni ambito urbano). La variabilità di tali medie assume, dal punto di vista epidemiologico, un notevole interesse qualora queste si rivelino fattori discriminanti tra i diversi ambiti urbani, ossia nel caso in cui risultino significative le differenze tra i dati relativi ai diversi capoluoghi di provincia. L’obiettivo principale è, quindi, quello di effettuare un confronto tra la variabilità osservata all’interno di ogni città con la variabilità tra città diverse, per capire se l’elevata varianza complessiva delle medie annue di monossido di carbonio, monossido di azoto e biossido di azoto può essere attribuita a sensibili differenze tra i diversi ambiti urbani. Il metodo usualmente adottato è quello proposto da Fisher (ANOVA). Esso si basa sul confronto tra la varianza entro i gruppi (in questo caso le città) e la varianza tra i gruppi; questa procedura, tuttavia, richiede ipotesi la cui fondatezza è difficilmente dimostrabile in casi, come quello in questione, in cui i dati disponibili sono poco numerosi. Di conseguenza si è ritenuto più opportuno effettuare un confronto tra le medie annue registrate da centraline situate in diversi ambiti urbani utilizzando il test di Kruskal-Wallis, alternativa non parametrica all’analisi della varianza che prescinde dalle ipotesi di omoschedasticità e normalità distributiva del carattere. Il test saggia l’ipotesi che le medie annue delle centraline di tutta la regione appartengano alla medesima popolazione. Più in particolare esso verifica che le medie annue di ogni singola città abbiano uguale distribuzione dei posti d’ordine (e di conseguenza anche uguale mediana); se tale ipotesi viene rifiutata significa che esistono differenze non accidentali tra le varie città e quindi livelli di inquinamento differenti per ogni singolo urbano. L’analisi è stata condotta solo per i tre inquinanti (NO, NO2, CO) monitorati da un numero sufficiente di centraline. Per gli ossidi di azoto il test ha mostrato la non significatività delle differenze tra i differenti ambiti urbani, a qualunque livello di significatività. Diversi sono i risultati ottenuti relativamente al monossido di carbonio, per il quale le differenze tra i diversi ambiti urbani risultano significative, anche se non altamente significative (p=0.014). Il risultato non è più significativo se dal calcolo si escludono i dati relativi alla città di Ravenna. Il p-value sale addirittura a 0.719 escludendo anche i dati di Bologna. Queste due città presentano infatti valori di CO sensibilmente inferiori a quelli rilevati nelle altre città. Tale risultato, nel caso di Bologna, contrasta col fatto che i livelli di NO ed NO2 sono invece paragonabili a quelli delle altre città. I risultati ottenuti da questa analisi (Tabella 4.1) sembrano, quindi, attribuire in gran parte alla variabilità all’interno delle singole città la diversità osservata tra le medie annue registrate dalle centraline fisse, nonostante le differenze esistenti tra i capoluoghi dell’Emilia Romagna sia per quanto riguarda le dimensioni, sia per quanto riguarda la collocazione geografica. Si può pertanto concludere che le stazioni fisse, che registrano grande variabilità all’interno di ogni singola città e non significative diversità tra i diversi capoluoghi, difficilmente permettono, senza il supporto di altre informazioni (per es. dati sperimentali o metodi di selezione o combinazione dei rilevamenti delle centraline), di effettuare confronti di tipo epidemiologico. 12 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Tabella 4.1 – Significatività delle differenze tra le medie delle diverse città per CO, NO ed NO2 TEST P-VALUE NO 0,499 NO2 0,502 CO 0,014 CO senza Ravenna 0,055 CO senza Ravenna né Bologna 0,719 Concludendo, notevole è l’importanza della grande variabilità spaziale degli inquinanti monitorati: considerato infatti che i limiti di legge hanno essenzialmente una valenza sanitaria, occorrerebbe dotarsi del quadro concettuale e strumentale appropriato per la salvaguardia della salute della popolazione con un corrispondente dettaglio spaziale. A tal proposito occorrerebbe in linea teorica poter disporre, al fine di una efficace stima delle concentrazioni medie di ogni ambito urbano, delle concentrazioni outdoor in ogni punto della città per tutto l’anno, obiettivo, come già detto, non raggiungibile con le centraline fisse già installate né raggiungibile con l’aggiunta di altre centraline fisse. 13 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 2,5 2,0 1,5 1,0 0,5 0,0 BO CE FE FO MO PR PC RA RE RN Figura 4.1 –Medie annue dei rilevamenti di CO (anno 2000). Le colonne retinate rappresentano le medie di ogni città. 120 100 80 60 40 20 0 BO CE FE FO MO PR PC RA RE RN Figura 4.2 –Medie annue dei rilevamenti di NO (anno 2000). Le colonne retinate rappresentano le medie di ogni città. 14 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 90 80 70 g/m3 60 50 40 30 20 10 0 BO CE FE FO MO PR PC RA RE RN Figura 4.3 –Medie annue dei rilevamenti di NO2 (anno 2000). Le colonne retinate rappresentano le medie di ogni città. 60 50 40 µ 30 20 10 0 BO CE FE FO MO PR PC RA RE RN Figura 4.4 –Medie annue dei rilevamenti di O3 (anno 2000). Le colonne retinate rappresentano le medie di ogni città. 15 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 5. Relazioni tra statistiche univariate Il legame tra le statistiche univariate risulta di particolare interesse. La differenza tra la media, la mediana, il valore massimo e il 95º percentile è spesso notevole e spiegabile tramite le distribuzioni di frequenza delle concentrazioni degli inquinanti: tali distribuzioni, asimmetriche a destra (e che la letteratura identifica come generalmente assimilabili a distribuzioni lognormali), presentano infatti code molto lunghe. La figura 5.1 mostra, a titolo di esempio, la distribuzione delle concentrazioni di monossido di carbonio relative alla stazione “Malpighi“ di Bologna. 800 700 frequenza 600 500 400 300 200 100 0 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6 6,5 7 7,8 8,9 concentrazioni Figura 5.1 – Distribuzione in frequenza delle concentrazioni orarie di monossido di carbonio – Stazione “Malpighi” (anno 2000). La tabella 5.1 riporta i coefficienti di correlazione tra le medie annue e i 95-percentili e tra le medie e i massimi, calcolate partendo sia dai dati orari sia da quelli giornalieri. Il forte legame tra le medie e i 95-percentili appare evidente per tutti gli inquinanti considerati; più debole risulta l’associazione tra medie annue e massimi. Tabella 5.1 - Coefficienti di correlazione tra statistiche univariate Media - 95 perc Media - max ORARI CO 0,95 0,64 NO 0,90 0,47 NO2 0,95 0,72 O3 0,74 0,04 SO2 0,78 0,00 Benzene 0,99 0,52 GIORNALIERI CO NO NO2 O3 SO2 PTS PM10 Benzene Media - 95 perc 0,94 0,90 0,94 0,89 0,74 0,92 0,97 0,95 Media - max 0,88 0,76 0,75 0,73 0,12 0,83 0,63 0,94 16 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna L’esistenza di una buona correlazione tra 95° percentile e media significa che i siti ove si registrano le medie di lungo periodo più elevate, sono anche quelli dove con più probabilità si verificheranno anche i picchi. Questo aspetto assume una certa importanza sia dal punto di vista della prevenzione sanitaria che della programmazione del territorio. E’ infatti possibile mirare alla conoscenza di medie di lungo periodo per avere informazioni anche sulla probabilità di eventi acuti. La ricerca delle aree critiche all’interno della città dovrebbe quindi concentrarsi sulle medie di lungo periodo, non solo per gli inquinanti che hanno effetti a lungo termine come il benzene ma anche per quelli che sono legati ad effetti di tipo acuto. Anche le attività modellistiche potrebbero trarre utili indicazioni da tali relazioni tra le grandezze statistiche potendo indirizzarsi verso il calcolo di medie di lungo periodo; questo dovrebbe avvenire non solo per l’estrema difficoltà di ottenere all’interno degli ambiti urbani andamenti di tipo orario o giornaliero ad alta risoluzione, ma anche per la minore utilità da un punto di vista della difesa della salute della popolazione. Anche l’ipotetica individuazione esatta del dove (in quale punto della città) e quando si è registrato (utilizzo diagnostico della modellistica) o si registrerà (utilizzo prognostico) un picco non appare di grande interesse pratico in quanto difficilmente appaiono percorribili e utili interventi di limitazione del traffico di tipo molto puntuale. Di un qualche interesse sarebbe la previsione degli eventi acuti del valore medio di inquinamento della città, anche se l’evoluzione della legislazione e delle pratiche di intervento mira sempre più a evitare provvedimenti d’urgenza e quindi ne riduce l’interesse. Obiettivi quindi di grande importanza pratica per la ricerca ambientale, potrebbero essere, come già detto, quelli di mirare alla conoscenza delle concentrazioni medie annue nei diversi punti delle aree urbane (per permettere all’amministrazione comunale di agire per il risanamento delle aree critiche) e/o all’andamento orario delle concentrazioni medie della città (in senso spaziale) per tutto l’anno per ogni inquinante (dato che potrebbe essere utilizzato come indicatore dell’esposizione media della popolazione). Il raggiungimento di questi obiettivi richiede però l’utilizzo di strumenti modellistici e di procedure sperimentali che valorizzino sia i dati delle centraline fisse, sia quelli dei mezzi mobili e dei campionatori passivi. 17 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 6. Correlazioni lineari tra centraline Il calcolo del grado di correlazione tra le diverse centraline ha rappresentato la parte centrale dello studio e ha permesso di evidenziare il legame fra gli andamenti temporali dei rilevamenti delle centraline fisse, andando al di là del confronto tra le grandezze medie. Lo strumento operativo scelto è il coefficiente di correlazione di Pearson, che verifica la correlazione lineare tra due variabili. Il coefficiente è un parametro adimensionale che varia tra –1 e 1. Un coefficiente pari a –1 indica che le due variabili sono perfettamente anticorrelate, un coefficiente uguale a 0 indica che le due variabili sono indipendenti, un coefficiente uguale a 1 indica una perfetta correlazione. E’ stato scelto questo parametro perché si è verificata l’appropriatezza dell’ipotesi di linearità tra le concentrazioni rilevate in due diverse stazioni di misura, anche se la dispersione dei dati intorno alla retta di regressione è molto variabile a seconda dell’inquinante e della coppia di centraline considerate. Una importante annotazione preliminare riguarda la presenza di errori sperimentali che tendono ad abbassare le correlazioni. Un errore relativo del 10% nelle misure di un inquinante si ripercuote in una riduzione di circa il 9% del coefficiente di correlazione 1. Questo porta a dire che l’approccio adottato in questo studio è quello del calcolo del valore minimo di correlazione. L’eliminazione di eventuali dati anomali presenti nel dataset perchè sfuggiti al controllo effettuato in fase preliminare e la considerazione precisa per ogni centralina e per ogni inquinante degli errori sperimentali porterebbe ad un aumento anche sensibile del coefficiente di correlazione calcolato. Vengono qui di seguito analizzati i risultati dell’analisi di correlazione. Le correlazioni giornaliere sono risultate quasi sempre più alte di quelle orarie anche perché non risentono del leggero, non sistematico sfasamento dei picchi orari (anticipo o ritardo) tra le diverse centraline. Anche di questo bisogna tenere conto in fase di interpretazione dei risultati, in quanto le correlazioni orarie risultano ridotte da questo effetto che però da un punto di vista di difesa della salute della popolazione ha una importanza limitata. L’analisi del coefficiente di correlazione di Pearson per il monossido di carbonio ha evidenziato una generalmente buona correlazione tra le diverse centraline (N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 11). Ancora migliore è risultata la correlazione per il monossido di azoto, con valori di correlazione tra i dati giornalieri che superano spesso 0,9 (N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 43). Inferiore al CO e all’NO è risultata la correlazione tra le centraline per la misura del biossido di azoto (N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 5). Ottime sono risultate le correlazioni relative all’ozono: a Modena, Bologna, Ferrara e Ravenna, uniche città ove sono disponibili più rilevatori di O3 all’interno dell’area urbana, le correlazioni giornaliere tra le diverse centraline sono sempre superiori a 0,94. L’analisi dei dati del biossido di zolfo ha evidenziato una estrema variabilità del grado di correlazione, dato quest’ultimo che riveste peraltro un’importanza relativa a causa dei problemi relativi alla sua misura (i valori sono spesso al di sotto della soglia di rilevabilità). 18 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna La situazione del benzene è particolare in quanto esso, quando è misurato in continuo, è generalmente rilevato da una sola centralina. Solo a Modena e Bologna esistono più rilevatori di tale parametro. A Bologna l’analisi di correlazione è stata condotta per le tre stazione che misurano tale parametro (“Zanardi”, “S. Felice” e “G. Margherita”). Non è stata invece effettuata l’analisi a Modena per la non sufficiente disponibilità di dati validi della centralina XX Settembre. Le correlazioni giornaliere a Bologna risultano tutte e tre superiori a 0,81, pur essendo una di tipo A, una di tipo B e una di tipo C. La correlazione più alta (0,91) risulta quella tra la centralina “Zanardi” e G.Margherita”. I dati sono quindi pochi per trarre conclusioni, anche se è ragionevole ritenere che esista una buona correlazione tra i rilevamenti giornalieri di benzene nei diversi punti di un’area urbana. Un discorso particolare meritano le polveri. Esse vengono misurate nella forma di Polveri Totali Sospese (PTS) e nella forma PM10 (Polveri con diametro aerodinamico inferiore a 10 micron). Le PTS sono monitorate in genere da più di una centralina per ogni ambito urbano con rilevatori che sono spesso omogenei all’interno della stessa città ma disomogenei tra diverse città. I dati sono in genere giornalieri, a parte Bologna e Piacenza che dispongono di centraline che forniscono dati biorari. Non sono state però considerate nell’analisi le centraline di Bologna del tipo MPSI100 (beta) per problemi di numerosità di dati validi. Le correlazioni sono risultate comprese tra 0,49 e 0,64 per le aree urbane di Cesena, Forlì e Rimini e tra 0,84 e 0,91 per le aree urbane di Modena, Parma e Piacenza. Per quanto riguarda il PM10, il discorso è analogo al benzene per quanto riguarda la numerosità dei siti di rilevamento, con l’aggravante che, ove è misurato da più di una centralina, è misurato con tipi di rilevatori diversi. Modena e Ravenna sono le uniche città che disponevano nel 2000 di 2 rilevatori di PM10 collocati all’inetrno dell’area urbana. Modena ha un rilevatore Adam (beta) giornaliero e un rilevatore Teom (freq.) orario. La correlazione giornaliera è pari a 0,89. A Ravenna la correlazione è tra un MP101M (beta) biorario e un Adam (beta): anche in questo caso la correlazione risulta pari a 0,89. Concludendo, dai dati in nostro possesso pare ragionevole dire che le centraline per la misura del PM10 sono ben correlate nonostante la diversità dei metodi sperimentali, anche se i dati sono pochi per poter trarre conclusioni generali. Come già evidenziato per le statistiche univariate, nemmeno rispetto alle correlazioni emerge una particolare influenza della tipologia di centralina. Concludendo, i risultati presentati vanno interpretati in diverse propettive. Essi possono infatti essere utilizzati: 1. Per un controllo di qualità dei rilevamenti (se due centraline sono ben correlate si possono evidenziare i malfunzionamenti sulla base dell’analisi dei residui standardizzati calcolati rispetto alla retta di regressione); 2. Per la copertura di dati mancanti nelle serie storiche (se due centraline sono ben correlate e se una per un guasto smette di funzionare, si potrebbero stimare i dati di quella non funzionante sulla base dei dati di quella funzionante); 3. Per ottimizzare la distribuzione e il numero delle centraline fisse necessarie al monitoraggio nell’ottica di un miglior rapporto costi-benefici; 4. Per un utilizzo sinergico di dati di campionatori passivi e mezzi mobili con i dati delle centraline fisse (vedi capitolo 7). In particolare, rispetto al terzo punto, una correlazione alta implica una certa ridondanza dell’informazione fornita. Una volta ottenuta, infatti, sulla base dei rilevamenti passati, la relazione funzionale che lega due centraline, sarebbe possibile ricavare i rilevamenti futuri nel sito di una centralina sulla base dei valori rilevati dall’altra. Si ritiene ragionevole 19 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna fissare a 0,9 la soglia del coefficiente di correlazione per una affidabile stima delle concentrazioni nel sito di una centralina rispetto ad un’altra. L’errore che si commetterebbe ricavando la concentrazione media giornaliera di una centralina dall’altra è in tal caso basso, in alcuni casi addirittura paragonabile all’errore sperimentale associato alla misura di quell’inquinante. Il criterio indicato per l’applicazione delle procedure di stima potrebbe probabilmente essere reso meno stringente valutando attentamente gli errori sperimentali nei dati di partenza e la strategia e i fini della rete di monitoraggio nel suo complesso. Occorre anche considerare se, in un contesto di risorse limitate e contenimento dei costi, sia opportuno mantenere in funzione un numero molto alto (rispetto agli standard europei e mondiali) di centraline o sia più opportuno rinunciare ad alcune centraline fisse, che hanno peraltro un raggio di rappresentatività molto limitato, per liberare risorse a favore di un controllo più efficace sulle centraline rimaste e di un utilizzo più sistematico di mezzi mobili e campionatori passivi. Un’ultima osservazione riguarda le implicazioni epidemiologiche della buona correlazione tra le diverse centraline all’interno degli ambiti urbani. Il dato d’inquinamento ambientale che si desume da una o più centraline, infatti, può, come già detto, non essere rappresentativo del livello di inquinamento medio della città. Se però i vari siti sono ben correlati tra loro, l’andamento temporale di uno di essi (o di una combinazione di essi) è probabilmente rappresentativo dell’andamento temporale dell’intera città e quindi dell’esposizione della popolazione. Ciò permette di valutare, ad esempio, l’entità dell’associazione tra gli andamenti dei dati ambientali e sanitari ma rende problematica la quantificazione delle soglie e dei livelli di inquinamento associati ad un determinato effetto sanitario (funzione di rischio). Nelle tabelle che seguono sono sintetizzati i risultati dell’analisi dei coefficienti di correlazione. Le statistiche riportate sono state calcolate sull’insieme di tutte le coppie di centraline dei singoli agglomerati urbani. Tale prospetto viene presentato nell’idea che le proprietà di correlazione debbano essere considerate più legate alle caratteristiche dei siti di misura e alle proprietà fisico-chimiche di ogni singolo inquinante che alle specificità dei diversi ambiti urbani. La numerosità riportata nelle tabelle è riferita al numero di coppie di centraline su cui sono calcolate le statistiche sintetiche. Tabella 6.1 – Prospetto sintetico delle correlazioni calcolate sui dati orari tra tutte le coppie di centraline collocate all’interno dello stesso ambito urbano. CO NO NO2 O3 SO2 PTS Mediana 0,75 0,76 0,70 0,94 0,48 0,82 Media 0,72 0,75 0,69 0,94 0,50 0,82 Massimo 0,90 0,93 0,90 0,96 0,87 0,82 Minimo 0,41 0,42 0,32 0,93 0,25 0,82 Numerosita' 82 99 95 6 19 1 Tabella 6.2 – Prospetto sintetico delle correlazioni calcolate sui dati giornalieri tra tutte le coppie di centraline collocate all’interno dello stesso ambito urbano. CO NO NO2 O3 SO2 Benzene PTS Mediana 0,82 0,89 0,78 0,96 0,64 0,84 0,85 Media 0,81 0,87 0,74 0,96 0,62 0,85 0,79 Massimo 0,97 0,98 0,93 0,97 0,84 0,91 0,91 Minimo 0,58 0,61 0,26 0,94 0,34 0,81 0,49 Numerosita' 82 99 95 6 19 4 11 20 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 7. Regressioni lineari tra centraline 7.1 Scelta del modello di regressione Nel calcolo delle correlazioni, si era già osservato che la relazione che lega i valori di un inquinante in due diverse centraline può ritenersi lineare. La dispersione dei dati intorno alla retta interpolante è molto variabile a seconda dell’inquinante e della coppia di centraline considerati, ma anche nei casi di maggiore dispersione, il modello lineare sembra comunque quello più appropriato. La via più immediata sarebbe quella di applicare una regressione lineare calcolata con il metodo dei minimi quadrati. Tale regressione, nella versione più comunemente usata, minimizza i quadrati degli scarti tra il valore previsto e quello osservato della variabile dipendente. Ne consegue che, a seconda che si consideri come esplicativa una variabile o l’altra, vengono stimate due rette diverse, i cui coefficienti angolari non sono, come ci si aspetterebbe, l’uno il reciproco dell’altro. La differenza tra le rette stimate è tanto maggiore quanto minore è l’R2 del modello (v. figura seguente). Nel nostro caso, non essendovi un antecedente causale (non c’è una centralina che determini “fisicamente” il valore dell’altra: semplicemente esse covariano) la scelta di considerare una delle due variabili dipendente sarebbe risultata necessariamente arbitraria. Ci si è dunque orientati verso un modello regressivo lineare proposto da Pearson in cui la retta stimata è quella che minimizza non già i quadrati delle differenze tra il valore previsto della variabile dipendente e quello osservato, ma i quadrati delle proiezioni ortogonali, sulla retta, dei valori osservati. Così, il modello risulta invariante rispetto all’inversione degli assi e quindi rispetto al fatto che si consideri esplicativa una variabile piuttosto che l’altra. L’applicazione di tale metodo anziché di quello regressivo tradizionale si rende anche necessaria in quanto entrambe le variabili sono affette da errore. Ciò aumenta il carattere di pariteticità delle due variabili. Figura 7.1 – Esempi di rette di regressione ai minimi quadrati e ai minimi quadrati ortogonali sui dati orari di due stazioni (“Morgagni” e “Giardini”) per la misura del monossido di carbonio a Forlì. Unità di misura mg/m3. 21 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 7.2 Stima degli errori Interpolare una nube di punti con una retta, e basarsi su tale retta per leggere i valori stimati di una centralina, comporta naturalmente un’approssimazione, tanto più elevata quanto maggiore è la dispersione dei punti intorno alla retta. Se la dispersione dei punti intorno alla retta rimane costante al crescere dei valori della variabile indipendente, la varianza della variabile dipendente è costante rispetto ai valori assunti dalla variabile esplicativa, così come è costante l’errore di previsione. In tal caso si può dare una valutazione dell’errore medio di previsione. Come misura dell’incertezza associata alla previsione è stata considerata la deviazione standard delle proiezioni ortogonali dei dati osservati sulla perpendicolare alla retta di regressione calcolata secondo il metodo proposto da Pearson. Si riporta nella figura 7.2 un esempio di varianza quasi costante per tutto l’intervallo di valori delle variabili, per una coppia di centraline molto ben correlate, che rivelano l’ozono. Figura 7.2 – Dispersione dei dati e retta di regressione per due stazioni per la misura dell’ozono (“Bologna” e “Mizzana”) a Ferrara. Dati orari. Unità di misura µg/m3. Come si osserva, la dispersione dei punti intorno alla retta stimata non cresce all’aumentare dei valori rilevati dalla centralina Mizzana. Tale dispersione risulta inoltre abbastanza contenuta ed infatti l’indice di correlazione di Pearson è pari a 0.94. La deviazione standard calcolata risulta pari a 8.4. Ciò significa che, nel 68% dei casi in cui si effettua una stima del valore assunto dalla centralina Bologna, l’errore commesso sarà, nell’ipotesi di una distribuzione gaussiana dei residui ortogonali rispetto alla retta di regressione, inferiore, in valore assoluto, a 8.4. La figura 7.3 esemplifica la distribuzione dei residui di regressione per una coppia di centraline per la misura dell’NO2 (le centraline “Garibaldi” e “Giardini” a Modena) con una correlazione di media entità (0,81). 22 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 3000 2000 1000 Dev. Stand = 1 1,01 Media = - ,8 0 N = 7833,0 0 ,0 75 ,0 65 ,0 55 ,0 45 ,0 35 ,0 25 ,0 15 0 5, ,0 -5 0 5, -1 0 5, -2 0 5, -3 0 5, -4 0 5, -5 0 5, -6 Figura 7.3 – Distribuzione in frequenza dei residui di regressione per due stazioni per la misura del biossido di azoto (“Garibaldi” e “Giardini”) a Modena. Il test di Kolmogorov-Smirnov porta a rifiutare l’ipotesi di normalità distributiva, ma, come si vede dal grafico, la distribuzione è unimodale e abbastanza simmetrica; rispetto ad una curva normale risulta leggermente più piccata (presenta una curtosi pari a 3.6), il che significa che vi è un maggior numero di residui prossimi allo zero e quindi un maggior numero di dati che si trovano in un intervallo pari a una deviazione standard. In alcuni casi capita invece che l’errore cresca al crescere del valore della variabile indipendente (eteroschedasticità). Ciò si può verificare abbastanza agevolmente dal semplice grafico a dispersione. In questo caso, risulterebbe più appropriato esprimere l’errore medio di previsione invece che in termini di deviazione standard, in termini di errore relativo. Nelle figure che seguono sono riportate alcune regressioni esemplificative della tipologia di dispersione dei dati, della bontà del modello di regressione (deviazione standard delle incertezze) e della diversità tra regressioni sui dati orari e sui dati giornalieri. 23 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Figura 7.4 – Dispersione dei dati e retta di regressione per due stazioni per la misura dell’ozono (“Bologna” e “Mizzana”) a Ferrara. Dati orari. Unità di misura µg/m3. Figura 7.5 – Dispersione dei dati e retta di regressione per due stazioni per la misura del biossido di azoto (“Zanardi” e “G.Margherita”) a Bologna. Dati orari. Unità di misura µg/m3. 24 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Figura 7.6 – Dispersione dei dati e retta di regressione per due stazioni per la misura del biossido di azoto (“Bufalini” e “Mulini”) a Cesena. Dati orari. Unità di misura µg/m3. Figura 7.7 – Dispersione dei dati e retta di regressione per due stazioni per la misura del biossido di azoto (“Garibaldi” e “Giardini”) a Modena. Dati orari. Unità di misura µg/m3. 25 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Figura 7.8 – Dispersione dei dati e retta di regressione per due stazioni per la misura del monossido di azoto (“Isonzo” e “Mizzana”) a Ferrara. Dati orari. Unità di misura µg/m3. Figura 7.9 – Dispersione dei dati e retta di regressione per due stazioni per la misura del monossido di carbonio (“Morgagni” e “Giardini”) a Forlì. Dati orari. Unità di misura mg/m3. 26 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Figura 7.10 – Dispersione dei dati e retta di regressione per due stazioni per la misura dell’ozono (“Bologna” e “Mizzana”) a Ferrara. Unità di misura mg/m3. 27 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 8. Individuazione dei dati anomali Una buona correlazione lineare tra due centraline permette di definire una procedura per l’individuazione dei dati anomali. Analizzando il grafico a dispersione tra due centraline ben correlate, infatti, i punti risulteranno concentrati intorno ad una retta, con una dispersione abbastanza contenuta. Un valore che si discosta in modo evidente dalla retta interpolante, indica che presso una centralina si è rilevato un valore “anomalo” rispetto alla usuale relazione funzionale che lega i due siti. Ciò può essere dovuto sia ad episodi straordinari di inquinamento (cantieri, chiusura del traffico in via, incidenti con rilascio di inquinanti, etc.), sia ad una rilevazione erronea da parte della centralina. In ogni caso, si tratta di un valore anomalo, che è utile identificare. La procedura suggerita prevede, una volta identificato un dato anomalo, di osservare l’andamento temporale della concentrazione dell’inquinamento per il periodo immediatamente precedente e seguente a tale dato. In tal modo, si può osservare se il dato è isolato o se fa parte di un gruppo di valori che si discostano da quelli attesi. Inoltre, un dato orario mal correlato può essere dovuto anche semplicemente ad uno sfasamento di picchi di maggior inquinamento e questo si vede agevolmente da un grafico di sequenza. Un grafico di questo tipo, quindi, permette di fare alcune ipotesi sulla natura del dato anomalo.L’identificazione del dato anomalo dal grafico a dispersione, però, non è sempre agevole e può presentare dei problemi soprattutto quando vi è molta dispersione dei dati. Tale metodo, inoltre, presenta inevitabilmente una componente di soggettività. Un metodo oggettivo che segue un principio equivalente, è quello di stimare i residui standardizzati di tutte le osservazioni rispetto alla retta interpolante e scegliere di controllare i valori che generano i residui standardizzati maggiori o eccedenti una certa soglia prefissata. Tale soglia può essere fissa, o variabile in base alla dispersione dei punti. Nella figura 8.1è riportato il grafico a dispersione di due centraline che presentano una correlazione non molto alta: si tratta delle centraline Roma e Giardini che rilevano il CO a Forlì. Figura 8.1 – Dispersione dei dati per due stazioni per la misura del monossido di carbonio (“Giardini” e “Roma”) a Forlì. 28 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Come risulta abbastanza chiaramente dal grafico, il punto evidenziato si discosta notevolmente dagli altri, in quanto la centralina Roma rileva un valore di CO pari a 11.6, mentre la centralina Giardini rileva un valore pari a 0.9 dello stesso inquinante. A tale punto corrisponde un residuo standardizzato di valore assoluto molto elevato. Di seguito vengono riportati i cinque residui negativi con valore assoluto più alto, calcolati rispetto alla retta di regressione. Il primo valore (-11,126) identifica proprio il punto indicato nella figura precedente. Tabella 8.1 - Residui standardizzati di regressione per i rilevamenti orari di monossido di carbonio delle centraline “Giardini” e “Roma” a Forlì.. 1 -11,126 2 -4,074 3 -4,070 4 -3,996 5 -3,484 6 …… In questo caso il residuo generato dal valore anomalo è pari a –11.126, in valore assoluto quasi il triplo del secondo residuo negativo più alto. Anche dall’analisi dei residui standardizzati, quindi, emerge il dato anomalo individuato graficamente. Figura 8.1 – Andamento temporale del monossido di carbonio nelle due stazioni “Giardini” e “Roma” a Forlì in corrispondenza del dato individuato come anomalo. Analizzando la finestra temporale con i valori precedenti e successivi a quello anomalo (figura seguente), si osserva inoltre che tale dato è isolato, risultando notevolmente differente sia dai valori rilevati le ore precedenti e quelle successive dalla stessa centralina, sia dai valori rilevati per la stessa ora dalle altre due centraline presenti a Forlì. 29 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 9. Ipotesi per un utilizzo integrato di centraline fisse, mezzi mobili e campionatori passivi. La conoscenza della distribuzione dell’inquinamento all’interno delle città rappresenta certo uno degli obiettivi più ambiziosi e di maggior importanza sia in ottica ambientale che epidemiologica. La bassa rappresentatività spaziale delle centraline fisse rappresenta una importante limitazione ad un loro utilizzo in questa ottica, nemmeno prospettandone un aumento di numero: questioni di costo, ingombro, manutenzione e gestione dei dati impediscono infatti la percorribilità di una tale strada. Occorre quindi non solo un utilizzo appropriato di modellistica di vario tipo ma anche una integrazione dei dati delle centraline fisse con i dati di strumenti di misura più “snelli” come i campionatori passivi ed i mezzi mobili. Questi ultimi prevedono però, dati gli elevati costi, un tempo di rilevazione limitato all’interno del quale eventuali episodi anomali di inquinamento (rispetto alle medie del periodo) hanno un notevole effetto distorcente rispetto alle medie di lungo periodo e non sono comunque lo strumento appropriato per cogliere, oltre alla varibilità spaziale, la marcata variabilità temporale di quasi tutti gli inquinanti. Sebbene, quindi, campionatori fissi e mobili non permettano, da soli, una mappatura dell’inquinamento, un loro uso sinergico potrebbe consentire, a determinate condizioni, un monitoraggio più dettagliato a livello spaziale e temporale che si affiancherebbe in modo efficace alla modellistica. Qualora si stabilisse infatti che esiste una buona correlazione (per es. > 0,9) tra un sito non provvisto di apparati di misura in continuo di un certo inquinante e uno in cui sia collocata una centralina fissa, sarebbe possibile derivare la concentrazione nel primo sito tramite un campionamento a finestra temporale. In particolare, la procedura consisterebbe nel fare campionamenti limitati nel tempo in diversi punti della città (con mezzi mobili o campionatori passivi), calcolare il coefficiente di correlazione per ognuno di essi rispetto ad una o più centraline fisse prese come riferimento, e nel caso questo risulti superiore ad una soglia stabilita, ottenere una relazione funzionale e ricavare sulla base di questa l’andamento della concentrazione per tutto l’anno. La procedura si semplificherebbe ulteriormente nel caso si verificasse che tra due punti di misura qualsiasi di un certo inquinante all’interno dell’area urbana esiste una buona correlazione. L’esistenza di una buona correlazione soprattutto degli inquinanti primari da traffico è suffragata del resto dalla constatazione della peculiarità dell'ambiente urbano. La città può essere infatti generalmente considerata un ambiente spazialmente uniforme da un punto di dell’andamento temporale delle proprietà dispersive, anche se le variabili meteorologiche e le proprietà dispersive possono avere una distribuzione estremamente puntuale. A questo si aggiunga che gli ambiti urbani sono interessati da una preponderante, quasi unica e comune a quasi tutti gli inquinanti, sorgente di inquinamento: il traffico veicolare. Questi aspetti suggeriscono la possibilità dell’esistenza di buone correlazioni tra gli inquinanti, al di là delle loro differenti caratteristiche fisico-chimiche. Lo studio ha evidenziato come, sulla base dei dati delle centraline fisse esaminati, questo approccio appare giustificato con un errore accettabile in un numero consistente di siti e di inquinanti, soprattutto su scala giornaliera. Vi sono però centraline che per alcuni inquinanti paiono avere comportamenti molto particolari, in contrasto rispetto ad un comportamento generale di ottima correlazione. A questo proposito sarebbero utili controlli sulla affidabilità dei dati di tali centraline e comunque una definizione dell’errore accettabile nell’ottenimento di queste stime. Sono comunque necessarie ulteriori analisi per verificare la corretteza dell’utilizzo di tale procedura anche nei siti dove non sono presenti centraline fisse. 30 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Bisogna anche dire che più si è interessati, piuttosto che a valori orari, a valori medi giornalieri o di più lungo periodo, più la procedura sarebbe affidabile. D’altronde le medie di lungo periodo sono probabilmente il parametro più importante da un punto di vista della programmazione del territorio e spesso anche da un punto di vista della prevenzione sanitaria. A suffragio della percorribilità di tale procedura, viene qui di seguito presentata un’analisi dei dati di campionatori passivi per la misura del benzene condotte dal 1996 a cadenza mensile e della durata di una settimana cadauna, in 5 postazioni in area urbana. La tabella seguente illustra le caratteristiche dei siti di misura. Tabella 9.1 - Caratteristiche dei 5 siti di campionamento periodico di benzene Nome della stazione Caratteristiche del sito Via Nonantolana Prima periferia: strada a medio traffico L.go Garibaldi Area ad alta densità di traffico V. Scudari Centro storico: zona a traffico limitato P.co Amendola Area verde residenziale Via Fontanelli Area a medio traffico Il posizionamento di un sito di campionamento passivo in corrispondenza del sito di misura in automatico (Via Nonantolana) è servito per la verifica della comparabilità con il dato fornito dalla misura in automatico. 18.0 NONANTOLANA AMENDOLA 16.0 GARIBALDI FONTANELLI SCUDARI 12.0 10.0 8.0 6.0 4.0 2.0 0.0 15 /0 6/ 98 16 /0 6/ 98 17 /0 6/ 98 18 /0 6/ 98 19 /0 6/ 98 20 /0 6/ 98 21 /0 6/ 98 21 /0 9/ 98 22 /0 9/ 98 23 /0 9/ 98 24 /0 9/ 98 25 /0 9/ 98 26 /0 9/ 98 27 /0 9/ 98 26 /1 0/ 98 27 /1 0/ 98 28 /1 0/ 98 29 /1 0/ 98 30 /1 0/ 98 31 /1 0/ 98 01 /1 1/ 98 Microgrammi al metro cubo 14.0 Giorno Si è poi proceduto alla verifica dell’ipotesi di esistenza di coefficienti costanti che leghino le concentrazioni di benzene nelle varie zone della città analizzando i dati dei campionamenti periodici. La figura 9.1 esemplifica, per il secondo semestre del 1998, gli andamenti dei rilevamenti di benzene nei cinque siti; l’impressione visiva sembra suggerire una notevole correlazione fra le concentrazioni misurate nei diversi siti. L’analisi 31 Figura 9.1 – Andamento temporale della concentrazione di benzene nelle cinque stazioni di campionamento periodico all’interno dell’area urbana di Modena. Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna quantitativa, condotta tramite lo studio dei coefficienti di correlazione, ha confermato tale impressione. La tabella seguente evidenzia i risultati di questa indagine, condotta utilizzando i rilevamenti degli anni 1998 e 1999. Via Fontanelli L.go Garibaldi Via Nonantolana Via Scudari P.co Amendola Via Fontanelli L.go Garibaldi Via Nonantolana Via Scudari P.co Amendola Tabella 9.2 - Coefficienti di correlazione di Pearson tra i siti di misura del benzene 1 0,96 0,96 0,95 0,96 0,96 1 0,92 0,93 0,90 0,96 0,92 1 0,93 0,91 0,95 0,93 0,93 11 0,90 0,96 0,90 0,91 0,90 1 I valori misurati nei cinque siti sono quindi altamente correlati. I livelli di significatività (pvalue) sono, per tutte le correlazioni studiate, inferiori a 0.01. L’analisi dei dati dei campionatori passivi pare quindi suggerire la percorribilità dell’utilizzo di una procedura del tipo illustrato all’inizio del capitolo. La procedura in particolare potrebbe consistere nel campionamento dell’inquinante considerato (per es. benzene) in un tipico periodo con alte concentrazioni (gennaio o febbraio) e in uno di basse concentrazioni (giugno-luglio). Questo permetterebbe (sempre se fosse verificata una sufficiente correlazione) di ricavare la retta di regressione rispetto ad una centralina presa a riferimento (vedi figura 9.2). La scelta di campionare in un periodo di alta e in uno di bassa concentrazione deriva dal fatto che questo riduce l’incertezza nella stima della retta di regressione; se la correlazione fosse molto alta si potrebbe fare il campionamento in qualsiasi momento dell’anno e ricavarne la retta di regressione. E’ importante rimarcare come i compionamenti nei vari punti dell’area urbana non dovrebbero essere fatti necessariamente in contemporanea. In conclusione, si rimanda ad ulteriori approfondimenti la verifica per i diversi inquinanti della fattibilità della procedura e dell’errore ad essa associato in rapporto alle diverse stime (oraria, giornaliera, annuale). 32 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Campionamenti Benzene Garibaldi e Nonantolana Periodi Febbraio e Giugno 1998 18 16 14 12 10 8 6 Campionamenti Febbraio 1998 4 Campionamenti Giugno 1998 2 0 0 2 4 6 8 10 12 14 Figura 9.2 – Dispersione dei campionamenti di benzene di Febbraio e Giugno 1998 nelle siti di “Garibaldi” e “Nonantolana” all’interno dell’area urbana di Modena. 33 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 10. Correlazioni tra centraline a scala regionale Vengono qui di seguito riportate le correlazioni calcolate per tutte le coppie di centraline presenti all’interno degli ambiti urbani regionali. Si sono studiati, per ora, solo questi inquinanti in quanto sono quelli che hanno una dinamica più a larga scala. L’obiettivo di questa analisi è testare i livelli di correlazione a grande distanza e verificare se ozono e PM10 che si suppone abbiano dinamiche a larga scala, abbiano livelli di correlazione più alti degli inquinanti primari. Il grado di correlazione per l’ozono è risultato molto elevato: 61 coppie di centraline su 91 hanno valori di correlazione su dati giornalieri superiori a 0,9 e tutte sono comunque superiori a 0,84. Tali alti livelli di correlazione permettono di ipotizzare una riduzione del numero di centraline collocate all’interno degli ambiti urbani che, nell’ottica di una rete regionale, potrebbe anche diventare inferiore al numero dei capoluoghi di provincia. Il grado di correlazione delle centraline di PM10 è risultato abbastanza variabile, con valori compresi tra 0,46 e 0,89, media 0,69 e mediana 0,70 (non sono comprese le correlazioni tra centraline delle stesse città). In questo caso il risultato è di più difficile utilizzo e meriterebbe ulteriori approfondimenti che necessariamente tengano conto anche dei diversi apparati di misura utilizzati e di una preventiva, più approfondita, analisi di qualità dei dati. Occorre anche tenere presente che la numerosità dei dati delle polveri fini è in genere molto inferiore rispetto all’efficienza di campionamento tipica degli altri inquinanti. Si è quindi reso meno stringente il criterio della disponibilità di almeno il 75% dei dati. Si sono infatti calcolate le correlazioni anche in presenza di solo 50% delle 365 coppie di dati teoricamente disponibili. La numerosità riportata nelle tabelle seguenti è riferita al numero di coppie di centraline su cui sono calcolate le statistiche sintetiche. I livelli di correlazione degli inquinanti primari sono risultati abbastanza elevati evidenziando una buon legame tra gli andamenti delle emissione e delle variabili meteorologiche anche a scala regionale. In generale le correlazioni non sono risultate molto differenti da quelle ottenute per il PM10 e per alcuni inquinanti come CO e NO addirittura inferiori. Table 10.1. Prospetto sintetico dei coefficienti di correlazione tra centraline a scala regionale. Sono escluse le centraline collocate all’interno dello stesso ambito urbano. CO NO NO2 O3 SO2 PM10 PTS BENZENE 0,75 0,78 0,69 0,91 0,31 0,69 0,50 0,61 Mediana 0,74 0,77 0,66 0,91 0,30 0,70 0,53 0,58 Media 0,92 0,93 0,93 0,98 0,79 0,89 0,81 0,82 Massimo 0,23 0,44 -0,02 0,84 -0,29 0,46 0,21 0,19 Minimo 821 936 895 86 163 49 141 18 Numerosità 34 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 11. Correlazioni tra inquinanti L’analisi del grado di correlazione tra i diversi inquinanti è stata fatta per tutti gli inquinanti monitorati; vengono qui di seguito riportati i risultati per le coppie di inquinanti ritenute più interessanti. Essi vengono presentati nelle tabelle seguenti in una visione sintetica. La numerosità riportata nelle tabelle è riferita al numero di centraline su cui sono calcolate le statistiche sintetiche delle correlazioni tra inquinanti. Le correlazioni più alte sono risultate quelle tra CO e NO, con mediana del coefficiente di correlazione pari a 0,86 (i dati riportati in questo paragrafo si riferiscono a valori giornalieri). Più deboli si sono rivelate quelle tra CO e NO2 (0,67) e tra NO e NO2 (0,67). Discretamente alta è la correlazione tra NO e benzene (0,74). Gli inquinanti più legati al traffico autoveicolare risultano quindi legati, come era lecito aspettarsi, da buona correlazione anche se generalmente non a un livello sufficiente per poter ipotizzare di ricavare un inquinante da un altro neppure su base giornaliera. Di notevole interesse sono le correlazioni tra le varie tipologie di polveri tra di loro e rispetto agli altri inquinanti. L’esistenza infatti di buoni coefficienti di correlazione soprattutto tra PTS e PM10 permetterebbe di risalire dal dato delle PTS a quello delle polveri più fini, per le quali il monitoraggio è di relativamente recente installazione e limitato a pochi siti. La correlazione tra PTS e PM10 è risultata abbastanza variabile con un valore minimo di 0,43 e massimo di 0,86 (mediana 0,75). Tale risultato suggerisce il notevole margine di errore a cui sarebbe soggetta una stima del PM10 ricavata dai dati delle PTS. Occorre però ricordare le difficoltà delle metodologie di misura delle polveri (e quindi il loro maggiore errore di misura) e le differenti metodologie di misura. E’ importante anche evidenziare come le correlazioni tra il PM10 e gli altri inquinanti risulti influenzato dalla bassa numerosità di dati validi. Si è inoltre deciso per tutte le correlazioni che coinvolgevano tale inquinante di rendere molto meno stringente il criterio della disponibilità del 75% dei dati per la scarsa efficienza di campionamento delle apparecchiature nel corso del 2000. Tali elementi portano a ritenere auspicabili approfondimenti e test sperimentali appositi. Le correlazioni studiate sono correlazioni di tipo lineare. Tale approccio è stato scelto solo per questioni di semplicità. Tale modello lineare appare però per alcune coppie di inquinanti non adeguato e sarebbe quindi utile la verifica di altri tipi di correlazione, anche non parametrici. Occorre anche aggiungere che le correlazioni tra inquinanti possono variare nel tempo al mutare delle sorgenti di emissione e quindi andrebbero periodicamente verificate. L’esistenza di correlazioni tra i diversi inquinanti risulta importante sia per la mappatura dell’inquinamento all’interno delle aree urbane (se si fanno campionamenti ad alta risoluzione spaziale per un certo inquinante è utile sapere se tale mappatura può avere elementi di validità anche per un altro inquinante), sia nella fase di impostazione delle campagne epidemiologiche (quali inquinanti monitorare per quantificare un determinato effetto sanitario) sia nella fase di interpretazione dei risultati (la ricerca delle cause determinanti gli effetti sanitari legati all’inquinamento risulta fortemente condizionata dal legame tra i diversi inquinanti). 35 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna CO - NO2 CO- PTS CO - PM10 CO - BEN NO - NO2 NO - PTS NO - PM10 NO - BEN NO2 - PM10 NO2 - BEN NO2 - PTS mediana media max min numerosità CO - NO Tabella 11.1 - Correlazioni tra inquinanti – Dati orari 0,85 0,83 0,91 0,61 42 0,63 0,61 0,76 0,36 42 0,45 0,45 0,57 0,33 2 0,63 0,63 0,65 0,60 2 0,76 0,73 0,82 0,56 4 0,57 0,54 0,65 0,25 45 0,43 0,43 0,55 0,30 2 0,46 0,46 0,47 0,45 2 0,74 0,71 0,83 0,52 4 0,48 0,48 0,53 0,44 2 0,50 0,51 0,66 0,39 4 0,46 0,46 0,47 0,45 2 CO - NO2 CO- PTS CO - PM10 CO - BEN NO - NO2 NO - PTS mediana media max min numerosità CO – NO Tabella 11.2 - Correlazioni tra inquinanti – Dati giornalieri (Parte 1) 0,86 0,84 0,93 0,61 42 0,67 0,65 0,85 0,26 42 0,59 0,54 0,66 0,30 17 0,64 0,62 0,74 0,36 11 0,70 0,67 0,84 0,43 6 0,67 0,63 0,83 0,07 45 0,50 0,48 0,61 0,25 16 NO - BEN NO2 - PTS NO2 - PM10 NO2 - BEN PTS - PM10 PTS - BEN PM10 - BEN mediana media max min numerosità NO - PM10 Tabella 11.3 - Correlazioni tra inquinanti – Dati giornalieri (Parte 2) 0,57 0,52 0,67 0,30 11 0,78 0,75 0,88 0,48 7 0,55 0,52 0,73 0,04 16 0,56 0,53 0,70 0,25 10 0,61 0,61 0,87 0,35 7 0,75 0,69 0,87 0,43 7 0,45 0,48 0,71 0,33 4 0,61 0,59 0,64 0,52 5 36 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna 12. Conclusioni L’analisi statistica dei rilevamenti delle centraline fisse collocate all’interno delle aree urbane della regione Emilia Romagna si prefiggeva i seguenti scopi: 1. fornire una quadro descrittivo della variabilità spaziale e temporale delle concentrazioni dei principali inquinanti all’interno delle aree urbane; 2. quantificare la correlazione tra le centraline anche nell’ottica di un miglior rapporto costi-benefici; 3. verificare la possibilità di definire criteri per un migliore utilizzo di campionamenti limitati nel tempo (mezzi mobili, campionatori passivi) nell’ottica di una mappatura dell’inquinamento a scala sub-urbana; 4. verificare il livello di correlazione tra centraline a scala regionale; 5. verificare la possibilità di stimare alcuni inquinanti basandosi sulle informazioni raccolte su altri inquinanti; 1) Lo studio ha permesso di evidenziare e quantificare la grande variabilità spaziale dei principali inquinanti primari da traffico (CO, NO, NO2, Benzene). Le concentrazioni medie annue rilevate dalle centraline fisse variano anche di 3 volte tra una postazione e l’altra, rispecchiando solo in parte l’effettiva variabilità spaziale all’interno degli ambiti urbani. Ciò è dovuto al fatto che all’interno delle città il raggio di rappresentatività del dato sperimentale è molto ristretto, spesso ridotto a poche decine o centinaia di metri. E’ emersa anche la limitata significatività della tipologia della centralina (A,B,C,D). Le medie appaiono infatti estremamente variabili tra centraline dello stesso tipo nella stessa area urbana e spesso molto simili tra quelle di tipo diverso (anche se quelle di tipo A hanno, generalmente, medie più basse). La variabilità temporale è anch’essa estremamente marcata e legata in modo particolare alla variabilità delle condizioni meteorologiche e della principale (quasi unica) fonte di inquinamento delle aree urbane che è costituita dal traffico. Emerge quindi, per gli inquinanti sopra citati, la difficoltà di ottenere un quadro completo dell’inquinamento atmosferico all’interno delle aree urbane tramite l’utilizzo delle sole centraline fisse e soprattutto occorre concludere che esse difficilmente permettono di accedere, neppure dove sono in numero maggiore, né ai livelli di inquinamento medi (in senso spaziale) nelle diverse città né alla distribuzione dei diversi inquinanti all’interno di esse. Test specifici hanno infatti dimostrato la non significatività statistica delle differenze tra le medie dei diversi ambiti urbani ottenute sulla base dei rilevamenti delle centraline fisse. Questo aspetto ha una notevole importanza considerando che i limiti di legge hanno essenzialmente una valenza sanitaria e sarebbe opportuno che fossero applicati con la maggior coerenza possibile nelle diverse aree. Importante eccezione potrebbe essere rappresentata dalle polveri fini (PM10 ed eventualmente PM2,5). Per tali inquinanti la letteratura individua generalmente una variabilità meno marcata 2,3, anche se non vi è su questo unanimità di giudizio 4,5. Sarebbero quindi opportune, considerata anche la tipicità degli ambiti urbani emiliani, indagini specifiche su tale aspetto, che assume una notevole rilevanza considerato che l’epidemiologia utilizza con sempre maggiore frequenza le polveri fini come unico indicatore della qualità dell’aria per la stima degli effetti sanitari. Se, infatti, fosse verificata la limitata variabilità spaziale delle polveri fini all’interno delle aree urbane si potrebbe disporre di un indicatore di qualità dell’aria che permetterebbe più efficaci confronti tra città diverse e più coerenti politiche e provvedimenti per il controllo e la limitazione dell’inquinamento atmosferico. Le centraline fisse sono quindi, in ambito urbano, un indispensabile strumento per l’analisi dei trend temporali degli inquinanti e (con qualche riserva) delle 37 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna correlazioni temporali tra variabili ambientali e sanitarie. Esse non permettono però, per molti degli inquinanti monitorati, nè di individuare le aree più critiche da un punto di vista ambientale (né a scala urbana né a scala regionale) né di quantificare in modo preciso l’esposizione media della popolazione. Per raggiungere tali scopi si rende necessario l’utilizzo di un approccio integrato di dati di centraline fisse, di campionatori passivi e mezzi mobili e strumenti modellistici di tipo fisico e statistico. Sarebbe anche auspicabile una definizione di criteri il più possibile uniformi nella collocazione o nella selezione delle centraline che potrebbero far parte di una rete a scala regionale. Tale rete dovrebbe mirare soprattutto alla rilevazione dei dati con la maggior rappresentatività spaziale possibile (parchi, aree a scarso traffico e ben areate). La buona correlazione riscontrata tra medie annue e 95° percentili per tutti gli inquinanti considerati nello studio, evidenzia l’importanza delle medie di lungo periodo nell’ottica dell’individuazione delle aree critiche. Il legame statistico infatti tra medie e valori dei picchi permette di servirsi delle medie annue per caratterizzare le zone critiche all’interno delle singole aree urbane sia in rapporto agli inquinanti che hanno effetti a lungo termine, sia in rapporto a quelli che hanno effetti di tipo acuto. 2) L’analisi del grado di correlazione tra le diverse centraline ha portato alla quantificazione precisa del legame fra gli andamenti temporali delle concentrazioni. Le correlazioni giornaliere sono risultate quasi sempre più alte di quelle orarie perché l’operazione di media limita l’effetto sia delle piccole differenze micro-meteorologiche e di traffico locali, sia degli errori di misura. L’approccio adottato in questo studio è quello del calcolo del “valore minimo” di correlazione. L’eliminazione di eventuali dati anomali presenti nel dataset e sfuggiti al controllo effettuato in fase preliminare e la considerazione precisa per ogni centralina e per ogni inquinante degli errori sperimentali potrebbe portare ad un aumento anche sensibile del coefficiente di correlazione orario calcolato (un errore relativo del 10% nelle misure di un inquinante si ripercuote in una riduzione del 9% circa nel coefficiente di correlazione). L’analisi del ha evidenziato una generalmente buona correlazione tra le diverse centraline per la misura del monossido di carbonio (Mediana del coeff. di corr. su dati giornalieri =0,82, N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 11). Ancora migliore è risultata la correlazione per il monossido di azoto, con valori di correlazione tra i dati giornalieri che superano spesso 0,9 (Mediana del coeff. di corr. su dati giornalieri =0,89, N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 43). Un po’ al di sotto del CO e dell’NO si collocano i valori di correlazione relativi al biossido di azoto (Mediana del coeff. di corr. su dati giornalieri =0,78, N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 5). Ottime sono risultate le correlazioni relative all’ozono: a Modena, Bologna, Ferrara e Ravenna, uniche città ove sono disponibili più rilevatori di O3 all’interno dell’area urbana, le correlazioni sono sempre superiori a 0,94. L’analisi dei dati del biossido di zolfo ha evidenziato una estrema variabilità del grado di correlazione. Questo dato riveste comunque un’importanza limitata a causa dei suoi bassi livelli di concentrazione tipici, spesso al di sotto della soglia di rilevabilità. La situazione del benzene è particolare in quanto esso, quando è misurato in continuo, è generalmente rilevato da una sola centralina. Pur essendo pochi quindi i dati a disposizione, essi concordano nell’assegnare una correlazione notevole (tra 0,8 e 0,9) tra diversi siti per la misura di tale inquinante. Campionamenti periodici effettuati nell’area urbana di Modena per diversi anni in cinque siti confermano questa tesi. Un discorso particolare meritano le polveri. Esse vengono monitorate nella forma di Polveri Totali Sospese (PTS) e nella forma PM10 (Polveri con diametro aerodinamico inferiore a 10 µm). Le PTS sono monitorate in genere da più di una centralina per ogni ambito urbano con 38 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna rilevatori che sono spesso omogenei all’interno della stessa città ma disomogenei tra diverse città. Le correlazioni sono risultate molto diverse tra le varie coppie di centraline. Per quanto riguarda il PM10, il discorso è analogo al benzene in rapporto alla numerosità dei siti di rilevamento; un’ulteriore aspetto problematico deriva dal fatto che, ove è misurato da più di una centralina, la misura è fatta con tipi di rilevatori diversi la cui comparabilità è oggetto di discussione. Tenendo presente queste considerazioni preliminari, dai dati in nostro possesso pare ragionevole dire che le centraline per la misura del PM10 all’interno della stessa area urbana sono abbastanza ben correlate nonostante la diversità dei metodi sperimentali, anche se i dati sono pochi per poter trarre conclusioni generali. Come già evidenziato per le statistiche univariate, nemmeno rispetto alle correlazioni emerge una particolare influenza della tipologia di centralina. Concludendo, l’analisi di correlazione tra i rilevamenti dei principali inquinanti in diversi siti all’interno dei singoli ambiti urbani ha evidenziato un legame generalmente abbastanza stretto tra gli andamenti temporali. Tale risultato può essere utilizzato sia per definire procedure per la ricostruzione di dati mancanti, sia per individuare eventuali dati anomali presenti nelle serie storiche, sia per valutare il contenuto informativo delle centraline fisse nell’ottica di un miglior rapporto costi benefici. Una correlazione alta implica infatti una certa ridondanza dell’informazione fornita. Una volta infatti ottenuto il coefficiente di regressione tra le due centraline sulla base dei rilevamenti passati, è possibile ricavare i rilevamenti nel sito di una centralina sulla base dei valori rilevati da quella scelta come riferimento. Si ritiene ragionevole fissare a 0,9 la soglia del coefficiente di correlazione che rende tale procedura di estrema affidabilità in quanto l’errore che si commetterebbe ricavando la concentrazione media giornaliera di una centralina dall’altra sarebbe basso, paragonabile all’errore di misura. Tale criterio potrebbe probabilmente essere reso meno stringente sia valutando attentamente gli errori sperimentali nei dati di partenza sia la strategia e i fini della rete di monitaraggio nel suo complesso (e quindi l’incertezza accettabile nella stima di un certo inquinante in un determinato sito). E’ utile precisare che i coefficienti di correlazione e i parametri della retta di regressione calcolati per ogni coppia di centraline si suppone debbano rimanere pressochè costanti nel tempo a meno di cambiamenti di tipo urbanistico e viario nei siti considerati. Partendo quindi dal presupposto che maggiore è il numero di centraline fisse, maggiori sono la quantità di informazioni disponibili e gli strumenti per individuare ed intervenire in caso di malfunzionamenti, è però importante evidenziare una certa ridondanza dell’informazione fornita dalle stesse. Occorre quindi valutare, in un’ottica di assegnazione delle risorse, in quale proporzione assegnare investimenti ai diversi strumenti che compongono un sistema di controllo della qualità dell’aria. 3) La bassa rappresentatività delle centraline all’interno delle città ne limita l’utilizzo nell’ottica della mappatura dell’inquinamento a scala sub-urbana. D’altro canto nemmeno aumentare i punti di misura tramite campionatori passivi e mezzi mobili appare appropriato a questo scopo, in quanto questi ultimi, fornendo dati solo per periodi limitati, non permettono di cogliere la marcata variabilità temporale degli inquinanti. Si è quindi ipotizzata una procedura per un utilizzo sinergico di tutti i dati sperimentali disponibili e cioè dei dati dei campionamenti a finestra temporale e delle centraline fisse. In particolare, la procedura consisterebbe nel fare campionamenti limitati nel tempo nei diversi punti della città (con mezzi mobili o campionatori passivi), verificare il grado di correlazione in ognuno di essi rispetto ad una o più centraline di riferimento e qualora la correlazione risultasse sufficientemente alta, ottenere i parametri della regressione e ricavare quindi l’andamento per tutto l’anno sulla base della relazione funzionale trovata (la retta) rispetto alle centraline di 39 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna riferimento. Lo studio ha evidenziato come, sulla base dei dati delle centraline fisse esaminati, questo approccio appare giustificato con un errore accettabile per molti degli inquinanti e dei siti considerati. Sono comunque necessarie ulteriori analisi per verificare la corretteza dell’utilizzo di tale procedura anche nei siti dove non sono presenti centraline fisse. E’ quindi auspicabile un prosieguo dello studio incentrato sull’analisi di dati di campionatori passivi e mezzi mobili. Bisogna anche dire che più si è interessati, piuttosto che a valori orari, a valori medi giornalieri o di più lungo periodo, più la procedura sarebbe affidabile; tali medie di lungo periodo sono forse d’altronde il parametro più importante da un punto di vista della programmazione del territorio e della prevenzione sanitaria. 4) L’obiettivo di questa analisi era di testare i livelli di correlazione a grande distanza e verificare se ozono e PM10 che si suppone abbiano dinamiche a larga scala, abbiano livelli di correlazione più alti degli inquinanti primari. Il grado di correlazione tra le centraline di ozono collocate negli ambiti urbani di tutta la regione è risultato molto elevato: 61 coppie di centraline su 91 hanno valori di correlazione su dati giornalieri superiori a 0,9 e tutte sono comunque superiori a 0,84. Tutte le centraline della regione sono quindi ottimamente correlate. E’ quindi ipotizzabile anche una riduzione del loro numero. Il grado di correlazione delle centraline di PM10 è risultato abbastanza variabile, con valori compresi tra 0,46 e 0,89, media 0,69 e mediana 0,70. In questo caso, pur essendo la correlazione evidente, il risultato non permette certo di ipotizzare una riduzione del numero di stazioni e anzi meriterebbe ulteriori approfondimenti sia nell’ambito della comparazione dei metodi di misura e quindi dei dati sperimentali utilizzati, sia nello studio delle dinamiche dispersive delle polveri fini alle diverse scale spaziali, sia nell’ambito della efficienza degli apparati di misura che per tale inquinante è risultata spesso nel corso del 2000 molto più bassa rispetto agli inquinanti. La correlazione tra gli inquinanti primari è risultata a livelli molto simili a quella ottenuta per il PM10. 5) L’analisi del grado di correlazione tra i diversi inquinanti è stata condotta in termini di correlazione lineare anche se tale approccio potrebbe risultare non totalmente soddisfacente per alcune coppie di inquinanti. Le correlazioni più alte sono risultate quelle tra CO e NO, con mediana del coefficiente di correlazione sui dati giornalieri pari a 0,86. Più deboli si sono rivelate quelle tra CO e NO2 (mediana 0,67) e tra NO e NO2 (mediana 0,67). Discretamente alta è risultata la correlazione tra NO e benzene (mediana 0,78). Gli inquinanti primari da traffico autoveicolare risultano quindi legati, come è lecito aspettarsi, da buona correlazione anche se appare dubbia la possibilità di ricavare un inquinante da un altro. La correlazione tra PTS e PM10 è risultata di 0,75 (mediana). Tale risultato renderebbe abbastanza grossolana una eventuale stima delle polveri fini dai dati delle PTS. Occorre però ricordare le differenti metodologie di misura tra le due specie di particolato, elemento che porta a ritenere auspicabili approfondimenti e test sperimentali appositi. Le correlazioni tra le polveri fini e gli inquinanti primari da traffico sono in genere intorno a 0,6. Se da un lato questo sembra suggerire l’importanza del traffico nella genesi, diretta ed indiretta, di tale inquinante, dall’altro occorre tenere presente il problema dell’influenza dell’andamento temporale delle proprietà dispersive dell’atmosfera che è comune a tutti gli inquinanti e che quindi tende ad aumentare la correlazione tra gli inquinanti indipendentemente dalla analogia delle fonti di emissione. Fa eccezione a questo l’ozono che, oltre ad avere proprietà fisico-chimiche e meccanismi di formazione totalmente differenti dagli altri inquinanti, ha una relazione del tutto peculiare anche con la meteorologia, risultando infatti non correlato rispetto a tutti gli altri inquinanti analizzati. 40 Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna Bibliografia 1. 2. 3. 4. 5. Fisher L.D., Van Belle G., “Biostatistics”, pag.385, Wiley – Interscince Publication) EPA, Air Quality Criteria for Particulate Matter (Second External Review Draft), Marzo 2001; Röösli M. et al., “Spatial Variability of Different Fractions of Particulate Matter within an Urban Environment and between Urban and Rural Sites”, J. Air & Waste Manage. Assoc.,2000, 50:11151124; VanCuren T., “Spatial Factors Influencing Winter Primary Particle Sampling and Interpretation”, J. Air & Waste Manage. Assoc., 1999, 49:PM-3-15; Brook J.R., “Observations and Interpretations from the Canadian Fine Particle Monitoring Program”, J. Air & Waste Manage. Assoc., 1999, 49:PM-35-44; 41