Analisi statistiche a supporto del monitoraggio della qualità dell`aria

Analisi statistiche a
supporto del monitoraggio della qualità
dell'aria in Emilia Romagna
Progetto SINA
10
9
8
7
6
5
4
3
2
1
0
1
3
5
7
9
11 13 15 17 19 21 23
1
3
5
7
9
11 13 15 17 19 21 23
1
3
5
7
9
11 13 15 17 19 21 23
Tempo (ore)
Area di Epidemiologia Ambientale
ARPA Emilia Romagna
Coordinamento progetto:
Stefano Zauli Sajani
Paolo Lauriola
Gruppo di lavoro:
Fabiana Scotto
Francesca Galassi
Stefano Zauli Sajani
Hanno collaborato:
Angela Montanari (Dipartimento di Statistica – Università di Bologna)
Analisi statistiche
a supporto al monitoraggio
della qualità dell'aria in Emilia Romagna
Progetto SINA
Sommario
1. Introduzione....................................................................................................................... 1
2. Le centraline e gli inquinanti analizzati............................................................................. 2
3. Andamenti tipici ................................................................................................................ 3
3.1 Andamenti giornalieri.............................................................................................................................. 4
3.2 Andamenti settimanali............................................................................................................................. 7
3.3 Andamenti annuali................................................................................................................................... 9
4. Statistiche descrittive generali e analisi della variabilità spaziale................................... 11
5. Relazioni tra statistiche univariate................................................................................... 16
6. Correlazioni lineari tra centraline .................................................................................... 18
7. Regressioni lineari tra centraline ..................................................................................... 21
7.1 Scelta del modello di regressione .......................................................................................................... 21
7.2 Stima degli errori................................................................................................................................... 22
8. Individuazione dei dati anomali ...................................................................................... 28
9. Ipotesi per un utilizzo integrato di centraline fisse, mezzi mobili e campionatori passivi.
............................................................................................................................................. 30
10. Correlazioni tra centraline a scala regionale.................................................................. 33
11. Correlazioni tra inquinanti............................................................................................. 35
12. Conclusioni.................................................................................................................... 37
Bibliografia.......................................................................................................................... 41
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
1. Introduzione
Lo studio statistico qui presentato ha lo scopo di fornire un quadro delle relazioni tra i
rilevamenti delle centraline fisse collocate all’interno degli ambiti urbani della regione
Emilia Romagna. Si è scelto di privilegiare l’analisi degli ambiti urbani in quanto è questo
il contesto ove maggiori sono le problematiche connesse con la valutazione del contenuto
informativo dei sistemi di monitoraggio in continuo. Solo per la città di Bologna, per la
quale la definizione di area urbana risulta difficoltosa sia da un punto di vista urbanistico
che amministrativo, si è scelto di considerare anche le centraline collocate nei comuni che
circondano il capoluogo, rispetto al quale costituiscono ormai un unico aggregato.
La prospettiva in cui lo studio si inquadra è l’ottimizzazione della rete di monitoraggio
della qualità dell’aria in Emilia Romagna. L’Emilia Romagna rappresenta una della aree
d’Europa più critiche da un punto di vista ambientale a causa degli altissimi livelli di
urbanizzazione e industrializzazione. Ciò ha portato nel tempo all’istallazione di una delle
reti di monitoraggio della qualità dell’aria più ricche di dati e con la maggior risoluzione
spaziale a livello europeo e mondiale. Occorre verificare se l’attuale rete di monitoraggio,
molto dispendiosa sia in termini economici che di impiego di risorse umane, è in grado di
soddisfare gli obiettivi del monitoraggio nel miglior rapporto costi-benefici. In tali
obiettivi, oltre a quello prioritario del rispetto della legislazione vigente e prossima ventura,
sono da comprendere anche le richieste delle amministrazioni locali e degli enti preposti
alla difesa della salute della popolazione. Tali richieste sono indirizzate sia verso la
definizione di indicatori ambientali a livello comunale, provinciale e regionale, sia verso
l’identificazione, all’interno delle aree urbane, di zone e di gruppi di persone soggetti a
particolari rischi ambientali. La programmazione del territorio ed i piani urbanistici e
sanitari necessitano infatti di valutazioni di tipo ambientale a diverse scale spaziali,
valutazioni a cui la rete di monitoraggio dovrebbe fornire un importante contributo. Tra gli
scopi dello studio vi è quindi anche quello di analizzare in modo critico le modalità di
utilizzo dei dati delle centraline fisse e suggerire strategie di integrazione con i dati di
campionatori passivi e mezzi mobili. Tale processo di integrazione di dati sperimentali
differenti rientra in un più generale processo di valutazione integrata della qualità dell’aria
che comprende anche le simulazioni modellistiche e gli inventari delle emissioni.
1
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
2. Le centraline e gli inquinanti analizzati
Gli inquinanti considerati nello studio sono quelli usualmente monitorati nelle aree urbane:
monossido di carbonio (CO), ossidi di azoto (NO, NO2), ozono (O3), biossido di zolfo
(SO2), benzene (C6H6), polveri totali sospsese (PTS) e polveri con diametro aerodinamico
inferiore a 10 micron (PM10). L’arco temporale analizzato è l’intero anno 2000. La tabella
2.1 riporta le centraline e gli inquinanti monitorati per ogni città. Per le polveri è anche
indicato il tipo di rilevatore in virtù dell’influenza della tipologia di strumento rispetto alla
misura di tale categoria di inquinanti.
I dati sono stati sottoposti a diversi controlli di qualità. Durante la fase di raccolta
immediatamente successiva alla misura, i dati subiscono un primo controllo da parte degli
operatori responsabili: Tale controllo, pur essendo abbastanza approfondito, non si basa su
procedure automatizzate e/o uniformemente applicate a livello regionale ed è affetto quindi
da un certo grado di discrezionalità. Si è quindi ritenuto opportuno procedere ad un
ulteriore controllo dei dati che ha portato ad una minima riduzione della numerosità
complessiva del database. E’ comunque probabile che non solo singoli dati ma addirittura
interi periodi affetti da qualche forma di malfunzionamento degli strumenti siano tuttora
presenti nel database. Nei casi infatti ove fosse opinabile l’eliminazione o non ci fossero
notizie attendibili di danni strumentali, si è ritenuto di dover conservare il maggior numero
possibile di dati. Talune centraline non sono state considerate nello studio per la scarsa
numerosità dei dati forniti nel corso del 2000.
Non è stato possibile accedere ad una stima affidabile dell’errore sperimentale associato
alla misura dei diversi inquinanti per vari motivi: notevole varietà dei rilevatori, diversa
anzianità strumentale, modifiche apportate nel tempo agli strumenti originari, carenti
informazioni nei manuali di utilizzo.
I dati sono stati raccolti alla miglior risoluzione temporale permessa dagli strumenti. Ove i
dati fossero disponibili su base oraria si è provveduto a calcolare le medie giornaliere a
condizione che fosse presente almeno il 75% dei dati per ogni giorno. Lo stesso criterio,
salvo diversa indicazione, è stato tenuto anche per il calcolo di tutti i parametri statistici
utilizzati nello studio.
2
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Tabella 2.1 – Prospetto degli inquinanti rilevati per ogni centralina
BOLOGNA
Borgo Panigale
Casalecchio
Castel Maggiore
Fiera
G. Margherita
Malpighi
S. Felice
S. Lazzaro
Zanardi
Tipo
B
B
B
C
A
B
C
B
C
CO
X
X
X
X
X
X
X
X
X
NO
X
X
X
X
X
X
X
X
X
NO2
X
X
X
X
X
X
X
X
X
O3
FERRARA
Barco
Bologna
Isonzo
Mizzana
San Giovanni
Tipo
B
C
B
D
C
CO
X
X
X
X
NO
X
X
X
X
X
FORLI' - CESENA
Giardini - FO
Morgagni - FO
Roma - FO
Mulini - CE
Bufalini - CE
Emilia - CE
Tipo
A
B
C
B
A
C
CO
X
X
X
X
X
X
MODENA
Cavour
Garibaldi
Giardini
Nonantolana
XXsettembre
Tipo
B
B
B
B
A
PARMA
Cittadella
Fratti
Milazzo
Montebello
Spalato
SO2
BEN
PM10
PTS
MPSI100 (beta)
X
MPSI100 (beta)
MPSI100 (beta)
X
X
X
X
MPSI100 (beta)
X
MPSI100 (beta)
MPSI100 (beta)
X
X
X
X
X
NO2
X
X
X
X
X
O3
SO2
BEN
NO
X
X
X
X
X
X
NO2
X
X
X
X
X
X
O3
X
CO
X
X
X
X
X
NO
X
X
X
X
X
NO2
X
X
X
X
X
O3
SO2
X
X
Tipo
A
B
C
B
B
CO
NO2
X
X
X
X
X
O3
X
X
X
X
X
NO
X
X
X
X
X
PIACENZA
Giordani
Medaglie
Passeggio
Piatti
Roma
Tipo
C
C
A
C
B
CO
X
X
X
X
X
NO
X
X
X
X
X
NO2
X
X
X
X
X
RAVENNA
Caorle
Brancaleone
Stadio
Zalamella
Tipo
B
B
B
C
CO
X
X
X
X
NO
X
X
X
X
NO2
X
X
X
X
O3
X
X
REGGIO EMILIA
Ortolane
Risorgimento
XXsettembre
San Lazzaro
Timavo
Tipo
B
B
C
A
C
CO
X
X
X
X
X
NO
X
X
X
X
X
NO2
X
X
X
X
X
O3
RIMINI
Abete
Flaminia
Marecchia
Tipo
B
C
A
CO
X
X
X
NO
X
X
X
NO2
X
X
X
O3
Adam (beta)
Zambelli grav.
MPSI100 (beta)
PM10
PTS
X
X
X
X
Zambelli grav.
Adam (beta)
SO2
BEN
PM10
PTS
Adm9000 (beta)
Zambelli grav.
X
Zambelli grav.
X
X
Adam (beta)
Zambelli grav.
Zambelli grav.
BEN
PM10
PTS
Zambelli grav.
Zambelli grav.
X
X
SO2
X
X
Adam (beta)
Zambelli grav.
Teom (freq.)
Zambelli grav.
BEN
PM10
PTS
Tecora (grav.)
X
X
Adam (beta)
Tecora (grav.)
O3
SO2
BEN
PM10
PTS
X
X
Adam (beta)
MP101M (beta)
X
SO2
X
X
X
SO2
X
MP101M (beta)
BEN
PM10
PTS
MP101M (beta)
MP101M (beta)
X
Adam (beta)
BEN
PM10
Zambelli grav.
PTS
APM1(beta)/SEA(I.R.)
APM1(beta)/SEA(I.R.)
X
X
SO2
X
Adam (beta)
BENZ
PM10
PTS
Zambelli grav.
X
X
Zambelli grav.
MP101M (beta)
MP101M (beta)
3
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
3. Andamenti tipici
Nei paragrafi seguenti vengono riportati i risultati dell’analisi degli andamenti temporali
medi ricavati da 5 anni di osservazioni (escluso il benzene per il quale sono disponibili
solo 2 anni di dati) in una stazione di rilevamento di Modena. Questo periodo è stato
ritenuto un arco temporale sufficiente per poter ottenere andamenti il meno possibile
soggetti alla variabilità interannuale. I grafici seguenti si ritiene possano essere
qualitativamente esemplificativi del comportamento di quasi tutte le centraline all’interno
delle aree urbane. I grafici si riferiscono alla stazione di Via Nonantolana, nella immediata
periferia di Modena, scelta in virtù dell’alto numero di inquinanti monitorati. E’ escluso
dall’analisi il biossido di zolfo in quanto non misurato in tale stazione.
3.1 Andamenti giornalieri
L'analisi degli andamenti medi giornalieri evidenzia la stretta dipendenza tra i flussi di
traffico e i principali inquinanti primari. Le figure sopra riportate mostrano infatti due
picchi di inquinamento corrispondenti ai massimi dei flussi stradali (alle 8/9 del mattino e
alle 7/8 di sera). E’ utile notare come al marcato minimo di concentrazione degli inquinanti
primari nelle ore centrali della giornata non corrisponda un altrettanto marcato minimo nei
flussi di traffico. Ciò è dovuto principalmente alle migliori capacità dispersive
dell’atmosfera nelle ore centrali del giorno. A questo proposito, occorre dire che gli
andamenti riportati sono valori medi annuali. Se si analizzano gli andamenti medi
giornalieri differenziati per stagione, si evidenzia un altro aspetto importante dovuto alle
differenti proprietà dispersive dell’atmosfera nelle differenti condizioni meteorologiche e
nelle diverse ore della giornata. Nei mesi autunnali ed invernali, quando il sole tramonta
presto, il picco serale di inquinamento risulta sensibilmente più alto del picco mattutino.
L’opposto succede nei mesi estivi e primaverili quando le giornate sono più lunghe e lo
strato limite planetario conserva le proprietà dispersive proprie dei vortici convettivi fino
alle ore serali. La figure successive esemplificano questo punto utilizzando come
inquinante di riferimento il monossido di azoto.
Il ruolo dell’accumulo giornaliero degli inquinanti sembra giocare un ruolo secondario
anche se comunque evidenziabile nel valore più alto del picco serale di inquinamento nei
mesi autunnali ed invernali: essendo infatti comparabili sia le intensità dei flussi di traffico
che le proprietà dispersive dell’atmosfera, è lecito da questo dedurre che la differenza tra i
picchi di inquinamento del mattino e della sera siano da imputare all’accumulo degli
inquinanti primari nelle aree di emissione.
Qualitativamente differente, come è logico aspettarsi, è l’andamento giornaliero dei valori
medi di concentrazione dell’ozono per il quale si evidenzia un marcato picco nelle prime
ore del pomeriggio. La natura di inquinante secondario fotochimico giustifica questo
andamento. Questa variabilità intragiornaliera risulta molto marcata nel periodo estivo e
molto meno rilevabile nei periodi invernali ed autunnali.
4
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
2,5
120
100
2,0
80
1,5
60
40
Media NO
Media CO
1,0
,5
1,00
5,00
3,00
9,00
7,00
13,00
11,00
17,00
15,00
20
0
21,00
19,00
1,00
5,00
23,00
3,00
ORA
9,00
7,00
13,00
11,00
17,00
15,00
21,00
19,00
23,00
ORA
80
70
60
70
50
60
40
50
Media O3
Media NO2
30
40
30
1,00
5,00
3,00
9,00
7,00
13,00
11,00
17,00
15,00
21,00
19,00
20
10
1,00
23,00
ORA
5,00
3,00
9,00
7,00
13,00
11,00
17,00
15,00
21,00
19,00
23,00
ORA
10
9
8
7
6
Media Benzene
5
4
3
2
1,00
5,00
3,00
9,00
7,00
13,00
11,00
17,00
15,00
21,00
19,00
23,00
ORA
Figura 3.1 – Andamenti medi giornalieri delle concentrazioni dei principali inquinanti –
Centralina “Nonantolana” (Modena)
5
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Andamento giornaliero traffico autoveicolare
2500
2000
lunedì
1500
martedì
mercoledì
giovedì
venerdì
sabato
1000
domenica
500
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Ora
Figura 3.2 – Andamenti medi giornalieri dei flussi di traffico ricavati da una media di 7 strade
all’interno dell’area urbana di Modena (Dati concessi dal Comune di Modena)
STAGIONE:
1,00 Inverno
STAGIONE:
200
2,00 Primavera
70
60
50
40
100
30
Media NO
Media NO
20
0
1,00
5,00
3,00
9,00
7,00
STAGIONE:
13,00
11,00
17,00
15,00
10
0
21,00
19,00
1,00
23,00
5,00
3,00
3,00 Estate
9,00
7,00
STAGIONE:
50
13,00
11,00
17,00
15,00
21,00
19,00
23,00
4,00 Autunno
200
40
30
100
Media NO
Media NO
20
10
0
1,00
5,00
3,00
9,00
7,00
13,00
11,00
17,00
15,00
21,00
19,00
0
1,00
23,00
5,00
3,00
9,00
7,00
13,00
11,00
17,00
15,00
21,00
19,00
23,00
Figura 3.3 – Andamenti medi giornalieri delle concentrazioni di NO differenziati per stagione –
Centralina “Nonantolana” (Modena)
6
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
3.2 Andamenti settimanali
Gli andamenti settimanali confermano la stretta dipendenza tra traffico ed inquinamento.
(La scala settimanale è tra l’altro l’unica scala temporale dove l’effetto dell’altro
determinante principale delle concentrazioni, la meteorologia, non ha alcuna influenza). E’
infatti evidente un sensibile decremento dell’inquinamento medio nel fine settimana dove i
flussi di traffico sono nettamente inferiori. Per quanto riguarda gli inquinanti primari (CO,
NO, NO2, Benzene, PTS) si può inoltre notare un costante aumento dell’inquinamento
medio dal lunedì al venerdì. Questo effetto risulta legato all’accumulo dei vari inquinanti
nell’atmosfera e non a variazioni dei flussi di traffico che, nei giorni feriali della settimana,
si mantengono pressochè costanti. Il minimo di concentrazione si verifica la domenica e il
massimo il venerdì. I grafici seguenti riportano gli andamenti settimanali tipici per i diversi
inquinanti e per i flussi di traffico.
Figura 3.4 – Andamenti medi settimanali delle concentrazioni dei principali inquinanti – Centralina
“Nonantolana” (Modena)
7
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Andamento settimanale flussi traffico
35000
30000
25000
20000
15000
10000
domenica
lunedì
martedì
mercoledì
giovedì
venerdì
sabato
Figura 3.5 – Andamento medio settimanale dei flussi di traffico ricavati da una media di 7 strade
all’interno dell’area urbana di Modena (Dati concessi dal Comune di Modena)
8
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
3.3 Andamenti annuali
La variazione delle emissioni rispetto ai mesi dell’anno si suppone essere ragionevolmente
piccola e comunque limitata soprattutto ai mesi estivi quando l’influenza dei cambiamenti
delle abitudini sociali e del numero di veicoli circolanti assume una qualche rilevanza. La
variabilità delle concentrazioni nei diversi periodi dell’anno pare dunque da imputare in
modo preponderante alla varrizione delle condizioni meteorologiche.
L’analisi degli andamenti annuali evidenzia concentrazioni medie dei principali inquinanti
più elevate nei periodi autunnali ed invernali. Il monossido di carbonio e gli ossidi di azoto
hanno un comportamento molto regolare con rapporti tra massimo invernale e minimo
estivo uguali a circa 3 per il monossido di carbonio, a circa 8 per il monossido di azoto e a
circa 2 per il biossido di azoto.
Forti analogie rispetto a questi andamenti presenta il benzene il cui andamento tipico è
stato ricavato sulla base di soli due anni di dati. Questo periodo limitato potrebbe essere la
causa del dato di gennaio che pare essere non molto coerente con l’andamento degli altri
mesi.
Assimilabili al benzene per il comportamento “anomalo” nel periodo autunnale, sono le
polveri totali mentre coerente appare l’andamento del PM10. La variabilità stagionale delle
polveri risulta paragonabile a quella del biossido di azoto.
Differente, come di consueto, è il discorso per quanto riguarda l’ozono. Esso mostra un
marcato picco nei mesi estivi salvo poi passare a concentrazioni trascurabili nei mesi
invernali ed autunnali. Come già detto, questa peculiarità deriva dalla sua natura di
inquinante secondario fotochimico che lo porta ad accumularsi nei periodi di massima
insolazione.
La tabella 3.1 sintetizza gli intervalli di variabilità dei rapporti “massimo/minimo” calcolati
nelle 5 centraline di Modena per le diverse scale temporali e per i diversi inquinanti. La
figura 3.6 illustra gli andamenti annuali tipici per i diversi inquinanti nella centralina
“Nonantolana”.
Tabella 3.1 – Intervalli di variabilità temporale degli andamenti medi degli inquinanti. I
dati sono stati ottenuti dall’analisi di 5 stazioni fisse di monitoraggio all’interno dell’area
urbana di Modena.
Inquinante
Max/min giornaliero Max/min settimanale
Max/min annuale
CO
NO
NO2
O3
PM10
TSP
Benzene
2,5÷4,0
3,0÷4,6
1,5÷1,8
3,0÷6,4
/
/
/
1,2÷1,3
1,7÷2,1
1,3
1,1÷1,3
1,2
1,2÷1,3
1,1
2,4÷3,3
6,5÷10,0
1,6÷2,1
2,9÷12,1
4,0
1,9÷2,3
2,6
9
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Figura 3.6 – Andamenti medi giornalieri delle concentrazioni dei principali inquinanti –
Centralina “Nonantolana” (Modena)
10
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
4. Statistiche descrittive generali e analisi della variabilità spaziale
La prima fase dell’analisi dei rilevamenti delle centraline fisse ha riguardato il calcolo di
alcune grandezze statistiche univariate di tipo descrittivo (numerosità, media, mediana,
deviazione standard, minimo, massimo e 95º percentile).
Tale parte dello studio ha permesso di mettere in evidenza la grande variabilità spaziale dei
principali inquinanti primari da traffico (CO, NO, NO2). Le concentrazioni medie annue
rilevate dalle centraline fisse variano fino a 3 volte tra una postazione e l’altra.
Campionamenti ad alta risoluzione spaziale effettuati in alcune città emiliane (Modena,
Bologna, Ferrara) hanno evidenziato come all’interno dei principali “canyon” stradali ed in
prossimità degli incroci si raggiungano punte di inquinamento per tali inquinanti superiori
anche di 5 volte rispetto ad altre aree. I dati delle centraline fisse forniscono quindi quasi
sempre un quadro limitato della effettiva variabilità spaziale all’interno degli ambiti urbani.
Marcata appare anche la variabilità delle polveri totali (PTS) mentre il quadro per il PM10
appare largamente incompleto rispetto ad una analisi di variabilità spaziale, in quanto tale
inquinante è generalmente monitorato da una sola centralina per ogni ambito urbano. La
letteratura ha messo in evidenza una variabilità spaziale per le polveri fini meno marcata
rispetto agli altri inquinanti anche se tale diffusa opinione è stata contestata da alcune
recenti pubblicazioni.
Altrettanto dipendenti dal sito di misura appaiono le medie dell’ozono, che, negli ambiti
urbani dove è monitorato da più centraline, risultano notevolmente più alte nelle centraline
di tipo A.
E’ emersa anche la scarsa significatività della tipologia della centralina (A,B,C,D). Le
medie appaiono infatti estremamente variabili tra centraline dello stesso tipo nella stessa
area urbana e spesso molto simili tra quelle di tipo diverso. Occorre però evidenziare come
quelle di tipo A abbiano, relativamente agli inquinanti da traffico, medie generalmente più
basse. Una centralina di una certa tipologia non è comunque rappresentativa di tutte quelle
della stessa tipologia.
Dalla grande variabilità spaziale delle concentrazioni degli inquinanti all’interno degli
ambiti urbani deriva la difficoltà di ottenere un quadro completo dell’inquinamento
atmosferico all’interno delle città. Nelle figure 4.1-4.4 sono riportate, per alcuni inquinanti,
le medie annue nelle diverse centraline raggruppate per ambiti urbani, con evidenziata (in
rosso) la media delle concentrazioni per ogni città. I grafici evidenziano graficamente la
grande variabilità di concentrazione in ogni ambito urbano, variabilità che risulta maggiore
della variabilità delle concentrazioni medie dei diversi ambiti urbani. Si evidenzia quindi la
difficoltà di ricavare una concentrazione che sia indicativa dell’esposizione media della
popolazione in ogni singolo ambito urbano. Anche utilizzando una qualche funzione dei
valori ottenuti dalle centraline fisse (la centralina con valore mediano, la centralina con
valore massimo, etc.) la comparazione tra i diversi ambiti urbani pare essere difficoltosa.
Le centraline fisse difficilmente permettono quindi di ricavare in modo rigoroso, neppure
dove sono in numero maggiore, né i livelli di inquinamento medi (in senso spaziale) nelle
diverse città, né la distribuzione dei diversi inquinanti all’interno delle città stesse. Ciò è
dovuto al fatto che la città (soprattutto la tipologia urbana italiana) è un ambito nel quale il
raggio di rappresentatività del dato sperimentale è molto ristretto; è, anzi, un ambito nel
quale il concetto stesso di raggio di rappresentatività tende a perdere di significato. Mentre
in ambiti rurali un eventuale dato ambientale può essere rappresentativo di aree vaste
(anche chilometri), in ambito urbano valori misurati all’interno di un canyon stradale e a
poca distanza dietro gli edifici possono differire anche di alcuni fattori. Proprio il canyon
stradale è probabilmente la scala spaziale tipica dell’inquinamento atmosferico in ambito
urbano. Unica, importante eccezione dovrebbe essere rappresentata, sulla base dei dati
11
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
disponibili in letteratura, dalle polveri fini che rappresentano insieme a ozono e benzene gli
inquinanti più critici.
Si è anche verificata la significatività delle differenze riscontrate nelle concentrazioni
medie proprie di ogni città (ottenute cioè dalla media dei rilevamenti di tutte le centraline
collocate in ogni ambito urbano).
La variabilità di tali medie assume, dal punto di vista epidemiologico, un notevole
interesse qualora queste si rivelino fattori discriminanti tra i diversi ambiti urbani, ossia nel
caso in cui risultino significative le differenze tra i dati relativi ai diversi capoluoghi di
provincia. L’obiettivo principale è, quindi, quello di effettuare un confronto tra la
variabilità osservata all’interno di ogni città con la variabilità tra città diverse, per capire se
l’elevata varianza complessiva delle medie annue di monossido di carbonio, monossido di
azoto e biossido di azoto può essere attribuita a sensibili differenze tra i diversi ambiti
urbani.
Il metodo usualmente adottato è quello proposto da Fisher (ANOVA). Esso si basa sul
confronto tra la varianza entro i gruppi (in questo caso le città) e la varianza tra i gruppi;
questa procedura, tuttavia, richiede ipotesi la cui fondatezza è difficilmente dimostrabile in
casi, come quello in questione, in cui i dati disponibili sono poco numerosi.
Di conseguenza si è ritenuto più opportuno effettuare un confronto tra le medie annue
registrate da centraline situate in diversi ambiti urbani utilizzando il test di Kruskal-Wallis,
alternativa non parametrica all’analisi della varianza che prescinde dalle ipotesi di
omoschedasticità e normalità distributiva del carattere.
Il test saggia l’ipotesi che le medie annue delle centraline di tutta la regione appartengano
alla medesima popolazione. Più in particolare esso verifica che le medie annue di ogni
singola città abbiano uguale distribuzione dei posti d’ordine (e di conseguenza anche
uguale mediana); se tale ipotesi viene rifiutata significa che esistono differenze non
accidentali tra le varie città e quindi livelli di inquinamento differenti per ogni singolo
urbano. L’analisi è stata condotta solo per i tre inquinanti (NO, NO2, CO) monitorati da un
numero sufficiente di centraline. Per gli ossidi di azoto il test ha mostrato la non
significatività delle differenze tra i differenti ambiti urbani, a qualunque livello di
significatività. Diversi sono i risultati ottenuti relativamente al monossido di carbonio, per
il quale le differenze tra i diversi ambiti urbani risultano significative, anche se non
altamente significative (p=0.014). Il risultato non è più significativo se dal calcolo si
escludono i dati relativi alla città di Ravenna. Il p-value sale addirittura a 0.719 escludendo
anche i dati di Bologna. Queste due città presentano infatti valori di CO sensibilmente
inferiori a quelli rilevati nelle altre città. Tale risultato, nel caso di Bologna, contrasta col
fatto che i livelli di NO ed NO2 sono invece paragonabili a quelli delle altre città.
I risultati ottenuti da questa analisi (Tabella 4.1) sembrano, quindi, attribuire in gran parte
alla variabilità all’interno delle singole città la diversità osservata tra le medie annue
registrate dalle centraline fisse, nonostante le differenze esistenti tra i capoluoghi
dell’Emilia Romagna sia per quanto riguarda le dimensioni, sia per quanto riguarda la
collocazione geografica. Si può pertanto concludere che le stazioni fisse, che registrano
grande variabilità all’interno di ogni singola città e non significative diversità tra i diversi
capoluoghi, difficilmente permettono, senza il supporto di altre informazioni (per es. dati
sperimentali o metodi di selezione o combinazione dei rilevamenti delle centraline), di
effettuare confronti di tipo epidemiologico.
12
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Tabella 4.1 – Significatività delle differenze tra le medie delle diverse
città per CO, NO ed NO2
TEST
P-VALUE
NO
0,499
NO2
0,502
CO
0,014
CO senza Ravenna
0,055
CO senza Ravenna né Bologna
0,719
Concludendo, notevole è l’importanza della grande variabilità spaziale degli inquinanti
monitorati: considerato infatti che i limiti di legge hanno essenzialmente una valenza
sanitaria, occorrerebbe dotarsi del quadro concettuale e strumentale appropriato per la
salvaguardia della salute della popolazione con un corrispondente dettaglio spaziale. A tal
proposito occorrerebbe in linea teorica poter disporre, al fine di una efficace stima delle
concentrazioni medie di ogni ambito urbano, delle concentrazioni outdoor in ogni punto
della città per tutto l’anno, obiettivo, come già detto, non raggiungibile con le centraline
fisse già installate né raggiungibile con l’aggiunta di altre centraline fisse.
13
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
2,5
2,0
1,5
1,0
0,5
0,0
BO
CE
FE
FO
MO
PR
PC
RA
RE
RN
Figura 4.1 –Medie annue dei rilevamenti di CO (anno 2000). Le colonne retinate rappresentano
le medie di ogni città.
120
100
80
60
40
20
0
BO
CE
FE
FO
MO
PR
PC
RA
RE
RN
Figura 4.2 –Medie annue dei rilevamenti di NO (anno 2000). Le colonne retinate rappresentano
le medie di ogni città.
14
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
90
80
70
g/m3
60
50
40
30
20
10
0
BO
CE
FE
FO
MO
PR
PC
RA
RE
RN
Figura 4.3 –Medie annue dei rilevamenti di NO2 (anno 2000). Le colonne retinate
rappresentano le medie di ogni città.
60
50
40
µ
30
20
10
0
BO
CE
FE
FO
MO
PR
PC
RA
RE
RN
Figura 4.4 –Medie annue dei rilevamenti di O3 (anno 2000). Le colonne retinate rappresentano
le medie di ogni città.
15
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
5. Relazioni tra statistiche univariate
Il legame tra le statistiche univariate risulta di particolare interesse. La differenza tra la
media, la mediana, il valore massimo e il 95º percentile è spesso notevole e spiegabile
tramite le distribuzioni di frequenza delle concentrazioni degli inquinanti: tali distribuzioni,
asimmetriche a destra (e che la letteratura identifica come generalmente assimilabili a
distribuzioni lognormali), presentano infatti code molto lunghe. La figura 5.1 mostra, a
titolo di esempio, la distribuzione delle concentrazioni di monossido di carbonio relative
alla stazione “Malpighi“ di Bologna.
800
700
frequenza
600
500
400
300
200
100
0
0 0,5
1 1,5
2 2,5
3 3,5
4 4,5
5 5,5
6 6,5
7 7,8 8,9
concentrazioni
Figura 5.1 – Distribuzione in frequenza delle concentrazioni orarie di monossido di carbonio –
Stazione “Malpighi” (anno 2000).
La tabella 5.1 riporta i coefficienti di correlazione tra le medie annue e i 95-percentili e tra
le medie e i massimi, calcolate partendo sia dai dati orari sia da quelli giornalieri. Il forte
legame tra le medie e i 95-percentili appare evidente per tutti gli inquinanti considerati; più
debole risulta l’associazione tra medie annue e massimi.
Tabella 5.1 - Coefficienti di correlazione tra statistiche univariate
Media - 95 perc
Media - max
ORARI
CO
0,95
0,64
NO
0,90
0,47
NO2
0,95
0,72
O3
0,74
0,04
SO2
0,78
0,00
Benzene
0,99
0,52
GIORNALIERI
CO
NO
NO2
O3
SO2
PTS
PM10
Benzene
Media - 95 perc
0,94
0,90
0,94
0,89
0,74
0,92
0,97
0,95
Media - max
0,88
0,76
0,75
0,73
0,12
0,83
0,63
0,94
16
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
L’esistenza di una buona correlazione tra 95° percentile e media significa che i siti ove si
registrano le medie di lungo periodo più elevate, sono anche quelli dove con più
probabilità si verificheranno anche i picchi. Questo aspetto assume una certa importanza
sia dal punto di vista della prevenzione sanitaria che della programmazione del territorio.
E’ infatti possibile mirare alla conoscenza di medie di lungo periodo per avere
informazioni anche sulla probabilità di eventi acuti. La ricerca delle aree critiche
all’interno della città dovrebbe quindi concentrarsi sulle medie di lungo periodo, non solo
per gli inquinanti che hanno effetti a lungo termine come il benzene ma anche per quelli
che sono legati ad effetti di tipo acuto. Anche le attività modellistiche potrebbero trarre
utili indicazioni da tali relazioni tra le grandezze statistiche potendo indirizzarsi verso il
calcolo di medie di lungo periodo; questo dovrebbe avvenire non solo per l’estrema
difficoltà di ottenere all’interno degli ambiti urbani andamenti di tipo orario o giornaliero
ad alta risoluzione, ma anche per la minore utilità da un punto di vista della difesa della
salute della popolazione. Anche l’ipotetica individuazione esatta del dove (in quale punto
della città) e quando si è registrato (utilizzo diagnostico della modellistica) o si registrerà
(utilizzo prognostico) un picco non appare di grande interesse pratico in quanto
difficilmente appaiono percorribili e utili interventi di limitazione del traffico di tipo molto
puntuale. Di un qualche interesse sarebbe la previsione degli eventi acuti del valore medio
di inquinamento della città, anche se l’evoluzione della legislazione e delle pratiche di
intervento mira sempre più a evitare provvedimenti d’urgenza e quindi ne riduce
l’interesse.
Obiettivi quindi di grande importanza pratica per la ricerca ambientale, potrebbero essere,
come già detto, quelli di mirare alla conoscenza delle concentrazioni medie annue nei
diversi punti delle aree urbane (per permettere all’amministrazione comunale di agire per il
risanamento delle aree critiche) e/o all’andamento orario delle concentrazioni medie della
città (in senso spaziale) per tutto l’anno per ogni inquinante (dato che potrebbe essere
utilizzato come indicatore dell’esposizione media della popolazione). Il raggiungimento di
questi obiettivi richiede però l’utilizzo di strumenti modellistici e di procedure sperimentali
che valorizzino sia i dati delle centraline fisse, sia quelli dei mezzi mobili e dei
campionatori passivi.
17
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
6. Correlazioni lineari tra centraline
Il calcolo del grado di correlazione tra le diverse centraline ha rappresentato la parte
centrale dello studio e ha permesso di evidenziare il legame fra gli andamenti temporali dei
rilevamenti delle centraline fisse, andando al di là del confronto tra le grandezze medie.
Lo strumento operativo scelto è il coefficiente di correlazione di Pearson, che verifica la
correlazione lineare tra due variabili. Il coefficiente è un parametro adimensionale che
varia tra –1 e 1. Un coefficiente pari a –1 indica che le due variabili sono perfettamente
anticorrelate, un coefficiente uguale a 0 indica che le due variabili sono indipendenti, un
coefficiente uguale a 1 indica una perfetta correlazione. E’ stato scelto questo parametro
perché si è verificata l’appropriatezza dell’ipotesi di linearità tra le concentrazioni rilevate
in due diverse stazioni di misura, anche se la dispersione dei dati intorno alla retta di
regressione è molto variabile a seconda dell’inquinante e della coppia di centraline
considerate.
Una importante annotazione preliminare riguarda la presenza di errori sperimentali che
tendono ad abbassare le correlazioni. Un errore relativo del 10% nelle misure di un
inquinante si ripercuote in una riduzione di circa il 9% del coefficiente di correlazione 1.
Questo porta a dire che l’approccio adottato in questo studio è quello del calcolo del valore
minimo di correlazione. L’eliminazione di eventuali dati anomali presenti nel dataset
perchè sfuggiti al controllo effettuato in fase preliminare e la considerazione precisa per
ogni centralina e per ogni inquinante degli errori sperimentali porterebbe ad un aumento
anche sensibile del coefficiente di correlazione calcolato.
Vengono qui di seguito analizzati i risultati dell’analisi di correlazione.
Le correlazioni giornaliere sono risultate quasi sempre più alte di quelle orarie anche
perché non risentono del leggero, non sistematico sfasamento dei picchi orari (anticipo o
ritardo) tra le diverse centraline. Anche di questo bisogna tenere conto in fase di
interpretazione dei risultati, in quanto le correlazioni orarie risultano ridotte da questo
effetto che però da un punto di vista di difesa della salute della popolazione ha una
importanza limitata.
L’analisi del coefficiente di correlazione di Pearson per il monossido di carbonio ha
evidenziato una generalmente buona correlazione tra le diverse centraline (N. coppie
centraline con coefficiente maggiore di 0,9 su dati giornalieri = 11).
Ancora migliore è risultata la correlazione per il monossido di azoto, con valori di
correlazione tra i dati giornalieri che superano spesso 0,9 (N. coppie centraline con
coefficiente maggiore di 0,9 su dati giornalieri = 43).
Inferiore al CO e all’NO è risultata la correlazione tra le centraline per la misura del
biossido di azoto (N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri
= 5).
Ottime sono risultate le correlazioni relative all’ozono: a Modena, Bologna, Ferrara e
Ravenna, uniche città ove sono disponibili più rilevatori di O3 all’interno dell’area urbana,
le correlazioni giornaliere tra le diverse centraline sono sempre superiori a 0,94.
L’analisi dei dati del biossido di zolfo ha evidenziato una estrema variabilità del grado di
correlazione, dato quest’ultimo che riveste peraltro un’importanza relativa a causa dei
problemi relativi alla sua misura (i valori sono spesso al di sotto della soglia di rilevabilità).
18
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
La situazione del benzene è particolare in quanto esso, quando è misurato in continuo, è
generalmente rilevato da una sola centralina. Solo a Modena e Bologna esistono più
rilevatori di tale parametro. A Bologna l’analisi di correlazione è stata condotta per le tre
stazione che misurano tale parametro (“Zanardi”, “S. Felice” e “G. Margherita”). Non è
stata invece effettuata l’analisi a Modena per la non sufficiente disponibilità di dati validi
della centralina XX Settembre. Le correlazioni giornaliere a Bologna risultano tutte e tre
superiori a 0,81, pur essendo una di tipo A, una di tipo B e una di tipo C. La correlazione
più alta (0,91) risulta quella tra la centralina “Zanardi” e G.Margherita”. I dati sono quindi
pochi per trarre conclusioni, anche se è ragionevole ritenere che esista una buona
correlazione tra i rilevamenti giornalieri di benzene nei diversi punti di un’area urbana.
Un discorso particolare meritano le polveri. Esse vengono misurate nella forma di Polveri
Totali Sospese (PTS) e nella forma PM10 (Polveri con diametro aerodinamico inferiore a
10 micron). Le PTS sono monitorate in genere da più di una centralina per ogni ambito
urbano con rilevatori che sono spesso omogenei all’interno della stessa città ma
disomogenei tra diverse città. I dati sono in genere giornalieri, a parte Bologna e Piacenza
che dispongono di centraline che forniscono dati biorari. Non sono state però considerate
nell’analisi le centraline di Bologna del tipo MPSI100 (beta) per problemi di numerosità di
dati validi. Le correlazioni sono risultate comprese tra 0,49 e 0,64 per le aree urbane di
Cesena, Forlì e Rimini e tra 0,84 e 0,91 per le aree urbane di Modena, Parma e Piacenza.
Per quanto riguarda il PM10, il discorso è analogo al benzene per quanto riguarda la
numerosità dei siti di rilevamento, con l’aggravante che, ove è misurato da più di una
centralina, è misurato con tipi di rilevatori diversi. Modena e Ravenna sono le uniche città
che disponevano nel 2000 di 2 rilevatori di PM10 collocati all’inetrno dell’area urbana.
Modena ha un rilevatore Adam (beta) giornaliero e un rilevatore Teom (freq.) orario. La
correlazione giornaliera è pari a 0,89. A Ravenna la correlazione è tra un MP101M (beta)
biorario e un Adam (beta): anche in questo caso la correlazione risulta pari a 0,89.
Concludendo, dai dati in nostro possesso pare ragionevole dire che le centraline per la
misura del PM10 sono ben correlate nonostante la diversità dei metodi sperimentali, anche
se i dati sono pochi per poter trarre conclusioni generali.
Come già evidenziato per le statistiche univariate, nemmeno rispetto alle correlazioni
emerge una particolare influenza della tipologia di centralina.
Concludendo, i risultati presentati vanno interpretati in diverse propettive. Essi possono
infatti essere utilizzati:
1. Per un controllo di qualità dei rilevamenti (se due centraline sono ben correlate si
possono evidenziare i malfunzionamenti sulla base dell’analisi dei residui
standardizzati calcolati rispetto alla retta di regressione);
2. Per la copertura di dati mancanti nelle serie storiche (se due centraline sono ben
correlate e se una per un guasto smette di funzionare, si potrebbero stimare i dati di
quella non funzionante sulla base dei dati di quella funzionante);
3. Per ottimizzare la distribuzione e il numero delle centraline fisse necessarie al
monitoraggio nell’ottica di un miglior rapporto costi-benefici;
4. Per un utilizzo sinergico di dati di campionatori passivi e mezzi mobili con i dati delle
centraline fisse (vedi capitolo 7).
In particolare, rispetto al terzo punto, una correlazione alta implica una certa ridondanza
dell’informazione fornita. Una volta ottenuta, infatti, sulla base dei rilevamenti passati, la
relazione funzionale che lega due centraline, sarebbe possibile ricavare i rilevamenti futuri
nel sito di una centralina sulla base dei valori rilevati dall’altra. Si ritiene ragionevole
19
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
fissare a 0,9 la soglia del coefficiente di correlazione per una affidabile stima delle
concentrazioni nel sito di una centralina rispetto ad un’altra. L’errore che si commetterebbe
ricavando la concentrazione media giornaliera di una centralina dall’altra è in tal caso
basso, in alcuni casi addirittura paragonabile all’errore sperimentale associato alla misura
di quell’inquinante. Il criterio indicato per l’applicazione delle procedure di stima potrebbe
probabilmente essere reso meno stringente valutando attentamente gli errori sperimentali
nei dati di partenza e la strategia e i fini della rete di monitoraggio nel suo complesso.
Occorre anche considerare se, in un contesto di risorse limitate e contenimento dei costi,
sia opportuno mantenere in funzione un numero molto alto (rispetto agli standard europei e
mondiali) di centraline o sia più opportuno rinunciare ad alcune centraline fisse, che hanno
peraltro un raggio di rappresentatività molto limitato, per liberare risorse a favore di un
controllo più efficace sulle centraline rimaste e di un utilizzo più sistematico di mezzi
mobili e campionatori passivi.
Un’ultima osservazione riguarda le implicazioni epidemiologiche della buona correlazione
tra le diverse centraline all’interno degli ambiti urbani. Il dato d’inquinamento ambientale
che si desume da una o più centraline, infatti, può, come già detto, non essere
rappresentativo del livello di inquinamento medio della città. Se però i vari siti sono ben
correlati tra loro, l’andamento temporale di uno di essi (o di una combinazione di essi) è
probabilmente rappresentativo dell’andamento temporale dell’intera città e quindi
dell’esposizione della popolazione. Ciò permette di valutare, ad esempio, l’entità
dell’associazione tra gli andamenti dei dati ambientali e sanitari ma rende problematica la
quantificazione delle soglie e dei livelli di inquinamento associati ad un determinato effetto
sanitario (funzione di rischio).
Nelle tabelle che seguono sono sintetizzati i risultati dell’analisi dei coefficienti di
correlazione. Le statistiche riportate sono state calcolate sull’insieme di tutte le coppie di
centraline dei singoli agglomerati urbani. Tale prospetto viene presentato nell’idea che le
proprietà di correlazione debbano essere considerate più legate alle caratteristiche dei siti
di misura e alle proprietà fisico-chimiche di ogni singolo inquinante che alle specificità dei
diversi ambiti urbani. La numerosità riportata nelle tabelle è riferita al numero di coppie di
centraline su cui sono calcolate le statistiche sintetiche.
Tabella 6.1 – Prospetto sintetico delle correlazioni calcolate sui dati orari tra
tutte le coppie di centraline collocate all’interno dello stesso ambito urbano.
CO
NO
NO2
O3
SO2
PTS
Mediana
0,75
0,76
0,70
0,94
0,48
0,82
Media
0,72
0,75
0,69
0,94
0,50
0,82
Massimo
0,90
0,93
0,90
0,96
0,87
0,82
Minimo
0,41
0,42
0,32
0,93
0,25
0,82
Numerosita'
82
99
95
6
19
1
Tabella 6.2 – Prospetto sintetico delle correlazioni calcolate sui dati giornalieri tra
tutte le coppie di centraline collocate all’interno dello stesso ambito urbano.
CO
NO
NO2
O3
SO2
Benzene
PTS
Mediana
0,82
0,89
0,78
0,96
0,64
0,84
0,85
Media
0,81
0,87
0,74
0,96
0,62
0,85
0,79
Massimo
0,97
0,98
0,93
0,97
0,84
0,91
0,91
Minimo
0,58
0,61
0,26
0,94
0,34
0,81
0,49
Numerosita'
82
99
95
6
19
4
11
20
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
7. Regressioni lineari tra centraline
7.1 Scelta del modello di regressione
Nel calcolo delle correlazioni, si era già osservato che la relazione che lega i valori di un
inquinante in due diverse centraline può ritenersi lineare. La dispersione dei dati intorno
alla retta interpolante è molto variabile a seconda dell’inquinante e della coppia di
centraline considerati, ma anche nei casi di maggiore dispersione, il modello lineare
sembra comunque quello più appropriato.
La via più immediata sarebbe quella di applicare una regressione lineare calcolata con il
metodo dei minimi quadrati. Tale regressione, nella versione più comunemente usata,
minimizza i quadrati degli scarti tra il valore previsto e quello osservato della variabile
dipendente. Ne consegue che, a seconda che si consideri come esplicativa una variabile o
l’altra, vengono stimate due rette diverse, i cui coefficienti angolari non sono, come ci si
aspetterebbe, l’uno il reciproco dell’altro. La differenza tra le rette stimate è tanto
maggiore quanto minore è l’R2 del modello (v. figura seguente). Nel nostro caso, non
essendovi un antecedente causale (non c’è una centralina che determini “fisicamente” il
valore dell’altra: semplicemente esse covariano) la scelta di considerare una delle due
variabili dipendente sarebbe risultata necessariamente arbitraria. Ci si è dunque orientati
verso un modello regressivo lineare proposto da Pearson in cui la retta stimata è quella che
minimizza non già i quadrati delle differenze tra il valore previsto della variabile
dipendente e quello osservato, ma i quadrati delle proiezioni ortogonali, sulla retta, dei
valori osservati. Così, il modello risulta invariante rispetto all’inversione degli assi e quindi
rispetto al fatto che si consideri esplicativa una variabile piuttosto che l’altra.
L’applicazione di tale metodo anziché di quello regressivo tradizionale si rende anche
necessaria in quanto entrambe le variabili sono affette da errore. Ciò aumenta il carattere di
pariteticità delle due variabili.
Figura 7.1 – Esempi di rette di regressione ai minimi quadrati e ai minimi quadrati ortogonali sui
dati orari di due stazioni (“Morgagni” e “Giardini”) per la misura del monossido di carbonio a Forlì.
Unità di misura mg/m3.
21
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
7.2 Stima degli errori
Interpolare una nube di punti con una retta, e basarsi su tale retta per leggere i valori
stimati di una centralina, comporta naturalmente un’approssimazione, tanto più elevata
quanto maggiore è la dispersione dei punti intorno alla retta. Se la dispersione dei punti
intorno alla retta rimane costante al crescere dei valori della variabile indipendente, la
varianza della variabile dipendente è costante rispetto ai valori assunti dalla variabile
esplicativa, così come è costante l’errore di previsione. In tal caso si può dare una
valutazione dell’errore medio di previsione. Come misura dell’incertezza associata alla
previsione è stata considerata la deviazione standard delle proiezioni ortogonali dei dati
osservati sulla perpendicolare alla retta di regressione calcolata secondo il metodo proposto
da Pearson.
Si riporta nella figura 7.2 un esempio di varianza quasi costante per tutto l’intervallo di
valori delle variabili, per una coppia di centraline molto ben correlate, che rivelano
l’ozono.
Figura 7.2 – Dispersione dei dati e retta di regressione per due stazioni per la misura dell’ozono
(“Bologna” e “Mizzana”) a Ferrara. Dati orari. Unità di misura µg/m3.
Come si osserva, la dispersione dei punti intorno alla retta stimata non cresce all’aumentare
dei valori rilevati dalla centralina Mizzana. Tale dispersione risulta inoltre abbastanza
contenuta ed infatti l’indice di correlazione di Pearson è pari a 0.94. La deviazione
standard calcolata risulta pari a 8.4. Ciò significa che, nel 68% dei casi in cui si effettua
una stima del valore assunto dalla centralina Bologna, l’errore commesso sarà, nell’ipotesi
di una distribuzione gaussiana dei residui ortogonali rispetto alla retta di regressione,
inferiore, in valore assoluto, a 8.4.
La figura 7.3 esemplifica la distribuzione dei residui di regressione per una coppia di
centraline per la misura dell’NO2 (le centraline “Garibaldi” e “Giardini” a Modena) con
una correlazione di media entità (0,81).
22
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
3000
2000
1000
Dev. Stand = 1 1,01
Media = - ,8
0
N = 7833,0 0
,0
75
,0
65
,0
55
,0
45
,0
35
,0
25
,0
15
0
5,
,0
-5
0
5,
-1
0
5,
-2
0
5,
-3
0
5,
-4
0
5,
-5
0
5,
-6
Figura 7.3 – Distribuzione in frequenza dei residui di regressione per due stazioni per la misura
del biossido di azoto (“Garibaldi” e “Giardini”) a Modena.
Il test di Kolmogorov-Smirnov porta a rifiutare l’ipotesi di normalità distributiva, ma,
come si vede dal grafico, la distribuzione è unimodale e abbastanza simmetrica; rispetto ad
una curva normale risulta leggermente più piccata (presenta una curtosi pari a 3.6), il che
significa che vi è un maggior numero di residui prossimi allo zero e quindi un maggior
numero di dati che si trovano in un intervallo pari a una deviazione standard.
In alcuni casi capita invece che l’errore cresca al crescere del valore della variabile
indipendente (eteroschedasticità). Ciò si può verificare abbastanza agevolmente dal
semplice grafico a dispersione. In questo caso, risulterebbe più appropriato esprimere
l’errore medio di previsione invece che in termini di deviazione standard, in termini di
errore relativo.
Nelle figure che seguono sono riportate alcune regressioni esemplificative della tipologia
di dispersione dei dati, della bontà del modello di regressione (deviazione standard delle
incertezze) e della diversità tra regressioni sui dati orari e sui dati giornalieri.
23
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Figura 7.4 – Dispersione dei dati e retta di regressione per due stazioni per la misura dell’ozono
(“Bologna” e “Mizzana”) a Ferrara. Dati orari. Unità di misura µg/m3.
Figura 7.5 – Dispersione dei dati e retta di regressione per due stazioni per la misura del
biossido di azoto (“Zanardi” e “G.Margherita”) a Bologna. Dati orari. Unità di misura µg/m3.
24
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Figura 7.6 – Dispersione dei dati e retta di regressione per due stazioni per la misura del
biossido di azoto (“Bufalini” e “Mulini”) a Cesena. Dati orari. Unità di misura µg/m3.
Figura 7.7 – Dispersione dei dati e retta di regressione per due stazioni per la misura del
biossido di azoto (“Garibaldi” e “Giardini”) a Modena. Dati orari. Unità di misura µg/m3.
25
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Figura 7.8 – Dispersione dei dati e retta di regressione per due stazioni per la misura del
monossido di azoto (“Isonzo” e “Mizzana”) a Ferrara. Dati orari. Unità di misura µg/m3.
Figura 7.9 – Dispersione dei dati e retta di regressione per due stazioni per la misura del
monossido di carbonio (“Morgagni” e “Giardini”) a Forlì. Dati orari. Unità di misura mg/m3.
26
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Figura 7.10 – Dispersione dei dati e retta di regressione per due stazioni per la misura dell’ozono
(“Bologna” e “Mizzana”) a Ferrara. Unità di misura mg/m3.
27
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
8. Individuazione dei dati anomali
Una buona correlazione lineare tra due centraline permette di definire una procedura per
l’individuazione dei dati anomali. Analizzando il grafico a dispersione tra due centraline
ben correlate, infatti, i punti risulteranno concentrati intorno ad una retta, con una
dispersione abbastanza contenuta. Un valore che si discosta in modo evidente dalla retta
interpolante, indica che presso una centralina si è rilevato un valore “anomalo” rispetto alla
usuale relazione funzionale che lega i due siti. Ciò può essere dovuto sia ad episodi
straordinari di inquinamento (cantieri, chiusura del traffico in via, incidenti con rilascio di
inquinanti, etc.), sia ad una rilevazione erronea da parte della centralina. In ogni caso, si
tratta di un valore anomalo, che è utile identificare.
La procedura suggerita prevede, una volta identificato un dato anomalo, di osservare
l’andamento temporale della concentrazione dell’inquinamento per il periodo
immediatamente precedente e seguente a tale dato. In tal modo, si può osservare se il dato
è isolato o se fa parte di un gruppo di valori che si discostano da quelli attesi. Inoltre, un
dato orario mal correlato può essere dovuto anche semplicemente ad uno sfasamento di
picchi di maggior inquinamento e questo si vede agevolmente da un grafico di sequenza.
Un grafico di questo tipo, quindi, permette di fare alcune ipotesi sulla natura del dato
anomalo.L’identificazione del dato anomalo dal grafico a dispersione, però, non è sempre
agevole e può presentare dei problemi soprattutto quando vi è molta dispersione dei dati.
Tale metodo, inoltre, presenta inevitabilmente una componente di soggettività. Un metodo
oggettivo che segue un principio equivalente, è quello di stimare i residui standardizzati di
tutte le osservazioni rispetto alla retta interpolante e scegliere di controllare i valori che
generano i residui standardizzati maggiori o eccedenti una certa soglia prefissata. Tale
soglia può essere fissa, o variabile in base alla dispersione dei punti.
Nella figura 8.1è riportato il grafico a dispersione di due centraline che presentano una
correlazione non molto alta: si tratta delle centraline Roma e Giardini che rilevano il CO a
Forlì.
Figura 8.1 – Dispersione dei dati per due stazioni per la misura del monossido di carbonio
(“Giardini” e “Roma”) a Forlì.
28
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Come risulta abbastanza chiaramente dal grafico, il punto evidenziato si discosta
notevolmente dagli altri, in quanto la centralina Roma rileva un valore di CO pari a 11.6,
mentre la centralina Giardini rileva un valore pari a 0.9 dello stesso inquinante.
A tale punto corrisponde un residuo standardizzato di valore assoluto molto elevato. Di
seguito vengono riportati i cinque residui negativi con valore assoluto più alto, calcolati
rispetto alla retta di regressione. Il primo valore (-11,126) identifica proprio il punto
indicato nella figura precedente.
Tabella 8.1 - Residui standardizzati di regressione per i
rilevamenti orari di monossido di carbonio delle centraline
“Giardini” e “Roma” a Forlì..
1
-11,126
2
-4,074
3
-4,070
4
-3,996
5
-3,484
6
……
In questo caso il residuo generato dal valore anomalo è pari a –11.126, in valore assoluto
quasi il triplo del secondo residuo negativo più alto. Anche dall’analisi dei residui
standardizzati, quindi, emerge il dato anomalo individuato graficamente.
Figura 8.1 – Andamento temporale del monossido di carbonio nelle due stazioni “Giardini” e
“Roma” a Forlì in corrispondenza del dato individuato come anomalo.
Analizzando la finestra temporale con i valori precedenti e successivi a quello anomalo
(figura seguente), si osserva inoltre che tale dato è isolato, risultando notevolmente
differente sia dai valori rilevati le ore precedenti e quelle successive dalla stessa centralina,
sia dai valori rilevati per la stessa ora dalle altre due centraline presenti a Forlì.
29
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
9. Ipotesi per un utilizzo integrato di centraline fisse, mezzi mobili e
campionatori passivi.
La conoscenza della distribuzione dell’inquinamento all’interno delle città rappresenta
certo uno degli obiettivi più ambiziosi e di maggior importanza sia in ottica ambientale che
epidemiologica. La bassa rappresentatività spaziale delle centraline fisse rappresenta una
importante limitazione ad un loro utilizzo in questa ottica, nemmeno prospettandone un
aumento di numero: questioni di costo, ingombro, manutenzione e gestione dei dati
impediscono infatti la percorribilità di una tale strada. Occorre quindi non solo un utilizzo
appropriato di modellistica di vario tipo ma anche una integrazione dei dati delle centraline
fisse con i dati di strumenti di misura più “snelli” come i campionatori passivi ed i mezzi
mobili. Questi ultimi prevedono però, dati gli elevati costi, un tempo di rilevazione limitato
all’interno del quale eventuali episodi anomali di inquinamento (rispetto alle medie del
periodo) hanno un notevole effetto distorcente rispetto alle medie di lungo periodo e non
sono comunque lo strumento appropriato per cogliere, oltre alla varibilità spaziale, la
marcata variabilità temporale di quasi tutti gli inquinanti.
Sebbene, quindi, campionatori fissi e mobili non permettano, da soli, una mappatura
dell’inquinamento, un loro uso sinergico potrebbe consentire, a determinate condizioni, un
monitoraggio più dettagliato a livello spaziale e temporale che si affiancherebbe in modo
efficace alla modellistica.
Qualora si stabilisse infatti che esiste una buona correlazione (per es. > 0,9) tra un sito non
provvisto di apparati di misura in continuo di un certo inquinante e uno in cui sia collocata
una centralina fissa, sarebbe possibile derivare la concentrazione nel primo sito tramite un
campionamento a finestra temporale. In particolare, la procedura consisterebbe nel fare
campionamenti limitati nel tempo in diversi punti della città (con mezzi mobili o
campionatori passivi), calcolare il coefficiente di correlazione per ognuno di essi rispetto
ad una o più centraline fisse prese come riferimento, e nel caso questo risulti superiore ad
una soglia stabilita, ottenere una relazione funzionale e ricavare sulla base di questa
l’andamento della concentrazione per tutto l’anno. La procedura si semplificherebbe
ulteriormente nel caso si verificasse che tra due punti di misura qualsiasi di un certo
inquinante all’interno dell’area urbana esiste una buona correlazione.
L’esistenza di una buona correlazione soprattutto degli inquinanti primari da traffico è
suffragata del resto dalla constatazione della peculiarità dell'ambiente urbano. La città può
essere infatti generalmente considerata un ambiente spazialmente uniforme da un punto di
dell’andamento temporale delle proprietà dispersive, anche se le variabili meteorologiche e
le proprietà dispersive possono avere una distribuzione estremamente puntuale. A questo si
aggiunga che gli ambiti urbani sono interessati da una preponderante, quasi unica e
comune a quasi tutti gli inquinanti, sorgente di inquinamento: il traffico veicolare. Questi
aspetti suggeriscono la possibilità dell’esistenza di buone correlazioni tra gli inquinanti, al
di là delle loro differenti caratteristiche fisico-chimiche.
Lo studio ha evidenziato come, sulla base dei dati delle centraline fisse esaminati, questo
approccio appare giustificato con un errore accettabile in un numero consistente di siti e di
inquinanti, soprattutto su scala giornaliera. Vi sono però centraline che per alcuni
inquinanti paiono avere comportamenti molto particolari, in contrasto rispetto ad un
comportamento generale di ottima correlazione. A questo proposito sarebbero utili
controlli sulla affidabilità dei dati di tali centraline e comunque una definizione dell’errore
accettabile nell’ottenimento di queste stime. Sono comunque necessarie ulteriori analisi per
verificare la corretteza dell’utilizzo di tale procedura anche nei siti dove non sono presenti
centraline fisse.
30
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Bisogna anche dire che più si è interessati, piuttosto che a valori orari, a valori medi
giornalieri o di più lungo periodo, più la procedura sarebbe affidabile. D’altronde le medie
di lungo periodo sono probabilmente il parametro più importante da un punto di vista della
programmazione del territorio e spesso anche da un punto di vista della prevenzione
sanitaria.
A suffragio della percorribilità di tale procedura, viene qui di seguito presentata un’analisi
dei dati di campionatori passivi per la misura del benzene condotte dal 1996 a cadenza
mensile e della durata di una settimana cadauna, in 5 postazioni in area urbana. La tabella
seguente illustra le caratteristiche dei siti di misura.
Tabella 9.1 - Caratteristiche dei 5 siti di campionamento periodico di benzene
Nome della stazione
Caratteristiche del sito
Via Nonantolana
Prima periferia: strada a medio traffico
L.go Garibaldi
Area ad alta densità di traffico
V. Scudari
Centro storico: zona a traffico limitato
P.co Amendola
Area verde residenziale
Via Fontanelli
Area a medio traffico
Il posizionamento di un sito di campionamento passivo in corrispondenza del sito di
misura in automatico (Via Nonantolana) è servito per la verifica della comparabilità con il
dato fornito dalla misura in automatico.
18.0
NONANTOLANA
AMENDOLA
16.0
GARIBALDI
FONTANELLI
SCUDARI
12.0
10.0
8.0
6.0
4.0
2.0
0.0
15
/0
6/
98
16
/0
6/
98
17
/0
6/
98
18
/0
6/
98
19
/0
6/
98
20
/0
6/
98
21
/0
6/
98
21
/0
9/
98
22
/0
9/
98
23
/0
9/
98
24
/0
9/
98
25
/0
9/
98
26
/0
9/
98
27
/0
9/
98
26
/1
0/
98
27
/1
0/
98
28
/1
0/
98
29
/1
0/
98
30
/1
0/
98
31
/1
0/
98
01
/1
1/
98
Microgrammi al metro cubo
14.0
Giorno
Si è poi proceduto alla verifica dell’ipotesi di esistenza di coefficienti costanti che leghino
le concentrazioni di benzene nelle varie zone della città analizzando i dati dei
campionamenti periodici. La figura 9.1 esemplifica, per il secondo semestre del 1998, gli
andamenti dei rilevamenti di benzene nei cinque siti; l’impressione visiva sembra suggerire
una notevole correlazione fra le concentrazioni misurate nei diversi siti. L’analisi
31
Figura 9.1 – Andamento temporale della concentrazione di benzene nelle cinque stazioni di
campionamento periodico all’interno dell’area urbana di Modena.
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
quantitativa, condotta tramite lo studio dei coefficienti di correlazione, ha confermato tale
impressione. La tabella seguente evidenzia i risultati di questa indagine, condotta
utilizzando i rilevamenti degli anni 1998 e 1999.
Via Fontanelli
L.go Garibaldi
Via Nonantolana
Via Scudari
P.co Amendola
Via Fontanelli
L.go Garibaldi
Via Nonantolana
Via Scudari
P.co Amendola
Tabella 9.2 - Coefficienti di correlazione di Pearson tra i siti di
misura del benzene
1
0,96
0,96
0,95
0,96
0,96
1
0,92
0,93
0,90
0,96
0,92
1
0,93
0,91
0,95
0,93
0,93
11
0,90
0,96
0,90
0,91
0,90
1
I valori misurati nei cinque siti sono quindi altamente correlati. I livelli di significatività (pvalue) sono, per tutte le correlazioni studiate, inferiori a 0.01.
L’analisi dei dati dei campionatori passivi pare quindi suggerire la percorribilità
dell’utilizzo di una procedura del tipo illustrato all’inizio del capitolo.
La procedura in particolare potrebbe consistere nel campionamento dell’inquinante
considerato (per es. benzene) in un tipico periodo con alte concentrazioni (gennaio o
febbraio) e in uno di basse concentrazioni (giugno-luglio). Questo permetterebbe (sempre
se fosse verificata una sufficiente correlazione) di ricavare la retta di regressione rispetto
ad una centralina presa a riferimento (vedi figura 9.2). La scelta di campionare in un
periodo di alta e in uno di bassa concentrazione deriva dal fatto che questo riduce
l’incertezza nella stima della retta di regressione; se la correlazione fosse molto alta si
potrebbe fare il campionamento in qualsiasi momento dell’anno e ricavarne la retta di
regressione. E’ importante rimarcare come i compionamenti nei vari punti dell’area urbana
non dovrebbero essere fatti necessariamente in contemporanea.
In conclusione, si rimanda ad ulteriori approfondimenti la verifica per i diversi inquinanti
della fattibilità della procedura e dell’errore ad essa associato in rapporto alle diverse stime
(oraria, giornaliera, annuale).
32
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Campionamenti Benzene Garibaldi e Nonantolana
Periodi Febbraio e Giugno 1998
18
16
14
12
10
8
6
Campionamenti Febbraio 1998
4
Campionamenti Giugno 1998
2
0
0
2
4
6
8
10
12
14
Figura 9.2 – Dispersione dei campionamenti di benzene di Febbraio e Giugno 1998 nelle
siti di “Garibaldi” e “Nonantolana” all’interno dell’area urbana di Modena.
33
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
10. Correlazioni tra centraline a scala regionale
Vengono qui di seguito riportate le correlazioni calcolate per tutte le coppie di centraline
presenti all’interno degli ambiti urbani regionali. Si sono studiati, per ora, solo questi
inquinanti in quanto sono quelli che hanno una dinamica più a larga scala.
L’obiettivo di questa analisi è testare i livelli di correlazione a grande distanza e verificare
se ozono e PM10 che si suppone abbiano dinamiche a larga scala, abbiano livelli di
correlazione più alti degli inquinanti primari.
Il grado di correlazione per l’ozono è risultato molto elevato: 61 coppie di centraline su 91
hanno valori di correlazione su dati giornalieri superiori a 0,9 e tutte sono comunque
superiori a 0,84. Tali alti livelli di correlazione permettono di ipotizzare una riduzione del
numero di centraline collocate all’interno degli ambiti urbani che, nell’ottica di una rete
regionale, potrebbe anche diventare inferiore al numero dei capoluoghi di provincia.
Il grado di correlazione delle centraline di PM10 è risultato abbastanza variabile, con valori
compresi tra 0,46 e 0,89, media 0,69 e mediana 0,70 (non sono comprese le correlazioni tra
centraline delle stesse città). In questo caso il risultato è di più difficile utilizzo e
meriterebbe ulteriori approfondimenti che necessariamente tengano conto anche dei diversi
apparati di misura utilizzati e di una preventiva, più approfondita, analisi di qualità dei dati.
Occorre anche tenere presente che la numerosità dei dati delle polveri fini è in genere
molto inferiore rispetto all’efficienza di campionamento tipica degli altri inquinanti. Si è
quindi reso meno stringente il criterio della disponibilità di almeno il 75% dei dati. Si sono
infatti calcolate le correlazioni anche in presenza di solo 50% delle 365 coppie di dati
teoricamente disponibili. La numerosità riportata nelle tabelle seguenti è riferita al numero
di coppie di centraline su cui sono calcolate le statistiche sintetiche.
I livelli di correlazione degli inquinanti primari sono risultati abbastanza elevati
evidenziando una buon legame tra gli andamenti delle emissione e delle variabili
meteorologiche anche a scala regionale. In generale le correlazioni non sono risultate
molto differenti da quelle ottenute per il PM10 e per alcuni inquinanti come CO e NO
addirittura inferiori.
Table 10.1. Prospetto sintetico dei coefficienti di correlazione tra centraline a scala regionale. Sono
escluse le centraline collocate all’interno dello stesso ambito urbano.
CO
NO
NO2
O3
SO2
PM10
PTS
BENZENE
0,75
0,78
0,69
0,91
0,31
0,69
0,50
0,61
Mediana
0,74
0,77
0,66
0,91
0,30
0,70
0,53
0,58
Media
0,92
0,93
0,93
0,98
0,79
0,89
0,81
0,82
Massimo
0,23
0,44
-0,02
0,84
-0,29
0,46
0,21
0,19
Minimo
821
936
895
86
163
49
141
18
Numerosità
34
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
11. Correlazioni tra inquinanti
L’analisi del grado di correlazione tra i diversi inquinanti è stata fatta per tutti gli
inquinanti monitorati; vengono qui di seguito riportati i risultati per le coppie di inquinanti
ritenute più interessanti. Essi vengono presentati nelle tabelle seguenti in una visione
sintetica. La numerosità riportata nelle tabelle è riferita al numero di centraline su cui sono
calcolate le statistiche sintetiche delle correlazioni tra inquinanti.
Le correlazioni più alte sono risultate quelle tra CO e NO, con mediana del coefficiente di
correlazione pari a 0,86 (i dati riportati in questo paragrafo si riferiscono a valori
giornalieri). Più deboli si sono rivelate quelle tra CO e NO2 (0,67) e tra NO e NO2 (0,67).
Discretamente alta è la correlazione tra NO e benzene (0,74). Gli inquinanti più legati al
traffico autoveicolare risultano quindi legati, come era lecito aspettarsi, da buona
correlazione anche se generalmente non a un livello sufficiente per poter ipotizzare di
ricavare un inquinante da un altro neppure su base giornaliera.
Di notevole interesse sono le correlazioni tra le varie tipologie di polveri tra di loro e
rispetto agli altri inquinanti. L’esistenza infatti di buoni coefficienti di correlazione
soprattutto tra PTS e PM10 permetterebbe di risalire dal dato delle PTS a quello delle
polveri più fini, per le quali il monitoraggio è di relativamente recente installazione e
limitato a pochi siti. La correlazione tra PTS e PM10 è risultata abbastanza variabile con un
valore minimo di 0,43 e massimo di 0,86 (mediana 0,75). Tale risultato suggerisce il
notevole margine di errore a cui sarebbe soggetta una stima del PM10 ricavata dai dati delle
PTS. Occorre però ricordare le difficoltà delle metodologie di misura delle polveri (e
quindi il loro maggiore errore di misura) e le differenti metodologie di misura. E’
importante anche evidenziare come le correlazioni tra il PM10 e gli altri inquinanti risulti
influenzato dalla bassa numerosità di dati validi. Si è inoltre deciso per tutte le correlazioni
che coinvolgevano tale inquinante di rendere molto meno stringente il criterio della
disponibilità del 75% dei dati per la scarsa efficienza di campionamento delle
apparecchiature nel corso del 2000. Tali elementi portano a ritenere auspicabili
approfondimenti e test sperimentali appositi.
Le correlazioni studiate sono correlazioni di tipo lineare. Tale approccio è stato scelto solo
per questioni di semplicità. Tale modello lineare appare però per alcune coppie di
inquinanti non adeguato e sarebbe quindi utile la verifica di altri tipi di correlazione, anche
non parametrici.
Occorre anche aggiungere che le correlazioni tra inquinanti possono variare nel tempo al
mutare delle sorgenti di emissione e quindi andrebbero periodicamente verificate.
L’esistenza di correlazioni tra i diversi inquinanti risulta importante sia per la mappatura
dell’inquinamento all’interno delle aree urbane (se si fanno campionamenti ad alta
risoluzione spaziale per un certo inquinante è utile sapere se tale mappatura può avere
elementi di validità anche per un altro inquinante), sia nella fase di impostazione delle
campagne epidemiologiche (quali inquinanti monitorare per quantificare un determinato
effetto sanitario) sia nella fase di interpretazione dei risultati (la ricerca delle cause
determinanti gli effetti sanitari legati all’inquinamento risulta fortemente condizionata dal
legame tra i diversi inquinanti).
35
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
CO - NO2
CO- PTS
CO - PM10
CO - BEN
NO - NO2
NO - PTS
NO - PM10
NO - BEN
NO2 - PM10
NO2 - BEN
NO2 - PTS
mediana
media
max
min
numerosità
CO - NO
Tabella 11.1 - Correlazioni tra inquinanti – Dati orari
0,85
0,83
0,91
0,61
42
0,63
0,61
0,76
0,36
42
0,45
0,45
0,57
0,33
2
0,63
0,63
0,65
0,60
2
0,76
0,73
0,82
0,56
4
0,57
0,54
0,65
0,25
45
0,43
0,43
0,55
0,30
2
0,46
0,46
0,47
0,45
2
0,74
0,71
0,83
0,52
4
0,48
0,48
0,53
0,44
2
0,50
0,51
0,66
0,39
4
0,46
0,46
0,47
0,45
2
CO - NO2
CO- PTS
CO - PM10
CO - BEN
NO - NO2
NO - PTS
mediana
media
max
min
numerosità
CO – NO
Tabella 11.2 - Correlazioni tra inquinanti – Dati giornalieri (Parte 1)
0,86
0,84
0,93
0,61
42
0,67
0,65
0,85
0,26
42
0,59
0,54
0,66
0,30
17
0,64
0,62
0,74
0,36
11
0,70
0,67
0,84
0,43
6
0,67
0,63
0,83
0,07
45
0,50
0,48
0,61
0,25
16
NO - BEN
NO2 - PTS
NO2 - PM10
NO2 - BEN
PTS - PM10
PTS - BEN
PM10 - BEN
mediana
media
max
min
numerosità
NO - PM10
Tabella 11.3 - Correlazioni tra inquinanti – Dati giornalieri (Parte 2)
0,57
0,52
0,67
0,30
11
0,78
0,75
0,88
0,48
7
0,55
0,52
0,73
0,04
16
0,56
0,53
0,70
0,25
10
0,61
0,61
0,87
0,35
7
0,75
0,69
0,87
0,43
7
0,45
0,48
0,71
0,33
4
0,61
0,59
0,64
0,52
5
36
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
12. Conclusioni
L’analisi statistica dei rilevamenti delle centraline fisse collocate all’interno delle aree
urbane della regione Emilia Romagna si prefiggeva i seguenti scopi:
1. fornire una quadro descrittivo della variabilità spaziale e temporale delle
concentrazioni dei principali inquinanti all’interno delle aree urbane;
2. quantificare la correlazione tra le centraline anche nell’ottica di un miglior rapporto
costi-benefici;
3. verificare la possibilità di definire criteri per un migliore utilizzo di campionamenti
limitati nel tempo (mezzi mobili, campionatori passivi) nell’ottica di una mappatura
dell’inquinamento a scala sub-urbana;
4. verificare il livello di correlazione tra centraline a scala regionale;
5. verificare la possibilità di stimare alcuni inquinanti basandosi sulle informazioni
raccolte su altri inquinanti;
1) Lo studio ha permesso di evidenziare e quantificare la grande variabilità spaziale dei
principali inquinanti primari da traffico (CO, NO, NO2, Benzene). Le concentrazioni
medie annue rilevate dalle centraline fisse variano anche di 3 volte tra una postazione e
l’altra, rispecchiando solo in parte l’effettiva variabilità spaziale all’interno degli ambiti
urbani. Ciò è dovuto al fatto che all’interno delle città il raggio di rappresentatività del
dato sperimentale è molto ristretto, spesso ridotto a poche decine o centinaia di metri.
E’ emersa anche la limitata significatività della tipologia della centralina (A,B,C,D). Le
medie appaiono infatti estremamente variabili tra centraline dello stesso tipo nella
stessa area urbana e spesso molto simili tra quelle di tipo diverso (anche se quelle di
tipo A hanno, generalmente, medie più basse). La variabilità temporale è anch’essa
estremamente marcata e legata in modo particolare alla variabilità delle condizioni
meteorologiche e della principale (quasi unica) fonte di inquinamento delle aree urbane
che è costituita dal traffico. Emerge quindi, per gli inquinanti sopra citati, la difficoltà
di ottenere un quadro completo dell’inquinamento atmosferico all’interno delle aree
urbane tramite l’utilizzo delle sole centraline fisse e soprattutto occorre concludere che
esse difficilmente permettono di accedere, neppure dove sono in numero maggiore, né
ai livelli di inquinamento medi (in senso spaziale) nelle diverse città né alla
distribuzione dei diversi inquinanti all’interno di esse. Test specifici hanno infatti
dimostrato la non significatività statistica delle differenze tra le medie dei diversi
ambiti urbani ottenute sulla base dei rilevamenti delle centraline fisse. Questo aspetto
ha una notevole importanza considerando che i limiti di legge hanno essenzialmente
una valenza sanitaria e sarebbe opportuno che fossero applicati con la maggior
coerenza possibile nelle diverse aree. Importante eccezione potrebbe essere
rappresentata dalle polveri fini (PM10 ed eventualmente PM2,5). Per tali inquinanti la
letteratura individua generalmente una variabilità meno marcata 2,3, anche se non vi è
su questo unanimità di giudizio 4,5. Sarebbero quindi opportune, considerata anche la
tipicità degli ambiti urbani emiliani, indagini specifiche su tale aspetto, che assume una
notevole rilevanza considerato che l’epidemiologia utilizza con sempre maggiore
frequenza le polveri fini come unico indicatore della qualità dell’aria per la stima degli
effetti sanitari. Se, infatti, fosse verificata la limitata variabilità spaziale delle polveri
fini all’interno delle aree urbane si potrebbe disporre di un indicatore di qualità
dell’aria che permetterebbe più efficaci confronti tra città diverse e più coerenti
politiche e provvedimenti per il controllo e la limitazione dell’inquinamento
atmosferico. Le centraline fisse sono quindi, in ambito urbano, un indispensabile
strumento per l’analisi dei trend temporali degli inquinanti e (con qualche riserva) delle
37
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
correlazioni temporali tra variabili ambientali e sanitarie. Esse non permettono però,
per molti degli inquinanti monitorati, nè di individuare le aree più critiche da un punto
di vista ambientale (né a scala urbana né a scala regionale) né di quantificare in modo
preciso l’esposizione media della popolazione. Per raggiungere tali scopi si rende
necessario l’utilizzo di un approccio integrato di dati di centraline fisse, di
campionatori passivi e mezzi mobili e strumenti modellistici di tipo fisico e statistico.
Sarebbe anche auspicabile una definizione di criteri il più possibile uniformi nella
collocazione o nella selezione delle centraline che potrebbero far parte di una rete a
scala regionale. Tale rete dovrebbe mirare soprattutto alla rilevazione dei dati con la
maggior rappresentatività spaziale possibile (parchi, aree a scarso traffico e ben areate).
La buona correlazione riscontrata tra medie annue e 95° percentili per tutti gli
inquinanti considerati nello studio, evidenzia l’importanza delle medie di lungo periodo
nell’ottica dell’individuazione delle aree critiche. Il legame statistico infatti tra medie e
valori dei picchi permette di servirsi delle medie annue per caratterizzare le zone
critiche all’interno delle singole aree urbane sia in rapporto agli inquinanti che hanno
effetti a lungo termine, sia in rapporto a quelli che hanno effetti di tipo acuto.
2) L’analisi del grado di correlazione tra le diverse centraline ha portato alla
quantificazione precisa del legame fra gli andamenti temporali delle concentrazioni. Le
correlazioni giornaliere sono risultate quasi sempre più alte di quelle orarie perché
l’operazione di media limita l’effetto sia delle piccole differenze micro-meteorologiche
e di traffico locali, sia degli errori di misura. L’approccio adottato in questo studio è
quello del calcolo del “valore minimo” di correlazione. L’eliminazione di eventuali dati
anomali presenti nel dataset e sfuggiti al controllo effettuato in fase preliminare e la
considerazione precisa per ogni centralina e per ogni inquinante degli errori
sperimentali potrebbe portare ad un aumento anche sensibile del coefficiente di
correlazione orario calcolato (un errore relativo del 10% nelle misure di un inquinante
si ripercuote in una riduzione del 9% circa nel coefficiente di correlazione). L’analisi
del ha evidenziato una generalmente buona correlazione tra le diverse centraline per la
misura del monossido di carbonio (Mediana del coeff. di corr. su dati giornalieri =0,82,
N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 11). Ancora
migliore è risultata la correlazione per il monossido di azoto, con valori di correlazione
tra i dati giornalieri che superano spesso 0,9 (Mediana del coeff. di corr. su dati
giornalieri =0,89, N. coppie centraline con coefficiente maggiore di 0,9 su dati
giornalieri = 43). Un po’ al di sotto del CO e dell’NO si collocano i valori di
correlazione relativi al biossido di azoto (Mediana del coeff. di corr. su dati giornalieri
=0,78, N. coppie centraline con coefficiente maggiore di 0,9 su dati giornalieri = 5).
Ottime sono risultate le correlazioni relative all’ozono: a Modena, Bologna, Ferrara e
Ravenna, uniche città ove sono disponibili più rilevatori di O3 all’interno dell’area
urbana, le correlazioni sono sempre superiori a 0,94. L’analisi dei dati del biossido di
zolfo ha evidenziato una estrema variabilità del grado di correlazione. Questo dato
riveste comunque un’importanza limitata a causa dei suoi bassi livelli di
concentrazione tipici, spesso al di sotto della soglia di rilevabilità. La situazione del
benzene è particolare in quanto esso, quando è misurato in continuo, è generalmente
rilevato da una sola centralina. Pur essendo pochi quindi i dati a disposizione, essi
concordano nell’assegnare una correlazione notevole (tra 0,8 e 0,9) tra diversi siti per
la misura di tale inquinante. Campionamenti periodici effettuati nell’area urbana di
Modena per diversi anni in cinque siti confermano questa tesi. Un discorso particolare
meritano le polveri. Esse vengono monitorate nella forma di Polveri Totali Sospese
(PTS) e nella forma PM10 (Polveri con diametro aerodinamico inferiore a 10 µm). Le
PTS sono monitorate in genere da più di una centralina per ogni ambito urbano con
38
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
rilevatori che sono spesso omogenei all’interno della stessa città ma disomogenei tra
diverse città. Le correlazioni sono risultate molto diverse tra le varie coppie di
centraline. Per quanto riguarda il PM10, il discorso è analogo al benzene in rapporto alla
numerosità dei siti di rilevamento; un’ulteriore aspetto problematico deriva dal fatto
che, ove è misurato da più di una centralina, la misura è fatta con tipi di rilevatori
diversi la cui comparabilità è oggetto di discussione. Tenendo presente queste
considerazioni preliminari, dai dati in nostro possesso pare ragionevole dire che le
centraline per la misura del PM10 all’interno della stessa area urbana sono abbastanza
ben correlate nonostante la diversità dei metodi sperimentali, anche se i dati sono pochi
per poter trarre conclusioni generali. Come già evidenziato per le statistiche univariate,
nemmeno rispetto alle correlazioni emerge una particolare influenza della tipologia di
centralina. Concludendo, l’analisi di correlazione tra i rilevamenti dei principali
inquinanti in diversi siti all’interno dei singoli ambiti urbani ha evidenziato un legame
generalmente abbastanza stretto tra gli andamenti temporali. Tale risultato può essere
utilizzato sia per definire procedure per la ricostruzione di dati mancanti, sia per
individuare eventuali dati anomali presenti nelle serie storiche, sia per valutare il
contenuto informativo delle centraline fisse nell’ottica di un miglior rapporto costi
benefici. Una correlazione alta implica infatti una certa ridondanza dell’informazione
fornita. Una volta infatti ottenuto il coefficiente di regressione tra le due centraline
sulla base dei rilevamenti passati, è possibile ricavare i rilevamenti nel sito di una
centralina sulla base dei valori rilevati da quella scelta come riferimento. Si ritiene
ragionevole fissare a 0,9 la soglia del coefficiente di correlazione che rende tale
procedura di estrema affidabilità in quanto l’errore che si commetterebbe ricavando la
concentrazione media giornaliera di una centralina dall’altra sarebbe basso,
paragonabile all’errore di misura. Tale criterio potrebbe probabilmente essere reso
meno stringente sia valutando attentamente gli errori sperimentali nei dati di partenza
sia la strategia e i fini della rete di monitaraggio nel suo complesso (e quindi
l’incertezza accettabile nella stima di un certo inquinante in un determinato sito). E’
utile precisare che i coefficienti di correlazione e i parametri della retta di regressione
calcolati per ogni coppia di centraline si suppone debbano rimanere pressochè costanti
nel tempo a meno di cambiamenti di tipo urbanistico e viario nei siti considerati.
Partendo quindi dal presupposto che maggiore è il numero di centraline fisse, maggiori
sono la quantità di informazioni disponibili e gli strumenti per individuare ed
intervenire in caso di malfunzionamenti, è però importante evidenziare una certa
ridondanza dell’informazione fornita dalle stesse. Occorre quindi valutare, in un’ottica
di assegnazione delle risorse, in quale proporzione assegnare investimenti ai diversi
strumenti che compongono un sistema di controllo della qualità dell’aria.
3) La bassa rappresentatività delle centraline all’interno delle città ne limita l’utilizzo
nell’ottica della mappatura dell’inquinamento a scala sub-urbana. D’altro canto
nemmeno aumentare i punti di misura tramite campionatori passivi e mezzi mobili
appare appropriato a questo scopo, in quanto questi ultimi, fornendo dati solo per
periodi limitati, non permettono di cogliere la marcata variabilità temporale degli
inquinanti. Si è quindi ipotizzata una procedura per un utilizzo sinergico di tutti i dati
sperimentali disponibili e cioè dei dati dei campionamenti a finestra temporale e delle
centraline fisse. In particolare, la procedura consisterebbe nel fare campionamenti
limitati nel tempo nei diversi punti della città (con mezzi mobili o campionatori
passivi), verificare il grado di correlazione in ognuno di essi rispetto ad una o più
centraline di riferimento e qualora la correlazione risultasse sufficientemente alta,
ottenere i parametri della regressione e ricavare quindi l’andamento per tutto l’anno
sulla base della relazione funzionale trovata (la retta) rispetto alle centraline di
39
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
riferimento. Lo studio ha evidenziato come, sulla base dei dati delle centraline fisse
esaminati, questo approccio appare giustificato con un errore accettabile per molti degli
inquinanti e dei siti considerati. Sono comunque necessarie ulteriori analisi per
verificare la corretteza dell’utilizzo di tale procedura anche nei siti dove non sono
presenti centraline fisse. E’ quindi auspicabile un prosieguo dello studio incentrato
sull’analisi di dati di campionatori passivi e mezzi mobili. Bisogna anche dire che più
si è interessati, piuttosto che a valori orari, a valori medi giornalieri o di più lungo
periodo, più la procedura sarebbe affidabile; tali medie di lungo periodo sono forse
d’altronde il parametro più importante da un punto di vista della programmazione del
territorio e della prevenzione sanitaria.
4) L’obiettivo di questa analisi era di testare i livelli di correlazione a grande distanza e
verificare se ozono e PM10 che si suppone abbiano dinamiche a larga scala, abbiano
livelli di correlazione più alti degli inquinanti primari. Il grado di correlazione tra le
centraline di ozono collocate negli ambiti urbani di tutta la regione è risultato molto
elevato: 61 coppie di centraline su 91 hanno valori di correlazione su dati giornalieri
superiori a 0,9 e tutte sono comunque superiori a 0,84. Tutte le centraline della regione
sono quindi ottimamente correlate. E’ quindi ipotizzabile anche una riduzione del loro
numero. Il grado di correlazione delle centraline di PM10 è risultato abbastanza
variabile, con valori compresi tra 0,46 e 0,89, media 0,69 e mediana 0,70. In questo
caso, pur essendo la correlazione evidente, il risultato non permette certo di ipotizzare
una riduzione del numero di stazioni e anzi meriterebbe ulteriori approfondimenti sia
nell’ambito della comparazione dei metodi di misura e quindi dei dati sperimentali
utilizzati, sia nello studio delle dinamiche dispersive delle polveri fini alle diverse scale
spaziali, sia nell’ambito della efficienza degli apparati di misura che per tale inquinante
è risultata spesso nel corso del 2000 molto più bassa rispetto agli inquinanti. La
correlazione tra gli inquinanti primari è risultata a livelli molto simili a quella ottenuta
per il PM10.
5) L’analisi del grado di correlazione tra i diversi inquinanti è stata condotta in termini di
correlazione lineare anche se tale approccio potrebbe risultare non totalmente
soddisfacente per alcune coppie di inquinanti. Le correlazioni più alte sono risultate
quelle tra CO e NO, con mediana del coefficiente di correlazione sui dati giornalieri
pari a 0,86. Più deboli si sono rivelate quelle tra CO e NO2 (mediana 0,67) e tra NO e
NO2 (mediana 0,67). Discretamente alta è risultata la correlazione tra NO e benzene
(mediana 0,78). Gli inquinanti primari da traffico autoveicolare risultano quindi legati,
come è lecito aspettarsi, da buona correlazione anche se appare dubbia la possibilità di
ricavare un inquinante da un altro. La correlazione tra PTS e PM10 è risultata di 0,75
(mediana). Tale risultato renderebbe abbastanza grossolana una eventuale stima delle
polveri fini dai dati delle PTS. Occorre però ricordare le differenti metodologie di
misura tra le due specie di particolato, elemento che porta a ritenere auspicabili
approfondimenti e test sperimentali appositi. Le correlazioni tra le polveri fini e gli
inquinanti primari da traffico sono in genere intorno a 0,6. Se da un lato questo sembra
suggerire l’importanza del traffico nella genesi, diretta ed indiretta, di tale inquinante,
dall’altro occorre tenere presente il problema dell’influenza dell’andamento temporale
delle proprietà dispersive dell’atmosfera che è comune a tutti gli inquinanti e che
quindi tende ad aumentare la correlazione tra gli inquinanti indipendentemente dalla
analogia delle fonti di emissione. Fa eccezione a questo l’ozono che, oltre ad avere
proprietà fisico-chimiche e meccanismi di formazione totalmente differenti dagli altri
inquinanti, ha una relazione del tutto peculiare anche con la meteorologia, risultando
infatti non correlato rispetto a tutti gli altri inquinanti analizzati.
40
Analisi statistiche a supporto del monitoraggio della qualità dell’aria in Emilia Romagna
Bibliografia
1.
2.
3.
4.
5.
Fisher L.D., Van Belle G., “Biostatistics”, pag.385, Wiley – Interscince Publication)
EPA, Air Quality Criteria for Particulate Matter (Second External Review Draft), Marzo 2001;
Röösli M. et al., “Spatial Variability of Different Fractions of Particulate Matter within an Urban
Environment and between Urban and Rural Sites”, J. Air & Waste Manage. Assoc.,2000, 50:11151124;
VanCuren T., “Spatial Factors Influencing Winter Primary Particle Sampling and Interpretation”, J.
Air & Waste Manage. Assoc., 1999, 49:PM-3-15;
Brook J.R., “Observations and Interpretations from the Canadian Fine Particle Monitoring
Program”, J. Air & Waste Manage. Assoc., 1999, 49:PM-35-44;
41