Università degli Studi di Roma “Tor Vergata” Corso di Telerilevamento e Diagnostica Elettromagnetica A.A. 2009/2010 Stima di profili di ozono atmosferico da dati satellitari mediante reti neurali Antonio Di Noia 24 giugno 2010 Parte I L’ozono atmosferico: fenomenologia e rilevanza geofisica Composizione chimica dell’atmosfera S PECIE CHIMICA S IMBOLO F RAZIONE MOLARE (%) Azoto Ossigeno Argon Neon Elio Cripton Xenon Idrogeno Metano Vapor d’acqua Anidride carbonica Ozono Anidride solforosa Ammoniaca Ossidi di azoto Formaldeide N2 O2 Ar He He Kr Xe H2 CH4 H2 O CO2 O3 SO2 NH4 NO/NO2 HCHO 78.084 20.948 0.934 0.001818 0.000525 0.000914 0.0000087 0.00005 0.0002 0.1 ÷ 4 0.0314 (2 ÷ 7) × 10−6 (0.5 ÷ 7.2) × 10−5 tracce tracce tracce 24 giugno 2010 3 di 35 Importanza dell’ozono atmosferico Ozono stratosferico • Assorbe la radiazione solare ultravioletta, impedendone l’arrivo sulla superficie terrestre • È un importante gas serra Ozono troposferico • Precursore del radicale OH, che rimuove specie chimiche inquinanti (ossidazione troposferica) • Agente inquinante: concorre a formare lo smog fotochimico 24 giugno 2010 4 di 35 Ozono stratosferico Formazione • Radiazione UV solare dissocia molecole di O2 , formando ossigeno atomico • Ossigeno atomico reagisce con altre molecole di O2 formando O3 Rimozione • Fotodissociazione di O3 e ricombinazione con ossigeno atomico • Reazioni con HOx , NOx , composti di cloro e bromo (cicli catalitici) 24 giugno 2010 5 di 35 Ozono troposferico Formazione • Ossidazione di CO, idrocarburi e composti organici volatili catalizzata da ossidi di azoto (influenza delle emissioni umane) • Afflusso di aria ricca di ozono dalla stratosfera (STE - Stratosphere/Troposphere Exchange) Rimozione • Reazioni con HOx e OH Concentrazioni locali influenzate da • Presenza di sorgenti • Condizioni meteo (temperatura, pressione, direzione e intensità vento) 24 giugno 2010 6 di 35 Distribuzione globale dell’ozono 24 giugno 2010 7 di 35 Profili verticali di concentrazione di ozono Dipendenza della concentrazione di ozono dalla quota: • Ozono concentrato per la gran parte nella stratosfera • Picco di concentrazione in genere tra 20 e 30 km (dipendente da latitudine) • In Antartide, nei mesi primaverili (settembre-novembre), concentrazioni di ozono minime (buco dell’ozono) 24 giugno 2010 8 di 35 Parte II Tecniche di telerilevamento da satellite Osservazione dell’ozono da satellite: gli esordi • Prime osservazioni risalenti al 1970: sensore BUV (Backscattered UltraViolet) su Nimbus-4 • Osservazioni regolari a partire dal 1978: • TOMS (Total Ozone Mapping Spectrometer) • SBUV (Solar Backscattered UltraViolet) su Nimbus-7 (poi su altri satelliti) • Primi sensori operavano esclusivamente nell’ultravioletto 24 giugno 2010 10 di 35 L’ozono e la radiazione elettromagnetica Proprietà radiative dell’ozono • Bande di assorbimento in UV/VIS (transizioni elettroniche) • • • • Banda di Hartley (UV): 200 − 310 nm Banda di Huggins (UV): 310 − 350 nm Banda di Chappuis (VIS): 480 − 610 nm Gran parte dei sensori opera in questo intervallo (es. TOMS, GOME, SCIAMACHY, OMI) • Gran numero di righe di assorbimento/emissione in TIR/FIR (transizioni vibrazionali) • Riga particolarmente intensa a 9.7 µm - sfruttata da Meteosat (canale 8 SEVIRI) • Su satellite, spettrometri a trasformata di Fourier ricostruiscono spettri IR ad alta risoluzione (es. IASI, MIPAS, TES) • Alcune righe a microonde (roto-vibrazionali). Particolarmente importanti • 110.8 GHz - sfruttata da molti radiometri a terra • 206.1 GHz - canale 4 del sensore satellitare MLS (Microwave Limb Sounder) su Aura (centrato a 205 GHz) 24 giugno 2010 11 di 35 Telerilevamento UV/VIS: principio base • Satellite misura radiazione solare diffusa da sistema Terra-atmosfera mediante • Scattering dalla superficie terrestre • Scattering da molecole atmosferiche, elastico (scattering di Rayleigh) e anelastico (scattering di Raman) • Scattering da nubi e aerosol (scattering di Mie) • Assorbimento da ozono (e altri gas) modifica segnale misurato 24 giugno 2010 12 di 35 Informazione sull’ozono nelle misure UV/VIS • Proprietà assorbitive dell’ozono dipendono da lunghezza d’onda • Forte assorbimento in banda di Hartley: radiazione in tale intervallo assorbita per la gran parte in stratosfera (dove la concentrazione di ozono è alta) • Radiazione a lunghezze d’onda superiori penetra a quote inferiori (essendo meno assorbita) • La dipendenza dell’assorbimento dalla quota è la base fisica del telerilevamento dei profili di ozono 24 giugno 2010 13 di 35 Le funzioni peso • Le funzioni peso sono una misura della sensibilità della radianza misurata dal sensore alla concentrazione di ozono in funzione della quota • Formalmente, funzione peso per la lunghezza d’onda λi definita da Ki (z) = d Iλmis i dXO3 (z) con Iλmis radianza misurata e XO3 (z) concentrazione ozono alla i quota z • Funzioni peso dipendenti da • Processo fisico di misura (trasferimento radiativo) • Caratteristiche dello strumento 24 giugno 2010 14 di 35 Esempi di funzioni peso UV: SCIAMACHY 24 giugno 2010 15 di 35 Commenti sull’andamento delle funzioni peso • Tipicamente, funzioni peso per l’ozono hanno andamento “a campana” • Valori negativi: maggiore concentrazione di ozono assorbimento à minore radianza al satellite à maggior • Il picco tende a spostarsi verso quote inferiori all’aumentare di λ • Di conseguenza, scandire lo spettro in λ equivale a scandire l’atmosfera in verticale (λ maggiori contengono informazione su quote inferiori) 24 giugno 2010 16 di 35 Parte III Elementi di teoria dell’inversione Il problema dell’inversione: introduzione • Il sensore satellitare effettua misure di radianza in m lunghezze d’onda λ1 , . . . , λm • Obiettivo: determinare la concentrazione di ozono in n quote z1 , . . . , zn . • Il segnale misurato dipende da • Concentrazione di ozono • Concentrazione di altri gas assorbenti • Riflettanza della superficie • Presenza di nubi • Concentrazione di aerosol • Rumore di misura Problema: Come isolare l’informazione sull’ozono? 24 giugno 2010 18 di 35 Il problema dell’inversione: aspetti formali • Vettore delle misure y (es. radianze a varie λ) funzione di vettore di stato x (es. conc. ozono a varie quote) e vettore dei parametri b (tutte le altre grandezze che concorrono a determinare il segnale misurato), più errori di misura (es. rumore) y = F(x, b) + • Problema di inversione: stimare x dati y (misurato) e b (noto per assunzioni a priori) b = R(y, b) x • Formalmente, il problema dell’inversione è mal posto: • Soluzione non unica (segnale misurato dipende anche da parametri diversi da quello da stimare) • Soluzione instabile (piccoli errori di misura si traducono in forti oscillazioni della soluzione) 24 giugno 2010 19 di 35 Parte IV Le reti neurali nell’inversione di dati telerilevati Una riformulazione del problema di inversione • Dato il vettore delle misure y, si cerca una corrispondenza x = R(y) che consenta di ricavare il vettore di stato x (es. profilo di ozono) una volta noto y (es. vettore delle radianze) • Questa formulazione non fa riferimento alla necessità di conoscere il modello diretto F (che permette di ricavare y noto x) • Si presta al caso in cui si voglia effettuare l’inversione direttamente dai dati (come succede con una rete neurale) 24 giugno 2010 21 di 35 Inversione tramite reti neurali • MLP sono in grado di approssimare con accuratezza arbitraria qualsiasi funzione continua (Teorema di approssimazione universale - K. Hornik, G. Cybenko, 1989) • Obiettivo dell’inversione basata su NN: determinare l’insieme dei parametri liberi della rete (pesi, bias) che minimizzano una funzione costo, dipendente dall’errore (x − R(y))2 (varie espressioni possibili, a seconda dell’algoritmo di addestramento) 24 giugno 2010 22 di 35 Parte V Caso di studio: stima di profili di ozono da dati SCIAMACHY Descrizione dello studio • Progettazione e studio delle prestazioni di algoritmi di rete neurale per la determinazione di profili di ozono atmosferico da dati del sensore SCIAMACHY su Envisat • Cosa vedremo: 1 2 3 4 24 giugno 2010 Scelta del dataset di addestramento Selezione delle lunghezze d’onda Ottimizzazione della topologia di rete Discussione dei risultati dell’inversione 24 di 35 Il dataset di addestramento • Dati di input: • Spettri di radianza SCIAMACHY, normalizzati all’irradianza solare • Colonna integrata di ozono • Angolo zenitale solare • Dati di output: profili di ozono misurati da ozonosonde, co-locati con spettri SCIAMACHY, campionati in 9 quote 24 giugno 2010 25 di 35 Selezione delle lunghezze d’onda • Obiettivo. Selezionare le lunghezze d’onda maggiormente informative ai fini dell’inversione dei dati • Strategia. Extended Pruning (EP) • Selezione automatica delle lunghezze d’onda • Si parte da una rete con un grande numero di ingressi (nel nostro caso 224) • Vengono eseguiti addestramenti ripetuti, eliminando dopo ciascun addestramento il peso con valore più basso • Un ingresso viene eliminato quando sono stati cancellati tutti i pesi che lo connettono al primo strato nascosto • Durante il processo, l’errore della rete in fase di test tende ad aumentare (prezzo da pagare per minor complessità) • Il processo viene arrestato quando l’errore di generalizzazione della rete supera una certa soglia • Risultati • 26 lunghezze d’onda selezionate • Una lunghezza d’onda in banda di Hartley • 19 lunghezze d’onda in banda di Huggins • 6 lunghezze d’onda in banda di Chappuis • In tutto, 28 ingressi (lunghezze d’onda, colonna ozono totale, angolo zenitale solare) 24 giugno 2010 26 di 35 Interpretazione dei risultati dell’EP • In banda di Hartley, lo spettro di assorbimento dell’ozono ha andamento “liscio” • In banda di Huggins, la dinamica spettrale è più rapida lunghezze d’onda “indipendenti” à più • Radiazione VIS penetra maggiormente negli strati atmosferici più bassi: Informazione su ozono troposferico 24 giugno 2010 27 di 35 Ottimizzazione della topologia • Problema. Quanti strati nascosti? Quanti neuroni per strato nascosto? • Non esistono teoremi che permettano di determinare con certezza tali parametri • Scelta basata su esperienza, guidata dai seguenti criteri: 1 Uno o due strati nascosti solitamente sufficienti 2 Pochi neuroni nascosti riducono capacità di approssimazione 3 Troppi neuroni nascosti aumentano rischio di overfitting • Soluzione euristica. Addestrare più reti, con diversi numeri di neuroni (strati) nascosti, e scegliere quella che dà il minimo errore in fase di test • I nostri risultati: • Uno strato nascosto • 27 neuroni nascosti 24 giugno 2010 28 di 35 Contenuto informativo del visibile • La selezione automatica delle lunghezze d’onda evidenzia la rilevanza del visibile • Inversione nel VIS resa difficile dalla variabilità di altri parametri (riflettanza della superficie, carico aerosol, concentrazione di altri gas assorbenti, etc.) • Le reti neurali sembrano riuscire ad estrarre l’informazione in questo intervallo, meglio di altri metodi di inversione 24 giugno 2010 29 di 35 Influenza del VIS sull’accuratezza • Domanda. Quanto migliorano i risultati dell’inversione se si include il VIS nel vettore di misura? • Esperimento. Confronto tra due reti della stessa topologia, una utilizzante il VIS una operante solo nell’UV 24 giugno 2010 30 di 35 Scatter plots a 1000 hPa (troposfera) (a) Rete UV 24 giugno 2010 (b) Rete UV+VIS 31 di 35 Scatter plots a 56.25 hPa (stratosfera) (c) Rete UV 24 giugno 2010 (d) Rete UV+VIS 32 di 35 Profilo del coeff. di correlazione Maggiori info: P. Sellitto, A. Di Noia, F. Del Frate, D. Solimini, “On the role of visible radiation for ozone retrieval from SCIAMACHY by Neural Network algorithms”, Atmospheric Science Conference 2009, Barcellona, 7-11 settembre 2009. 24 giugno 2010 33 di 35 Discussione dei risultati Riultati ottenuti • Reti neurali consentono di ottenere profili sufficientemente accurati a tutte le quote • Uso del VIS dà particolari benefici in bassa troposfera • In stratosfera, l’uso di sole radianze UV appare sufficiente Questioni aperte • Analisi degli errori in relazione alla riflettanza della superficie sottostante • Ricerca di metodi per aumentare l’accuratezza di stima in troposfera 24 giugno 2010 34 di 35 GRAZIE PER L’ATTENZIONE