SARFIRE – Kick-Off Meeting Presentazione dei partecipanti WG3

SARFIRE – Kick-Off Meetingg
Presentazione dei partecipanti
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
speaker Silvia Canale (DIS)
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
SCOPO e OBIETTIVI
Determinare un modello di apprendimento automatico per l’identificazione
identificazione di “pattern di
rischio incendi” sulla base dell’esperienza (incendi già verificatisi).
Le regole
g di identificazione di ppattern, insieme alle regole
g empiriche
p
ggià identificate dagli
g
esperti del settore, forniscono una base di conoscenza per:
- la classificazione delle aree di interesse in base al rischio di incendio stimato (modello di
suscettibilità);
- la previsione di incendi futuri (modello di previsione).
previsione)
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
ESEMPIO DI MODELLO DI SUSCETTIBILITÀ
Fonte: Dipartimento forestale Andhra Pradesh, India. Forest Fire Risk Modeling (Fire Hazard
Zonation, http://forest.ap.nic.in/GIS%20Fire.htm)
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
ESEMPIO DI MODELLO DI PREVISIONE
Fire-danger forecast on 2009,
2009 Aug.
Aug 4
Fire-danger forecast today
Fonte: EC Joint Research Centre – Institute for Environment and Sustainability, European
Forest Fire Information System (http://effis.jrc.ec.europa.eu)
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
MODELLO DI APPRENDIMENTO AUTOMATICO (MACHINE LEARNING)
La maggior parte delle metodologie di data mining impiegano tecniche di apprendimento
automatico (machine learning) per l’induzione di regole a partire da esempi
REGOLE
deduzione
ESEMPI
ESEMPI
induzione
REGOLE
9 apprendimento supervisionato l’induzione avviene a partire da esempi xi cui è associata
un’etichetta yi
¾le regole indotte definiscono un’approssimazione della relazione tra gli esempi e le
relative etichette
f ( xi ) = yi
( f incognita )
¾in base alla natura dell
dell’etichetta
etichetta yi abbiamo diversi problemi (pattern recognition,
classificazione, regressione)
9 apprendimento non supervisionato l’induzione avviene a partire da esempi privi di
etichetta
¾le regole indotte definiscono regolarità che vengono identificate in cluster (gruppi
omogenei di dati)
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
ESEMPI ED ETICHETTE (TRAINING SET)
ESEMPI DA WP1 (ANALISI), WP2 (RACCOLTA DATI), WP3 (ELABORAZIONE)
IMMAGINI SAR/ottiche
(fonti ASI)
Informazioni/dati sulle
attuali procedure di stima
suscettibilità aree incendi
Dati sulla
popolazione
Dati sul territorio e
uso del suolo
(fonti Istat)
(fonti Comuni,
EEA, Corpo
Forestale)
(fonti Protezione Civile)
WP1,
WP2,
WP3
WP1,
WP2,
WP3
WP2
WP2
Dati catastali
Dati orografici
(fonti Comuni
Comuni,
(fonti NASA)
Province, Regioni,
APAT)
WP2
WP2
Mappe indicizzate aree target
complete di feature temporali
WP2
Mappe indicizzate aree target
(data set per l’analisi statistica)
FORMATO ISTANZA
indici immagini
…
indici attuali procedure
……
indici di densità di
popolazione
…
indici di uso indici catastali indici meteo
del suolo
…
…
…
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
ESEMPI ED ETICHETTE (TRAINING SET)
ETICHETTE DAGLI ESPERTI DEL SETTORE (PROTEZIONE CIVILE, GUARDIA
FORESTALI, VIGILI DEL FUOCO)
FORMATO ISTANZA
indici immagini
…
indici attuali procedure
……
indici di densità di
popolazione
…
xi
f ((xi ) = yi
indici immagini
…
indici attuali procedure
……
indici di uso indici catastali indici meteo
del suolo
…
…
…
d
i
yi
( f incognita
g
)
indici di densità di
popolazione
…
indici di uso indici catastali indici meteo
del suolo
…
i
n
d
i
c
e
…
…
r
i
s
c
h
i
o
WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI
MODELLO DI SUSCETTIBILITÀ
indici immagini
…
indici attuali procedure
indici di densità di
popolazione
……
…
indici di uso indici catastali indici meteo
del suolo
…
…
…
Algoritmo di apprendimento automatico
Scelta
del modello
Selezione
del modello
APPROSSIMAZIONE g
DELLA FUNZIONE DI RELAZIONE f
g (xi ) = yi’ rischio di incendio atteso
Validazione
del modello
VALIDAZIONE DEGLI
ESPERTI DEL SETTORE