SARFIRE – Kick-Off Meetingg Presentazione dei partecipanti WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI speaker Silvia Canale (DIS) WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI SCOPO e OBIETTIVI Determinare un modello di apprendimento automatico per l’identificazione identificazione di “pattern di rischio incendi” sulla base dell’esperienza (incendi già verificatisi). Le regole g di identificazione di ppattern, insieme alle regole g empiriche p ggià identificate dagli g esperti del settore, forniscono una base di conoscenza per: - la classificazione delle aree di interesse in base al rischio di incendio stimato (modello di suscettibilità); - la previsione di incendi futuri (modello di previsione). previsione) WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI ESEMPIO DI MODELLO DI SUSCETTIBILITÀ Fonte: Dipartimento forestale Andhra Pradesh, India. Forest Fire Risk Modeling (Fire Hazard Zonation, http://forest.ap.nic.in/GIS%20Fire.htm) WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI ESEMPIO DI MODELLO DI PREVISIONE Fire-danger forecast on 2009, 2009 Aug. Aug 4 Fire-danger forecast today Fonte: EC Joint Research Centre – Institute for Environment and Sustainability, European Forest Fire Information System (http://effis.jrc.ec.europa.eu) WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI MODELLO DI APPRENDIMENTO AUTOMATICO (MACHINE LEARNING) La maggior parte delle metodologie di data mining impiegano tecniche di apprendimento automatico (machine learning) per l’induzione di regole a partire da esempi REGOLE deduzione ESEMPI ESEMPI induzione REGOLE 9 apprendimento supervisionato l’induzione avviene a partire da esempi xi cui è associata un’etichetta yi ¾le regole indotte definiscono un’approssimazione della relazione tra gli esempi e le relative etichette f ( xi ) = yi ( f incognita ) ¾in base alla natura dell dell’etichetta etichetta yi abbiamo diversi problemi (pattern recognition, classificazione, regressione) 9 apprendimento non supervisionato l’induzione avviene a partire da esempi privi di etichetta ¾le regole indotte definiscono regolarità che vengono identificate in cluster (gruppi omogenei di dati) WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI ESEMPI ED ETICHETTE (TRAINING SET) ESEMPI DA WP1 (ANALISI), WP2 (RACCOLTA DATI), WP3 (ELABORAZIONE) IMMAGINI SAR/ottiche (fonti ASI) Informazioni/dati sulle attuali procedure di stima suscettibilità aree incendi Dati sulla popolazione Dati sul territorio e uso del suolo (fonti Istat) (fonti Comuni, EEA, Corpo Forestale) (fonti Protezione Civile) WP1, WP2, WP3 WP1, WP2, WP3 WP2 WP2 Dati catastali Dati orografici (fonti Comuni Comuni, (fonti NASA) Province, Regioni, APAT) WP2 WP2 Mappe indicizzate aree target complete di feature temporali WP2 Mappe indicizzate aree target (data set per l’analisi statistica) FORMATO ISTANZA indici immagini … indici attuali procedure …… indici di densità di popolazione … indici di uso indici catastali indici meteo del suolo … … … WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI ESEMPI ED ETICHETTE (TRAINING SET) ETICHETTE DAGLI ESPERTI DEL SETTORE (PROTEZIONE CIVILE, GUARDIA FORESTALI, VIGILI DEL FUOCO) FORMATO ISTANZA indici immagini … indici attuali procedure …… indici di densità di popolazione … xi f ((xi ) = yi indici immagini … indici attuali procedure …… indici di uso indici catastali indici meteo del suolo … … … d i yi ( f incognita g ) indici di densità di popolazione … indici di uso indici catastali indici meteo del suolo … i n d i c e … … r i s c h i o WG3 – CLASSIFICAZIONE DEI DATI E SERIE TEMPORALI MODELLO DI SUSCETTIBILITÀ indici immagini … indici attuali procedure indici di densità di popolazione …… … indici di uso indici catastali indici meteo del suolo … … … Algoritmo di apprendimento automatico Scelta del modello Selezione del modello APPROSSIMAZIONE g DELLA FUNZIONE DI RELAZIONE f g (xi ) = yi’ rischio di incendio atteso Validazione del modello VALIDAZIONE DEGLI ESPERTI DEL SETTORE