STRUTTURA TESINA
December 17, 2003
1
Descrizione del problema
Breve descrizione del problema da risolvere.
2
Preprocessing dei dati
Preprocessing dei dati per permetterne la manipolazione da parte di reti neurali. Eventualmente rappresentazione vettoriale di attributi discreti o normalizzazione di attributi continui. Scelta del numero di neuroni di uscita della
rete.
3
Suddivisione dei dati
Suddivisione dei dati in training set, validation set, test set cercando di conservare una percentuale di esempi di ogni classe in ciascuno dei tre sottoinsiemi.
4
Addestramento della rete
Per ogni architettura di rete sperimentata provare un certo numero di varianti
nell’addestramento (inizializzazione, learning rate, tipo di funzione tra backprop online, backprop batch e backprop con momentum) interrompendo sempre l’addestramento in base al comportamento sul validation set. Confrontare
le reti ottenute calcolando l’accuratezza sul validation set della rete addestrata.
Riportare il grafico di addestramento per la rete con la miglior accuratezza.
5
Selezione dell’architettura
Ripetere il procedimento sopra riportato per diverse architetture, variando il
numero di neuroni nascosti per strato ed il numero di strati (1 o 2). Riportare
un grafico con in ascissa il numero di neuroni nascosti della rete ed in ordinata
l’accuratezza della miglior rete ottenuta con quell’architettura.
1
6
Test della rete
Valutare le prestazioni del sistema tramite k-fold cross validation (con k = 3):
• Dividere l’intero insieme di dati (train+test) in tre sottoinsiemi con dimensione 1/3 ciascuno (mantenendo in ogni sottoinsieme la stessa proporzione
tra le classi).
• Ripetere 3 volte l’addestramento della miglior rete trovata al punto 5.Ad
ogni iterazione:
1. fondere due sottoinsiemi e poi separarli in train(2/3)+validate(1/3),
lasciando il terzo sottoinsieme per il test;
2. addestrare sul train usando il validate per l’early stopping e calcolare
l’accuratezza sul test.
• Valutare media e deviazione standard dell’accuratezza sui tre esperimenti.
7
Confronto con Alberi di Decisione
Confrontare le prestazioni della rete al punto 6 con quelle di un albero di decisione, valutate tramite la stessa k-fold cross validation usata per la rete, riportando media e deviazione standard dell’accuratezza ottenuta.
2