Descrivere il funzionamento di una macchina di Turing. A quale

annuncio pubblicitario
Università degli Studi di Milano - Corso di Sistemi Intelligenti – Prof. Borghese
Cognome e nome dello studente:
Matricola:
Anno di corso e turno:
A.A. 2005-2006 – Prova d’esame del 21.07.2006
Descrivere il funzionamento di una macchina di Turing. A quale problema vuole dare una risposta? Qual è il significato? [3]
Quali sono i macro-componenti di un sistema di realtà Virtuale? Descrivere nel modo piu’ dettagliato un componente utilizzato
per la Realtà Virtuale? [3]
Descrivere come funziona un motore di inferenza fuzzy. Su quali principi si basa? Compararlo con un motore di inferenza
basato sulla logica classica. Evidenziarne le differenze [4].
A cosa serve un modello neurale? Come funziona? In che relazione è con l’apprendimento? Descrivere con un appropriato
grado di profondità un modello basato su reti neurali e l’algoritmi e le equazioni che servono per definirne i parametri
(learning) e per utilizzarlo. Descriverne una possibile applicazione. [3]
Cosa si intende per Intelligenza Artificiale? Cosa si intende per intelligenza? Quali sono l’ipotesi debole e forte
dell’intelligenza artificiale? Quando i robot si potranno definire macchine intelligenti? Un programma SW può essere
considerato intelligente? MOTIVARE TUTTE LE RISPOSTE [4].
Descrivere un algoritmo o un modello trattato nel corso che avete trovato particolarmente interessante e spiegarne le possibili
applicazioni [3].
Cos’è un modello dinamico? Cos’è un modello Markoviano? [1]
Teorema della Policy Improvement: enunciato e dimostrazione [3].
Descrivere l’algoritmo per la definizione dei parametri delle SOM. Farne un esempio di utilizzo [4].
ESERCIZIO [5]
Scrivere lo pseudo-codice dell’algoritmo completo per il problema n-armed bandit. Utilizzate la policy greedy ed il calcolo
incrementale della Value function con parametro α= 1/k. Assumete di dovere scrivere una funzione bandit(act) che riceve in
ingresso una azione act e fornisce il reward. Utilizzate pure vettori e variabili e potete omettere l’indice del tempo. Descrivete
specificatamente come le azioni vengono inzializzate ed aggiornate dopo ogni reward.
Scrivere una coppia di equazioni di Bellman utilizzate in uno degli algoritmi visti per Reinforcement Learning [2].
Scarica