Università degli Studi di Milano - Corso di Sistemi Intelligenti – Prof. Borghese Cognome e nome dello studente: Matricola: Anno di corso e turno: A.A. 2005-2006 – Prova d’esame del 21.07.2006 Descrivere il funzionamento di una macchina di Turing. A quale problema vuole dare una risposta? Qual è il significato? [3] Quali sono i macro-componenti di un sistema di realtà Virtuale? Descrivere nel modo piu’ dettagliato un componente utilizzato per la Realtà Virtuale? [3] Descrivere come funziona un motore di inferenza fuzzy. Su quali principi si basa? Compararlo con un motore di inferenza basato sulla logica classica. Evidenziarne le differenze [4]. A cosa serve un modello neurale? Come funziona? In che relazione è con l’apprendimento? Descrivere con un appropriato grado di profondità un modello basato su reti neurali e l’algoritmi e le equazioni che servono per definirne i parametri (learning) e per utilizzarlo. Descriverne una possibile applicazione. [3] Cosa si intende per Intelligenza Artificiale? Cosa si intende per intelligenza? Quali sono l’ipotesi debole e forte dell’intelligenza artificiale? Quando i robot si potranno definire macchine intelligenti? Un programma SW può essere considerato intelligente? MOTIVARE TUTTE LE RISPOSTE [4]. Descrivere un algoritmo o un modello trattato nel corso che avete trovato particolarmente interessante e spiegarne le possibili applicazioni [3]. Cos’è un modello dinamico? Cos’è un modello Markoviano? [1] Teorema della Policy Improvement: enunciato e dimostrazione [3]. Descrivere l’algoritmo per la definizione dei parametri delle SOM. Farne un esempio di utilizzo [4]. ESERCIZIO [5] Scrivere lo pseudo-codice dell’algoritmo completo per il problema n-armed bandit. Utilizzate la policy greedy ed il calcolo incrementale della Value function con parametro α= 1/k. Assumete di dovere scrivere una funzione bandit(act) che riceve in ingresso una azione act e fornisce il reward. Utilizzate pure vettori e variabili e potete omettere l’indice del tempo. Descrivete specificatamente come le azioni vengono inzializzate ed aggiornate dopo ogni reward. Scrivere una coppia di equazioni di Bellman utilizzate in uno degli algoritmi visti per Reinforcement Learning [2].