Quiz di verifica Strumenti quantitativi per la gestione

3/19/2015
Quiz di verifica
Quiz di verifica
Strumenti quantitativi per la gestione
Capitolo 2
1. Nell’espressione Vendite ∼ f (TV, radio, giornali), “Vendite” è:
a. la variabile risposta ­ corretto ­
b. i training data
c. la variabile indipendente
d. un parametro della popolazione
2. In un compito per casa, si adatta un modello lineare ad un certo set di dati. Si sta pensando di
cambiare il modello da lineare ad uno quadratico. Quale dei seguenti è più probabilmente vero:
a. Utilizzando il modello quadratico diminuisce l’errore irriducibile.
b. Utilizzando il modello quadratico diminuisce il Bias del modello ­ corretto
c. Utilizzando il modello quadratico diminuisce la varianza del modello
d. Utilizzando il modello quadratico diminuisce l’errore riducibile
3. Si guardi il grafico riportato a pagina 42 del testo. Quale dei seguenti è più probabilmente vero
mentre si incrementa 1/K al di sopra di 1 ?
a. I test errors aumenteranno
b. I test errors diminuiranno
c. Non si hanno abbastanza informazioni per decidere
d. Non ha senso avere 1/K > 1 ­ corretto ­
Poichè K è il numero di neighbors, non può avere valore inferiore ad 1 , necessario per
avere 1/K > 1 .
4. Per ciascuna delle seguenti domande, indicare se ci aspettiamo che le prestazioni di un metodo di
statistical learning flessibile sia migliore o peggiore di un modello inflessibile.
a. La dimensione del campione n è estremamente grande, e il numero di predittori p è
piccolo. ­ Flessibile è meglio: un modello flessibile ci consentirà di trarre il massimo
vantaggio dalla dimensione del campione.
b. Il numero di predittori p è estremamente grande, e la dimensione del campione n è piccolo.
­ Flessibile è peggio: il modello flessibile causerà over­fitting a causa della piccola
dimensione del campione.
c. La relazione tra i predittori e la risposta è fortemente non lineare. ­ Flessibile è meglio
d. La varianza dei termini di errore, cioè σ2 = V ar(ε) , è estremamente elevata. ­ Flessibile è
peggio: un modello flessibile causerà probabilmente un overfit dei dati, poichè tenderà a
seguire a seguire il “rumore”.
file:///C:/Users/emanuele.taufer/Dropbox/3%20SQG/Quiz/Quiz­2_­_Sol.html
1/2
3/19/2015
Quiz di verifica
5. Quale delle seguenti affermazioni sono vere? Seleziona tutte le risposte appropriate:
a. Un intervallo di confidenza al 95% è un intervallo casuale che contiene il vero parametro nel
95% dei casi. ­ Vero ­
b. Se da un campione osservato si ottiene un intervallo di confidenza 0.4­0.5, allora c’è una
probabilità del 95% che il vero parametro sia tra 0.4 e 0.5 ­ Falso
c. Il vero parametro (a me sconosciuto) è pari a 0.5. Se raccolgo un campione di dati e
costruisco un intervallo di confidenza all 95%, l’intervallo conterrà 0.5 con probabilità 0.95. ­
Vero ­
Gli intervalli di confidenza sono un concetto “frequentista”: l’intervallo, e non il vero
parametro, è considerato casuale. L’intervallo casuale conterrà il valore vero nel 95% dei
casi. Ma un intervallo fissato, come ad esempio (0.4, 0.5) contiene o non contiene il vero
parametro (un valore fisso). La probabilità di inclusione è 0 oppure 1 ma questo è
sconosciuto in pratica.
6. Data un’ipotesi H0 sottoposta a verifica, il livello di significatività α del test indica:
a. La probabilità che l’ipotesi nulla sia vera
b. La probabilità che l’ipotesi nulla sia falsa
c. La probabilità di rifiutare erroneamente l’ipotesi nulla ­ corretto ­
d. La probabilità di accettare erroneamente l’ipotesi nulla
7. Si considerino il test MSE ed il training MSE. Indicare se le seguenti affermazioni sono vere o false
a. minimizzare il training MSE può portare ad un overfitting dei dati se f^ è molto flessibile ­
vero ­
b. se il training MSE è molto basso anche il test MSE lo sarà ­ falso, generlamente non è così
c. il test MSE può essere utilizzato per scegliere tra diverse stime di f . ­ vero
d. il test MSE è il risultato di due forze opposte: il bias, che tende ad aumentare con la
flessibilità del modello, e la varianza che tende a diminuire all’aumentare della flessibilità del
modello. ­ Falso: è vero che esiste un trade­off, tuttavia all’aumentare della flessibilità del
modello il bias tende a diminuire e la varianza ad aumentare
file:///C:/Users/emanuele.taufer/Dropbox/3%20SQG/Quiz/Quiz­2_­_Sol.html
2/2