CORSO DI STATISTICA AZIENDALE – Domande tipo A.A. 2014-2015 - Seconda parte 1) Gli algoritmi di cluster analysis gerarchica: descrizione generale. 2) Il metodo del legame singolo e quello del legame completo. 3) Il metodo del legame medio e il metodo di Ward. 4) Descrivete i principali criteri per la scelta del numero ottimale di gruppi nei metodi di cluster gerarchica. 5) Gli algoritmi di cluster analysis non gerarchica. 6) Il metodo delle K-medie di McQueen. 7) Indici di dissomiglianza e misure di distanza. 8) La notorietà di marca: definizione, misura e analisi che possono essere effettuate. 9) Fasi di applicazione della tecnica AID. 10) 1) Data la seguente matrice di somiglianza, costruire il dendrogramma utilizzando la procedura del legame singolo. Unità statistiche A B C D E A 1 B 0,5 1 C 0,2 0,2 1 D 0,9 0,8 0,6 1 E 0,4 0,6 0,7 0,4 11) Costruisco la matrice delle DISSOMIGLIANZE ( d = 1 - s ) Unità statistiche A A 0 B 0,5 0 C 0,8 0,8 0 D 0,1 0,2 0,4 0 E 0,6 0,4 0,3 0,6 Unità statistiche A,D B C E A,D 0,0 B 0,2 0,0 C 0,4 0,8 0,0 E 0,6 0,4 0,3 B C D 0,0 E 0 1 Unità statistiche A,B,D A,B,D 0,0 C 0,4 0,0 E 0,4 0,3 Unità statistiche A,B,D C,E A,B,D 0,0 C,E 0,3 A C E 0,0 0,0 D B C E 12) Dati i seguenti schemi di segmentazione a priori, valutane la significatività statistica e determina qual è il migliore. Possesso di macchina NordCentro Su d Total e fotografica digitale Possesso di Età del macchina capofamiglia Totale fotografica digitale più 35 men o 35 anni SI 95 45 140 SI 80 60 140 NO 15 45 60 NO 30 30 60 Totale 110 90 200 Totale 110 90 13) Frequenze teoriche Possesso di macchina fotografica digitale Nord-Centro Sud Totale SI 77 63 140 NO 33 27 60 Totale 110 90 200 Chi-quadrato = 31,169 Frequenze teoriche Possesso di macchina fotografica digitale Chi-quadrato = Età del Età del capofamiglia capofamiglia > 35 anni <= 35 anni Totale SI 77 63 140 NO 33 27 60 Totale 110 90 200 0,866 200 numero dei gruppi 14) Il grafico seguente è stato ottenuto dai risultati di una Cluster Analysis effettuata su 15 marche di 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 0 100 200 300 400 500 600 700 800 distanza tra i gruppi yogurt utilizzando l'algoritmo di Ward. Interpretare i risultati, in particolare commentare la scelta del numero ottimale di gruppi. (10 pt.) 15) Il metodo CHAID: lineamenti generali 16) Il modello di Koyck 17) L’advertising wear-out 18) I modelli di attrazione 19) Notorietà di marca, riconoscimento e ricordo della pubblicità 20) I modelli di decadimento memoriale 21) La forma della funzione di risposta delle vendite 22) Si riporta l'output di una Cluster Analysis effettuata su 15 osservazioni. Commentare i risultati ottenuti, in particolar modo discutere la scelta del numero ottimale di gruppi ottenuto da tale analisi. Si tratta di un algoritmo gerarchico? (10 pt.) 23) 24) 25) 26) 27) 28) 29) 30) 31) 32) 33) 34) 35) 36) 37) 38) 39) 40) 41) Dendrogram using Ward Method Rescaled Distance Cluster Combine C A S E Label Num 2 9 10 7 13 5 14 12 1 8 6 4 11 3 0 5 10 15 20 25 +---------+---------+---------+---------+---------+ -+ -+-----------+ -+ +-------------------+ -+-----------+ I -+ +---------------+ -+ I I -+-------------------------------+ I -+ I -+ I -+-----------+ I -+ +-----------------------------------+ -+-+ I -+ +---------+ ---+