Analisi delle Corrispondenze semplici A. Iodice Analisi delle Corrispondenze semplici Definizione a matrice dei dati Strumenti quantitativi per l’economia e la finanza I Misura di connessione Alfonso Iodice D’Enza [email protected] Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Università degli studi di Cassino e del Lazio Meridionale Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 1 / 65 Outline Analisi delle Corrispondenze semplici A. Iodice 1 Definizione a matrice dei dati 2 Misura di connessione Definizione a matrice dei dati 3 Indipendenza Misura di connessione 4 Indici di connessione 5 Trasformazioni sulla tabella a doppia entrata 6 Interpretazioni geometriche 7 Formalizzazione del problema 8 Esempio di applicazione con R Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 2 / 65 Analisi Delle Corrispondenze Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione Analisi multidimensionale di dati qualitativi L’Analisi delle Corrispondenze rappresenta uno strumento per lo studio delle relazioni tra due caratteri statistici qualitativi. La sua generalizzazione al caso di più variabili qualitative si definisce Analisi delle Corrispondenze Multiple. Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche La matrice dei dati L’Analisi delle Corrispondenze si applica a coppie di variabili qualitative:i risultati dell’osservazione dei caratteri su un collettivo di n unità vengono riportati in una tabella a doppia entrata. Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 3 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Tabella a doppia entrata Analisi delle Corrispondenze semplici Si considerino due caratteri qualitativi A e B aventi rispettivamente k e q modalità osservate su n unità statistiche. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 4 / 65 Esempio di tabella a doppia entrata Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Si consideri di aver registrato la meta del viaggio e il mezzo di trasporto di un collettivo di 592 persone. I risultati sono raccolti nella seguente tabella mezzo/destinazione macchina aereo treno nave T ot Italia 68 20 15 5 108 Spagna 119 84 54 29 286 P ortogallo 26 17 14 14 71 F rancia 7 94 10 16 127 T ot 220 215 93 64 592 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 5 / 65 Distribuzioni relative condizionate Analisi delle Corrispondenze semplici Frequenze condizionate della variabile destinazione rispetto alle modalità della variabile mezzo A. Iodice macchina aereo treno nave Definizione a matrice dei dati Misura di connessione Indipendenza Italia 0.309 0.093 0.161 0.078 mezzo/destinazione P ortogallo 0.118 0.079 0.151 0.219 F rancia 0.032 0.437 0.108 0.250 T ot 1 1 1 1 Frequenze condizionate della variabile mezzo rispetto alle modalità della variabile destinazione Indici di connessione mezzo/destinazione Trasformazioni sulla tabella a doppia entrata macchina aereo treno nave T ot Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R Spagna 0.541 0.391 0.581 0.453 A. Iodice Italia 0.630 0.185 0.139 0.046 1 Spagna 0.416 0.294 0.189 0.101 1 Analisi delle Corrispondenze semplici P ortogallo 0.366 0.239 0.197 0.197 1 F rancia 0.055 0.740 0.079 0.126 1 Statistica 6 / 65 Indipendenza Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Indipendenza e distribuzioni condizionate Le componenti di una variabile doppia (X, Y ) sono indipendenti se le distribuzioni di frequenze relative condizionate Y |X e X|Y sono costanti. Formalmente dovrà risultare per Y |X Misura di connessione ni1 ni2 ni3 nih ni. = = = ... = ∀i = 1 : k = n.1 n.2 n.3 n.h n.. Indipendenza Indici di connessione e per X|Y nkj n1j n2j n3j n.j = = = ... = = ∀j = 1 : h n1. n2. n3. nk. n.. Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 7 / 65 Indipendenza Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Si supponga che nel precedente esempio sia stata osservata la seguente distribuzione doppia. mezzo/destinazione Misura di connessione macchina aereo treno nave T ot Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Italia 40 39 17 12 108 Spagna 106 104 45 31 286 P ortogallo 26 26 11 8 71 F rancia 47 46 20 14 127 T ot 220 215 93 64 592 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 8 / 65 Indipendenza Analisi delle Corrispondenze semplici In questo caso le frequenze condizionate della variabile destinazione rispetto alle modalità della variabile mezzo mezzo/destinazione A. Iodice macchina aereo treno nave T ot Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Spagna 0.483 0.483 0.483 0.483 0.483 P ortogallo 0.120 0.120 0.120 0.120 0.120 F rancia 0.215 0.215 0.215 0.215 0.215 T ot 1 1 1 1 1 Mentre le frequenze condizionate della variabile mezzo rispetto alle modalità della variabile destinazione mezzo/destinazione Trasformazioni sulla tabella a doppia entrata macchina aereo treno nave T ot Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R Italia 0.182 0.182 0.182 0.182 0.182 Italia 0.372 0.363 0.157 0.108 1 Spagna 0.372 0.363 0.157 0.108 1 P ortogallo 0.372 0.363 0.157 0.108 1 F rancia 0.372 0.363 0.157 0.108 1 T ot. 0.372 0.363 0.157 0.108 1 In questo caso le due variabili sono indipendenti A. Iodice Analisi delle Corrispondenze semplici Statistica 9 / 65 Indipendenza Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Se le componenti di una variabile doppia (X, Y ) sono indipendenti (le distribuzioni di frequenze relative condizionate Y |X e X|Y sono costanti), allora vale la seguente relazione ni. n.j n̂ij n.j → n̂ij = = ni. n.. n.. Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata con i = 1, . . . , k; j = 1, . . . , h Pertanto, data una distribuzione doppia di frequenze, il legame tra le due componenti (mutabile) varierà tra una situazione di indipendenza (assenza di legame) e un qualche grado di connessione Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 10 / 65 Indice quadratico di connessione (X 2 ) Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Gli indici per la misura della connessioni sono basati sulle differenze tra le frequenze osservate sul collettivo nij e le frequenze teoriche n̂ij , che si osserverebbero sul collettivo se le mutabili considerate fossero indipendenti. Indice quadratico di connessione (X 2 ) è dato dalla seguente relazione Misura di connessione X2 = Indipendenza k X h X (nij − n̂ij )2 n̂ij i=1 j=1 Indici di connessione Trasformazioni sulla tabella a doppia entrata in caso di indipendenza, essendo nij = n̂ij , risulta X 2 = 0 il massimo valore dell’indice è dato dalla seguente espressione: n × min(k − 1, h − 1), con h numero di righe e k numero di colonne. Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 11 / 65 Indice quadratico di connessione (X 2 ) Analisi delle Corrispondenze semplici Per calcolare l’indice quadratico di connessione che caratterizza le variabili mezzo e destinazione, con distribuzione congiunta di frequenze A. Iodice Definizione a matrice dei dati nij : Misura di connessione Indipendenza Italia 68 20 15 5 Spagna 119 84 54 29 P ortogallo 26 17 14 14 F rancia 7 94 10 16 T ot. 220 215 93 64 T ot 108 286 71 127 592 si deve calcolare la distribuzione di frequenze che si osserverebbero in caso di indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata mezzo/destinazione macchina aereo treno nave n̂ij : Interpretazioni geometriche mezzo/destinazione macchina aereo treno nave Italia 40.135 39.223 16.966 11.676 Spagna 106.284 103.868 44.929 30.919 P ortogallo 26.385 25.785 11.154 7.676 F rancia 47.196 46.123 19.951 13.730 T ot. 220 215 93 64 T ot 108 286 71 127 592 Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 12 / 65 Indice quadratico di connessione (X 2 ) Analisi delle Corrispondenze semplici A. Iodice 2 nij −n̂ij n̂ij Definizione a matrice dei dati Misura di connessione : mezzo/destinazione macchina aereo treno nave Italia 19.346 9.421 0.228 3.817 Spagna 1.521 3.800 1.831 0.119 P ortogallo 0.006 2.993 0.726 5.211 F rancia 34.234 49.697 4.963 0.375 L’indice X 2 è dato dunque dalla somma degli elementi in tabella Indipendenza Indici di connessione X 2 = k X h X (nij − n̂ij )2 i=1 j=1 Trasformazioni sulla tabella a doppia entrata n̂ij = 19.346 + 1.521 + 0.006 + 34.234 + 9.421 + 3.800 + 2.993+ + 49.697 + 0.228 + 1.831 + 0.726 + 4.963 + 3.817 + 0.119 + 5.211 + 0.375 = 138.29 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 13 / 65 Indice ν di Cramer Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati avendo definito n × min(k − 1, h − 1) come valore massimo che X 2 può assumere, è possibile ottenere una versione normalizzata dell’indice di connessione. Viene definito indice ν di Cramer. s ν= Misura di connessione X2 = n × min(k − 1, h − 1) s Φ2 min(k − 1, h − 1) Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata dove k e h rappresentano il numero di modalità delle componenti della mutabile 2 doppia, mentre Φ2 = Xn , e si può ottenere effettuando il calcolo di X 2 sulle frequenze relative invece che sulle frequenze assolute. A differenza di X 2 , l’indice Φ2 non dipende dalla numerosità n. L’indice è normalizzato, quindi 0 ≤ ν ≤ 1. Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 14 / 65 Indice ν di Cramer Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Con riferimento ai dati dell’esercizio, si ha che X 2 = 138.29, n = 592, h = 4 e k = 4 s Misura di connessione ν = X2 n × min(k − 1, h − 1) s = 138.29 592 × min(3, 3) = 0.28 Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 15 / 65 Analisi delle Corrispondenze per visualizzare tabelle di frequenza Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Un istogramma presenta un insieme di dati in una forma diversa. Allo stesso modo l’Analisi delle Corrispondenze trasforma una matrice in una rappresentazione grafica (. . .). (Greenacre, 1985) Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 16 / 65 Un semplice esempio Analisi delle Corrispondenze semplici A. Iodice Si considerino due variabili qualitative motivo del viaggio Definizione a matrice dei dati meta del viaggio Misura di connessione Indipendenza Indici di connessione Norway Canada Greece Germany vacanza 6 1 4 2 vacanza/lavoro 1 3 25 2 lavoro 11 11 0 20 Sum 18 15 29 24 Sum 13 31 42 86 Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 17 / 65 Un semplice esempio Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Distribuzioni condizionate della variabile motivi del viaggio rispetto alle modalità della variabile “meta del viaggio”: rappresentano il tipo di viaggio in ciascun paese indipendentemente dal totale dei viaggi fatti in quel paese. Misura di connessione Indipendenza Indici di connessione Norway Canada Greece Germany vacanza 0.330 0.070 0.140 0.080 vacanza/lavoro 0.060 0.200 0.860 0.080 lavoro 0.610 0.730 0.000 0.830 Sum 1 1 1 1 Sum 0.150 0.360 0.490 1 Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 18 / 65 Triangular map Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 19 / 65 Tabella di frequenze assolute: un esempio Analisi delle Corrispondenze semplici A. Iodice Si consideri la tabella di frequenze N che rappresenta le preferenze di 7 tipologie di consumatori rispetto a 4 differenti prodotti. Definizione a matrice dei dati tipo A tipo B tipo C tipo D tipo E tipo F tipo G Sum Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata item.1 69 148 170 159 122 106 40 814 item.2 37 45 65 57 26 21 7 258 item.3 7 14 12 12 6 5 1 57 item.4 5 22 29 28 18 23 14 139 Sum 118 229 276 256 172 155 62 1268 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 20 / 65 Tabella di frequenze relative Analisi delle Corrispondenze semplici A. Iodice Per passare dalla tabella di frequenze assolute alla tabella F delle frequenze relative dividendo gli elementi di N per il totale di tabella n. Definizione a matrice dei dati Misura di connessione Indipendenza F= Indici di connessione Trasformazioni sulla tabella a doppia entrata tipo A tipo B tipo C tipo D tipo E tipo F tipo G Sum item.1 0.054 0.117 0.134 0.125 0.096 0.084 0.032 0.642 item.2 0.029 0.035 0.051 0.045 0.021 0.017 0.006 0.203 item.3 0.006 0.011 0.009 0.009 0.005 0.004 0.001 0.045 item.4 0.004 0.017 0.023 0.022 0.014 0.018 0.011 0.110 Sum 0.093 0.181 0.218 0.202 0.136 0.122 0.049 1 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 21 / 65 Le tabelle dei profili Analisi delle Corrispondenze semplici A. Iodice Dalla tabella di frequenze relative è possibile passare alla tabella dei profili riga e dei profili colonna. In particolare Definizione a matrice dei dati profili riga: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) di riga, fij Misura di connessione fi. , i = 1, . . . , k, j = 1, . . . , q Indipendenza profili colonna: si ottiengono dividendo ciascun elemento di F per il rispettivo marginale (totale) di colonna, fij , i = 1, . . . , k, j = 1, . . . , q f.j Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 22 / 65 Tabella dei profili riga Analisi delle Corrispondenze semplici A. Iodice La tabella dei profili riga consente, ad esempio, di confrontare le scelte delle diverse tipologie di consumatori relativamente ai prodotti considerati, indipendentemente dal numero di prodotti acquistati da ciascuna tipologia di consumatore. Il profilo riga medio corrisponde al vettore dei marginali di colonna della tabella F. Corrisponde alla media dei profili riga ponderati per le rispettive masse Definizione a matrice dei dati Le masse dei profili riga sono date dalla colonna dei marginali di riga di F. Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata D−1 r F= Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R tipo A tipo B tipo C tipo D tipo E tipo F tipo G profilo riga medio A. Iodice item.1 0.585 0.646 0.616 0.621 0.709 0.684 0.645 0.642 item.2 0.314 0.197 0.236 0.223 0.151 0.135 0.113 0.203 Analisi delle Corrispondenze semplici item.3 0.059 0.061 0.043 0.047 0.035 0.032 0.016 0.045 item.4 0.042 0.096 0.105 0.109 0.105 0.148 0.226 0.110 Sum 1 1 1 1 1 1 1 1 Statistica 23 / 65 Tabella dei profili colonna Analisi delle Corrispondenze semplici La tabella dei profili colonna consente di confrontare le distribuzioni delle vendite di prodotti tra le diverse tipologie di consumatori , indipendentemente dal numero delle vendite di complessive di ciascun prodotto. Il profilo colonna medio corrisponde al vettore dei marginali di diga della tabella F. Corrisponde alla media dei profili colonna ponderati per le rispettive masse A. Iodice Definizione a matrice dei dati Le masse dei profili colonna sono date dalla riga dei marginali di colonna di F. Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata FD−1 c = Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R tipo A tipo B tipo C tipo D tipo E tipo F tipo G sum A. Iodice item.1 0.085 0.182 0.209 0.195 0.150 0.130 0.049 1 item.2 0.143 0.174 0.252 0.221 0.101 0.081 0.027 1 item.3 0.123 0.246 0.211 0.211 0.105 0.088 0.018 1 Analisi delle Corrispondenze semplici item.4 0.036 0.158 0.209 0.201 0.129 0.165 0.101 1 Sum 0.093 0.181 0.218 0.202 0.136 0.122 0.049 1 Statistica 24 / 65 Interpretazione geometrica dei profili Analisi delle Corrispondenze semplici A. Iodice Da un punto di vista geometrico un profilo corrisponde ad un vettore in uno spazio multidimensionale. Tuttavia, i profili sono espressi in termini relativi, ed è quindi necessario ponderare i singoli profili attraverso le masse per non perdere l’informazione di partenza. Notazione matriciale Siano Dr e Dc matrici diagonali i cui elementi sono rispettivamente i marginali di riga e di colonna della matrice F. Definizione a matrice dei dati profili riga: −1 Dr F Misura di connessione profili colonna: −1 FDc Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 25 / 65 Distanza tra punti profilo Analisi delle Corrispondenze semplici A. Iodice In ACP la distanza che caratterizza i punti nello spazio di riferimento è la metrica euclidea. Tuttavia questa distanza tende a dare eccessiva importanza alle modalità della variabile che presentano le frequenze più elevate, trascurando le relazioni tra le modalità caratterizzate da frequenze basse. distanza euclidea tra profili Si considerino i profili A e B Definizione a matrice dei dati Misura di connessione D−1 r F= Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata item.1 0.585 0.646 0.616 0.621 0.709 0.684 0.645 0.642 item.2 0.314 0.197 0.236 0.223 0.151 0.135 0.113 0.203 item.3 0.059 0.061 0.043 0.047 0.035 0.032 0.016 0.045 item.4 0.042 0.096 0.105 0.109 0.105 0.148 0.226 0.110 Sum 1 1 1 1 1 1 1 1 distanza euclidea: v u q uX f f2j 2 1j u d(A, B) = t − 1. 2. j=1 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R tipo A tipo B tipo C tipo D tipo E tipo F tipo G profilo riga medio A. Iodice Analisi delle Corrispondenze semplici Statistica 26 / 65 Distanza tra punti profilo Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione distanza euclidea tra i profili riga A e B v u q uX f f2j 2 1j u d(A, B) =t − = 1. 2. j=1 q (.585 − .646)2 + (.314 − .197)2 + (.059 − .061)2 + (.042 − .096)2 = .143 Indipendenza È necessario pertanto un sistema di pesi nel calcolo della distanza per rendere omogeneo il contributo di ciasuna modalità alla determinazione della distanza tra i profili. Si rende necessario adottare la distanza del chi-quadrato. Indici di connessione distanza del chi-quadrati tra i profili riga A e B Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche v u q uX u d(A, B) =t j=1 s Formalizzazione del problema Esempio di applicazione con R 1 f.j 1. (.585 − .646)2 .642 A. Iodice f1j − + f2j 2. 2 = (.314 − .197)2 .203 + (.059 − .061)2 Analisi delle Corrispondenze semplici .045 + (.042 − .096)2 0.110 Statistica = .316 27 / 65 Matrice da analizzare, scelta della distanza, scelta dei pesi Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Una tecnica di analisi multidimensionale, è identificata da tre elementi: matrice di dati,la metrica e pesi delle unità. Analisi delle Corrispondenze Analisi in componenti principali Misura di connessione matrice di dati: tabella individui per variabili X centrata e standardizzata Indipendenza metrica: distanza euclidea tra i punti nello spazio di rappresentazione Indici di connessione pesi delle unità:tutte le unità hanno peso 1 uguale a n Trasformazioni sulla tabella a doppia entrata matrice di dati: tabelle dei profili riga −1 D−1 r F (colonna FDc ) metrica: distanza del chi-quadrato D−1 c tra i punti profilo riga (D−1 tra i punti r profilo colonna) pesi delle unità: ciascun punto ha un peso pari alla propria massa: Dr per i punti riga, Dc per i punti colonna. Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 28 / 65 Formalizzazione del problema: soluzione in Rc Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione Il problema In CA l’obbiettivo è ricercare un sistema di assi unitari che consenteano di massimizzare le distanze tra le proiezioni dei profili riga. Gli assi u sono unitari secondo la metrica del chi-quadrato, ovvero uD−1 c u = 1. Per ciascun asse, le coordinate delle proiezioni dei profili sono date da −1 −1 ĉ = Dr FDc u La funzione obbiettivo consiste nella ricerca degli assi che massimizzino la somma dei quadrati delle proiezioni. ovvero Indipendenza funzione obbiettivo: Indici di connessione T Trasformazioni sulla tabella a doppia entrata max! ĉ u Interpretazioni geometriche T −1 −1 Dr ĉ = (Dr FDc T −1 −1 u) Dr (Dr FDc −1 T −1 −1 −1 Dc F Dr Dr Dr FDc u T =u u) = −1 T −1 −1 Dc F Dr FDc u vincolo: uT D−1 c u = 1 Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 29 / 65 Formalizzazione del problema: soluzione in Rc Analisi delle Corrispondenze semplici La soluzione A. Iodice Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione Definizione a matrice dei dati −1 ∂u L : Dc Indipendenza F T −1 T −1 F Dr FDc −1 ∂u L = 2Dc Misura di connessione Indici di connessione −1 T max!L = u Dc T −1 −1 F Dr FDc T −1 −1 F Dr FDc −1 −1 Dr FDc u −1 T u − λ(u Dc −1 u − 2λDc −1 u = λDc u − 1) u=0 u = λu La soluzione si ottiene estraendo autovalori e autovettori dalla seguente matrice Trasformazioni sulla tabella a doppia entrata T −1 −1 S = F Dr FDc Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 30 / 65 Assi principali, fattori e coordinate Analisi delle Corrispondenze semplici proiezione sugli assi A. Iodice il versore dell’asse principale è u Definizione a matrice dei dati La proiezione di un vettore sull’asse di versore u secondo la distanza del chi-quadro si ottiene moltiplicando il vettore per il fattore principale Misura di connessione −1 Dc Indipendenza u Indici di connessione le coordinate principali dei profili riga sono date dal prodotto dalla matrice dei profili e il fattore principale −1 −1 × Dc u ĉ = Dr F | {z } | {z } Trasformazioni sulla tabella a doppia entrata matrice profili riga fattore principale Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 31 / 65 Interpretazione dell’inerzia Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Interpretazione dell’Inerzia L’inerzia della nube dei profili riga è data dalla somma ponderata delle distanze al quadrato di ciascun profilo dal baricentro (profilo riga medio). I pesi della somma pi = fi. sono le masse dei profili. Inerzia = Misura di connessione h X fi. × i=1 |{z} pesi k X 1 j=1 f.j | fij fi. {z 2 − f.j } distanza del chi-quadro tra profili e centroide Indipendenza Indici di connessione = h X k X (fij − fi. f.j )2 i=1 j=1 fi. f.j 2 = φ |{z} indice di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche questa relazione mostra che la rappresentazione grafica dei profili riga rappresenta una decomposizione 2 dell’indice quadratico di connessione χ2 (ricordando che φ2 = χn ) Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 32 / 65 Scelta delle dimensioni Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 33 / 65 Formalizzazione del problema: soluzione in Rr Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Il problema Analogamente a quanto accade nello spazio Rc , l’analisi nello spazio Rr dei profili colonna si ha che T −1 T −1 T ĉ = FD−1 D−1 c r v = Dc F Dr v. Dunque si vuole massimizzare ĉ Dc ĉ che rappresenta la somma ponderata dei quadrati delle proiezioni dei profili colonna nel sottospazio di approssimazione. Misura di connessione funzione obbiettivo: Indipendenza T max! ĉ Dc ĉ = Indici di connessione T −1 T −1 −1 T −1 Dc F Dr v Dc Dc F Dr v T −1 −1 = v Dr FDc Trasformazioni sulla tabella a doppia entrata −1 Dc Dc T −1 T −1 −1 F Dr v = v Dr FDc T −1 F Dr v vincolo: vT D−1 r v = 1 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 34 / 65 Formalizzazione del problema: soluzione in Rr Analisi delle Corrispondenze semplici A. Iodice La soluzione Definizione a matrice dei dati Misura di connessione Ricorrendo al metodo dei moltiplicatori di Lagrange, si perviene alla seguente formalizzazione −1 FDc T −1 F Dr v = λv La soluzione si ottiene diagonalizzando la seguente matrice Indipendenza S Indici di connessione ∗ = −1 FDc | {z } T −1 F Dr | {z } profili colonna profili rigaT Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 35 / 65 Assi principali, fattori e coordinate Analisi delle Corrispondenze semplici A. Iodice proiezione sugli assi Definizione a matrice dei dati asse principale v Misura di connessione fattore principale −1 Dr v Indipendenza Indici di connessione coordinata principale −1 Dc Trasformazioni sulla tabella a doppia entrata T −1 F Dr v Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 36 / 65 Formalizzazione alternativa CA Analisi delle Corrispondenze semplici A. Iodice Per ottenere una soluzione della CA è possibile analizzare la tabella dei residui standardizzati. tabella delle contingenze Definizione a matrice dei dati La tabella delle frequenze relative (F) Misura di connessione A B C D E F G Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata P1 0.05 0.12 0.13 0.13 0.10 0.08 0.03 P2 0.03 0.04 0.05 0.04 0.02 0.02 0.01 P3 0.01 0.01 0.01 0.01 0.00 0.00 0.00 P4 0.00 0.02 0.02 0.02 0.01 0.02 0.01 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 37 / 65 Formalizzazione alternativa CA Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati vettori dei marginali (totali) di riga A B C D E F G Misura di connessione Indipendenza Indici di connessione r 0.09 0.18 0.22 0.20 0.14 0.12 0.05 vettore dei marginali (totali) di colonna P1 P2 P3 P4 c 0.64 0.20 0.04 0.11 Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 38 / 65 Formalizzazione alternativa CA Analisi delle Corrispondenze semplici Per ottenere una soluzione della CA è possibile analizzare la tabella dei residui standardizzati. A. Iodice centratura Definizione a matrice dei dati la centratura della matrice F si ottiene sottraendo a ciascun valore il prodotto dei marginali di riga e di colonna ad esso corrispondenti, formalmente fij − fi. f.j . Da un punto di vista algebrico questo corrisponde a Misura di connessione Indipendenza F − rcT = Indici di connessione Trasformazioni sulla tabella a doppia entrata A B C D E F G P1 -0.0053 0.0008 -0.0057 -0.0042 0.0091 0.0051 0.0002 P2 0.0102 -0.0013 0.0070 0.0039 -0.0071 -0.0083 -0.0044 P3 0.0013 0.0029 -0.0003 0.0004 -0.0014 -0.0016 -0.0014 P4 -0.0063 -0.0024 -0.0010 -0.0000 -0.0007 0.0047 0.0057 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 39 / 65 Formalizzazione alternativa CA Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Misura di connessione Per ottenere una soluzione della CA è possibile analizzare la tabella dei residui standardizzati. standardizzazione dopo aver effettuato la centratura della matrice F si procede alla standardizzazione, formalmente fij −fi. f.j q . Da un punto di vista fi. f.j −1/2 −1/2 (F − rcT )Dc = S = Dr algebrico questo corrisponde a Indipendenza Indici di connessione −1/2 S = Dr Trasformazioni sulla tabella a doppia entrata −1/2 (F − rcT )Dc = A B C D E F G P1 -0.0218 0.0023 -0.0151 -0.0117 0.0310 0.0183 0.0009 P2 0.0745 -0.0066 0.0331 0.0191 -0.0427 -0.0527 -0.0444 P3 0.0207 0.0324 -0.0032 0.0041 -0.0175 -0.0209 -0.0301 P4 -0.0620 -0.0174 -0.0064 -0.0003 -0.0055 0.0409 0.0776 Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 40 / 65 Formalizzazione alternativa CA Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Ottenuta la tabella S dei residui standardizzati, per ottenere la soluzione si effettua la decomposizione in valori singolari, (SVD) decomposizione in valori singolari Misura di connessione Indipendenza Indici di connessione SV D(S) = UDα V T dove U e l’autovettore di sinistra e rappresenta lo spazio delle righe, V e l’autovettore di destra e rappresenta lo spazio delle colonne, Dα è la matrice diagonale dei valori singolari, che sono la radice quadrata degli autovalori. Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 41 / 65 Relazione tra EVD ed SVD Analisi delle Corrispondenze semplici A. Iodice La decomposizione in valori singolari (SVD) è uno dei risultati dell’algebra lineare più utilizzati in assoluto. La SVD consente di riscrivere una generica matrice X come prodotto tra matrici UDα VT . Le matrici in questione sono in stretta relazione con autovalori e autovettori. In particolare, se X = UDα UT Definizione a matrice dei dati XT X = EV D(XT X) = EV D(VDα UT UDα VT ) = VD2α VT Misura di connessione Indipendenza XXT = EV D(XXT ) = EV D(UDα VT VDα UT ) = UD2α UT Indici di connessione Trasformazioni sulla tabella a doppia entrata i vettori singolari di destra (V) della matrice X corrispondono agli autovettori della matrice XT X Interpretazioni geometriche i vettori singolari di sinistra (U) della matrice X corrispondono agli autovettori della matrice XXT Formalizzazione del problema i valori singolari della matrice X corrispondono alla radice quadrata degli autovalori non nulli delle matrici XT X e XXT Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 42 / 65 Formalizzazione alternativa CA Analisi delle Corrispondenze semplici Ottenuta la tabella S dei residui standardizzati, per ottenere la soluzione si effettua la decomposizione in valori singolari, (SVD) valori singolari A. Iodice Definizione a matrice dei dati Dα = 1 2 3 4 1 0.1611 0.0000 0.0000 0.0000 2 0.0000 0.0617 0.0000 0.0000 3 0.0000 0.0000 0.0324 0.0000 4 0.0000 0.0000 0.0000 0.0000 Misura di connessione Indipendenza vettori singolari Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R 1 2 3 4 5 6 7 A. Iodice 1 -0.6267 -0.0937 -0.1815 -0.1059 0.2331 0.4470 0.5478 U 2 0.0888 -0.3761 0.3513 0.2401 -0.6108 -0.0937 0.5364 vettori singolari 3 0.2293 -0.7776 0.2252 -0.0882 0.5227 0.0611 -0.0853 4 -0.1885 0.1390 0.7076 -0.2089 -0.1655 0.5070 -0.3411 1 2 3 4 Analisi delle Corrispondenze semplici 1 0.2067 -0.6946 -0.2839 0.6279 V 2 -0.5036 0.5269 -0.2269 0.6460 3 0.2485 0.1910 -0.9072 -0.2807 Statistica 4 -0.8012 -0.4511 -0.2120 -0.3311 43 / 65 Formalizzazione alternativa CA Analisi delle Corrispondenze semplici A. Iodice Definizione a matrice dei dati Calcolo delle coordinate dei profili riga e colonna coordinate delle righe Misura di connessione coordinate delle colonne −1/2 standard coords = Dr Indipendenza −1/2 principal coords = Dr U UDα −1/2 standard coords = Dc −1/2 principal coords = Dc V VDα Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 44 / 65 Rappresentazione grafica Analisi delle Corrispondenze semplici Figura : Principal Coords righe, Standard Coords colonne A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 45 / 65 Rappresentazione grafica Analisi delle Corrispondenze semplici Figura : Standard Coords righe, Principal Coords colonne A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 46 / 65 Rappresentazione grafica Analisi delle Corrispondenze semplici Figura : Principal Coords righe, Principal Coords colonne A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 47 / 65 Contributi agli assi e qualità della rappresentazione Analisi delle Corrispondenze semplici A. Iodice Coseni quadri Contributi assoluti profili riga Definizione a matrice dei dati profili riga Caα = fi. ψ̂α Misura di connessione Indipendenza 2 ψ̂iα d2 (i, g) profili colonna profili colonna Indici di connessione Criα = Caα = f.j φ̂α Trasformazioni sulla tabella a doppia entrata Crαj = 2 ψ̂αj d2 (j, h) Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 48 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Uno strumento molto potente per l’Analisi delle Corrispondenze Semplici e Multiple è il pacchetto ca sviluppato dal Dott. Oleg Nenadic e dal Prof.Michael Greenacre. Per installare il pacchetto in ambiente R digitare la seguente sintassi: install.packages(‘ca’,dep=T) A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 49 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 50 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 51 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 52 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 53 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 54 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 55 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 56 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 57 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 58 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 59 / 65 Esempio elaborazione con R: il pacchetto ‘ca’ Analisi delle Corrispondenze semplici Dall’analisi della tabella a doppia entrata si ottiene il seguente output A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 60 / 65 Esempio elaborazione con R: rappresentazioni grafiche 3D Analisi delle Corrispondenze semplici Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di visualizzazione interattivamente via mouse. La dimensione dei punti è proporzionale alla loro massa; la trasparenza è inversamente proporzionale al loro contributo assoluto agli assi (minor massa =⇒ maggior trasparenza) A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 61 / 65 Esempio elaborazione con R: rappresentazioni grafiche 3D Analisi delle Corrispondenze semplici Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di visualizzazione interattivamente via mouse. A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 62 / 65 Esempio elaborazione con R: rappresentazioni grafiche 3D Analisi delle Corrispondenze semplici Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di visualizzazione interattivamente via mouse. Rappresentazione primo e secondo asse A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 63 / 65 Esempio elaborazione con R: rappresentazioni grafiche 3D Analisi delle Corrispondenze semplici Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di visualizzazione interattivamente via mouse. Rappresentazione primo e terzo asse A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 64 / 65 Esempio elaborazione con R: rappresentazioni grafiche 3D Analisi delle Corrispondenze semplici Sfruttando il pacchetto rgl si ottengono le rappresentazioni in 3 dimensioni, è possibile cambiare l’angolo di visualizzazione interattivamente via mouse. Rappresentazione secondo e terzo asse A. Iodice Definizione a matrice dei dati Misura di connessione Indipendenza Indici di connessione Trasformazioni sulla tabella a doppia entrata Interpretazioni geometriche Formalizzazione del problema Esempio di applicazione con R A. Iodice Analisi delle Corrispondenze semplici Statistica 65 / 65