INDICETORI DI TENDENZA CENTRALE E DI DISPERSIONE MODA: l'unico modo che è tipicamente indicato per sintetizzare dati qualitativi. Il valore della X che presenta frequenza più elevata. Se si anno i dati suddivisi in classi la moda è rappresentata dall' Xc della classe con più alta frequenza. MEDIA ARITMETICA: si ottiene sommando tutti i valori i X e dividendo per il numero di osservazioni. Si indica di solito con X oppure con m. Per dati non raggruppati: X=X N Per dati distribuiti in frequenza: X = X*f N Per dati raggruppati n classi: X = Xc*f N MEDIANA: la mediana e quel valore che divide la distribuzione in due parti uguali: Per dati non raggruppati: 1. Ordinare in senso crescente i valori; 2. Calcolare la posizione occupata dalla mediana, cioè dove si trova la metà della distribuzione: PosMe = (N+1)/2 3. Cercare, nella distribuzione ordinata il valore di X che occupa la posizione. Per dati in distribuzione di frequenza: 1. Si calcola la PosMedia = (N+1)/2; 2. Si calcola la colonna delle fcum; 3. Si cerca in quest'ultima colonna il valore fcum che contiene PosMe; 4. Si vede a quale valore di x corrisponde la fcum individuata. Per dati raggruppati in classi: 1. Si calcola PosMe che per n abbastanza grande : PosMe=N/2; 2. Si cerca nella colonna delle fcum quella che contiene PosMe; 3. Si individua la classe corrispondente; 4. Si calcola il valore preciso: con la formula generica (1a)applicata alla mediana Mediana = XllLimRealinf + (PosMe - fllcum della classe precedente) * (ampll ampiezza classe) Fi QUANTILI Si tratta di indici di posizione all'interno di una distribuzione simili alla mediana i più usati sono: QUARTILI: sono i tre valori che dividono la distribuzione in quattro parti, ciascuna con il 25% de soggetti (1/4 di N); 1. PosQ1 = [(N+1)/4]*1; PosQ1 = [(N+1)/4]*2; PosQ1 = [(N+1)/4]*3; 2. Si prende il valore di X alla posizione risultante per ogni PosQi. N.B. In caso di distribuzione in frequenza si usa la formula 1a . DECILI : Sono i 9 valori che dividono la distribuzione in dieci parti, ciascuna con il 10% dei soggetti; 1. PosD1=[(N/10)*1]; PosD2=[(N/10)*2]…………. PosD9=[(N/10)*9]; 2. Si prende il valore di X alla posizione risultante per ogni PosDi N.B. In caso di distribuzione in frequenza si usa la formula 1a . PERCENTILI: sono i 99 valori (P1,P2,……..P99) che dividono la distribuzione in 100 parti, ciascuna con lo 1% dei soggetti. 1. PosP1=[(N/100)*1]; PosP2=[(N/100)*2]…………. PosP99=[(N/100)*99]; 2. Si prende il valore di X alla posizione risultante per ogni PosPi N.B. In caso di distribuzione in frequenza si usa la formula 1a . MISURE DI DISPERSIONE Si tratta di misurare quanto i dati si disperdono intorno alla media. Misure di variabilità o dispersione: 1. Scostamento dalla media o scarto (X- media ), se si sommano e si dividono per n si ottiene la media degli scostamenti ma visto che per definizione di X, verrebbe sempre 0 si eleva, quindi, al quadrato ciascuno scostamento ottenendo così la Devianza che è la somma degli scarti al quadrato. Dividendo la devianza per n si avrà la media degli scarti al quadrato cioè la Varianza. 2. La varianza per come è strutturata non può mai essere negativa. 3. Ora estraendo la radice quadrata della varianza si otterra lo scarto quadrtico medio, s = X- media2 N Formula abbreviata Si dimostra che le due formule sono equivalenti s = X 2 f - media 2 N N.B Se si ha una distribuzione in frequenza s = X- media2 fi N Se si ha una distribuzione in classi s= Xc- media2 fi N ASIMMETRIA E CURTOSI Asimmetria: Quanto una distribuzione si discosta da una forma simmetrica. La simmetria di distribuzione si misura con un indice che tiene conto dei valori di media , mediana e s.q.m.. As = 3 (media - Mediana) S Asimmetria (-) media < mediana < moda e le frequenze più elevate si trovano per i valori di X più alti. Asimmetria (-) moda < mediana < media e le frequenze più elevate si trovano per i valori di X più alti. Curtosi Indica la misura in cui la distribuzione si allontana dalla forma a "campana "(distribuzione normale che ha curtosi = 0); Se s è piccolo, la distribuzione è più appuntita, perché i punteggi X sono più raggruppati intorno alla media "code corte" si dice Leptocurtica e il valore è negativo. Se s è grande, la distribuzione è più "schiacciata" perchè i punteggi sono più distanti dalla media "code lunghe" si dice Platicurtica e il valore è positivo. Curtosi = [(Xi -media)/s]4 N MISURE DI DISPERSIONE La standardizzazione delle misure serve a ad avere un'idea chiara della posizione che assume il soggetto all'interno del gruppo di cui fa parte. Cioè riferire la misura ad una scala standard di cui sono noti i parametri. La più usata i psicologia è la scala standard e si indica con z, che ha media = 0 e scarto =1 La formula Z= (Xi - media) / s Z esprime il punteggio in termini di distanza dalla media rapportandola però all scarto che assume così il ruolo di unità di misura. Z esprime la posizione del soggetto al di sopra o al di sotto della media, in termini di s.q.m.. Scala T La scala T può assumere valori positivi più o meno da 10 a 90 e ha media =50 e s=10; La formula T= 50 + 10 ( z ) Scala sten (standard ten) Attraverso una trasformazione lineare di z consente di ottenere 10 categorie standardizzate di punteggi e ha medi = 5.5 e s=2; La formula sten = 5.5 + 2 * z Scala stanine (standard nine) Attraverso una trasformazione lineare di z consente di ottenere 9 categorie standardizzate di punteggi e ha media=5 e s=2; La formula stanine = 5 + 2 * z