CdL SEAFC – a.a. 2016-2017 – II semestre Pedagogia sperimentale. Modelli e procedure per l’educazione degli adulti [email protected] T4. Modelli e procedure di valutazione Proseguono gli appuntamenti con le attività di statistica del corso ”Pedagogia sperimentale. Modelli e procedure per l’educazione degli adulti” Che cosa faremo ▪ Impostazione di un archivio di dati ▪ Pulizia dei dati ▪ Calcolo delle frequenze ▪ Difficoltà e discriminatività ▪ Misure di tendenza centrale e di dispersione ▪ Centili, punti z e punti T ▪ Distribuzione pentenaria e punteggi soglia ▪ Rappresentazione grafica ▪ Alcuni test (chi quadrato, phi, T-Test) ▪ Correlazione (Pearson, Spearman) Misure di tendenza centrale • MEDIA • MODA • MEDIANA e dispersione • GAMMA • DEVIAZIONE STANDARD “ a Statistica Sai ched’è la statistica? È ’na cosa che serve pe’ fa’ un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa. Ma pe’ me la statistica curiosa è dove c’entra la percentuale, pe’ via che, lì, la media è sempre eguale puro co’ la persona bisognosa. Me spiego: da li conti che se fanno secondo le statistiche d’adesso risurta che te tocca un pollo all’anno: e, se nun entra ne le spese tue, t’entra ne la statistica lo stesso perché c’è un antro che ne magna due. La Statistica, Trilussa Perché usare le misure di dispersione ▪Se forniamo solo i dati relativi alle misure di tendenza centrale diamo adito a fraintendimenti ▪Ossia non mettiamo in grado chi legge di stabilire quanto i punteggi analizzati siano tra loro omogenei o dispersi ▪Per valutare le differenze tra i punteggi di due distribuzioni dovremmo analizzare uno ad uno i singoli punteggi, perdendo un tempo enorme ▪Per descrivere una distribuzione di dati è necessario utilizzare quindi anche le misure di variabilità o dispersione GAMMA (o RANGE o INTERVALLO DI VARIAZIONE) ▪ Ogni prova ha un punteggio grezzo minimo e un massimo teorico ed effettivo ▪ La gamma di una distribuzione di punteggi si calcola sottraendo dal punteggio massimo effettivo quello minimo effettivo e sommando uno al risultato gamma = maxeff.-mineff.+1 ▪ Dipende solamente dai due punteggi estremi di una distribuzione ▪ La gamma rappresenta la più semplice misura di dispersione Che cosa significa la gamma di una distribuzione? ▪ indica la distanza in termini di punteggio tra chi ha ottenuto il punteggio più alto rispetto a chi ha ottenuto quello più basso ▪ definisce la parte della scala effettivamente utilizzata rispetto a quella disponibile ▪ ad es. chi esprime giudizi più severi, pur avendo una scala che va da 0 a 10, usa una gamma di voti ristretta e limitata alla parte inferiore della scala, ad es. 4-7, ossia costringe tutti i voti in una gamma di 4 (7-4+1) valori possibili (4,5,6 e 7) Lo scarto medio (assoluto o semplice) ▪ lo scarto medio è la differenza tra il valore medio e i valori delle misure ▪ in altre parole per scarto medio si intende la media delle differenze di un certo numero di punteggi con la media ▪ per calcolarlo si sommano i valori assoluti delle differenze e si dividono per il numero dei punteggi Lo scarto medio (assoluto o semplice) ▪ nato in prima battuta per superare il problema che la somma degli scarti di tutti i punteggi dalla media è, per costruzione, sempre zero ▪ poco usato nella pratica statistica ▪ ad es. ci consente di stabilire che una coppia di correttori di una prova ha espresso valutazioni diverse VARIANZA ▪ Si introduce quindi la varianza, altra misura di dispersione ▪ Si eleva al quadrato i singoli scarti (o scostamenti) dalla media, sommandoli tra di loro e dividendo il risultato per il numero totale dei punteggi N ▪ Così facendo però l’ordine di grandezza della varianza è al quadrato rispetto a quello dei punteggi DEVIAZIONE STANDARD ▪ si arriva quindi a alla radice quadrata della varianza. ▪ è lo “scarto quadratico medio” e si indica con σ (sigma) oppure con s ▪ è uguale alla radice quadrata della varianza ossia della media del quadrato degli scarti di tutti punteggi dalla media DEVIAZIONE STANDARD punteggio scarto scarto al quadrato 5 2 4 4 1 1 3 0 0 2 -1 1 1 -2 4 Somma = 15 Somma = 0 Somma = 10 Media = 3 s=√(10/5)=√2=1.41 DEVIAZIONE STANDARD ▪ Concettualmente (e non statisticamente), la deviazione standard indica, in media, quanto sono “lontani” i punteggi di una distribuzione dalla loro media ▪ Non si tratta semplicemente della “lontananza” dalla media, perché la somma delle deviazioni è sempre 0 (e per questo si eleva a potenza e poi si fa la radice) ▪ Aiuta ad interpretare le misure di tendenza centrale, indicando quanto esse siano sintesi fedele della distribuzione cui fanno riferimento ▪ 10/12% della media – riferimento per interpretarla DEVIAZIONE STANDARD: come si legge ▪ il valore della deviazione standard aumenta (rispetto al valore della media) quanto più i punteggi della serie sono distanti dalla media ▪ il valore della deviazione standard diminuisce (rispetto alla media) quanto più i punteggi della serie sono vicini alla media ▪ se non supera il 10/12% della media (riferimento didattico) i risultati ottenuti dalle prove strutturate sono abbastanza uniformi DEVIAZIONE STANDARD: perché è utile 1. 2. 3. Riflette la dispersione dei punteggi così che la variabilità di diverse distribuzioni può essere messa a confronto in termini di scarto quadratico medio Consente una interpretazione precisa dei punteggi entro la distribuzione Come la media, fa parte di un insieme di teorie matematiche che ci consentono di usarlo in metodologie statistiche più complesse (statistica inferenziale) La distribuzione normale e la deviazione standard • La deviazione standard è una misura di variabilità che descrive la variazione di tutti i punti dati rispetto al valore medio • La parte di una distribuzione che si trova tra più e meno una deviazione standard della media include circa il 68% dei casi e la parte che si trova tra più e meno 1,96 deviazioni standard include circa il 95% dei casi • Ciò significa che se la variabile è distribuita normalmente, è prevedibile che il 95% dei casi si trovi entro 2 deviazioni standard dalla media La distribuzione normale e la deviazione standard La distribuzione normale e la deviazione standard La media ingannatrice media = 5,3 media = 6 Serie I: 4, 6, 6, 4, 5, 6, 6 Serie II: 6, 5, 10, 4, 4, 9, 4 ¡ Proviamo ad ordinare le distribuzioni… Serie I: 4, 4, 5, 6, 6, 6, 6 Serie II: 4, 4, 4, 5, 6, 9, 10 sufficienza § Gamma molto diversa (come più semplice misura di dispersione) § Moda (punteggio più frequente) molto diversa § Mediana (punteggio che divide in due la distribuzione ordinata) diversa La media ingannatrice ¡ Ma la mediana non ci salva completamente da errori di interpretazione.. Serie III 4 5 8 9 11 Serie IV 5 6 7 10 13 differenza -1 -1 1 -1 -2 Media = 7,4 Media = 8,2 Mediana = -1 § Come stabilire quale delle due serie è andata meglio? La media inganna ma la mediana non è da meno… ▪L’andamento mostra come la serie IV sia sotto solo in punto alla serie III Provate voi… Gruppo A Gruppo B 3 4 4 5 6 5 7 8 7 8 8 9 8 9 9 10 10 Media 10 Media Mediana Mediana Provate voi… Gruppo A Gruppo B 3 4 4 5 6 5 7 8 7 8 8 9 8 9 9 10 10 Media 10 Media 6,59 Mediana 7 7,56 Mediana 8 Perché ci interessa la media ¡ perché si associa spesso al concetto di sufficienza (cut-off score o threshold) § sia dal punto di vista del senso comune (più o meno la metà..) § sia per tradizione (statunitense) ¡ due modi di trovare la sufficienza § criteriale: chi raggiunge determinate competenze (quindi risponde bene a determinati quesiti) § normativo: chi raggiunge il punteggio medio raggiunto dal gruppo in cui è inserito/a Regole per una corretta interpretazione Considerare sempre: ▫ allo stesso tempo tutte le misure di tendenza centrale (media, mediana e moda) ▫ il numero di casi analizzato ▫ le misure di dispersione (gamma e deviazione standard) ▫ se la rilevazione è campionaria, considerare sempre la media con l’errore standard È una stima di quanto la media del campione si avvicini alla media della popolazione. Più il campione è grande, minore sarà l’errore standard, e più la media del campione si avvicinerà alla media della popolazione. Una distribuzione di punteggi con media 6, mediana 7, moda 8 e dev.st. 0.3 (max teorico = 10) indica che A. la prova è andata male e i punteggi sono concentrati attorno alla media. B. la prova è andata bene e i punteggi sono concentrati attorno alla media. C. la prova è andata bene e i punteggi non sono concentrati attorno alla media. D. la prova è andata male e i punteggi non sono concentrati attorno alla media Una distribuzione di punteggi con media 6, mediana 7, moda 8 e dev.st. 0.3 (max teorico = 10) indica che A. la prova è andata male e i punteggi sono concentrati attorno alla media. B. la prova è andata bene e i punteggi sono concentrati attorno alla media. C. la prova è andata bene e i punteggi non sono concentrati attorno alla media. D. la prova è andata male e i punteggi non sono concentrati attorno alla media Verifica Gruppo A ▪ Quale dei tre gruppi presenta una maggiore dispersione attorno alla media? media 7 7 7 8 8 8 8 9 9 9 8 Gruppo B 0 1 3 5 7 8 10 12 16 18 8 Verifica Gruppo A ▪ Quale dei tre gruppi presenta una maggiore dispersione attorno alla media? media dev.st % 7 7 7 8 8 8 8 9 9 9 8 0,74 9% Gruppo B 0 1 3 5 7 8 10 12 16 18 8 5,49 69% Il significato dei punteggi e le scale ▪ Nominale: identifica oggetti che possiedono una certa caratteristica sulla base di un nome o di una descrizione ▪ A,B,C,D,E sono inclusi in una classe mentre F,G,H ne sono esclusi. ▪ Se la caratteristica è “sa calcolare la somma di numeri interi”, gli allievi A,B,C,D,E sono ugualmente capaci di farlo, gli altri non sono capaci Il significato dei punteggi e le scale ▪ Ordinale: consente di stabilire una graduatoria nel possesso di una caratteristica ▪ È possibile stabilire che B>A,C>B…F>E ▪ Le distanze fra le posizioni sono sono regolari ▪ Non possiamo stabilire di quanto B è maggiore di A Il significato dei punteggi e le scale ▪ A intervalli: restituisce un valore quantitativo della distanza tra due posizioni successive della scala ▪ In questa scala AB=BC…=GH ▪ Possiamo definire, usando i numeri, quantitativamente la differenza ▪ La posizione 0 è convenzionale, non si può definire assenza di apprendimento Il significato dei punteggi e le scale ▪ Di rapporti: scala a intervalli con origine corrispondente alla totale assenza di ciò che si vuole osservare ▪ Possiamo dire che 4 è il doppio di 2, 3 la metà di 6 ecc. ▪ È improbabile si possa usare nelle misure di apprendimento ▪ Ad es. si può usare per misurare il tempo necessario ad eseguire una prova Quartili, decili, centili ▪ Concetto simile a quello della mediana ▪ Si suddivide una serie di punteggi (ordinata in modo crescente o decrescente) in 4 (quartili), 10 (decili), 100 (centili, o percentili) parti uguali ▪ Ad es. il primo quartile quindi è quel valore al di sotto del quale è contenuto il 25% della distribuzione e al di sopra del quale rimane il 75% ▪ Il secondo quartile corrisponde a…? I centili ▪ Immaginiamo di “spalmare” gli studenti sottoposti ad una prova su base 100: ogni studente ha il suo punteggio a “caratterizzarlo” ▪ Quanti studenti si classificherebbero sotto un dato studente se la classe contasse 100 studenti? ▪ Il centile è il valore al di sotto del quale si colloca una data percentuale di casi (studenti) di una distribuzione (gruppo) ▫ Da non confondere con il “punteggio percentuale” ossia la proporzione del totale dei punti di un esame lo studente ha ottenuto. ▪ Non si calcola per meno di 100 rispondenti, in linea teorica Il (rango) centile di un punteggio può essere definito come.. ▪ Non sempre tutti sono d’accordo: ▫ ▫ ▫ la percentuale di punteggi inferiori ad un punteggio dato la percentuale di punteggi pari o inferiori ad un dato punteggio la percentuale di punteggi che è sotto il punto mediano dell’intervallo di un dato punteggio ▪ Per definire l’andamento di una prova può essere utile sapere a quale punteggio corrisponde il 90° centile. ▫ Ad esempio, il 90° centile è il voto al di sotto del quale si trova il 90% di un gruppo di studenti universitari potrebbe corrispondere a 28. ▪ Il 50° centile può essere altrimenti detto…? Come si calcola ▪Funzione percentile ▪Interpolazione lineare ▪ Galton-Ferguson Centili e punteggi grezzi ▪ La distanza che c’è tra Luca e Mara in termini di centili è la stessa (quasi un decile) ma così non è in termini di punteggi grezzi ▪ I centili amplificano le distanze se sono vicini alla media È importante ricordare che.. ▪ i centili rappresentano delle graduatorie, ossia delle scale ordinali, nelle quali le differenze non sono riportate ad una stessa unità di misura ▪ sappiamo quindi che un punteggio è superiore o inferiore ad altri ma non sappiamo di quanto ▪ la trasformazione in centili comporta una amplificazione delle distanze tra i punteggi vicini alla media e una riduzione tra quelli situati agli estremi ▪ è possibile convertire i punteggi in modo da posizionarli su scale comparabili tra loro nelle medie e nelle dispersioni grazie ai punti z e ai punti T