media - Dipartimento di Scienze della Formazione

CdL SEAFC – a.a. 2016-2017 – II semestre
Pedagogia sperimentale.
Modelli e procedure per
l’educazione degli adulti
[email protected]
T4.
Modelli e procedure di valutazione
Proseguono gli appuntamenti con le attività di statistica del corso ”Pedagogia
sperimentale. Modelli e procedure per l’educazione degli adulti”
Che cosa
faremo
▪
Impostazione di un archivio di dati
▪
Pulizia dei dati
▪
Calcolo delle frequenze
▪
Difficoltà e discriminatività
▪
Misure di tendenza centrale e di
dispersione
▪
Centili, punti z e punti T
▪
Distribuzione pentenaria e punteggi
soglia
▪
Rappresentazione grafica
▪
Alcuni test (chi quadrato, phi, T-Test)
▪
Correlazione (Pearson, Spearman)
Misure di tendenza centrale
• MEDIA
• MODA
• MEDIANA
e dispersione
• GAMMA
• DEVIAZIONE
STANDARD
“
a Statistica
Sai ched’è la statistica? È ’na cosa
che serve pe’ fa’ un conto in generale
de la gente che nasce, che sta male,
che more, che va in carcere e che sposa.
Ma pe’ me la statistica curiosa
è dove c’entra la percentuale,
pe’ via che, lì, la media è sempre eguale
puro co’ la persona bisognosa.
Me spiego: da li conti che se fanno
secondo le statistiche d’adesso
risurta che te tocca un pollo all’anno:
e, se nun entra ne le spese tue,
t’entra ne la statistica lo stesso
perché c’è un antro che ne magna due.
La Statistica, Trilussa
Perché usare le misure
di dispersione
▪Se forniamo solo i dati relativi alle misure di tendenza centrale diamo
adito a fraintendimenti
▪Ossia non mettiamo in grado chi legge di stabilire quanto i punteggi
analizzati siano tra loro omogenei o dispersi
▪Per valutare le differenze tra i punteggi di due distribuzioni dovremmo
analizzare uno ad uno i singoli punteggi, perdendo un tempo enorme
▪Per descrivere una distribuzione di dati è necessario utilizzare quindi
anche le misure di variabilità o dispersione
GAMMA (o RANGE o INTERVALLO DI VARIAZIONE)
▪ Ogni prova ha un punteggio grezzo minimo e un massimo teorico ed
effettivo
▪ La gamma di una distribuzione di punteggi si calcola sottraendo dal
punteggio massimo effettivo quello minimo effettivo e sommando
uno al risultato
gamma = maxeff.-mineff.+1
▪ Dipende solamente dai due punteggi estremi di una distribuzione
▪ La gamma rappresenta la più semplice misura di dispersione
Che cosa significa la gamma di una distribuzione?
▪ indica la distanza in termini di punteggio tra chi ha ottenuto il
punteggio più alto rispetto a chi ha ottenuto quello più basso
▪ definisce la parte della scala effettivamente utilizzata rispetto a
quella disponibile
▪ ad es. chi esprime giudizi più severi, pur avendo una scala che va da
0 a 10, usa una gamma di voti ristretta e limitata alla parte inferiore
della scala, ad es. 4-7, ossia costringe tutti i voti in una gamma di 4
(7-4+1) valori possibili (4,5,6 e 7)
Lo scarto medio (assoluto o semplice)
▪ lo scarto medio è la differenza tra il valore medio e i valori delle misure
▪ in altre parole per scarto medio si intende la media delle differenze di un certo
numero di punteggi con la media
▪ per calcolarlo si sommano i valori assoluti delle differenze e si dividono per il
numero dei punteggi
Lo scarto medio (assoluto o semplice)
▪ nato in prima battuta per superare il problema che la somma degli
scarti di tutti i punteggi dalla media è, per costruzione, sempre zero
▪ poco usato nella pratica statistica
▪ ad es. ci consente di stabilire che una coppia di correttori di una prova
ha espresso valutazioni diverse
VARIANZA
▪ Si introduce quindi la varianza, altra misura di dispersione
▪ Si eleva al quadrato i singoli scarti (o scostamenti) dalla media,
sommandoli tra di loro e dividendo il risultato per il numero totale
dei punteggi N
▪ Così facendo però l’ordine di grandezza della varianza è al
quadrato rispetto a quello dei punteggi
DEVIAZIONE
STANDARD
▪ si arriva quindi a alla radice quadrata della varianza.
▪ è lo “scarto quadratico medio” e si indica con σ (sigma)
oppure con s
▪ è uguale alla radice quadrata della varianza ossia della
media del quadrato degli scarti di tutti punteggi dalla media
DEVIAZIONE
STANDARD
punteggio
scarto
scarto al
quadrato
5
2
4
4
1
1
3
0
0
2
-1
1
1
-2
4
Somma = 15
Somma = 0
Somma = 10
Media = 3
s=√(10/5)=√2=1.41
DEVIAZIONE
STANDARD
▪ Concettualmente (e non statisticamente), la deviazione standard
indica, in media, quanto sono “lontani” i punteggi di una
distribuzione dalla loro media
▪ Non si tratta semplicemente della “lontananza” dalla media, perché
la somma delle deviazioni è sempre 0 (e per questo si eleva a
potenza e poi si fa la radice)
▪ Aiuta ad interpretare le misure di tendenza centrale, indicando
quanto esse siano sintesi fedele della distribuzione cui fanno
riferimento
▪ 10/12% della media – riferimento per interpretarla
DEVIAZIONE STANDARD:
come si legge
▪ il valore della deviazione standard aumenta (rispetto al valore della
media) quanto più i punteggi della serie sono distanti dalla media
▪ il valore della deviazione standard diminuisce (rispetto alla media)
quanto più i punteggi della serie sono vicini alla media
▪ se non supera il 10/12% della media (riferimento didattico) i
risultati ottenuti dalle prove strutturate sono abbastanza uniformi
DEVIAZIONE STANDARD:
perché è utile
1.
2.
3.
Riflette la dispersione dei punteggi così che la variabilità di diverse
distribuzioni può essere messa a confronto in termini di scarto
quadratico medio
Consente una interpretazione precisa dei punteggi entro la
distribuzione
Come la media, fa parte di un insieme di teorie matematiche che ci
consentono di usarlo in metodologie statistiche più complesse
(statistica inferenziale)
La distribuzione normale e la deviazione standard
• La deviazione standard è una misura di variabilità che descrive
la variazione di tutti i punti dati rispetto al valore medio
• La parte di una distribuzione che si trova tra più e meno una
deviazione standard della media include circa il 68% dei casi e la
parte che si trova tra più e meno 1,96 deviazioni standard
include circa il 95% dei casi
• Ciò significa che se la variabile è distribuita normalmente, è
prevedibile che il 95% dei casi si trovi entro 2 deviazioni standard
dalla media
La distribuzione normale e la deviazione standard
La distribuzione normale e la deviazione standard
La media ingannatrice
media = 5,3
media = 6
Serie I: 4, 6, 6, 4, 5, 6, 6
Serie II: 6, 5, 10, 4, 4, 9, 4
¡ Proviamo ad ordinare le distribuzioni…
Serie I: 4, 4, 5, 6, 6, 6, 6
Serie II: 4, 4, 4, 5, 6, 9, 10
sufficienza
§ Gamma molto diversa (come più semplice misura di dispersione)
§ Moda (punteggio più frequente) molto diversa
§ Mediana (punteggio che divide in due la distribuzione ordinata)
diversa
La media ingannatrice
¡ Ma la mediana non ci salva completamente da errori di interpretazione..
Serie III
4
5
8
9
11
Serie IV
5
6
7
10
13
differenza
-1
-1
1
-1
-2
Media = 7,4
Media = 8,2
Mediana = -1
§ Come stabilire quale delle due serie è andata meglio?
La media inganna ma la
mediana non è da meno…
▪L’andamento mostra
come la serie IV sia
sotto solo in punto alla
serie III
Provate voi…
Gruppo A
Gruppo B
3
4
4
5
6
5
7
8
7
8
8
9
8
9
9
10
10
Media
10
Media
Mediana
Mediana
Provate voi…
Gruppo A
Gruppo B
3
4
4
5
6
5
7
8
7
8
8
9
8
9
9
10
10
Media
10
Media
6,59
Mediana
7
7,56
Mediana
8
Perché ci interessa la
media
¡ perché si associa spesso al concetto di sufficienza (cut-off score o
threshold)
§ sia dal punto di vista del senso comune (più o meno la metà..)
§ sia per tradizione (statunitense)
¡ due modi di trovare la sufficienza
§ criteriale: chi raggiunge determinate competenze (quindi risponde
bene a determinati quesiti)
§ normativo: chi raggiunge il punteggio medio raggiunto dal gruppo in
cui è inserito/a
Regole per una corretta
interpretazione
Considerare sempre:
▫ allo stesso tempo tutte le misure di tendenza centrale
(media, mediana e moda)
▫ il numero di casi analizzato
▫ le misure di dispersione (gamma e deviazione standard)
▫ se la rilevazione è campionaria, considerare sempre la
media con l’errore standard
È una stima di quanto la media del campione si avvicini alla
media della popolazione. Più il campione è grande, minore sarà
l’errore standard, e più la media del campione si avvicinerà alla
media della popolazione.
Una distribuzione di
punteggi con media 6,
mediana 7, moda 8 e
dev.st. 0.3 (max teorico =
10) indica che
A. la prova è andata male e i punteggi
sono concentrati attorno alla
media.
B. la prova è andata bene e i punteggi
sono concentrati attorno alla
media.
C. la prova è andata bene e i punteggi
non sono concentrati attorno alla
media.
D. la prova è andata male e i punteggi
non sono concentrati attorno alla
media
Una distribuzione di
punteggi con media 6,
mediana 7, moda 8 e
dev.st. 0.3 (max teorico =
10) indica che
A. la prova è andata male e i punteggi
sono concentrati attorno alla
media.
B. la prova è andata bene e i punteggi
sono concentrati attorno alla
media.
C. la prova è andata bene e i punteggi
non sono concentrati attorno alla
media.
D. la prova è andata male e i punteggi
non sono concentrati attorno alla
media
Verifica
Gruppo A
▪ Quale dei tre
gruppi presenta
una maggiore
dispersione
attorno alla
media?
media
7
7
7
8
8
8
8
9
9
9
8
Gruppo B
0
1
3
5
7
8
10
12
16
18
8
Verifica
Gruppo A
▪ Quale dei tre
gruppi presenta
una maggiore
dispersione
attorno alla
media?
media
dev.st
%
7
7
7
8
8
8
8
9
9
9
8
0,74
9%
Gruppo B
0
1
3
5
7
8
10
12
16
18
8
5,49
69%
Il significato dei
punteggi e le scale
▪ Nominale: identifica oggetti che possiedono una certa
caratteristica sulla base di un nome o di una descrizione
▪ A,B,C,D,E sono inclusi in una classe mentre F,G,H ne sono esclusi.
▪ Se la caratteristica è “sa calcolare la somma di numeri interi”, gli
allievi A,B,C,D,E sono ugualmente capaci di farlo, gli altri non
sono capaci
Il significato dei
punteggi e le scale
▪ Ordinale: consente di stabilire una graduatoria nel possesso di
una caratteristica
▪ È possibile stabilire che B>A,C>B…F>E
▪ Le distanze fra le posizioni sono sono regolari
▪ Non possiamo stabilire di quanto B è maggiore di A
Il significato dei
punteggi e le scale
▪ A intervalli: restituisce un valore quantitativo della distanza tra
due posizioni successive della scala
▪ In questa scala AB=BC…=GH
▪ Possiamo definire, usando i numeri, quantitativamente la
differenza
▪ La posizione 0 è convenzionale, non si può definire assenza di
apprendimento
Il significato dei
punteggi e le scale
▪ Di rapporti: scala a intervalli con origine corrispondente alla
totale assenza di ciò che si vuole osservare
▪ Possiamo dire che 4 è il doppio di 2, 3 la metà di 6 ecc.
▪ È improbabile si possa usare nelle misure di apprendimento
▪ Ad es. si può usare per misurare il tempo necessario ad eseguire
una prova
Quartili, decili, centili
▪ Concetto simile a quello della mediana
▪ Si suddivide una serie di punteggi (ordinata in modo crescente o
decrescente) in 4 (quartili), 10 (decili), 100 (centili, o percentili)
parti uguali
▪ Ad es. il primo quartile quindi è quel valore al di sotto del quale è
contenuto il 25% della distribuzione e al di sopra del quale rimane il
75%
▪ Il secondo quartile corrisponde a…?
I centili
▪ Immaginiamo di “spalmare” gli studenti sottoposti ad una prova
su base 100: ogni studente ha il suo punteggio a “caratterizzarlo”
▪ Quanti studenti si classificherebbero sotto un dato studente se la
classe contasse 100 studenti?
▪ Il centile è il valore al di sotto del quale si colloca una data
percentuale di casi (studenti) di una distribuzione (gruppo)
▫
Da non confondere con il “punteggio percentuale” ossia la proporzione del totale
dei punti di un esame lo studente ha ottenuto.
▪ Non si calcola per meno di 100 rispondenti, in linea teorica
Il (rango) centile di un punteggio può
essere definito come..
▪ Non sempre tutti sono d’accordo:
▫
▫
▫
la percentuale di punteggi inferiori ad un punteggio dato
la percentuale di punteggi pari o inferiori ad un dato punteggio
la percentuale di punteggi che è sotto il punto mediano dell’intervallo di un dato
punteggio
▪ Per definire l’andamento di una prova può essere utile sapere a quale
punteggio corrisponde il 90° centile.
▫
Ad esempio, il 90° centile è il voto al di sotto del quale si trova il 90% di un gruppo di
studenti universitari potrebbe corrispondere a 28.
▪ Il 50° centile può essere altrimenti detto…?
Come si calcola
▪Funzione percentile
▪Interpolazione lineare
▪ Galton-Ferguson
Centili e punteggi
grezzi
▪ La distanza che c’è tra Luca e Mara in termini di centili è la stessa (quasi un
decile) ma così non è in termini di punteggi grezzi
▪ I centili amplificano le distanze se sono vicini alla media
È importante ricordare
che..
▪ i centili rappresentano delle graduatorie, ossia delle scale ordinali, nelle
quali le differenze non sono riportate ad una stessa unità di misura
▪ sappiamo quindi che un punteggio è superiore o inferiore ad altri ma non
sappiamo di quanto
▪ la trasformazione in centili comporta una amplificazione delle distanze tra i
punteggi vicini alla media e una riduzione tra quelli situati agli estremi
▪ è possibile convertire i punteggi in modo da posizionarli su scale comparabili
tra loro nelle medie e nelle dispersioni grazie ai punti z e ai punti T