APPUNTI INTEGRATIVI DI STATISTICA

annuncio pubblicitario
CLASSE 3^U – A.S. 2015/16
APPUNTI INTEGRATIVI DI STATISTICA
LA CONCENTRAZIONE DI UNA DISTRIBUZIONE STATISTICA
Consideriamo il numero totale di fogli di protocollo che una classe ha con sé in un
giorno di scuola. Supponiamo che siano 50 per 25 alunni. Ci sono diversi casi possibili:
ciascun alunno potrebbe avere con sé due fogli di protocollo oppure un solo alunno
avere tutti e 50i fogli, mentre i compagni ne sono sprovvisti. Nel primo caso c’è una
equidistribuzione dei fogli, nel secondo caso c’è una concentrazione massima. Sono i
due casi estremi. Nella maggio parte delle situazioni reali si avranno alunni con 3 o 4
fogli, qualcuno con un solo foglio, altri senza e così via.
Le due situazioni dell’equidistribuzione e della massima concentrazione limitano i casi
possibili, che si collocano tra queste due configurazioni.
Si parla di concentrazione del caso di caratteri
- QUANTITATIVI
- TRASFERIBILI
“Trasferibile” significa che una unità statistica può cedere parte o tutta la quantità che
possiede ad un’altra unità statistica.
Sono, quindi, caratteri trasferibili: il reddito delle famiglie italiane, lo stipendio annuo
di un gruppo di lavoratori, gli immobili posseduti dagli abitanti di una data regione
ecc.
Non sono invece caratteri trasferibili: il peso, l’altezza, i voti in una verifica ecc. Per
questi ultimi è sensato analizzare la variabilità, utilizzando gli indici di dispersione, non
la concentrazione.
Per studiare la concentrazione di una data distribuzione statistica si procede in tre
fasi:
- Elaborazione dei dati della distribuzione
- Rappresentazione grafica
- Valutazione del grado di concentrazione
ELABORAZIONE DELLA DISTRIBUZIONE STATISTICA
Prendiamo in considerazione l’esempio dei fogli di protocollo e immaginiamo di aver
raccolto i seguenti dati:
N. FOGLI
0
1
2
3
5
FREQUENZE (ALUNNI)
3
5
8
8
1
È una situazione abbastanza semplice perché i dati sono organizzati per singoli valori
e non per classi, come succede, invece, nell’esempio del libro di testo (pag. 351).
I dati sono disposti in ordine crescente, relativamente al numero di fogli, cioè dal
numero inferiore di fogli posseduti al numero maggiore (dai “più poveri” di fogli ai “più
ricchi”).
Rielaborando i dati dalla tabella, possiamo raccogliere altre informazioni sulla
distribuzione, che ci aiuteranno a dare una valutazione della concentrazione.
Aggiungiamo in particolare tre colonne, calcolando il totale dei fogli per ogni
occorrenza (moltiplicando le frequenze per il numero dei fogli ad esse relativo) le
percentuali degli alunni e dei fogli sul totale e due altre colonne, delle “percentuali
cumulate”:
N. FOGLI
0
1
2
3
5
TOTALI
FREQUENZE TOTALE
(ALUNNI)
FOGLI
3
5
8
8
1
25
0
5
16
24
5
50
%
ALUNNI
%
FOGLI
12
20
32
32
4
100
0
10
32
48
10
100
%
%
CUMULATE CUMULATE
ALUNNI
FOGLI
12
0
32
10
64
42
96
90
100
100
Le percentuali cumulate si calcolano riportando la prima percentuale e inserendo elle
altre righe la somma della percentuale della riga precedente con quella della riga
stessa.
Dalla tabella così ampliata si deduce, ad esempio, che il 32% degli alunni della classe
possiede il 10% dei fogli di protocollo, il 64% possiede il 42% dei fogli e così via.
RAPPRESENTAZIONE GRAFICA DELLA DISTRIBUZIONE
Ora rappresentiamo graficamente la distribuzione dei fogli di protocollo mettendo in
ascissa le percentuali cumulate degli alunni e in ordinata le percentuali cumulate dei
fogli:
La spezzata rossa OB è detta
CURVA DI CONCENTRAZIONE (o
anche CURVA DI LORENZ), la linea
retta azzurra OB si dice retta di
equidistribuzione (è la bisettrice
del primo quadrante), la spezzata
OAB rappresenta la situazione di
massima distribuzione: un solo
alunno ha con sé tutti i fogli di
protocollo, gli altri ne sono
sprovvisti.
VALUTAZIONE DEL GRADO DI CONCENTRAZIONE
Come già osservato:
- se i fogli sono equamente distribuiti tra gli alunni, la distribuzione è nulla e la
curva di concentrazione coincide con il segmento OB
- se un solo alunno possiede tutti i fogli, la curva di concentrazione coincide con
la spezzata OAB
- più la concentrazione è elevata e più la curva di concentrazione si discosta dalla
retta di equidistribuzione.
Un indicatore della concentrazione è il rapporto c tra l’area compresa tra la curva di
concentrazione e la retta di equidistribuzione (colorata in giallo nel grafico) e l’area
del triangolo OAB, detta area di concentrazione massima:
c
area di concentrazione
area di massima concentrazione
Nel caso di equidistribuzione, c = 0, se la concentrazione è massima si ha c = 1, in
tutti gli altri casi è 0 < c < 1.
Più c si avvicina a 0 e più i fogli, o in generale il bene considerato, tende ad essere
distribuito equamente tra la popolazione statistica, più c si avvicina a 1 e più il
bene tende ad essere concentrato in una parte della popolazione.
Calcoliamo c nell’esempio dei fogli di protocollo.
Area di massima concentrazione:
100  100
 5000
2
Area di concentrazione (può essere facilmente calcolata per differenza):
A1  0 (è ridotto a un segmento)
20  10
 100 (è un triangolo)
2
(42  10)  32
A3 
 832 (è un trapezio)
2
(90  42)  32
A4 
 2112 (è un trapezio)
2
(100  90)  4
A4 
 380 (è un trapezio)
2
A2 
(per calcolare i lati del triangolo e del trapezio basta ricordate che i punti della curva
di concentrazione sono stati ottenuti dalle due colonne delle percentuali cumulate)
Area di concentrazione = 5000 – (0 + 100 + 832 + 2112 + 380) = 1576
Quindi: c 
1576
 0,3152
5000
Scarica