Diapositiva 1

DISTRIBUZIONI IN CLASSI:
MODALITÀ DI PRESENTAZIONE
L’organizzazione di una distribuzione di frequenze è un’operazione per la quale non è
prevista “la soluzione” giusta; infatti, gli stessi dati possono dare origine a più soluzioni, dal
momento che i parametri che caratterizzano una distribuzione dipendono dalle scelte e
quindi dalla sensibilità e dalla capacità dell’operatore a mettere in luce aspetti peculiari del
fenomeno. Occorre tener presente che la finalità di una distribuzione in classi è di
evidenziare in tabelle numeriche, e corrispondenti rappresentazioni grafiche, le
caratteristiche dell’insieme dei dati e, nel limite del possibile, far risaltare come si
distribuiscono e dove si concentrano.
Non esistono, in realtà, leggi che definiscano il numero minimo di dati per giustificare una
distribuzione in classi o il numero ottimale: ogni situazione fa caso a sé e deve essere
valutata di conseguenza. Certamente, suddividere in 20 classi un numero modesto di
osservazioni porterebbe a una distribuzione così diluita da non risultare molto più
esplicativa dei dati grezzi. D’altra parte, la suddivisione in poche classi limita notevolmente
le potenzialità descrittive della distribuzione di frequenza in quanto tutte le osservazioni,
così concentrate, non garantiscono un sufficiente dettaglio informativo.
Il numero delle classi è legato all’intervallo di variazione delle misure e all’ampiezza
prescelta. La distribuzione, ovviamente, deve ricoprire il campo di variabilità per
comprendere tutti i valori osservati. Non è previsto che l’intervallo della distribuzione in
classi coincida esattamente con quello della variabile, anzi è conveniente che esso sia un
poco più ampio in modo da includere nel suo interno le misure estreme.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
La scelta della ampiezza delle classi deve essere adeguata al fenomeno osservato,
ma, salvo controindicazioni specifiche, conviene adottare ampiezze di facile
manipolazione, come per esempio multipli di 5 o comunque valori tali da rendere
semplici i confini di classe. Se la variabile è il peso, una suddivisione con ampiezza
di 5 kg pare adeguata e certamente più maneggevole di un valore quale 6 o 4.5 kg.
È buona norma, nella scelta dell’ampiezza, evitare la presenza di classi vuote, a
frequenza zero, situazione che si verifica quando l’intervallo di variazione è molto
ampio con pochi valori sparsi (generalmente, all’inizio o alla fine della distribuzione).
A questo si può ovviare considerando aperte le classi estreme, pur con gli
inconvenienti di rappresentazione ed elaborazione a esse collegati.
Il numero e le caratteristiche delle classi dipendono dalle scelte del ricercatore e si è
anche detto che conviene rispettare certi criteri quali classi chiuse, di ampiezze
uguali e così via. Tuttavia, se scopo peculiare è il confronto con altre realtà, per
renderlo possibile occorre adeguare le proprie scelte a quelle degli altri ricercatori.
Per esempio, volendo confrontare la distribuzione per classi di età dei decessi per
una determinata neoplasia riscontrati in una provincia italiana con i dati di altre zone,
conviene adeguarsi alla suddivisione in classi utilizzata dall’Istituto Nazionale di
Statistica (ISTAT). In base a tale criterio, le ampiezze di classi (Tabella 1) risultano
diverse per accorpare le età secondo gruppi omogenei; sono inoltre presenti classi
aperte ed è facile riscontrare classi vuote allorché, pur essendo la casistica poco
numerosa, si renda proponibile un confronto tra le varie situazioni.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
Quando una organizzazione in classi è poco significativa (per esiguità di frequenze o
distribuzione irregolare), nulla vieta che, per una migliore comprensione dell’insieme,
gli stessi dati possano essere espressi con una distribuzione a numero inferiore di
classi semplicemente accorpandole tra loro, generalmente due a due (Tabella 2).
Si tenga presente che non è possibile il passaggio inverso aumentando il numero
delle classi (per esempio, raddoppiandole), a meno di non ripartire dai dati originali;
da qui, la convenienza di programmare un numero di classi in eccesso piuttosto che
in difetto.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.