DISTRIBUZIONI IN CLASSI: MODALITÀ DI PRESENTAZIONE L’organizzazione di una distribuzione di frequenze è un’operazione per la quale non è prevista “la soluzione” giusta; infatti, gli stessi dati possono dare origine a più soluzioni, dal momento che i parametri che caratterizzano una distribuzione dipendono dalle scelte e quindi dalla sensibilità e dalla capacità dell’operatore a mettere in luce aspetti peculiari del fenomeno. Occorre tener presente che la finalità di una distribuzione in classi è di evidenziare in tabelle numeriche, e corrispondenti rappresentazioni grafiche, le caratteristiche dell’insieme dei dati e, nel limite del possibile, far risaltare come si distribuiscono e dove si concentrano. Non esistono, in realtà, leggi che definiscano il numero minimo di dati per giustificare una distribuzione in classi o il numero ottimale: ogni situazione fa caso a sé e deve essere valutata di conseguenza. Certamente, suddividere in 20 classi un numero modesto di osservazioni porterebbe a una distribuzione così diluita da non risultare molto più esplicativa dei dati grezzi. D’altra parte, la suddivisione in poche classi limita notevolmente le potenzialità descrittive della distribuzione di frequenza in quanto tutte le osservazioni, così concentrate, non garantiscono un sufficiente dettaglio informativo. Il numero delle classi è legato all’intervallo di variazione delle misure e all’ampiezza prescelta. La distribuzione, ovviamente, deve ricoprire il campo di variabilità per comprendere tutti i valori osservati. Non è previsto che l’intervallo della distribuzione in classi coincida esattamente con quello della variabile, anzi è conveniente che esso sia un poco più ampio in modo da includere nel suo interno le misure estreme. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. La scelta della ampiezza delle classi deve essere adeguata al fenomeno osservato, ma, salvo controindicazioni specifiche, conviene adottare ampiezze di facile manipolazione, come per esempio multipli di 5 o comunque valori tali da rendere semplici i confini di classe. Se la variabile è il peso, una suddivisione con ampiezza di 5 kg pare adeguata e certamente più maneggevole di un valore quale 6 o 4.5 kg. È buona norma, nella scelta dell’ampiezza, evitare la presenza di classi vuote, a frequenza zero, situazione che si verifica quando l’intervallo di variazione è molto ampio con pochi valori sparsi (generalmente, all’inizio o alla fine della distribuzione). A questo si può ovviare considerando aperte le classi estreme, pur con gli inconvenienti di rappresentazione ed elaborazione a esse collegati. Il numero e le caratteristiche delle classi dipendono dalle scelte del ricercatore e si è anche detto che conviene rispettare certi criteri quali classi chiuse, di ampiezze uguali e così via. Tuttavia, se scopo peculiare è il confronto con altre realtà, per renderlo possibile occorre adeguare le proprie scelte a quelle degli altri ricercatori. Per esempio, volendo confrontare la distribuzione per classi di età dei decessi per una determinata neoplasia riscontrati in una provincia italiana con i dati di altre zone, conviene adeguarsi alla suddivisione in classi utilizzata dall’Istituto Nazionale di Statistica (ISTAT). In base a tale criterio, le ampiezze di classi (Tabella 1) risultano diverse per accorpare le età secondo gruppi omogenei; sono inoltre presenti classi aperte ed è facile riscontrare classi vuote allorché, pur essendo la casistica poco numerosa, si renda proponibile un confronto tra le varie situazioni. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. Quando una organizzazione in classi è poco significativa (per esiguità di frequenze o distribuzione irregolare), nulla vieta che, per una migliore comprensione dell’insieme, gli stessi dati possano essere espressi con una distribuzione a numero inferiore di classi semplicemente accorpandole tra loro, generalmente due a due (Tabella 2). Si tenga presente che non è possibile il passaggio inverso aumentando il numero delle classi (per esempio, raddoppiandole), a meno di non ripartire dai dati originali; da qui, la convenienza di programmare un numero di classi in eccesso piuttosto che in difetto. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l.