CLASSE 3^U – A.S. 2015/16 APPUNTI INTEGRATIVI DI STATISTICA LA CONCENTRAZIONE DI UNA DISTRIBUZIONE STATISTICA Consideriamo il numero totale di fogli di protocollo che una classe ha con sé in un giorno di scuola. Supponiamo che siano 50 per 25 alunni. Ci sono diversi casi possibili: ciascun alunno potrebbe avere con sé due fogli di protocollo oppure un solo alunno avere tutti e 50i fogli, mentre i compagni ne sono sprovvisti. Nel primo caso c’è una equidistribuzione dei fogli, nel secondo caso c’è una concentrazione massima. Sono i due casi estremi. Nella maggio parte delle situazioni reali si avranno alunni con 3 o 4 fogli, qualcuno con un solo foglio, altri senza e così via. Le due situazioni dell’equidistribuzione e della massima concentrazione limitano i casi possibili, che si collocano tra queste due configurazioni. Si parla di concentrazione del caso di caratteri - QUANTITATIVI - TRASFERIBILI “Trasferibile” significa che una unità statistica può cedere parte o tutta la quantità che possiede ad un’altra unità statistica. Sono, quindi, caratteri trasferibili: il reddito delle famiglie italiane, lo stipendio annuo di un gruppo di lavoratori, gli immobili posseduti dagli abitanti di una data regione ecc. Non sono invece caratteri trasferibili: il peso, l’altezza, i voti in una verifica ecc. Per questi ultimi è sensato analizzare la variabilità, utilizzando gli indici di dispersione, non la concentrazione. Per studiare la concentrazione di una data distribuzione statistica si procede in tre fasi: - Elaborazione dei dati della distribuzione - Rappresentazione grafica - Valutazione del grado di concentrazione ELABORAZIONE DELLA DISTRIBUZIONE STATISTICA Prendiamo in considerazione l’esempio dei fogli di protocollo e immaginiamo di aver raccolto i seguenti dati: N. FOGLI 0 1 2 3 5 FREQUENZE (ALUNNI) 3 5 8 8 1 È una situazione abbastanza semplice perché i dati sono organizzati per singoli valori e non per classi, come succede, invece, nell’esempio del libro di testo (pag. 351). I dati sono disposti in ordine crescente, relativamente al numero di fogli, cioè dal numero inferiore di fogli posseduti al numero maggiore (dai “più poveri” di fogli ai “più ricchi”). Rielaborando i dati dalla tabella, possiamo raccogliere altre informazioni sulla distribuzione, che ci aiuteranno a dare una valutazione della concentrazione. Aggiungiamo in particolare tre colonne, calcolando il totale dei fogli per ogni occorrenza (moltiplicando le frequenze per il numero dei fogli ad esse relativo) le percentuali degli alunni e dei fogli sul totale e due altre colonne, delle “percentuali cumulate”: N. FOGLI 0 1 2 3 5 TOTALI FREQUENZE TOTALE (ALUNNI) FOGLI 3 5 8 8 1 25 0 5 16 24 5 50 % ALUNNI % FOGLI 12 20 32 32 4 100 0 10 32 48 10 100 % % CUMULATE CUMULATE ALUNNI FOGLI 12 0 32 10 64 42 96 90 100 100 Le percentuali cumulate si calcolano riportando la prima percentuale e inserendo elle altre righe la somma della percentuale della riga precedente con quella della riga stessa. Dalla tabella così ampliata si deduce, ad esempio, che il 32% degli alunni della classe possiede il 10% dei fogli di protocollo, il 64% possiede il 42% dei fogli e così via. RAPPRESENTAZIONE GRAFICA DELLA DISTRIBUZIONE Ora rappresentiamo graficamente la distribuzione dei fogli di protocollo mettendo in ascissa le percentuali cumulate degli alunni e in ordinata le percentuali cumulate dei fogli: La spezzata rossa OB è detta CURVA DI CONCENTRAZIONE (o anche CURVA DI LORENZ), la linea retta azzurra OB si dice retta di equidistribuzione (è la bisettrice del primo quadrante), la spezzata OAB rappresenta la situazione di massima distribuzione: un solo alunno ha con sé tutti i fogli di protocollo, gli altri ne sono sprovvisti. VALUTAZIONE DEL GRADO DI CONCENTRAZIONE Come già osservato: - se i fogli sono equamente distribuiti tra gli alunni, la distribuzione è nulla e la curva di concentrazione coincide con il segmento OB - se un solo alunno possiede tutti i fogli, la curva di concentrazione coincide con la spezzata OAB - più la concentrazione è elevata e più la curva di concentrazione si discosta dalla retta di equidistribuzione. Un indicatore della concentrazione è il rapporto c tra l’area compresa tra la curva di concentrazione e la retta di equidistribuzione (colorata in giallo nel grafico) e l’area del triangolo OAB, detta area di concentrazione massima: c area di concentrazione area di massima concentrazione Nel caso di equidistribuzione, c = 0, se la concentrazione è massima si ha c = 1, in tutti gli altri casi è 0 < c < 1. Più c si avvicina a 0 e più i fogli, o in generale il bene considerato, tende ad essere distribuito equamente tra la popolazione statistica, più c si avvicina a 1 e più il bene tende ad essere concentrato in una parte della popolazione. Calcoliamo c nell’esempio dei fogli di protocollo. Area di massima concentrazione: 100 100 5000 2 Area di concentrazione (può essere facilmente calcolata per differenza): A1 0 (è ridotto a un segmento) 20 10 100 (è un triangolo) 2 (42 10) 32 A3 832 (è un trapezio) 2 (90 42) 32 A4 2112 (è un trapezio) 2 (100 90) 4 A4 380 (è un trapezio) 2 A2 (per calcolare i lati del triangolo e del trapezio basta ricordate che i punti della curva di concentrazione sono stati ottenuti dalle due colonne delle percentuali cumulate) Area di concentrazione = 5000 – (0 + 100 + 832 + 2112 + 380) = 1576 Quindi: c 1576 0,3152 5000