LA STATISTICA Lo scopo di questo modulo è quello di fornire le nozioni elementari sul metodo di analisi statistica e sulle rappresentazioni statistiche. Attraverso l'analisi statistica di dati, precedentemente raccolti, è possibile valutare l'evoluzione di determinati fenomeni. La raccolta e l'elaborazione dei dati, infatti, serve non solo per descrivere il fenomeno stesso, ma anche per prevederne i comportamenti futuri e quindi operare scelte ed assumere decisioni. L'indagine statistica Un'indagine statistica si articola in una serie di fasi successive: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Individuare il fenomeno da studiare. Determinare l'universo statistico oggetto dell'indagine. Individuare le unità statistiche che costituiscono l'universo statistico. Determinare i caratteri statistici dell'indagine. Individuare le modalità di ogni carattere statistico. Rilevare i dati mediante interviste, questionari, ricerche in archivi ecc..... Procedere allo spoglio dei dati rilevati. Rappresentare graficamente i dati rilevati. Elaborare i dati rilevati. Dedurre le leggi che regolano il fenomeno. Universo statistico: caratteristiche. E' l'insieme di elementi che sono tra loro omogenei rispetto a una o più Unità statistiche: Sono gli elementi che costituiscono l'universo statistico. Caratteri statistici: Sono gli aspetti di un fenomeno statistico che si intendono rilevare su ogni unità statistica. I caratteri statistici si distinguono in: • caratteri quantitativi: si esprimono mediante un numero (età, voti, altezza, peso ecc.) • caratteri qualitativi: si esprimono mediante aggettivi o nomi (giudizi, materie preferite ecc.) Modalità: Sono i possibili valori che può assumere un carattere statistico. Esempio1: Si vuole svolgere un'indagine statistica sul voto finale di matematica degli alunni iscritti al terzo anno dell'istituto “Macrelli” di Cesena. In tal caso L'universo statistico è rappresentato dalle classi terze dell'istituto “Macrelli” di Cesena. Le unità statistiche sono gli alunni delle classi terze. Il carattere statistico che si vuole studiare è il voto finale di matematica, che è un numero e quindi è un carattere di tipo quantitativo. Le modalità del carattere statistico sono i possibili voti (da 2 a 10). Esempio2: Si vuole svolgere un'indagine statistica sugli abitanti di Cesena, analizzandone l'altezza ed il colore degli occhi. In tal caso L'universo statistico è rappresentato dal comune di Cesena Le unità statistiche sono gli abitanti residenti nel comune di Cesena Questa volta i caratteri statistici da studiare sono due: L'altezza che è un numero ed è quindi di tipo quantitativo. Le modalità di tale carattere sono le possibili altezze di una persona. Il colore degli occhi che non è un numero ma un colore e quindi di tipo qualitativo. Le modalità di tale carattere sono i possibili colori degli occhi di una persona. La rilevazione dei dati Una volta compreso che cosa si vuole analizzare è necessario procedere con la raccolta dei dati al fine di iniziare la fase di analisi statistica su dei dati concreti. I dati statistici possono essere rilevati mediante interviste, questionari, sondaggi e ricerche storiche. Da rilevare che l'indagine statistica non sempre può prendere in esame tutto l'universo statistico, perchè potrebbe essere troppo numeroso. Per questo motivo spesso si effettuano indagini su un campione rappresentativo dell'universo in esame. Ovviamente il campione deve essere scelto con criteri che garantiscano la rappresentatività di tutto l'universo statistico. Lo spoglio dei dati In generale i dati statistici non possono essere analizzati nella forma in cui vengono rilevati, ma devono essere ordinati e classificati in funzione della modalità del carattere che si intende studiare, rappresentandoli in opportune tabelle. Le tabelle possono essere semplici oppure a doppia entrata. Esempio1: Si vuole svolgere un'indagine statistica sul voto finale di matematica degli alunni iscritti alla 1B La raccolta e lo spoglio dei dati viene raccolto in una tabella semplice, una tabella cioè con una riga di intestazione, una colonna formata dalle unità statistiche ed un'altra in cui si riportano le modalità di un solo carattere statistico. Alunno Voto A 7 B 5 C 7 D 4 E 8 F 7 Esempio2: Si vuole svolgere un'indagine statistica su 100 cittadini di Cesena, analizzandone l'altezza ed il colore degli occhi. I risultati ottenuti dalla rilevazione sono i seguenti: 40 abitanti sono alti più di 180 cm, di questi 25 hanno occhi azzurri e 15 hanno occhi marroni. 60 abitanti sono alti meno di 180 cm, di questi 20 hanno occhi azzurri e 40 hanno occhi marroni. Per analizzare questa indagine, tenuto conto che i caratteri statistici sono due (altezza ed occhi), non è possibile usare una tabella semplice, ma è necessario usare una tabella a doppia entrata: Occhi Altezza Più di 180 cm Meno di 180 cm Totale Azzurri 25 20 45 Marroni 15 40 55 Totale 40 60 100 Elaborazione dati Le Frequenze Un primo studio interessante, una volta definiti gli elementi visti precedentemente, è quello delle frequenze, che possiamo suddividere in: frequenza assoluta, frequenza relativa e frequenza percentuale. La frequenza assoluta di una modalità è il numero di volte in cui tale modalità compare nell'universo in esame. La frequenza relativa di una modalità è il rapporto tra la sua frequenza assoluta e il numero di unità statistiche. La frequenza percentuale è il valore della frequenza relativa rapportato a 100. Esempio: Con riferimento all'esempio 1 (in cui l'universo statistico è formato da 6 unità statistiche) avremo: Modalità Frequenza assoluta Frequenza relativa Frequenza percentuale 4 1 1 : 6 = 0,16 16,00% 5 1 1 : 6 = 0,16 16,00% 7 3 3 : 6 = 0,5 50,00% 8 1 1 : 6 = 0,16 16,00% Osservazione La somma delle frequenze assolute coincide sempre con il numero delle unità statistiche prese in esame. La somma delle frequenze relative è sempre 1. La somma delle frequenze percentuali è sempre 100. Indici di posizione centrale Gli indici di posizione centrale servono a: • Limitare gli errori dovuti alle rilevazioni. • Prevedere l'evoluzione del fenomeno. Per evitare errori nella rilevazione è possibile effettuare più rilevazioni e calcolare la media aritmetica dei valori rilevati. La media aritmetica è la somma di tutti i valori rilevati per una data caratteristica, diviso per il numero totale delle rilevazioni. Esempio: un alunno svolge 4 verifiche di matematica riportando i seguenti voti: Verifica 1: 7 Verifica 2: 8 Verifica 3: 7 Verifica 4: 2 La media aritmetica delle rilevazioni sarà quindi Media= 7872 4 = 24 = 6 4 Altri indici di posizione centrale sono la moda e la mediana La moda è la modalità del carattere che si presenta con maggior frequenza. Essa viene utilizzata per determinare il carattere tipico dell'universo statistico in esame, cioè il carattere più diffuso. Per calcolare la moda è necessario rappresentare in una tabella le frequenze assolute e rilevare quale modalità ha la frequenza assoluta maggiore. Con riferimento all'esempio precedente abbiamo la seguente tabella di frequenze assolute: Voto Frequenza assoluta 2 1 7 2 8 1 La frequenza assoluta maggiore è associata al voto 7, per cui avremo che MODA = 7. La mediana indica quel valore tale che il numero di valori superiori a esso è uguale al numero di valori inferiori ad esso. La mediana rappresenta un concetto di equilibrio abbastanza intuitivo. Per calcolare la mediana è necessario ordinare le modalità in modo crescente. Se il numero delle modalità è dispari la mediana è l'elemento in posizione centrale. Se, invece, il numero delle modalità è pari la mediana si determina calcolando la media aritmetica dei due valori centrali. Con riferimento all'esempio precedente, in cui il numero delle modalità è dispari (3), avremo che MEDIANA = 7 (termine centrale).