L’indagine statistica DEFINIZIONE. La statistica è la disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del loro utilizzo a fini di conoscenza, oppure di azione. DEFINIZIONE. Si chiama carattere ogni aspetto di un fenomeno collettivo che si vuole analizzare. I caratteri si possono suddividere in: qualitativi: espressi da un nome o da un aggettivo, come ad esempio i tipi di programmi che si preferisce guardare in TV; quantitativi: espressi da numeri e divisi in caratteri discreti e caratteri continui. In ognuna delle due tipologie si possono distinguere: • caratteri sconnessi: tra le cui modalità si possono solo stabilire relazioni di uguaglianza o diversità, ad esempio il luogo di nascita; • caratteri ordinati: tra le cui modalità si può stabilire una relazione di ordine, ad esempio l’altezza di una persona. DEFINIZIONE. L’insieme degli individui a cui ci rivolgiamo per prendere informazioni circa il carattere da indagare si chiama popolazione. Ogni elemento della popolazione prende il nome di unità statistica. DEFINIZIONE. Si chiama modalità ogni possibile valore dato dall’unità statistica al carattere preso in esame. La statistica 1 La raccolta dei dati La raccolta dei dati può avvenire mediante: Censimento Interessa l’intera popolazione di una nazione. Rilevamento totale Si utilizza quando la popolazione statistica è formata da un numero ridotto di elementi. Rilevamento per campione Si utilizza quando la popolazione statistica assume dimensioni consistenti. La statistica 2 L’elaborazione dei dati DEFINIZIONE. La frequenza assoluta di un dato statistico è il numero di volte in cui tale dato si presenta nell’indagine statistica. Consideriamo i seguenti dati relativi al peso di 20 alunni di una scuola. Peso (in kg) Frequenza assoluta 50 kg 43 5 Claudio 43 kg 50 4 43 kg Mara 39 kg 47 3 Giovanni 50 kg Nicola 47 kg 39 3 Matteo 39 kg Nora 43 kg 42 2 Silvio 43 kg Pietro 50 kg 37 2 Sara 37 kg Simone 43 kg Enrico 50 kg Giovanna 42 kg 48 1 Totale 20 Stefano 48 kg Andrea 47 kg Anna 37 kg Giulia 42 kg Luca 39 kg Giorgio Marco 47 kg Paolo È possibile disporre i dati in una tabella delle frequenze. La statistica 3 L’elaborazione dei dati DEFINIZIONE. La frequenza relativa di un dato statistico è data dal rapporto fra la sua frequenza assoluta e il totale delle osservazioni; la frequenza relativa percentuale è data dal prodotto fra la sua frequenza relativa e 100. Relativamente all’esempio precedente degli alunni: Peso (in kg) Frequenza assoluta Frequenza relativa Frequenza relativa % 43 5 5 : 20 = 0,25 0,25 100 = 25% 50 4 4 : 20 = 0,20 0,20 100 = 20% 47 3 3 : 20 = 0,15 0,15 100 = 15% 39 3 3 : 20 = 0,15 0,15 100 = 15% 42 2 2 : 20 = 0,10 0,10 100 = 10% 37 2 2 : 20 = 0,10 0,10 100 = 10% 48 1 1 : 20 = 0,05 0,05 100 = 5% Totale 20 1 100% La statistica 4 La sintesi dei dati Quando si devono fare confronti fra diverse situazioni, è necessario introdurre un valore di sintesi che caratterizzi il fenomeno studiato. Tale valore viene detto indice di posizione e può essere definito in diversi modi, in relazione cioè agli obiettivi che si pone l’indagine. I più importanti indici di posizione sono: la media aritmetica la mediana la moda La statistica 5 La media aritmetica DEFINIZIONE. Si chiama media aritmetica di un insieme di dati statistici numerici il valore che si ottiene addizionando tutti i dati e dividendo la somma ottenuta per il numero di dati. In simboli: x + x2 + ... + xn media aritmetica = 1 n ESEMPIO Se un alunno ha i seguenti voti: Italiano: 6 Storia: 4 Scienze: 8 Geografia: 5 Matematica: 7 Inglese: 9 la media aritmetica dei voti si calcola nel seguente modo: 6 + 4 + 8 + 5 + 7 + 9 39 = = 6,5 6 6 La statistica 6 La mediana DEFINIZIONE. Si chiama mediana di un insieme di dati statistici il valore che nella serie di dati, disposti in ordine crescente (o decrescente), occupa il posto centrale. Se la serie è costituita da un numero pari di elementi allora la mediana è la media aritmetica dei due elementi centrali. ESEMPIO Data la distribuzione: 2 4 5 6 9 11 14 20 Il termine centrale cade nell’intervallo tra 6 e 9, pertanto: Mediana = (6 + 9) : 2 = 7,5 La statistica 7 La moda DEFINIZIONE. Si chiama moda di un insieme di dati statistici il valore che si presenta con maggiore frequenza. ESEMPIO La moda della distribuzione BLU VERDE ROSSO BIANCO BLU GIALLO GIALLO BLU è MODA = Blu Può anche capitare che in un’indagine statistica ci siano più di un valore modale. Ad esempio la moda della distribuzione 18 10 15 12 18 15 20 è MODA = 15 ; 18 Se sono presenti due valori modali, la distribuzione viene detta bimodale. La statistica 8 I numeri indice DEFINIZIONE. I numeri indice sono rapporti statistici che si realizzano tra i termini di una serie di dati quantitativi di un fenomeno e un termine della serie stessa, preso come riferimento, denominato valore standard e al quale si attribuisce il valore 100. In pratica quindi bisogna impostare la seguente proporzione valore anno : valore standard = x : 100 I risultati che otteniamo risolvendo le diverse proporzioni si chiamano numeri indice e il loro utilizzo fa capire in modo più immediato ed efficace come variano in percentuale i dati della nostra indagine. La statistica 9 I numeri indice Analizziamo l’andamento delle vendite di autovetture da parte di una concessionaria dal 2006 al 2011. Anni Autovetture vendute 2006 526 2007 593 2008 634 2009 667 2010 702 2011 899 • per l’anno 2006 → numero indice = 100 • per l’anno 2007 → 593 : 526 = x : 100 → x 593 100 112,7 526 • per l’anno 2008 → 634 : 526 = x : 100 → x 634 100 120,5 526 • per l’anno 2009 → 667 : 526 = x : 100 → x 667 100 126,8 526 • per l’anno 2010 → 702 : 526 = x : 100 → x 702 100 133,5 526 • per l’anno 2011 → 899 : 526 = x : 100 → x 899 100 170,9 526 Possiamo ora ordinare in una tabella i valori ottenuti: Anni 2006 2007 2008 2009 2010 2011 Autovetture vendute 526 593 634 667 702 899 Numeri indice 100 112,7 120,5 126,8 133,5 170,9 0 12,7% 20,5% 26,8% 33,5% 70,9% Variazione percentuale La statistica 10