Appunti di Statistica STATISTICA La statistica consiste in un metodo generale di raccolta, studio ed elaborazione di dati relativi a fenomeni collettivi, applicato a tutte le scienze sociali e naturali, ed è uno dei principali rami della matematica. Il censimento è un’indagine statistica per avere dati completi e aggiornati su argomenti di interesse generale come popolazione, industria, commercio ecc. La popolazione statistica è l’insieme di elementi oggetto di un’indagine statistica. Ogni elemento dell’insieme viene detto unità statistica. Carattere statistico: -qualitativo: se è espresso a parole (es. la razza di un cavallo); -quantitativo: se è espresso mediante numeri (es. il numero di fratelli e sorelle) Frequenza: è il numero di unità statistiche che presentano un certo carattere. Tabella statistica: è una tabella che riporta i risultati finali di un’indagine statistica, cioè un carattere, nelle sue varie modalità, e le frequenze o le intensità corrispondenti. Es. 1) popolazione residente in Italia, al 1° gennaio 2000, fra gli 11 e i 14 anni Età (carattere) 11 (modalità) 12 13 14 Totale Maschi 296375 287887 288613 298038 1170913 Femmine 280015 272126 273020 283718 1108879 Totale 576390 560013 561633 581756 2279792 Serie storica: è una tabella che raccoglie dati sull’evoluzione di un fenomeno nel tempo. I valori centrali: moda – mediana - media Moda: è il valore, se esiste, che si ripete con maggior frequenza nel gruppo. La moda non esiste quando ogni valore si presenta una sola volta. Mediana: in un numero dispari di valori ordinati la mediana è in posizione centrale; in un numero pari di valori la mediana è data dalla semisomma dei due valori centrali. Es. 2) statura di un campione di persone adulte in cm 170; 175; 177; 179; 153; 167; 155; 180; 181; 171; 182; 178; 168; 162; 185; 165; 168; 178;188. Mediana=175, infatti essendo la distribuzione formata da un numero dispari di elementi la mediana è il valore centrale tra quelli ordinati (incluse eventuali ripetizioni) 153; 155; 162; 165; 167; 168; 168; 170; 171; 175; 177; 178; 178; 179; 180; 181; 182; 185; 188 Media: la media aritmetica di un insieme di valori è il quoziente tra la somma di valori e il numero dei valori x + x 2 + ... + x n M = 1 . n Insegnante Irene Di Luca PDF created with pdfFactory Pro trial version www.pdffactory.com classi 1^H-1^I-1^G Appunti di Statistica Se si conosce la frequenza f i di ciascun valore, allora la media aritmetica è data dalla seguente formula f1 ⋅ x1 + f 2 ⋅ x 2 + ... + f n ⋅ x n f1 + f 2 + ... + f n La media aritmetica esiste soltanto per i caratteri quantitativi. M = Confronto tra media, mediana e moda: la mediana non cambia, se si aumentano i valori maggiori della distribuzione, o se si diminuiscono i valori minimi. Fra media, mediana e moda, la media è l’unico dei tre che tiene conto di tutti gli elementi della distribuzione. Grafici molto utilizzati in statistica Istogramma: E’ la rappresentazione grafica di una distribuzione di frequenze rispetto ad un carattere quantitativo “continuo”; ogni classe è rappresentata da una striscia, la cui area (cosa che excel base non è in grado di fare senza un particolare componente aggiuntivo) rappresenta la frequenza della classe. Ritornando all’es.2 raggruppando in classi di 10 cm a partire da 170 cm si ottiene il seguente istogramma classe [150;160) [160; 170) [170; 180) [180; 190) frequenza 2 5 7 5 Statura di campione di persone adulte in cm 8 7 7 6 5 5 5 4 3 2 2 1 0 [150;160) [160; 170) [170; 180) [180; 190) Continuo è un carattere che va rilevato con una misurazione (es area, peso, tempo…) Si contrappone a discreto che è un carattere rilevato con un conteggio (numero di figli, numero di biglietti dell’autobus ecc) Aerogramma o diagramma a torta: rappresenta la composizione di un dato fenomeno; il cerchio viene suddiviso in settori circolari, ciascuno dei quali rappresenta una modalità osservata. L’ampiezza dell’angolo al centro di ogni settore è direttamente proporzionale alla frequenza. Insegnante Irene Di Luca PDF created with pdfFactory Pro trial version www.pdffactory.com classi 1^H-1^I-1^G Appunti di Statistica Ritornando all’es 1) supponiamo di voler riportare in un diagramma a torta il numero dei maschi tra gli 11 e i 14 anni (si potrebbe fare un grafico analogo per la ripartizione delle femmine nella stessa fascia di età oppure si potrebbe pensare di fare una ripartizione del totale tra maschi e femmine ecc) Maschi tra gli 11 e i 14 anni (al 1° gennaio 2000) 11; 22% 14; 28% 12; 24% 13; 26% Insegnante Irene Di Luca PDF created with pdfFactory Pro trial version www.pdffactory.com classi 1^H-1^I-1^G