LA STATISTICA Introduzione Ogni giorno, attraverso la televisione ed i quotidiani, siamo investiti da una grande quantità di informazioni che riguardano molteplici argomenti e che ci vengono trasmesse mediante grafici, classifiche, tabelle, indici: Risultati di elezioni politiche Dati di ascolto Auditel di coloro che in un certo orario seguivano una certa trasmissione RAI Risultati riguardanti la sperimentazione di un certo farmaco fatti da una ditta specializzata Classifica squadre di un certo sport: calcio, basket, pallavolo … Prezzi per effettuare un viaggio in una data località in un certa data (Londra, a Natale, per 7 giorni) Costo gestore di Posta (WIND / TIM / Vodafone) per cellulare o per telefonia fissa Molte scelte che operiamo nella nostra vita quotidiana sono basate sulle informazioni che possediamo e sono condizionate da esse, per cui è importante comprendere (decodificare) tali informazioni per effettuare scelte migliori, per noi più vantaggiose. La scienza che si occupa di come si raccolgono le informazioni su un fenomeno collettivo ( riguardante molte persone o cose) e di come si organizzano, si analizzano e si interpretano, utilizzando metodi e strumenti matematici, è la STATISTICA. L’oggetto della statistica, pertanto, è lo studio quantitativo (cioè tramite gli strumenti della matematica) di fenomeni collettivi (ossia riguardanti più individui) osservabili nella realtà sociale, in natura o in laboratorio. Modalità rappresentazione dei dati Grafici, percentuali, tabelle… Risultati ultime elezioni Politiche: Forza Italia 30 P.D. 40 Grillo 20 Altri 10 Voti in % Voti in % 40 35 30 25 PD 20 Voti in % F. Italia Grillo 15 Altri 10 5 0 PD F. Italia Grillo Altri Ascolti Auditel: l’altra sera, tra le 20.00 e le 21.00 il 50% di coloro che avevano la televisione accesa seguiva i programmi RAI, il 20% Mediaset, il rimanente 30% altro . Torneo di calcio serie A Catania 20 Inter 18 Juventus 16 Milan 16 Linguaggio della STATISTICA Popolazione (o Universo collettivo) Unità statistica Campione Carattere Quantitativi e Qualitativi Modalità Dati Popolazione statistica e carattere Si definisce statistica la scienza che ha per oggetto la raccolta, l’analisi e l’interpretazione dei dati riguardanti un determinato fenomeno collettivo, (cioè su un avvenimento o una situazione che riguarda molte persone o cose) ed esprimibili con un numero. L’insieme degli elementi (persone o cose), sul quale viene svolta l’indagine si chiama popolazione statistica. Ciascuno degli elementi di una popolazione statistica si chiama unità statistica. Esempio di popolazione statistica: gli abitanti di una regione, gli alunni di una scuola, le automobili vendute nell’anno 2010. In alcune indagini statistiche è possibile interpellare tutti i membri della popolazione; in altri casi, per motivi di costi e di tempi, bisogna limitarsi a sottoporre le domande o le richieste di informazioni solo ad una parte della popolazione, che si chiama campione. Affinché i risultati del campione possano estendersi, senza effettuare errori, alla popolazione occorre che il campione sia rappresentativo e significativo, cioè sia ben scelto. Esempio di popolazione statistica: gli abitanti di una regione, gli alunni di una scuola, le automobili vendute nell’anno 2010. L’unità statistica è, negli esempi fatti, rispettivamente: un abitante di una regione, un alunno della scuola, un’auto venduta nel 2010. _______________________________ Ogni aspetto o caratteristica della popolazione statistica su cui si effettua un’indagine statistica si dice carattere o variabile statistica (quindi il carattere è la proprietà che è oggetto di studio in un’indagine statistica); Per esempio: il peso o il colore degli occhi degli studenti del nostro Liceo sono possibili caratteri di un’indagine. Ciascun carattere si manifesta con modalità diverse ed è necessario stabilire quali di esse sono oggetto dell’indagine . Ad esempio, se la popolazione statistica è costituita dagli alunni di una scuola, può essere oggetto d’indagine il carattere “colore dei capelli”, stabilendo che le modalità da analizzare sono: nero, biondo, castano, rosso; il carattere peso, invece, può assumere, in corrispondenza di un dato individuo, la modalità 72Kg, in corrispondenza di un altro individuo la modalità 80 Kg e così via. Si chiama modalità ciascuna delle varianti con cui un carattere può presentarsi; Le modalità osservate/misurate si chiamano dati statistici. Se 10 persone presentano il colore: nero, rosso, nero, castano, nero, rosso, nero, castano, biondo, rosso, ciascuno rappresenta un dato, per cui abbiamo 10 dati statistici. CARATTERI I caratteri di una popolazione statistica si possono distinguere in due tipi: 1. Caratteri qualitativi (o mutabili), le cui modalità non sono espresse da numeri, ma sono espresse da aggettivi o sostantivi, come il colore dei capelli, il titolo di studio, lo sport praticato, la nazionalità, … ; 2. Caratteri quantitativi (o variabili), le cui modalità sono espresse da numeri. CARATTERI Caratteri quantitativi Caratteri qualitativi I giorni di assenza di uno Il gusto di gelato preferito studente in un anno scolastico La quantità, in kilogrammi, di Il tipo di alimentazione mele vendute da un negozio (benzina o diesel) delle auto in un giorno in un dato parcheggio Il numero di multe dato in un giorno dai vigili di una città Il colore delle automobili vendute da un concessionario in un dato giorno Caratteri quantitativi I caratteri quantitativi (o variabili) si possono, a loro volta, suddividere in due categorie: a) caratteri discreti, se le modalità sono espresse da numeri naturali, come l’età, il numero dei componenti dalla famiglia, il voto ottenuto agli Esami di Stato, … , cioè può assumere soltanto un numero finito di valori; b) caratteri continui, se le modalità sono espresse da numeri reali che derivano da misurazioni, come la statura (1,72 cm), il peso (48,6 Kg), il tempo impiegato (2h e 20 min ), …, cioè può assumere (almeno in teoria) tutti i valori reali di un determinato intervallo. Tipicamente i caratteri discreti sono quelli che si rilevano contando (per esempio il numero dei figli in una famiglia o il numero dei dipendenti di un’azienda), mentre i caratteri continui sono quelli che si rilevano mediante misurazioni ( per esempio il peso di una persona di una certa età o la temperatura massima giornaliera registrata a Catania in un dato giorno) ESEMPI RIASSUNTIVI Fenomeno Studiato Popolazione Carattere Modalità Tipo di carattere L’anno di nascita dei metri) catanesi Gli alunni del Studenti della Gli abitanti di Liceo classe Catania Il colore degli La misura L’anno di occhi dell’altezza nascita Il colore degli Altezza (misurata in occhi Verdi, azzurri, Per esempio: marrone 1,72m;1,85m; 1,78m … Qualitativo Quantitativo continuo 1970 ; 1981; 1960; 1940 Quantitativo discreto Esempio Esempio Consideriamo l’indagine sul mezzo di trasporto usato dai dipendenti di un’azienda per recarsi al lavoro e sul tempo da loro impiegato. La popolazione statistica è ……………. L’unità statistica è ……………… I caratteri presi in esame sono: a) ……..….. , che è un carattere di tipo …………… e si possono stabilire …….. Modalità: a) …………. , che è un carattere di tipo …………… e si possono stabilire …….. Modalità: Esempio Esempio Consideriamo l’indagine sul mezzo di trasporto usato dai dipendenti di un’azienda per recarsi al lavoro e sul tempo da loro impiegato. La popolazione statistica è: l’insieme dei dipendenti. L’unità statistica è: ciascun dipendente. I caratteri presi in esame sono: a) il mezzo di trasporto usato, che è un carattere di tipo qualitativo, del quale si possono stabilire, ad esempio, quattro Modalità: auto, bus, moto, bicicletta; b) il tempo impiegato, che è un carattere di tipo quantitativo continuo, del quale si possono, ad esempio, stabilire quattro Modalità: meno di 15 minuti, tra 15 e 30 minuti, tra 30 e 45 minuti , più di 45 minuti. ESERCIZI Nell’esame degli studenti che hanno superato gli esami di Stato in una data scuola si esegue un’indagine statistica che ha per oggetto il voto conseguito. Indica, per questa indagine statistica: la popolazione, il carattere, alcune possibili modalità del carattere. Stabilisci poi se il carattere è quantitativo o qualitativo; in caso quantitativo se è discreto o continuo. FASI INDAGINE STATISTICA Una indagine statistica è un processo complesso suddiviso in più fasi. Ecco, in sintesi, un elenco delle principali: Pianificazione dell’indagine statistica Raccolta dati o Rilevazione dei dati Organizzazione dei dati Elaborazione dei dati PIANIFICAZIONE Si individuano: il carattere che interessa studiare; la popolazione (o eventualmente il campione) su cui si intende studiare tale carattere. Fissata la popolazione (o il campione), restano individuate anche le unità statistiche su cui possono essere osservate le varie modalità del carattere oggetto di studio RACCOLTA dei DATI La rilevazione dei dati può avvenire in modi differenti, principalmente attraverso due metodi diretti: a) l’intervista: si richiedono le informazioni direttamente agli interessati, ascoltandone le risposte ed annotandole; b) Il questionario: si recapitano a ciascun interessato uno o più fogli con le domande e si ritirano dopo che sono stati compilati. Il questionario può essere a risposta chiusa o a risposta aperta La raccolta dei dati con i metodi diretti può essere completa, se effettuata per tutta la popolazione statistica o per campione se viene effettuata solamente su una parte della popolazione. RACCOLTA dei DATI N.B. La raccolta dei dati completa è costosa e richiede molto tempo. I risultati dell’indagine ottenuti sul campione vengono poi rapportati a tutta la popolazione statistica. E’ assolutamente necessario che il campione venga scelto in modo corretto, che sia cioè rappresentativo della popolazione statistica; pertanto deve avere le seguenti caratteristiche fondamentali: a) Essere sufficientemente ampio; b) Rappresentare proporzionalmente tutte le componenti della popolazione su cui si effettua l’indagine. RACCOLTA dei Dati Esempio La Rai per conoscere il gradimento di uno spettacolo televisivo, non intervista tutti i suoi abbonati, ma solo un campione molto limitato, per avere subito i risultati. Tale campione può essere composto anche solo da100 abbonati, ma in esso devono essere presenti uomini e donne, giovani ed anziani, disoccupati, occupati e pensionati, persone del Nord, del Centro, del Sud e delle Isole, abitanti di città grandi e piccole, … ORGANIZZAZIONE dei dati In questa fase si costruiscono tabelle, diagrammi o grafici in modo che i dati possano essere letti, organizzati ed interpretati agevolmente ELABORAZIONE dei DATI L’obiettivo di questa fase è di fare emergere da un grande quantità di dati le informazioni che interessano. La parte della statistica che si occupa delle tecniche volte a sintetizzare i dati raccolti attraverso il calcolo di pochi numeri significativi si chiama statistica descrittiva. Se i dati sono stati rilevati su di un campione, occorre poi porsi l’obiettivo di estenderli all’intera popolazione; la parte della statistica che si occupa delle tecniche adatte a questi scopi si chiama statistica inferenziale. INTERPRETAZIONE dei Risultati L’interpretazione dei risultati non è sempre immediata e richiede un attento esame del contesto per evitare conclusioni affrettate ed inesatte. E’ buona norma fare chiare distinzioni fra i dati oggettivi rilevati nel corso dell’indagine e le interpretazioni soggettive dei dati.