Statistica La statistica è quella scienza che ha come scopo lo studio qualitativo e quantitativo dei fenomeni collettivi. La statistica si divide in due grandi settori: - Statistica descrittiva ha il compito di raccogliere, ordinare, riassumere i dati. - Inferenza statistica ha il compito di estendere i risultati ottenuti. La statistica trova impiego in diversi settori: Scienze demografiche, Scienze economiche, Fisica ……………….. Per fenomeno collettivo o statistico si intende quel fenomeno per il cui studio richiede la raccolta di numerosi osservazioni Un indagine statistica si effettua in varie fasi: 1. Definizione dell’obiettivo: definire lo scopo dell’indagine. 2. Individuazione del fenomeno: individuare il dato statistico per la risoluzione del problema; individuare il collettivo. 3. Rilevazione dei dati: a) Natura: qualitativi quantitativi b) Metodo di raccolta: Totale (Universo statistico) Parziale (Campione statistico) c) Tecnica: questionario-intervista quesiti a risposta aperta quesiti a risposta chiusa d) Istituti: ISTAT. Privati. 4) Spoglio e trascrizione: a) Enumerazione b) Classificazione dei dati ottenuti in classi omogenee c) Trascrizione in tabelle ( eliminando gli errori che si possono riscontrare). 5) Elaborazione e analisi: trasformazione dei dati delle tabelle in dati SINTETICI. 6) Interpretazione e divulgazione. I caratteri quantitativi: a) discreti ( assumono un numero finito di valori) b) continui (assumono un qualsiasi valore all’interno dell’intervallo). I caratteri quantitativi sono sempre ordinati. I caratteri qualitativi possono essere: - ordinati - sconnessi Caratteri quantitativi: Seriazioni. Caratteri qualitativi: Serie - Temporali o storiche - Geografiche o territoriali ERRORI Errori dipendono: - fenomeno - mezzi e strumenti - osservatore. Errori possono essere: - accidentali - sistematici. Errori possono essere: - campionari - imputazione(integrazione ad una risposta mancante o inesatta) - copertura (omissioni, duplicazioni, inclusioni improprie di unità statistiche) Misure di tendenza centrale Le misure più comuni sono: Primo gruppo • • • • Media aritmetica Media geometrica Media armonica Media quadratica Secondo gruppo • • Moda Mediana Le medie appartenenti al primo gruppo prendono il nome di medie ferme o medie analitiche in quanto tengono conto di tutti i valori della distribuzione. Le medie appartenenti al secondo gruppo prendono il nome di medie lasche o medie di posizione in quanto si ottengono scegliendo particolari elementi della distribuzione. Distribuzioni statistiche • Modalità: diversi modi di presentarsi di un carattere • Unità statistica: elemento su cui si svolge l’indagine statistica. • Universo statistico: l’insieme delle unità statistiche. • Campione statistico: sottoinsieme scelto dalla popolazione. Per effettuare lo studio di un fenomeno statistico si devono raggruppare in classi le diverse unità statistiche in modo da ottenere delle distribuzioni. In generale si parla di distribuzione statistica di frequenze ogni volta che si classifica una popolazione statistica in base ad uno o più caratteri e si suddividono le diverse unità a seconda delle classi cui appartengono. Se la distribuzione è secondo un solo carattere si usa una tabella semplice. semplice Se la distribuzione è secondo due caratteri si usa una tabella a doppia entrata. doppia Quando si costruisce la distribuzione statistica di un carattere qualitativo si dice che si classifica la mutabile statistica ad esso associata, intendendo con mutabile statistica l’insieme degli attributi secondo cui vengono classificate le unità statistiche. Quando si costruisce la distribuzione statistica di un carattere quantitativo si dice che si classifica la variabile statistica ( o variabile aleatoria) ad esso associata, intendendo con variabile statistica la grandezza che viene misurata in ciascuna unità statistiche. Misure Per evidenziare rapidamente le caratteristiche fondamentali di un fenomeno statistico è necessario procedere ad una sintesi al fine di ottenere delle <misure>del fenomeno visto nel suo insieme. L’uso di queste misure comporta, da una parte, la perdita di informazioni sui singoli dati, ma dall’altra una visione globale del fenomeno. Le misure più significative e semplici da calcolare sono: • • • • Misure di tendenza centrale, per esprimere sinteticamente qual è il centro della distribuzione. Misure di variabilità o dispersione, per dire se i dati sono più o meno dispersi attorno al centro. Misure di forma, per dire se la distribuzione è simmetrica rispetto ad un determinato valore e se è più o meno < appuntita>. Misure di concentrazione, per sapere se l’ammontare totale del carattere è equamente distribuito tra tutte le unità statistiche oppure concentrato in poche unità. Misure di tendenza centrale Le misure più comuni sono: Primo gruppo • • • • Media aritmetica Media geometrica Media armonica Media quadratica Secondo gruppo • • Moda Mediana Le medie appartenenti al primo gruppo prendono il nome di medie ferme o medie analitiche in quanto tengono conto di tutti i valori della distribuzione. Le medie appartenenti al secondo gruppo prendono il nome di medie lasche o medie di posizione in quanto si ottengono scegliendo particolari elementi della distribuzione. MISURE DI VARIABILITA’ , FORMA E CONCENTRAZIONE MISURE DI VARIABILITA’ • • • CAMPO DI VARIAZIONE SCARTO SEMPLICE MEDIO ASSOLUTO SCARTO QUADRATICO MEDIO E VARIANZA MISURE DI FORMA • • COEFFICIENTE DI ASIMMETRIA COEFFICIENTE DI CURTOSI DI PEARSON MISURE DI CONCENTRAZIONE • RAPPORTO DI CONCENTRAZIONE SCARTO QUADRATICO MEDIO E VARIANZA