Statistica
La statistica è
quella scienza che ha come scopo lo studio qualitativo e
quantitativo dei fenomeni collettivi.
La statistica si divide in due grandi settori:
- Statistica descrittiva ha il compito di raccogliere, ordinare, riassumere
i dati.
- Inferenza statistica ha il compito di estendere i risultati ottenuti.
La statistica trova impiego in diversi settori:
Scienze demografiche, Scienze economiche, Fisica ………………..
Per fenomeno collettivo o statistico si intende quel fenomeno per il cui
studio richiede la raccolta di numerosi osservazioni
Un indagine statistica si effettua in varie fasi:
1. Definizione dell’obiettivo: definire lo scopo dell’indagine.
2. Individuazione del fenomeno: individuare il dato statistico per la risoluzione del problema;
individuare il collettivo.
3. Rilevazione dei dati:
a) Natura:
qualitativi
quantitativi
b) Metodo di raccolta:
Totale (Universo statistico)
Parziale (Campione statistico)
c) Tecnica: questionario-intervista
quesiti a risposta aperta
quesiti a risposta chiusa
d) Istituti: ISTAT. Privati.
4) Spoglio e trascrizione:
a) Enumerazione
b) Classificazione dei dati ottenuti in classi omogenee
c) Trascrizione in tabelle ( eliminando gli errori che si possono
riscontrare).
5) Elaborazione e analisi: trasformazione dei dati delle tabelle in dati SINTETICI.
6) Interpretazione e divulgazione.
I caratteri quantitativi:
a) discreti ( assumono un numero finito di valori)
b) continui (assumono un qualsiasi valore all’interno
dell’intervallo).
I caratteri quantitativi sono sempre ordinati.
I caratteri qualitativi possono essere:
- ordinati
- sconnessi
Caratteri quantitativi: Seriazioni.
Caratteri qualitativi: Serie
- Temporali o storiche
- Geografiche o territoriali
ERRORI
Errori dipendono:
- fenomeno
- mezzi e strumenti
- osservatore.
Errori possono essere:
- accidentali
- sistematici.
Errori possono essere:
- campionari
- imputazione(integrazione ad una risposta mancante o inesatta)
- copertura (omissioni, duplicazioni, inclusioni improprie di unità
statistiche)
Misure di tendenza centrale
Le misure più comuni sono:
Primo gruppo
•
•
•
•
Media aritmetica
Media geometrica
Media armonica
Media quadratica
Secondo gruppo
•
•
Moda
Mediana
Le medie appartenenti al primo gruppo prendono il nome di medie ferme o medie
analitiche in quanto tengono conto di tutti i valori della distribuzione.
Le medie appartenenti al secondo gruppo prendono il nome di medie lasche o medie
di posizione in quanto si ottengono scegliendo particolari elementi della
distribuzione.
Distribuzioni statistiche
•
Modalità: diversi modi di presentarsi di un carattere
•
Unità statistica: elemento su cui si svolge l’indagine statistica.
•
Universo statistico: l’insieme delle unità statistiche.
•
Campione statistico: sottoinsieme scelto dalla popolazione.
Per effettuare lo studio di un fenomeno statistico si devono raggruppare in classi le diverse unità statistiche
in modo da ottenere delle distribuzioni.
In generale si parla di distribuzione statistica di frequenze ogni volta che si classifica una popolazione
statistica in base ad uno o più caratteri e si suddividono le diverse unità a seconda delle classi cui
appartengono.
Se la distribuzione è secondo un solo carattere si usa una tabella semplice.
semplice
Se la distribuzione è secondo due caratteri si usa una tabella a doppia entrata.
doppia
Quando si costruisce la distribuzione statistica di un carattere qualitativo si dice che si classifica la mutabile
statistica ad esso associata, intendendo con mutabile statistica l’insieme degli attributi secondo cui
vengono classificate le unità statistiche.
Quando si costruisce la distribuzione statistica di un carattere quantitativo si dice che si classifica la variabile
statistica ( o variabile aleatoria) ad esso associata, intendendo con variabile statistica la grandezza che
viene misurata in ciascuna unità statistiche.
Misure
Per evidenziare rapidamente le caratteristiche fondamentali di un fenomeno statistico è
necessario procedere ad una sintesi al fine di ottenere delle <misure>del fenomeno
visto nel suo insieme.
L’uso di queste misure comporta, da una parte, la perdita di informazioni sui singoli
dati, ma dall’altra una visione globale del fenomeno.
Le misure più significative e semplici da calcolare sono:
•
•
•
•
Misure di tendenza centrale, per esprimere sinteticamente qual è il centro della
distribuzione.
Misure di variabilità o dispersione, per dire se i dati sono più o meno dispersi
attorno al centro.
Misure di forma, per dire se la distribuzione è simmetrica rispetto ad un
determinato valore e se è più o meno < appuntita>.
Misure di concentrazione, per sapere se l’ammontare totale del carattere è
equamente distribuito tra tutte le unità statistiche oppure concentrato in poche
unità.
Misure di tendenza centrale
Le misure più comuni sono:
Primo gruppo
•
•
•
•
Media aritmetica
Media geometrica
Media armonica
Media quadratica
Secondo gruppo
•
•
Moda
Mediana
Le medie appartenenti al primo gruppo prendono il nome di medie ferme o medie
analitiche in quanto tengono conto di tutti i valori della distribuzione.
Le medie appartenenti al secondo gruppo prendono il nome di medie lasche o medie
di posizione in quanto si ottengono scegliendo particolari elementi della
distribuzione.
MISURE DI VARIABILITA’ , FORMA E CONCENTRAZIONE
MISURE DI VARIABILITA’
•
•
•
CAMPO DI VARIAZIONE
SCARTO SEMPLICE MEDIO ASSOLUTO
SCARTO QUADRATICO MEDIO E VARIANZA
MISURE DI FORMA
•
•
COEFFICIENTE DI ASIMMETRIA
COEFFICIENTE DI CURTOSI DI PEARSON
MISURE DI CONCENTRAZIONE
•
RAPPORTO DI CONCENTRAZIONE
SCARTO QUADRATICO MEDIO E
VARIANZA