1. Intro e definizione degli oggetti della Statistica L18

Appunti di Statistica Sociale
Università “Kore” di Enna
La STATISTICA consente di acquisire conoscenza sui fenomeni (variabili) economici e sociali,
attraverso la raccolta e l’analisi di informazioni (dati), che assumono prevalentemente formato
numerico.
OBIETTIVO PRIMARIO della Statistica è spiegare la variabilità osservata nei fenomeni studiati.
Per far ciò è necessario osservare, ovvero misurare le diverse caratteristiche o stati (fenomeni
qualitativi) e/o le diverse intensità (fenomeni quantitativi) con le quali il fenomeno, o i fenomeni
studiati si manifestano sugli oggetti/soggetti (unità statistiche) in esame.
Misurare in Statistica significa assegnare numeri, secondo una regola standard, ai diversi
stati/intensità dei fenomeni.
Il processo di misurazione conduce a misure espresse prevalentemente sotto forma di modalità
numeriche assegnate agli oggetti/soggetti, in funzione degli stati/intensità dei fenomeni possedute.
È di fondamentale importanza trattare le modalità, tenendo conto delle proprietà matematiche di cui
godono i numeri assegnati alle unità statistiche (gli oggetti/soggetti).
L’obiettivo si persegue in step successivi:
- formazione dei dati attraverso la rilevazione;
- organizzazione dei dati in distribuzioni di frequenza;
- elaborazione/analisi dei dati attraverso la sintesi numerica e
- rappresentazione grafica della forma della distribuzione;
- diffusione dei risultati.
In relazione al numero di fenomeni studiati (un solo fenomeno) simultaneamente (due o più
fenomeni), ci si muove in ambito di statistica:
• univariata;
• bivariata (o multi).
In relazione alla provenienza delle informazioni, se censuarie, ovvero da un’intera popolazione, o
campionarie, ovvero da un sottoinsieme della popolazione (detto campione), la statistica può essere:
• descrittiva;
• inferenziale.
1
Appunti di Statistica Sociale
Università “Kore” di Enna
ALCUNI CONCETTI FONDAMENTALI
VARIABILE: è la manifestazione del fenomeno oggetto di studio, misurabile su una scala predefinita.
Le variabili possono essere essenzialmente di due tipi:
- qualitative, le cui manifestazioni sono stati o caratteristiche;
- quantitative, le cui manifestazioni sono intensità (numeri).
UNITÀ STATISTICA: è qualsiasi elemento portatore della variabile, o delle variabili in esame. Su
ciascuna unità statistica (us) si può rilevare:
- una sola variabile (statistica univariata);
- due variabili simultaneamente (statistica bivariata)
- tre o più variabili simultaneamente (statistica multivariata).
OSSERVAZIONE: è la manifestazione dell’intensità (numerica, se la variabile è quantitativa), o dello
stato (non numerica, se la variabile è qualitativa) del fenomeno, effettivamente rilevata sulle unità
statistiche:
X
variabile
MODALITÀ:
⇒
⇒
(x1, x2, …, xN)
osservazioni
è l’insieme di stati o intensità della variabile effettivamente distinti tra loro.
DISTRIBUZIONE: è l’insieme di osservazioni, opportunamente organizzate.
2
Appunti di Statistica Sociale
Università “Kore” di Enna
IN AMBITO DI STATISTICA DESCRITTIVA
POPOLAZIONE, o UNIVERSO: è l’insieme di tutte le possibili unità statistiche portatrici delle
caratteristiche in studio.
ANALISI DESCRITTIVA SI CONDUCE attraverso
la:
- sintesi numerica: cioè il calcolo dei parametri della popolazione, quali la media (µ,),
la varianza (σ2) e lo scarto quadratico medio (σ);
- rappresentazione grafica della forma della distribuzione del fenomeno nella
popolazione.
La statistica descrittiva raccoglie le informazioni sulla popolazione, le organizza in distribuzioni
semplici (univariate), o complesse (almeno bivariate), le sintetizza numericamente attraverso indici
di posizione (o di tendenza centrale), indici di variabilità e di forma, o rapporti statistici; infine, ne
rappresenta graficamente le principali caratteristiche.
I risultati ottenuti dalla statistica descrittiva si definiscono certi.
IN AMBITO DI STATISTICA INFERENZIALE
CAMPIONE: è un sottoinsieme di unità statistiche, opportunamente estratte dalla popolazione, in base
ad un dato schema di campionamento.
ANALISI INFERENZIALE attraverso la:
- sintesi numerica: cioè il calcolo delle stime campionarie, quali la media ( x ), la
varianza (s2) e la deviazione standard (s);
- rappresentazione grafica della forma della distribuzione del fenomeno nel campione.
L'inferenza statistica è il procedimento per cui si inducono le caratteristiche di una popolazione
dall'osservazione di una parte di essa, detta campione, selezionata solitamente mediante un
esperimento casuale (o aleatorio), detto schema di campionamento.
Il CAMPIONE può essere:
- probabilistico;
- non probabilistico.
In ambito statistico col termine “campione” ci si riferisce generalmente a quello probabilistico.
3
Appunti di Statistica Sociale
Università “Kore” di Enna
SINTESI NUMERICA
INDICI DI POSIZIONE O DI TENDENZA CENTRALE
- moda (M0);
Medie lasche, o quantili:
- mediana (Me); quartili (Q1, Q2, Q3), percentili (p1, p2, …, p50, …, p99);
-
Medie analitiche:
media aritmetica (µ);
media geometrica (µg);
media quadratica (µq);
media armonica (µA).
INDICI DI VARIABILITÀ ASSOLUTA
Gli indici di variabilità assoluta più diffusi sono:
- il Range (R);
- la Differenza Interquartile (DI);
- l’indice di Gini (S);
- l’indice di Entropia (H);
- la Varianza (σ2);
- lo scarto quadratico medio (σ);
- il rapporto di concentrazione (R).
4