Appunti di Statistica Sociale Università “Kore” di Enna La STATISTICA consente di acquisire conoscenza sui fenomeni (variabili) economici e sociali, attraverso la raccolta e l’analisi di informazioni (dati), che assumono prevalentemente formato numerico. OBIETTIVO PRIMARIO della Statistica è spiegare la variabilità osservata nei fenomeni studiati. Per far ciò è necessario osservare, ovvero misurare le diverse caratteristiche o stati (fenomeni qualitativi) e/o le diverse intensità (fenomeni quantitativi) con le quali il fenomeno, o i fenomeni studiati si manifestano sugli oggetti/soggetti (unità statistiche) in esame. Misurare in Statistica significa assegnare numeri, secondo una regola standard, ai diversi stati/intensità dei fenomeni. Il processo di misurazione conduce a misure espresse prevalentemente sotto forma di modalità numeriche assegnate agli oggetti/soggetti, in funzione degli stati/intensità dei fenomeni possedute. È di fondamentale importanza trattare le modalità, tenendo conto delle proprietà matematiche di cui godono i numeri assegnati alle unità statistiche (gli oggetti/soggetti). L’obiettivo si persegue in step successivi: - formazione dei dati attraverso la rilevazione; - organizzazione dei dati in distribuzioni di frequenza; - elaborazione/analisi dei dati attraverso la sintesi numerica e - rappresentazione grafica della forma della distribuzione; - diffusione dei risultati. In relazione al numero di fenomeni studiati (un solo fenomeno) simultaneamente (due o più fenomeni), ci si muove in ambito di statistica: • univariata; • bivariata (o multi). In relazione alla provenienza delle informazioni, se censuarie, ovvero da un’intera popolazione, o campionarie, ovvero da un sottoinsieme della popolazione (detto campione), la statistica può essere: • descrittiva; • inferenziale. Docente: Fabio Aiello 1 Appunti di Statistica Sociale Università “Kore” di Enna ALCUNI CONCETTI FONDAMENTALI VARIABILE: è la manifestazione del fenomeno oggetto di studio, misurabile su una scala predefinita. Le variabili possono essere essenzialmente di due tipi: - qualitative, le cui manifestazioni sono stati o caratteristiche; - quantitative, le cui manifestazioni sono intensità (numeri). UNITÀ STATISTICA: è qualsiasi elemento portatore della variabile, o delle variabili in esame. Su ciascuna unità statistica (us) si può rilevare: - una sola variabile (statistica univariata); - due variabili simultaneamente (statistica bivariata) - tre o più variabili simultaneamente (statistica multivariata). OSSERVAZIONE: è la manifestazione dell’intensità (numerica, se la variabile è quantitativa), o dello stato (non numerica, se la variabile è qualitativa) del fenomeno, effettivamente rilevata sulle unità statistiche: X variabile MODALITÀ: ⇒ ⇒ (x1, x2, …, xN) osservazioni è l’insieme di stati o intensità della variabile effettivamente distinti tra loro. DISTRIBUZIONE: è l’insieme di osservazioni, opportunamente organizzate. Docente: Fabio Aiello 2 Appunti di Statistica Sociale Università “Kore” di Enna IN AMBITO DI STATISTICA DESCRITTIVA POPOLAZIONE, o UNIVERSO: è l’insieme di tutte le possibili unità statistiche portatrici delle caratteristiche in studio. ANALISI DESCRITTIVA SI CONDUCE attraverso la: - sintesi numerica: cioè il calcolo dei parametri della popolazione, quali la media (µ,), la varianza (σ2) e lo scarto quadratico medio (σ); - rappresentazione grafica della forma della distribuzione del fenomeno nella popolazione. La statistica descrittiva raccoglie le informazioni sulla popolazione, le organizza in distribuzioni semplici (univariate), o complesse (almeno bivariate), le sintetizza numericamente attraverso indici di posizione (o di tendenza centrale), indici di variabilità e di forma, o rapporti statistici; infine, ne rappresenta graficamente le principali caratteristiche. I risultati ottenuti dalla statistica descrittiva si definiscono certi. IN AMBITO DI STATISTICA INFERENZIALE CAMPIONE: è un sottoinsieme di unità statistiche, opportunamente estratte dalla popolazione, in base ad un dato schema di campionamento. ANALISI INFERENZIALE attraverso la: - sintesi numerica: cioè il calcolo delle stime campionarie, quali la media ( x ), la varianza (s2) e la deviazione standard (s); - rappresentazione grafica della forma della distribuzione del fenomeno nel campione. L'inferenza statistica è il procedimento per cui si inducono le caratteristiche di una popolazione dall'osservazione di una parte di essa, detta campione, selezionata solitamente mediante un esperimento casuale (o aleatorio), detto schema di campionamento. Il CAMPIONE può essere: - probabilistico; - non probabilistico. In ambito statistico col termine “campione” ci si riferisce generalmente a quello probabilistico. Docente: Fabio Aiello 3 Appunti di Statistica Sociale Università “Kore” di Enna SINTESI NUMERICA INDICI DI POSIZIONE O DI TENDENZA CENTRALE - moda (M0); Medie lasche, o quantili: - mediana (Me); quartili (Q1, Q2, Q3), percentili (p1, p2, …, p50, …, p99); - Medie analitiche: media aritmetica (µ); media geometrica (µg); media quadratica (µq); media armonica (µA). INDICI DI VARIABILITÀ ASSOLUTA Gli indici di variabilità assoluta più diffusi sono: - il Range (R); - la Differenza Interquartile (DI); - l’indice di Gini (S); - l’indice di Entropia (H); - la Varianza (σ2); - lo scarto quadratico medio (σ); - il rapporto di concentrazione (R). Docente: Fabio Aiello 4