“PRINCIPI DI STATISTICA”
PROF. GIOVANNI DI TRAPANI
Università telematica Pegaso
Principi di statistica
Indice
1
PREMESSA ---------------------------------------------------------------------------------------------------------------------- 3
2
LA STATISTICA --------------------------------------------------------------------------------------------------------------- 4
2.1.
BREVI CENNI NORMATIVI SULLA STATISTICA NELLA COMUNITÀ EUROPEA. ----------------------------------------- 5
3
L’INFORMAZIONE STATISTICA. --------------------------------------------------------------------------------------- 6
4
CONCETTI STATISTICI GENERALI ----------------------------------------------------------------------------------- 7
4.1
4.2
4.3
4.4
4.5
4.6
LE RILEVAZIONI STATISTICHE --------------------------------------------------------------------------------------------------- 8
POPOLAZIONE, CAMPIONE E UNITÀ STATISTICHE. --------------------------------------------------------------------------- 8
LE TIPOLOGIE DELL’INFORMAZIONE STATISTICA. ---------------------------------------------------------------------------- 9
LE MUTABILI ---------------------------------------------------------------------------------------------------------------------10
LE VARIABILI ---------------------------------------------------------------------------------------------------------------------11
LE SERIE STORICHE E LE SERIE CICLICHE. ------------------------------------------------------------------------------------11
Pag. 2
Università telematica Pegaso
Principi di statistica
1 Premessa
In questa lezione affronteremo alcuni concetti chiave della statistica. Dopo una prima breve
definizione della Statistica e dei suoi obiettivi primari, analizzeremo i presupposti normativi della
Statistica nella Comunità Europea.
Successivamente definiremo l’informazione Statistica e i suoi requisiti. Si passerà poi ad
una panoramica circa concetti generali delle statistiche; affrontando allora da un lato le rilevazioni;
ed in quest’ambito passeremo ad analizzare i concetti fondamentali di Popolazione, Campione ed
Unità Statistica. Infine sarà preso in esame lo studio delle diverse tipologie delle informazioni
statistiche riferite alle Mutabili ed alle Variabili.
Pag. 3
Università telematica Pegaso
Principi di statistica
2 La Statistica
Prima di passare ai temi ed ai concetti fondamentali per le applicazioni che saranno
affrontate più avanti si ritiene opportuno, in questa seconda lezione, fornire alcune definizioni
relativi al termine stesso di Statistica. A tale scopo si riporta la definizione di Zani il quale si
esprime in questi termini: “La statistica è il metodo per la raccolta, la classificazione,
l’elaborazione, l’analisi, dei dati utilizzati nelle scienze empiriche e per la generalizzazione dei
risultati, in termini probabilistici, ai casi non osservati”. Per completezza appare utile citare anche
Romanico Piccolo il quale brevemente definisce la Statistica come la “Scienza delle decisioni in
condizione di incertezza, … che sull’esperienza e sulle evidenze empiriche”. La caratteristica
principale, allora, della Statistica è che non può prescindere dall’osservazione di dati e di fatti,
un’osservazione m che però deve seguire delle regole ben precise che sono attinenti sia alla
raccolta dei dati sia alla gestione delle informazioni.
Con i concetti sopra esposti introduciamo l’indagine statistica (o esperimento statistico)
che si basa proprio sull’osservazione dei fenomeni i quali possono manifestarsi evidentemente in
modalità diverse. Utile ai fini dello studio delle nozioni di base della statistica è il metodo
statistico, assumendo come proprio il criterio induttivo.
Tale Criterio induttivo opera attraverso l’analisi dei fenomeni collettivi allo scopo di
ricavare, pur nella varietà delle singole manifestazioni le leggi soggiacenti ai fenomeni stessi in
modo da evidenziarne eventuali regolarità e trarre anche delle previsioni.
La Statistica è quindi la disciplina che studia i fenomeni collettivi di qualsivoglia natura la
cui misura richiede la disponibilità di una massa di osservazioni individuali, e mira
all’acquisizione, alla classificazione dei dati singoli, alla loro sintesi, per la formulazione di ipotesi
e teorie circa i meccanismi di regolazione dei fenomeni stessi.
La Statistica si divide i due importanti ambiti di analisi:
-
la Statistica descrittiva;
-
la Statistica inferenziale.
La prima, la Statistica descrittiva, rappresenta l’insieme delle metodologie di analisi che si
prefiggono la descrizione di determinati fenomeni; la seconda, la Statistica inferenziale, invece
comporta processi di inferenza in probabilità per l’interpretazione dei risultati dell’analisi. Si
tratterrà, allora, dall’osservazione di un certo numero di casi, di ricavarne la cosi detta legge del
fenomeno, ovvero di “generalizzare” i risultati.
Pag. 4
Università telematica Pegaso
Principi di statistica
Dopo questa descrizione dei concetti base della Statistica riteniamo necessario sintetizzare
brevemente illustrare le proposizioni che la Statistica intende suggerire; a tal proposito possiamo
affermare che, circa determinate informazioni la Statistica, si propone di:
-
Raccogliere;
-
Sintetizzare;
-
Interpretare.
In conclusione la Statistica, raccogliendo le informazioni di cui si compone il fenomeno
oggetto di studio, sintetizza in dati riassuntivi al fine di interpretarne i fattori che li influenzano e
gli effetti che ne derivano.
2.1.
Brevi cenni normativi sulla Statistica nella Comunità
Europea.
Il costante processo di integrazione dei Paesi membri alla Comunità Europea ha fatto si che
tra gli argomenti di discussione del trattato istitutivo dell’Unione rientrasse anche la statistica che
costituisce un importante strumento di programmazione economica e sociale. Lo scopo era quello
di dotare la Comunità europea di informazioni statistica UFFICIALI; in quanto rappresenta un
requisito “essenziale per lo sviluppo economico, demografico, sociale e ambientale nonché per la
reciproca conoscenza e per il commercio tra gli Stati e i popoli della regione”.
La nascita della Statistica ufficiale in Europa risale al 2 ottobre 1997 con l’adozione del
trattato di Amsterdam, e con l’art. 285 di questo trattato le statistiche comunitarie assumono un
valore costituzionale. Le basi normative della statistica ufficiale europea vengono sancite con il
Regolamento n. 322/97, con il quale si organizza, in modo sistematico, la produzione di statistiche
comunitarie. Il trattato di Amsterdam ha voluto definire alcune regole generali per la Statistica e
l’art. 285 così ne sintetizza i principi:
“La produzione delle statistiche comunitarie dovrà conformarsi ai principi di imparzialità,
affidabilità, obiettività, indipendenza scientifica, efficacia e riservatezza; gli operatori economici
non dovranno essere gravati da eccessivo onere statistico”
In conclusione, possiamo affidare una Funzione sociale alla Statistica in quanto è oramai
pienamente condiviso che ogni società evoluta necessita di informazioni economico-statistiche
indipendenti, attendibili, imparziali, trasparenti ed accessibili, in grado di descrivere le condizioni
ed i cambiamenti che avvengono in essa.
Pag. 5
Università telematica Pegaso
Principi di statistica
3 L’Informazione Statistica.
La questione preliminare allo sviluppo di una indagine e all’utilizzo delle fonti riguarda la
qualità dell'informazione statistica. Volendo semplificare, possiamo identificare le seguenti
importanti dimensioni della qualità, che comunque le svilupperemo nelle lezioni successive:
-
pertinenza o efficacia
-
accuratezza
-
tempestività
-
regolarità
-
accessibilità
-
chiarezza
-
comparabilità
-
coerenza
-
completezza
-
affidabilità
Passiamo allora a illustrane il significato di ciascun requisito dell’informazione statistica:
Pertinenza o efficacia indica la capacità delle informazioni a soddisfare gli obiettivi conoscitivi
dell’indagine. L’accuratezza indica la capacità delle stime di avvicinarsi ai valori incogniti della
popolazione. Con la tempestività si indica il tempo che intercorre tra la rilevazione dei dati e la
loro disponibilità, in altre parole è connessa alla possibilità per gli utenti finali di disporre di dati
aggiornati.
Relativamente alla regolarità possiamo affermare che indica la frequenza con cui il dato
viene diffuso, mentre con il requisito dell’accessibilità ci si riferisce alla reperibilità e quindi alla
possibilità offerta agli utilizzatori di utilizzare le informazioni. Ancora con il termine chiarezza
riguarda la modalità espositiva attraverso le quali è stata condotta un indagine statistica.
Per quanto riguarda il requisito della comparabilità, questa esiste se è assicurata la
possibilità di effettuare confronti omogenei nel tempo e nello spazio, per coerenza si intende la
possibilità di ottenere informazioni non contraddittorie dall'insieme delle fonti statistiche. Infine
con completezza ed affidabilità, le informazioni devono fornire un quadro sufficientemente
accurato e preciso dell'oggetto della ricerca.
Pag. 6
Università telematica Pegaso
Principi di statistica
4 Concetti statistici generali
I concetti chiave che tratteremo riguardano le fondamentali modalità di trattamento
dell'informazioni statistiche, in particolare ci riferiamo alle seguenti proprietà:

Elencare;

Classificare;

Contare;

Misurare;

Stratificare;

Sintetizzare;

Correlare;

Presentare.
In qualunque problema di analisi statistica bisogna innanzitutto essere in grado di elencare
con chiarezza quali sono le unità elementari, Successivamente sarà indispensabile classificare le
unità elementari cioè raggrupparle in classi in funzione di determinati attributi ritenuti rilevanti.
L'esito di una classificazione è comunque l'aggregazione delle unità elementari in un numero finito
di classi nell'ambito della medesima classificazione. Quando le unità elementari sono state
suddivise in classi, normalmente una prima informazione che sarà possibile trarre riguarda il
numero di unità appartenenti alle singole classi. Incrociando, allora, due classificazioni, e
contando il numero di occorrenze nei singoli incroci, si otterranno le cosiddette tabelle di
contingenza, che sono degli strumenti di analisi statistica semplici e molto potenti.
La maggior parte dei fenomeni può essere misurata adottando una scala di riferimento.
Quando esiste un’unità di misura, l'informazione quantitativa risultante dal procedimento di
misurazione prende il nome di variabile. Spesso è necessario misurare l'intensità di queste
variabili in rapporto a quella di una altra variabile di riferimento; sarà così che si costruiranno i
cosiddetti indicatori, che dal punto di vista matematico sono generalmente rapporti tra variabili.
Tuttavia l'analisi di una variabile, o di indicatori, evidenzia l'esigenza di stratificare i dati,
analizzando il comportamento all'interno di singole classi e verificando altresì quali differenze vi
siano da classe a classe, oppure tra l'andamento dell'indicatore nella singola classe e quello tipico
nella generalità dei casi.
Pag. 7
Università telematica Pegaso
Principi di statistica
L'analisi statistica dei dati deve sempre privilegiare la sintesi. Esistono tecniche statistiche
avanzate la cui logica di calcolo è complessa, ma i cui risultati sono di agevole interpretazione e
che sono state studiate per sintetizzare il contributo informativo di una molteplicità di variabili.
Ci riferiamo all’analisi fattoriale o alla cluster analysis. La prima è utile quando si voglia
sintetizzare i risultati di indagine sui fenomeni effettuate tramite per esempio ai questionari,
mentre la cluster analysis è indispensabile per classificare le unità elementari di rilevazione in
relazione a fenomeni che non possono dar luogo ad un unico criterio di misurazione e suddivisione
in classi. In questo secondo caso saranno colte determinate fenomenologie solo considerando
simultaneamente una molteplicità di variabili.
L'analisi statistica dei dati può, infine, servire ad indagare la relazione tra diversi fenomeni,
calcolando le misure di correlazione tra le variabili e, con il metodo della regressione lineare o
multipla, verificando se esistono leggi di causa-effetto che legano tra di loro le variabili.
In un ultimo la presentazione di una tabella densa di numeri, pur rappresentando già una
notevole sintesi, non consente spesso il colpo d'occhio sui fenomeni più significativi. Per questo
l'informazione finale risulta di più semplice lettura se presentata anche sotto forma di grafici
statistici, il cui scopo è, evidentemente, dare il giusto risalto ai dati più importanti.
Abbiamo cosi sinteticamente evidenziato le modalità di trattamento delle informazioni
statistiche.
4.1
Le rilevazioni statistiche
Il complesso delle operazioni indirizzate all’acquisizione di una o più informazioni su un
insieme di elementi oggetto di studio è detta rilevazione statistica. In questa fase occorre però fare
chiarezza su determinati concetti riguardanti proprio le rilevazioni, ci riferiamo allora a:
 Popolazione
 Campione
 Unità statistiche
4.2
Popolazione, Campione e Unità statistiche.
L’insieme (finito e infinito) delle unità statistiche sulle quali si effettua, tramite
osservazioni e sperimentazioni, la rilevazione di uno o più caratteri rappresenta la Popolazione o
collettivo statistico; un qualsiasi sottoinsieme derivato da una popolazione finalizzato ad uno
studio statistico è, invece, detto Campione. In fine gli elementi rientranti nel campo di
Pag. 8
Università telematica Pegaso
Principi di statistica
osservazione e sottoposti a rilevazione risultano essere le Unità statistiche. Da queste però
dobbiamo distinguere le unità di rilevazione, che invece rappresentano le unità prescelte per
effettuare ad esempio un’intervista.
A tal proposito sottolineiamo che non sempre le unità
statistiche coincidono con quelle di rilevazione: Ad Esempio nell’indagine dell’Istat sulle forze di
lavoro, le unità di rilevazione sono le famiglie-campione mentre le unità statistiche sono costitute
dai componenti intervistati della famiglia i cui risultati sono rapportati al totale della popolazione
residente.
Unitamente a questi concetti affronteremo anche elementi di notevole importanza ci
riferiamo allora a :
 Carattere
 Modalità
 Frequenza
 Serie
 Seriazione
Per Carattere si intende una qualsiasi quantità o qualità che varia, ossia che può assumere
più valori o forme verbali. Invece per Modalità si intende l’articolazione del carattere, cioè
l’espressione concreta attraverso la quale si manifesta il carattere nelle unità statistiche. Ancora
definiamo con Frequenza il numero di volte in cui si presenta una determinata modalità;
quest’ultima rappresenta l’elemento più importante in una distribuzione di frequenze. In fine con il
termine Serie si intende l’insieme delle modalità rilevate su una popolazione (o anche su un
campione) ed organizzate in modo che ad ogni unità statistica corrisponda una ben definita
modalità. L’insieme delle modalità di una popolazione (o campione) organizzate in modo che a
ciascuna modalità corrisponda la relativa frequenza prende il nome, in ultimo, di Seriazione.
4.3
Le tipologie dell’informazione statistica.
Elemento essenziale per l’analisi statistica è, dunque, l’informazione che viene raccolta
dalle unità statistica di una popolazione. In termini generali queste informazioni ne definiscono i
caratteri, che sono “misure” di caratteristiche, solitamente elementari, riferite alle unità statistiche.
Delle unità statistica vengono rilevati diversi aspetti, ciascuno dei quali è appunto chiamato
carattere, che rappresenta l’attributo posseduto da una unità statistica.
I caratteri possono essere distinti in:

Qualitativi;
Pag. 9
Università Telematica Pegaso

Principi di statistica
Quantitativi.
I caratteri qualitativi, anche detti mutabili o variabili qualitative, sono espresse in forma
verbale mentre i caratteri quantitativi che vengono definite variabili sono espressioni numeriche.
Caratteri qualitativi
Colore
degli occhi
Stato civile
Gruppo
Sanguigno
Caratteri quantitativi
Peso
Statura
4.4
Numero di
Componenti di
una famiglia
Le Mutabili
Le Mutabili si distinguono in:
 Sconnesse o nominali.
 Ordinali
Le prime assumono un insieme finito di categorie mutuamente esclusive tali che, per due
differenti unità statistiche, possono essere definite soltanto se queste assumono la stessa o
differenti categorie. Le ordinali, invece, assumono un insieme finito di categorie mutuamente
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da copyright. Ne è severamente
vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per gli effetti della legge sul diritto d’autore
(L. 22.04.1941/n. 633)
10 di 11
Università Telematica Pegaso
Principi di statistica
esclusive tali da poter ordinare due unità statistiche secondo il possesso di determinate
caratteristiche possedute. Per questa tipologia è, in fine, possibile stabilire una relazione d’ordine
tra le unità statistiche.
4.5
Le Variabili
Per quanto riguarda, invece, le Variabili, queste possono essere ancora distinte in:

discrete;

continue.
Nelle variabili discrete la caratteristica può essere descritta mediante un numero finito o
infinito numerabile di valori numerici, fra i quali abbia senso calcolare una differenza e/o un
rapporto. Mentre nelle variabili continue la caratteristica può essere descritta mediante un’infinità
non numerabile di valori, fra i quali abbia senso calcolare una differenza e/o un rapporto.
Tornando ai caratteri di una unità statistica questi possono assumere modalità dicotomiche
laddove siano solo due le modalità espresse. Ad esempio: l’assenza o la presenza.
I Caratteri possono assumere diverse connotazioni se riferite in relazione al tempo oppure
relativamente allo spazio. In questo caso ci troveremo di fronte alle cosiddette serie storiche o serie
cicliche.
4.6
Le Serie storiche e le Serie cicliche.
Le serie storiche che, come abbiamo detto, sono riferite a modalità di tempo,
rappresentano la dinamica di un certo fenomeno registrato istantaneamente o conteggiato durante
un periodi prefissato. Invece, le serie cicliche sono ordinabili senza che ci sia necessariamente un
ordine, quindi ordinabili anche a piacere. Infine le serie geografiche o serie territoriali sono
riferite a modalità strettamente legate ad un territorio; ed esprimono la distribuzione di una
variabile in rapporto ad unità statistica espressa come territorio; comuni, province, regioni o Stati,
ecc.
Attenzione! Questo materiale didattico è per uso personale dello studente ed è coperto da copyright. Ne è severamente
vietata la riproduzione o il riutilizzo anche parziale, ai sensi e per gli effetti della legge sul diritto d’autore
(L. 22.04.1941/n. 633)
11 di 11