Lezione 14 marzo 2013 - Università degli Studi della Basilicata

UNIVERSITA’ DEGLI STUDI DI BASILICATA
FACOLTA’ DI ECONOMIA
Corso di laurea in Economia Aziendale
Lezioni di Statistica
14 marzo 2013
Docente: Massimo Cristallo
ORIGINI ED EVOLUZIONE DELLA STATISTICA
Libro di Confucio (550 a.C.)
Notizia di una statistica agraria, artigiana e
commerciale, effettuata in Cina da un
imperatore vissuto oltre 2000 anni prima.
La Chiesa, dopo il Concilio di Trento
(iniziato nel 1545), impose ai parroci la
regolare registrazione dei matrimoni, dei
battesimi e delle morti, che ancora oggi
costituiscono preziosi fonti statistiche per
studi demografici.
ORIGINI ED EVOLUZIONE DELLA STATISTICA
Nel 1875 la “Statistica” viene inserita
come disciplina in tutte le facoltà di
Giurisprudenza del nuovo Regno
Unificato
I maggiori contributi alla scuola
statistica italiana sono stati forniti da
Rodolfo Benini (1862(1862-1956), Corrado
Gini (1884(1884-1965), Giorgio Mortara
(1885--1967), Marcello Boldrini
(1885
(1890--1969) e Livio Livi (1891
(1890
(1891--1968)
Significato della parola “statistica”
“statistica”
La parola statistica deriva dal termine latino
medievale “status”, che sta ad indicare
l’ordinamento politico
in tal senso la
statistica sarebbe, dunque, quella scienza che
descrive i fatti notevoli di uno Stato.
Tuttavia, il termine statistica
statistica,, secondo la
concezione del latino classico, significa modo di
essere, condizione, stato di fatto
si intravede in questo modo una estensione del
concetto di statistica, che comprende altri campi
di applicazione.
ASPETTI DELLA STISTICA MODERNA
Fornisce metodi matematici che
consentono di fare valide
supposizioni, partendo dall’insieme
dei dati osservati, e consente di
indagare più a fondo sui fattori che
determinano il presentarsi di un
certo fenomeno.
Nuovi Settori di applicazione della statistica
Applicazioni della
Statistica
Ricerche
di mercato
(acquisizione di
informazioni)
Pianificazione
Territoriale
(politiche di
intervento)
Controllo della
Qualità
EFFICACIA DELLE APPLICAZIONI
STATISTICHE
Grado di
preparazione della
disciplina da parte
delle persone che
la utilizzano
Spirito di
obiettività
Conoscenza del
fenomeno oggetto
di studio
IMPARZIALITA’
COMPETENZA
STATISTICA
CONOSCENZA
DEL FENOMENO
CONCETTI PRELIMINARI
Unità statistica
caso individuale
oggetto di osservazione (ad esempio, una
persona singola, una famiglia, il lancio di
una moneta, un’azienda);
Collettivo statistico
insieme di più unità
statistiche, omogenee rispetto ad uno o più
aspetti (ad esempio, l’insieme delle autovetture
presenti in Italia, gli abitanti della provincia di
Potenza, gli studenti del Corso di Laurea in
Economia Aziendale dell’Università di Basilicata)
CONCETTI PRELIMINARI
CARATTERE
Aspetto delle unità statistiche
prese in considerazione (ad
esempio, l’età, il reddito, il
titolo di studio, il tipo di
attività di una azienda);
MODALITA’
Diverso modo con cui
può presentarsi un
carattere.
MODALITA’
CARATTERE
COLLETTIVO
STATISTICO
TIPI DI CARATTERI
I CARATTERI
possono essere
di due tipi:
QUANTITATIVI (esempi:età, reddito, numero addetti,ecc.)
QUALITATIVI (esempi: professione, colore occhi, ecc.)
FENOMENI COLLETTIVI
La statistica è quindi l’insieme dei metodi
per lo studio dei fenomeni collettivi,
ovvero delle caratteristiche che in un
collettivo statistico (popolazione) si
presentano in maniera diversa per
l’influenza di varie circostanze.
ESEMPIO:
reddito
carattere
popolazione italiana
collettivo statistico
FASI DELL’INDAGINE
STATISTICA
1) RILEVAZIONE = operazioni con le quali si
perviene alla conoscenza dei dati
2) ELABORAZIONE = operazioni con cui i dati
“grezzi” o “originari” vengono classificati e
sintetizzati per ottener dati più espressivi (dati
derivati)
3) PRESENTAZIONE = esposizione dei dati in
forma chiara e compatta (tabelle, grafici, medie,
ecc..)
ecc
4) INTERPRETAZIONE = spiegazione dei risultati
ottenuti dall’indagine, anche sulla base di
conoscenze già possedute sul fenomeno oggetto
di studio
studio..
LA RILEVAZIONE STATISTICA
La rilevazione dei dati consente di
conoscere le unità del collettivo statistico
unitamente alle informazioni che
riguardano tali unità (ad esempio,
mediante il questionario di rilevazione)
In molte indagini si parte da un materiale
già rilevato (ad esempio, dall’ISTAT,
Camere di commercio, Ministero del
lavoro, ecc.)
TIPI DI RILEVAZIONI
TOTALI = quando si rilevano tutte le unità
che compongono la popolazione
PARZIALI O CAMPIONARIE = quando si
osserva solo una parte di tutte le unità
statistiche che costituiscono il collettivo,
con la caratteristica di fornire un’immagine
ridotta ma fedele delle caratteristiche del
medesimo collettivo (il
(il fenomeno si
presenta in scala ridotta o proporzionale)
proporzionale)
LE RILEVAZIONI CAMPIONARIE
A) Consentono di ridurre il tempo necessario per
la raccolta ed elaborazioni dei dati.
B) Permettono, di conseguenza, una notevole
riduzione dei costi (si possono quindi effettuare
più indagini)
C) E’ talvolta una scelta obbligata (esempio:
controllo qualità che comporta la distruzione
dell’unità osservata)
D) A volte, il tempo disponibile per effettuare
l’indagine è limitato, per cui non è possibile
effettuare una rilevazione totale
(esempio:rilevazione trimestrale sulle forze di
lavoro effettuata dall’ISTAT).
CLASSIFICAZIONE E TABULAZIONE DEI DATI
Una volta raccolti i questionari,
utilizzati per l’indagine, si passa ad
esaminare ed organizzare le
informazioni in essi contenute.
Si passa, quindi, all’operazione di
spoglio o classificazione, consistente
nel raggruppare i dati secondo le
modalità di uno o più caratteri.
SPOGLIO DEI DATI
A) Se si dispone di un solo carattere,
per effettuare lo spoglio si fa
corrispondere ad ogni modalità una
casella;
B) In ciascuna casella si pone un
trattino ogni qualvolta l’unità
statistica possiede la modalità
corrispondente a quella casella.
TABULAZIONE O
DISTRIBUZIONE STATISTICA
Consiste nel mettere i
dati sotto forma di
tabella, attraverso un
prospetto di due
colonne, ove nella
prima sono elencate le
modalità del carattere,
mentre nella seconda
si riporta il numero di
volte (frequenza
assoluta) in cui una
certa modalità è stata
riscontrata.
Carattere = X
Frequenza
assoluta
Modalità X1
n1
Modalità X2
n2
…
…
Modalità Xs
ns
TOTALE
N
DISTRIBUZIONE DI FREQUENZA
L’associazione
ad ogni modalità
(di un certo
carattere) della
relativa
frequenza è
anche chiamata
distribuzione di
frequenza.
MODALITA’
CARATTERE
FREQUENZA
VARIABILE STATISTICA
Le distribuzioni statistiche in cui il
carattere è quantitativo si chiamano
variabili statistiche.
MUTABILE STATISTICA
Le distribuzioni statistiche in cui il
carattere è qualitativo si chiamano
mutabili statistiche.
DISTINZIONE DELLE VARIABILI
STATISTICHE
1) DISCRETE = SE I VALORI ASSUNTI SI
RIFERISCONO AD UN INSIEME DISCRETO,
CIOE’ NUMERABILE DI VALORI ISOLATI
(Esempi:numero figli, numero
autovetture, ecc.)
2) CONTINUE = SE I VALORI ASSUNTI SI
RIFERISCONO AD UN INSIEME CONTINUO
DI VALORI (Esempi: peso corporeo,
reddito, ecc.)
VARIABILE STATISTICA CONTINUA
In questi casi le
modalità vengono
raggruppate in
classi
La prima e l’ultima
classe, in alcuni
casi, possono
essere aperte.
Carattere = X
Frequenza
assoluta
X1 - X2
n1
X2 - X3
n2
…
…
Xs – X (s+1)
ns
TOTALE
N
DISTINZIONE DELLE MUTABILI
STATISTICHE
A) RETTILINEA = le modalità ammettono un
ordine naturale di successione con una modalità
iniziale ed una finale (esempio:grado di
istruzione)
B) CICLICA = le modalità ammettono un ordine
naturale di successione, ma non si può dire, a
meno di una convenzione, quale sia la prima e
l’ultima modalità (esempio: i giorni della
settimana)
C) SCONNESSA = le modalità non ammettono un
ordine naturale di successione
(esempio:nazionalità).
SCALE DI MISURA
La classificazione con cui è possibile distinguere le variabili
secondo la classificazione proposta da Stevens (1946,
1951) è la seguente:
variabili nominali,
nominali, quando presentano categorie non
ordinabili;
variabili ordinali,
ordinali, quando presentano stati ordinabili ma
tuttavia non esiste una unità di misura e quindi una
distanza tra due stati presi a caso;
variabili ad intervalli,
intervalli, quando esiste una unità di misura ma
non esiste uno zero assoluto;
variabili cardinali,
cardinali, quando esiste una unità di misura ed uno
zero assoluto.
I VALORI MEDI
MEDIE ANALITICHE (tengono conto
di tutti i valori e vengono calcolate
attraverso operazioni algebriche
sulle modalità di un carattere
quantitativo))
quantitativo
MEDIE LASCHE (si basano solo su
alcuni valori dell’intera distribuzione)
SCELTA DEL VALOR MEDIO
I valori medi che si possono
utilizzare per sintetizzare una
distribuzione sono diversi.
La scelta del miglior valore medio
dipende dal singolo problema che si
esamina: non esiste una ricetta
universale.
MEDIA ARITMETICA
E’ facilmente calcolabile
Ha significato immediato
Può essere calcolata con valori di
qualsiasi tipo
Tiene conto di tutti i valori
MEDIA ARITMETICA semplice
E’ la somma dei valori assunti dal
carattere quantitativo in esame,
diviso per il numero di unità:
N
∑ xi
x1 + x2 + ... xN i=1
µ=
=
N
N
MEDIA ARITMETICA ponderata
E’ la somma dei valori assunti dal
carattere quantitativo in esame,
ciascuno ponderato con la relativa
frequenza assoluta, diviso per il
numero di unità:
s
∑ xi ni
x1 n1 + x2 n2 + ... xn ns i=1
µ=
= s
N
∑ ni
i =1
MEDIA ARITMETICA ponderata
Si applica la
formula
precedente,
individuando per
ciascuna classe il
valore centrale
(semisomma degli
estremi
dell’intervallo)
Carattere = X
Frequenza
assoluta
X1
X1--X2
n1
X2
X2--X3
n2
…
…
Xs – X (s+1)
ns
TOTALE
N
MEDIA GEOMETRICA
E’ più difficile da calcolare
Non può essere utilizzata se vi è qualche
dato negativo o nullo
Può essere usata nel caso di dati che
presentano una progressione geometrica
E’ utilizzata quando i dati variano in tempi
successivi secondo un certo tasso di
incremento (o decremento) per calcolare
l’incremento medio per unità di tempo
Tiene conto di tutti i valori
MEDIA GEOMETRICA semplice
Si ottiene estraendo la radice N-esima del
prodotto dei valori assunti dal carattere
quantitativo:
Mg =
N
x1 . x2 .... xN =
N
N
∏ xi
i =1
MEDIA GEOMETRICA ponderata
Si ottiene come nel caso semplice, ma
elevando ciascuna modalità del
carattere quantitativo alla rispettiva
frequenza:
s
Mg = x1 ⋅ x 2 ⋅...⋅ x = N ∏ x i
N
n1
n2
ns
s
i =1
ni
MEDIA ARMONICA
E’ utile nei problemi in cui vi siano legami
inversi del fenomeno considerato con altri
fenomeni (ad esempio, dati inversamente
proporzionali all’unità di tempo: velocità in
Km/h)
Può essere utilizzata quando i dati
presentano una progressione armonica
Tiene conto di tutti i valori
Non può essere utilizzata se vi è anche un
solo valore uguale a zero
MEDIA ARMONICA semplice
Si ottiene dal reciproco della media
aritmetica dei reciproci delle modalità
riferite alle n unità di un carattere
quantitativo:
N
N
Ma=
= N
1
1
1
1
+
+ ... +
∑
i=1 x i
x1 x 2
xN
MEDIA ARMONICA ponderata
Si procede con la formula utilizzata nel caso semplice,
“pesando” però ciascun addendo del denominatore per la
rispettiva frequenza:
s
∑ ni
n1 + n2 + ... + ns
N
i =1
Ma =
= s
= s
1
1
1
ni
ni
n1 . + n2 . + ... + ns
∑
∑
x1
x2
xs i=1 xi i=1 xi