Introduzione alla statistica descrittiva File

19 febbraio 2014
LEZIONE 1:
Nozioni introduttive di statistica
descrittiva
Dott.ssa Rita Allais PhD
Dipartimento di Scienze economico-sociali e matematico-statistiche
Dipartimento di Management
Università degli Studi di Torino
PER USO DIDATTICO INTERNO
STATISTICA
La Statistica è la disciplina che elabora i principi e le metodologie atti alla
rilevazione, alla raccolta e all’analisi dei dati per studiare, in maniera
quantitativa, fenomeni collettivi, ovvero quei fenomeni che possono essere
percepiti solo mediante numerose osservazioni su unità elementari.
Ad esempio gli effetti delle politiche del governo a favore dell’occupazione giovanile, l’incidenza
del fumo sulla salute degli Italiani, la capacità ricettiva delle aziende turistiche piemontesi, la
conformità alle specifiche di pezzi meccanici prodotti in grande serie, la correttezza della voce
contabile “scorte di magazzino” composta da 15.000 voci, l’analisi dei dati concernenti gli esercizi
concorrenti localizzati nell’area prescelta per l’apertura di un nuovo punto vendita di una catena di
supermercati …
La Statistica trae il suo nome dalle definizioni di alcuni studiosi del XVI / XVII
secolo come scienza atta a descrivere le qualità che caratterizzano e gli elementi
che compongono uno Stato.
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
2
Le applicazioni della Statistica
Sono sempre più numerose le applicazioni delle metodologie statistiche nei più disparati
casi. Ad esempio:
Sondaggi demoscopici
Voi conoscete altre
applicazioni della
Statistica?
Demografia
Marketing
Modelli econometrici
Ricerca scientifica
Controllo qualità
Revisione contabile
Analisi dei testi
Previsioni metereologiche
….
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
3
Fasi dell’indagine statistica
Definizione obiettivi ricerca
Formulazione delle ipotesi
Elaborazione piano di ricerca
Rilevazione dei dati Si procede alla raccolta completa o campionaria dei dati diretta oppure indiretta
Spoglio dei dati
Elaborazione dei dati Si fonda su calcoli di indici statistici
Analisi dei dati e verifica delle ipotesi Interpretazione dei risultati
Presentazione dei dati
19 febbraio 2014
Individuare soggetti, informazioni e modalità
Spiegazione provvisoria che sarà accettata o rifiutata
Si decide come studiare la variabili
Si procede alla classificazione dei dati
Report statistici e grafici
Nozioni introduttive di Statistica Descrittiva
4
Statistica Descrittiva
Collezionare i dati
Presentare i dati
Esempio: sondaggio
Esempio: tabelle e grafici
Sintetizzare i dati
Esempio: media campionaria =
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
1 n
∑ x
n i=1
i
5
Statistica Inferenziale
Laddove ve ne siano le condizioni, la Statistica elabora i principi e le
metodologie che presiedono alla generalizzazione delle evidenze osservate
Calcolo delle probabilità
Stima
Ad esempio, stimare il peso medio
della popolazione usando il peso
medio campionario
Verifica delle ipotesi
Ad esempio, verificare
l’affermazione che il peso medio
della popolazione è 70 Kg
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
6
Fonti statistiche italiane
•ISTAT (Istituto Nazionale di Statistica)
E’ l’istituto preposto in Italia alla produzione e diffusione delle statistiche relative a
tutti gli aspetti della vita del Paese . E’ posto al vertice del SISTAN (sistema statistico
nazionale)
•ENTI PUBBLICI O PRIVATI
ACI, INPS, INAIL, INPDAP,.., MINISTERI, …, BANCA d’ITALIA,..
•BANCHE DATI
CERVED, SARIN, NIELSEN, Centrale dei Bilanci, Pagine Gialle,…
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
7
Esempio tabelle dati
Presidi residenziali socio-assistenziali secondo l'utenza e la tipologia di presidio
< 1950
TIPOLOGIA DI PRESIDIO
1950-1979
1980-1989
1990-1999
2000-2006
Totale
presidi
(b)
VALORI ASSOLUTI
Centro di pronta accoglienza
Centro di accoglienza notturna
Comunità familiare
Comunità socio-educativa per minori
Comunità socio-riabilitativa
Comunità alloggio
Istituto per minori
Residenza assistenziale per anziani autosufficienti
Residenza socio-sanitaria per anziani
Residenza sanitaria assistenziale (Rsa)
Centro di accoglienza immigrati
Altro
TOTALE
14
9
42
131
32
59
36
266
259
295
0
28
1.170
7
6
51
92
67
105
32
351
212
213
1
17
1.152
34
15
103
92
115
165
7
517
340
156
13
40
1.597
63
31
297
212
230
435
10
405
387
371
133
66
2.640
54
35
349
187
200
452
2
222
219
273
122
41
2.157
181
104
856
729
658
1.252
89
1.823
1.457
1.330
284
201
8.964
8,14
9,38
4,99
18,37
4,97
4,85
41,86
15,11
18,27
22,55
0,00
14,51
13,42
4,07
6,25
6,06
12,90
10,40
8,63
37,21
19,94
14,95
16,28
0,37
8,81
13,22
19,77
15,63
12,23
12,90
17,86
13,57
8,14
29,38
23,98
11,93
4,83
20,73
18,32
36,63
32,29
35,27
29,73
35,71
35,77
11,63
23,01
27,29
28,36
49,44
34,20
30,29
31,40
36,46
41,45
26,23
31,06
37,17
2,33
12,61
15,44
20,87
45,35
21,24
24,75
100,00
100,00
100,00
100,00
100,00
100,00
100,00
100,00
100,00
100,00
100,00
100,00
100,00
VALORI PERCENTUALI (c)
Centro di pronta accoglienza
Centro di accoglienza notturna
Comunità familiare
Comunità educativa per minori
Comunità socio-riabilitativa
Comunità alloggio
Istituto per minori
Residenza assistenziale per anziani
Residenza socio-sanitaria per anziani
Residenza sanitaria assistenziale (Rsa)
Centro di accoglienza immigrati
Altro
TOTALE
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
8
Collettivo statistico e caratteri
Collettivo statistico Ω
Si definisce collettivo statistico o popolazione, l’insieme delle entità mediante le
quali è possibile ottenere informazioni sul fenomeno stesso. I suoi elementi sono
detti unità statistiche. La sua numerosità è indicata con n.
Carattere
Si definisce carattere la grandezza che, rilevata su ciascuna unità statistica, sarà di
aiuto nella comprensione del fenomeno collettivo in esame.
Insieme delle modalità di un carattere
Si definisce insieme delle modalità di un carattere l’insieme M di tutte le possibili
espressioni con cui il carattere può manifestarsi.
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
9
Collettivo statistico e caratteri CARATTERI
Ω
ωn
COLLETTIVO
Persone residenti nel comune
di Torino
ω3
ω2
ω1
Ω
COLLETTIVO
Ricette farmaceutiche a
carico SSN
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
oColore degli occhi
oSesso
oLivello di istruzione
oTemperatura corporea
oEtà in anni compiuti
oReddito
CARATTERI
oCodice fiscale
oCodice ricetta
oEtà paziente
oEsenzione (Si/no)
oCodice prodotto
oTicket (in Euro)
10
Classificazione dei caratteri
Carattere qualitativo: un carattere viene detto qualitativo o mutabile se le sue
modalità sono espresse in termini di attributi.
caratteri qualitativi sconnessi: quando le modalità non presentano alcuna
relazione d’ordine naturale, per cui la scala impiegata è nominale.
caratteri qualitativi ordinali: quando le modalità presentano una relazione
d’ordine naturale, per cui la scala impiegata è quella ordinale.
Carattere quantitativo: un carattere viene detto quantitativo o variabile se le
sue modalità sono espresse in termini numerici.
caratteri quantitativi discreti: quando fissata una modalità esiste un
intervallo all’interno del quale nessun altro valore costituisce una modalità.
caratteri quantitativi continui: qualora comunque scelte due possibili
modalità tra loro esistono infiniti valori che sono altrettante modalità.
In entrambi i casi le scale impiegate possono essere a intervalli o a rapporti
a seconda della natura del carattere esaminato.
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
11
Caratteri, modalità, scale di misura
Modalità:
Modalità:
CARATTERI
ATTRIBUTI
QUALITATIVI
(MUTABILI)
Sconnessi
19 febbraio 2014
Ordinali
NUMERI
QUANTITATIVI
(VARIABILI)
Discreti
Nozioni introduttive di Statistica Descrittiva
Continui
12
Scale di misura
Scale nominale: Un carattere è misurato su scala nominale se le sue modalità
si identificano in “attributi” tra i quali è impossibile individuare una relazione
d’ordine naturale
Scala ordinale: Un carattere è misurato su scala ordinale o per ranghi se le
sue modalità si identificano in “attributi” che presentano una relazione
d’ordine naturale.
Scala ad intervalli: Un carattere è misurato su scala per intervalli se le sue
modalità si identificano con numeri nell’ambito di un sistema di riferimento
dotato di origine arbitraria.
Scala a rapporti: Un carattere è misurato su scala per rapporti se le sue
modalità si identificano con numeri di un sistema di riferimento dotato di
origine assoluta, valore quest’ultimo cui è associata l’assenza di carattere.
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
13
Livelli di Misurazione
Rapporti fra misurazioni,
esiste lo zero assoluto
Differenze fra
misurazioni, ma non
esiste lo zero assoluto
Categorie Ordinate
(ranghi, ordine, o scala)
Scala a Rapporti
Dati
Quantitativi
Scala ad Intervallo
Scala ordinale
Dati
Qualitativi
Categorie (no ordine o
direzione)
19 febbraio 2014
Scala nominale
Nozioni introduttive di Statistica Descrittiva
14
Riassumendo…
Vogliamo studiare un fenomeno collettivo
Dobbiamo individuare il collettivo statistico Ω
Dobbiamo determinare i caratteri da rilevare
Dobbiamo scegliere la scala di misura per ciascun carattere
Dobbiamo individuare l’insieme M delle modalità per ciascun
carattere
SOLO ORA POSSIAMO …
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
15
Rilevazione dei caratteri
RILEVARE I CARATTERI SU CIASCUNA UNITA’
STATISTICA
ovvero
Individuare una corrispondenza fra le unità statistiche
appartenenti a Ω e gli elementi dell’insieme delle modalità M
Ω
19 febbraio 2014
M
Nozioni introduttive di Statistica Descrittiva
16
Mutabile e variabile statistica
L’applicazione che associa a ciascun elemento del collettivo statistico uno ed
uno solo elemento dell’insieme M delle modalità del carattere in esame viene
detta mutabile statistica se gli elementi di M sono rappresentati da attributi,
variabile statistica se l’insieme M è costituito da numeri reali.
Ω
A(⋅)
Ω
M
X (⋅)
R
180
170
M
150
F
Mutabile statistica
(sesso)
19 febbraio 2014
Variabile
statistica
(altezza)
Nozioni introduttive di Statistica Descrittiva
17
Rilevazioni di uno o più caratteri
Ω
Ω
R
180
170
Anno
imm.
2007
150
R2
2003
Rilevazione di
un carattere
2000
2000
4000
Rilevazione di due caratteri
(ES:altezza in cm)
9000
Prezzo
dell’usato
(ES:anno immatricolazione, prezzo del’usato)
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
18
La matrice dei dati grezzi
19 febbraio 2014
Nozioni introduttive di Statistica Descrittiva
19