STATISTICA
descrittiva
Le origini della statistica e della
probabilità risalgono alla metà del
XVIII secolo, quando si iniziarono ad
affrontare con metodo scientifico le
osservazioni
relative
alle
caratteristiche demografiche delle
popolazioni umane e ai giochi
d‘azzardo.
Statistica e probabilità hanno un‘origine
piü recente delle tradizionali discipline
matematiche; Esse sono collegate alla
variabilità ed all‘incertezza dei fenomeni
della realtà e si propongono di introdurre
tecniche rigorose per prendere decisioni
razionali laddove la complessità o la
natura stessa delle situazioni sembrano
rendere
imprevedibile
e
caotico
il
susseguirsi degli eventi.
Con il progresso scientifico, sociale ed
economico emerse con forza l‘utilità di
acquisire sempre piu' numerosi dati
statistici sui quali i politici, gli economisti e
gli scienziati in genere potessero basare e
confrontare le loro decisioni e le loro
teorie. Il termine statistica deriva da
stato, infatti è nato per indicare la
scienza dello stato
Raccolta dati
La statistica
nasce dalla necessità di
conoscere l‘andamento di un certo
fenomeno per poter fare previsioni sulla
sua evoluzione o per prendere decisioni
riguardanti lo stesso fenomeno. Mediante
la raccolta di dati si ottengono
informazioni utili per elaborare
un
prospetto o un grafico che schematizza
e illustra in modo immediato lo stato del
fenomeno.
Le sue applicazioni
I settori dove la statistica trova maggiore
applicazione sono:
•La ricerca scientifica
•Le scienze demografiche e attuariali
•Le scienze economiche
•Le scienze sociali
•Le scienze per la programmazione economica
e territoriale
•La ricerca operativa
Definizioni
• Statistica: la scienza che ha come scopo lo
studio dei fenomeni collettivi
• Unità statistica: la minima unità di cui si
raccolgono i dati (singoli alunni)
• Popolazione (o universo): l‘insieme delle
u.s. (alunni della classe)
• Caratteri: sono le proprietà che sono oggetto
della rilevazione della popolazione (voto,
statura, ecc.)
Definizioni
• Modalità: sono i modi in cui si presenta il
carattere
I caratteri possono essere
•Qualitativi, indicati con espressioni verbali –sostantivi
o aggettivi(colore occhi)
•Quantitativi, esprimibili con numeri;Questi ultimi
possono essere:
• discreti (possono assumero solo determinati
valori, di solito interi, es: n° nati, produz. auto)
• continui (assumono qualsiasi valore all‘interno di
un dato intervallo, es: la temperatura, il prezzo di
un prodotto)
• Le Modalità dei caratteri qualitativi possono
essere ordinate o non ordinate.
Esempi:
• Modalità ordinate -L‘ordine di nascita dei
fratelli, il titolo di studio, il mese di nascita.
• Modalità non ordinate – la nazionalità, la
professione, il colore dei capelli
Tipi di statistica
L‘indagine statistica può seguire due procedimenti:
Nel caso di rilevazione totale si ha la statistica
descrittiva, che si occupa della raccolta, del
riordino, nonchè della presentazione e dell‘analisi
dei dati ottenuti dallo studio del fenomeno
collettivo;
• Nel caso di rilevazione campionaria si ha la
statistica inferenziale, che si occupa di
estendere i risultati ottenuti con la statistica
descrittiva ad insiemi più numerosi di quelli
studiati fornendo strumenti analitici per trarre
conclusioni e conseguenti decisioni.
Universo statistico
Si può distinguere in:
• Universo finito, cioò formato da un numero
limitato di unità statistiche (le rilevazioni possono
essere totali o campionarie)
• Universo infinito, cioè costituito da un numero
illimitato o molto grande di unità statistiche ( le
rilevazioni sono sempre campionarie)
Rilevazione dei dati
I dati possono essere raccolti mediante:
a) Intervista diretta alle unità statistiche;
b) Compilazione di un questionario:
c) Rilevazione per mezzo di esperimenti;
d) Utilizzo di dati già predisposti da enti che si
occupano di rilevazioni statistiche.
Esempio: il censimento si effettua con una
rilevazione totale mediante questionario. In
Italia l‘organo ufficiale che si occupa di
rilevazioni statistiche è l‘ISTAT attivo dal 1926.
Costruzione di un questionario
I questionari sono dei modelli di rilevazione
per acquisire dati statistici e sono costituiti
da un insieme di domande a risposta chiusa
o aperta; nel primo caso l‘intervistato deve
scegliere la risposta tra quelle indicate, nel
secondo caso può esprimersi liberamente.
Spoglio dei dati
Una volta raccolti i dati è necessario riordinarli e
sintetizzarli per poterne poi trarre qualche
conclusione. Per far questo per prima cosa si
effettua lo spoglio dei dati che consiste nel
leggere e classificare le risposte alle domande.
Dallo spoglio si ricavano le frequenze assolute
delle modalità.
Def: La frequenza assoluta è il valore associato a
una certa modalità di un carattere, cioè il n° di
unità statistiche corrispondenti a quella modalità.
Tabelle
Le tabelle che riportano le frequenze
assolute costituiscono una distribuzione
statistica e possono essere:
•Tabelle semplici;
•Tabelle composte;
•Tabelle a doppia entrata.
Tabelle semplici
Una tabella semplice si
presenta come un
prospetto a due
colonne: nella prima
sono riportate le
modalità, qualitative o
quantitative, nella
seconda l‘intensità
cioè la frequenza con la
quale la modalità si
presenta
Voto
Frequenza
4
2
5
1
6
4
7
8
2
9
1
10
Tabelle composte
Una tabella composta è a più colonne. Nella prima
colonna sono riportate le modalità di un carattere,
nelle altre le intensità riferite a casi diversi.
Voto alunni
classe
1-3
4-6
7-9
10
IVA Ginnasio
8
5
1
VA Ginnasio
10
6
1
IC scientifico
10
10
2
IIE scientifico
6
14
2
Tabelle a doppia entrata
Sono tabelle a più colonne, dove vengono raccolti i dati
relativi a 2 caratteri: nella prima colonna vi sono le
modalità del primo carattere, nella prima riga le modalità
del secondo carattere.
Colore
capelli
biondi
neri
verdi
1
2
azzurri
4
2
rossi
castani
Colore occhi
1
1
1
castani
2
5
neri
5
4
Rappresentazioni grafiche
Non aggiungono nuove informazioni,
ma consentono una visione
immediata e complessiva del
fenomeno considerato.
Diagrammi a coordinate cartesiane
Grafici a nastri o a colonne
Istogrammi
Diagrammi a torta
Diagrammi in coordinate cartesiane
Sono significativi quando una
grandezza è funzione dell‘altra, ed
entrambe variano con continuità.
Spesso la variabile indipendente è
costituita dal tempo, in funzione del
quale si studia l‘andamento dell‘altra
grandezza.
Grafici a nastri o a colonne
Sono rappresentazioni grafiche molto
usate per modalità qualitative dove
vengono disegnate per ogni modalità
del fenomeno studiato, rettangoli di
uguale larghezza e di lunghezza
proporzionale alle frequenze delle
modalità.
Istogrammi
Sono utilizzati prevalentemente per
rappresentare fenomeni aventi
modalità quantitative espresse con
intervalli di valori. Sono costituite da
rettangoli aventi come base
l‘ampiezza dell‘intervallo e come
altezza la frequenza.
16
14
12
10
Alti
Bassi
8
6
4
2
0
Altezza
Diagrammi a torta
Sono significativi per rappresentare
come una popolazione viene
suddivisa, rispetto ad un determinato
carattere
L‘ampiezza x dei settori si calcola
risolvendo la proporzione seguente:
x:360°=f:T
ove
f=frequenza
T=totale della popolazione
Altezza
16;
80%
Alti
Bassi
4;
20%
Media
La media è un numero che ne
sintetizza molti e consente di averne
una visione unitaria.
la media è un valore
opportunamente scelto e
compreso tra il minimo e
il massimo dei dati.
Medie mobili o ferme
Moda e mediana sono medie mobili, cioè
sono quelle medie per la cui
determinazione non si usano tutti i dati.
media aritmetica,
quadratica,
geometrica, armonica
sono medie ferme, per il cui calcolo si
conteggiano tutti i dati disponibili
Moda
Si dice moda il carattere o il valore cui
corrisponde la massima frequenza.
La serie dei numeri 5,6,8,8,8,12,12,14
ha moda 8
La serie 5,6,8,8,8,12,12,14,14,14
ha due mode: 8 e 14
Mediana
Si dice mediana il valore che occupa il posto
di mezzo, quando i dati sono disposti in
ordine crescente.
La serie dei numeri 5,6,8,8,8,12,12,14
ha mediana (8+8)/2
La serie 5,6,8,8,8,12,12,14,14
ha mediana 8
Medie mobili o ferme
Contrariamente alle medie ferme, la
Mediana e moda possono essere
determinate anche quando i dati non
hanno carattere numerico:
suff, buono, buono
Medie mobili o ferme
Può accadere che cambiando alcuni dei
dati, anche in modo vistoso, moda e
mediana non cambino; ciò fa perdere
di significato alle grandezze.
Ecco perchè si introducono le
medie ferme