Statistica - Francesco Cerino

annuncio pubblicitario
LA STATISTICA
Lo scopo di questo modulo è quello di fornire le nozioni elementari sul metodo di analisi statistica
e sulle rappresentazioni statistiche. Attraverso l'analisi statistica di dati, precedentemente raccolti,
è possibile valutare l'evoluzione di determinati fenomeni. La raccolta e l'elaborazione dei dati,
infatti, serve non solo per descrivere il fenomeno stesso, ma anche per prevederne i comportamenti
futuri e quindi operare scelte ed assumere decisioni.
L'indagine statistica
Un'indagine statistica si articola in una serie di fasi successive:
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
Individuare il fenomeno da studiare.
Determinare l'universo statistico oggetto dell'indagine.
Individuare le unità statistiche che costituiscono l'universo statistico.
Determinare i caratteri statistici dell'indagine.
Individuare le modalità di ogni carattere statistico.
Rilevare i dati mediante interviste, questionari, ricerche in archivi ecc.....
Procedere allo spoglio dei dati rilevati.
Rappresentare graficamente i dati rilevati.
Elaborare i dati rilevati.
Dedurre le leggi che regolano il fenomeno.
Universo statistico:
caratteristiche.
E' l'insieme di elementi che sono tra loro omogenei rispetto a una o più
Unità statistiche:
Sono gli elementi che costituiscono l'universo statistico.
Caratteri statistici:
Sono gli aspetti di un fenomeno statistico che si intendono rilevare su ogni
unità statistica. I caratteri statistici si distinguono in:
•
caratteri quantitativi: si esprimono mediante un numero (età, voti, altezza, peso ecc.)
•
caratteri qualitativi: si esprimono mediante aggettivi o nomi (giudizi, materie preferite ecc.)
Modalità:
Sono i possibili valori che può assumere un carattere statistico.
Esempio1: Si vuole svolgere un'indagine statistica sul voto finale di matematica degli alunni iscritti
al terzo anno dell'istituto “Macrelli” di Cesena.
In tal caso
L'universo statistico è rappresentato dalle classi terze dell'istituto “Macrelli” di Cesena.
Le unità statistiche sono gli alunni delle classi terze.
Il carattere statistico che si vuole studiare è il voto finale di matematica, che è un numero e quindi è
un carattere di tipo quantitativo.
Le modalità del carattere statistico sono i possibili voti (da 2 a 10).
Esempio2: Si vuole svolgere un'indagine statistica sugli abitanti di Cesena, analizzandone l'altezza
ed il colore degli occhi.
In tal caso
L'universo statistico è rappresentato dal comune di Cesena
Le unità statistiche sono gli abitanti residenti nel comune di Cesena
Questa volta i caratteri statistici da studiare sono due:
L'altezza che è un numero ed è quindi di tipo quantitativo. Le modalità di tale carattere sono le
possibili altezze di una persona.
Il colore degli occhi che non è un numero ma un colore e quindi di tipo qualitativo. Le modalità di
tale carattere sono i possibili colori degli occhi di una persona.
La rilevazione dei dati
Una volta compreso che cosa si vuole analizzare è necessario procedere con la raccolta dei dati al
fine di iniziare la fase di analisi statistica su dei dati concreti. I dati statistici possono essere rilevati
mediante interviste, questionari, sondaggi e ricerche storiche.
Da rilevare che l'indagine statistica non sempre può prendere in esame tutto l'universo statistico,
perchè potrebbe essere troppo numeroso. Per questo motivo spesso si effettuano indagini su un
campione rappresentativo dell'universo in esame. Ovviamente il campione deve essere scelto con
criteri che garantiscano la rappresentatività di tutto l'universo statistico.
Lo spoglio dei dati
In generale i dati statistici non possono essere analizzati nella forma in cui vengono rilevati, ma
devono essere ordinati e classificati in funzione della modalità del carattere che si intende studiare,
rappresentandoli in opportune tabelle. Le tabelle possono essere semplici oppure a doppia entrata.
Esempio1: Si vuole svolgere un'indagine statistica sul voto finale di matematica degli alunni iscritti
alla 1B
La raccolta e lo spoglio dei dati viene raccolto in una tabella semplice, una tabella cioè con una riga
di intestazione, una colonna formata dalle unità statistiche ed un'altra in cui si riportano le modalità
di un solo carattere statistico.
Alunno
Voto
A
7
B
5
C
7
D
4
E
8
F
7
Esempio2: Si vuole svolgere un'indagine statistica su 100 cittadini di Cesena, analizzandone
l'altezza ed il colore degli occhi.
I risultati ottenuti dalla rilevazione sono i seguenti:
40 abitanti sono alti più di 180 cm, di questi 25 hanno occhi azzurri e 15 hanno occhi marroni.
60 abitanti sono alti meno di 180 cm, di questi 20 hanno occhi azzurri e 40 hanno occhi marroni.
Per analizzare questa indagine, tenuto conto che i caratteri statistici sono due (altezza ed occhi), non
è possibile usare una tabella semplice, ma è necessario usare una tabella a doppia entrata:
Occhi
Altezza
Più di 180 cm
Meno di 180 cm
Totale
Azzurri
25
20
45
Marroni
15
40
55
Totale
40
60
100
Elaborazione dati
Le Frequenze
Un primo studio interessante, una volta definiti gli elementi visti precedentemente, è quello delle
frequenze, che possiamo suddividere in: frequenza assoluta, frequenza relativa e frequenza
percentuale.
La frequenza assoluta di una modalità è il numero di volte in cui tale modalità compare
nell'universo in esame.
La frequenza relativa di una modalità è il rapporto tra la sua frequenza assoluta e il numero di
unità statistiche.
La frequenza percentuale è il valore della frequenza relativa rapportato a 100.
Esempio:
Con riferimento all'esempio 1 (in cui l'universo statistico è formato da 6 unità statistiche) avremo:
Modalità
Frequenza assoluta
Frequenza relativa
Frequenza percentuale
4
1
1 : 6 = 0,16
16,00%
5
1
1 : 6 = 0,16
16,00%
7
3
3 : 6 = 0,5
50,00%
8
1
1 : 6 = 0,16
16,00%
Osservazione
La somma delle frequenze assolute coincide sempre con il numero delle unità statistiche prese in
esame. La somma delle frequenze relative è sempre 1. La somma delle frequenze percentuali è
sempre 100.
Indici di posizione centrale
Gli indici di posizione centrale servono a:
• Limitare gli errori dovuti alle rilevazioni.
• Prevedere l'evoluzione del fenomeno.
Per evitare errori nella rilevazione è possibile effettuare più rilevazioni e calcolare la media
aritmetica dei valori rilevati.
La media aritmetica è la somma di tutti i valori rilevati per una data caratteristica, diviso per il
numero totale delle rilevazioni.
Esempio: un alunno svolge 4 verifiche di matematica riportando i seguenti voti:
Verifica 1: 7
Verifica 2: 8
Verifica 3: 7
Verifica 4: 2
La media aritmetica delle rilevazioni sarà quindi
Media=
7872
4
=
24
= 6
4
Altri indici di posizione centrale sono la moda e la mediana
La moda è la modalità del carattere che si presenta con maggior frequenza. Essa viene utilizzata per
determinare il carattere tipico dell'universo statistico in esame, cioè il carattere più diffuso. Per
calcolare la moda è necessario rappresentare in una tabella le frequenze assolute e rilevare quale
modalità ha la frequenza assoluta maggiore.
Con riferimento all'esempio precedente abbiamo la seguente tabella di frequenze assolute:
Voto
Frequenza assoluta
2
1
7
2
8
1
La frequenza assoluta maggiore è associata al voto 7, per cui avremo che MODA = 7.
La mediana indica quel valore tale che il numero di valori superiori a esso è uguale al numero di
valori inferiori ad esso. La mediana rappresenta un concetto di equilibrio abbastanza intuitivo.
Per calcolare la mediana è necessario ordinare le modalità in modo crescente. Se il numero delle
modalità è dispari la mediana è l'elemento in posizione centrale. Se, invece, il numero delle
modalità è pari la mediana si determina calcolando la media aritmetica dei due valori centrali.
Con riferimento all'esempio precedente, in cui il numero delle modalità è dispari (3), avremo che
MEDIANA = 7 (termine centrale).
Scarica