RILEVAZIONE E SPOGLIO DEI DATI

annuncio pubblicitario
GRUPPO: Lai, Pisciotta, Zuccalà
CLASSE: 4Bi
CALCOLO LABORATORIO
INDICE DELLA PRESENTAZIONE









PRESENTAZIONE
GENERALITA’
FASI DELL’INDAGINE STATISTICA
RILEVAZIONE E SPOGLIO DEI DATI STATISTICI
SISTEMAZIONE DEI DATI: Serie e Seriazione
VARIABILI E MUTABILI STATISTICHE
RAPPRESENTAZIONI GRAFICHE
LE RAPPRESENTAZIONI GRAFICHE CON L’AUSILIO DEI
FOGLI ELETTRONICI
LE RILEVAZIONI MEDIANTE QUESTIONARIO
La Statistica è sorta in tempi antichissimi, fin dai primi insediamenti umani aventi
una semplice organizzazione sociale.
Esistono notizie relative a rivelazioni statistiche fatte eseguire dall’imperatore
cinese Yu, più di 4000 anni fa, allo scopo di ottenere notizie precise sulla situazione
dell’agricoltura in ogni provincia, e quindi di poter ripartire equamente le imposte.
Presso i Romani, Servio Tullio istituì la prima forma di censimento, chiamato allora
<<Census>>, che veniva effettuato ogni cinque anni e serviva a conoscere il numero
dei cittadini, l’ammontare dei loro beni, l’andamento delle nascite e delle morti.
La ricerca di valori di sintesi di una serie di dati è dovuta agli astronomi.
Nel XVII e nel XIX secolo,grazie all’introduzione di metodi matematici e al “calcolo
delle probabilità”, il campo di applicazioni della statistica andò ampliandosi in quanto
si capì come utilizzare un insieme di informazioni allo scopo di ricercare le cause del
manifestarsi di molti fenomeni.
E’ consuetudine suddividere la statistica in :
-statistica descrittiva,che ha lo scopo di raccogliere ed elaborare i dati per
descrivere fenomeni collettivi o di massa;
-statistica induttiva (o inferenza statistica),che si occupa dei metodi che
permettono di stimare le caratteristiche di un fenomeno collettivo partendo
dall’analisi delle caratteristiche di un campione.
L’indagine statistica si basa sull’osservazione di fenomeni
che possono manifestarsi in svariati modi.
I fenomeni si dividono in Tipici, Atipici e Collettivi.
Tutti i fenomeni che si presentano costantemente con le
stesse caratteristiche sono chiamati fenomeni Tipici.
D’altra parte esistono dei fenomeni che si manifestano
ogni volta con delle caratteristiche diverse e per i quali è
difficile fare previsioni sul loro comportamento, possono
essere definiti fenomeni Atipici,come ad esempio i
fenomeni meteorologici.Se consideriamo, invece, i
fenomeni sociali quali ad esempio le nascite, i matrimoni, le
migrazioni, possiamo soprannominarli fenomeni Collettivi.
Natura del metodo statistico…
I metodi di ricerca delle leggi scientifiche sono essenzialmente due:
metodo induttivo e metodo deduttivo.
Se si parte dall’osservazione di fatti singoli e, con successive generalizzazioni, si
risale ai principi o alle leggi di carattere generale relativi ai fatti studiati, si
adopera il metodo induttivo, si procede cioè per induzione.
Se invece si stabiliscono a priori assiomi generali, che si pongono come premesse
al senso logico, e in seguito , attraverso il ragionamento, se ne ricavano le
possibili conseguenze, si adopera il metodo deduttivo, si procede cioè per
deduzione. Nel primo caso si procede dal particolare al generale, nel secondo,
invece, dal generale al particolare.
Il metodo statistico costituisce il metodo induttivo per eccellenza, perché è
formato sull’analisi di fenomeni collettivi allo scopo di ricavare, le leggi
soggiacenti ai fenomeni stessi, o almeno di evidenziare eventuali regolarità, in
modo da poter trarre previsioni relative al comportamento futuro.
L’operazione più difficile e importante per l’interpretazione dei fenomeni
studiati, è proprio la ricerca delle cause che li hanno generati.
Il Quetelet ha formulato alcuni canoni di logica statistica, allo scopo di poter
interpretare in maniera valida i risultati di una ricerca, e sono:
1) Non si devono avere idee preconcette sul risultato che si otterrà dalla
ricerca.
2) Non si deve eliminare arbitrariamente alcun dato.
3) Non si devono comparare elementi che non siano tra loro compatibili.
Dati statistici…
Per poter definire meglio che cosa siano i dati statistici, occorre prima precisare
che l’unità statistica è il più piccolo elemento sul quale si effettua una
osservazione. L’unità statistica può essere:
1) Semplice  se corrisponde ad una singola persona o a un oggetto,
2) Composta  se è formata da un insieme di elementi.
Si definisce dato statistico il risultato di un operazione compiuta sulle unità
statistiche (es: numero di persone di sesso maschile della popolazione italiana
ecc. ).
Per popolazione statistica si intende, <<un insieme finito di dati statistici tra loro
omogenei per quanto riguarda una o più caratteristiche>>.
Rappresenta una popolazione statistica, l’insieme degli alunni di una scuola.
Un universo è: <<una popolazione statistica composta da un numero infinito di
elementi>>.
Un campione invece è: <<un complesso di osservazioni effettive sugli elementi di
una popolazione o universo>>.
Ad esempio è un universo l’insieme formato dai risultati di un numero illimitato di
lanci di un dado, o l’insieme degli esperimenti.
Costituisce un campione, ad esempio, l’insieme di un certo numero di studenti
estratti dalla popolazione scolastica di una città.
Frequenza e intensità…
I dati statistici possono rappresentare due specie di grandezze
diverse: se esprimono il numero delle volte in cui il fenomeno si è
verificato in relazione ad un determinato periodo di tempo, assumono
la natura di frequenza, se invece rappresentano una media, o una
somma di misure effettuate sulle unità statistiche, esprimono una
intensità.
Rappresentano delle frequenze, ad esempio, il numero dei promossi a
giugno di una certa scuola; rappresentano, invece, delle intensità: la
statura media di un gruppo di giovani della stessa età, le tasse pagate
da una determinata categoria di lavoratori.
In genere un’intensità viene espressa mediante una misura di peso, di
lunghezza, di superficie, di volume, di valore.
Carattere,modalità quantitative e
qualitative
Le unità statistiche vengono studiate secondo uno o più caratteri comuni che
rappresentano gli aspetti che si vogliono mettere in evidenza e successivamente
vengono divisi rispetto alle varie modalità con cui tale carattere si manifesta.
Esaminando ad esempio la distribuzione degli studenti di una data provincia secondo la
specie delle scuole, in un determinato anno, diremo che il carattere è rappresentato
dal <<tipo di scuola>>, mentre le varie modalità sono rappresentate da: <<scuole
materne>>, <<scuole elementari>>, <<scuole medie>>, e <<scuole superiori>>.
Le modalità secondo cui vengono classificate le unità statistiche possono essere
qualitative o quantitative.
Le modalità quantitative sono espresse da numeri risultanti da misurazioni o da
enumerazioni, come ad esempio la rilevazione dei redditi di una popolazione.
Le modalità quantitative possono essere continue o discrete:
Continue  se sono espresse da numeri reali e possono assumere tutti i valori di un
intervallo (ad esempio, altezze e pesi ).
Discrete in caso contrario (ad esempio, numeri dei vani delle abitazioni, numero degli
addetti ad un settore industriale).
Le modalità qualitative sono espresse da attributi, espressioni verbali,.
Fasi dell’ indagine statistica…
Per effettuare un indagine statistica bisogna procedere per fasi:
• pianificazione del lavoro: è la fase nella quale il lavoro viene preparato ; in essa
viene definita la stesura del lavoro,gli obiettivi da raggiungere attraverso
l’indagine , l’oggetto di rilevazione e il modo in cui i dati vengono raccolti.
• raccolta dei dati:questa fase consiste nella raccolta di dati individuali che
costituiscono il fenomeno collettivo da analizzare.La raccolta può avvenire
attraverso dei questionari o dei moduli e schede.
• spoglio dei dati raccolti:consiste nella classificazione dei dati raccolti secondo il
piano prestabilito.I dati del fenomeno vengono raggruppati secondo le modalità
di un carattere qualitativo o secondo le intensità di uno quantitativo.
• rappresentazione dei dati:è la rappresentazione grafica secondo tabelle o
grafici dei risultati ottenuti.
• elaborazione dei dati:in questa fase vengono elaborati i dati ”grezzi” per
ottenere dati “elaborati”che mettano in evidenza le caratteristiche del
fenomeno collettivo da studiare.
• interpretazione dei risultati:E’ la fase finale dell’indagine statistica nella quale
viene esaminato se l’obiettivo dell’indagine è stato raggiunto,se esistono
relazioni con altri fenomeni,se è possibile fare una previsione sulla tendenza del
fenomeno nel tempo.
RILEVAZIONE E SPOGLIO DEI DATI
STATISTICI…
1)Nozioni generali:
L’operazione preliminare più importante consiste nello stabilire con molta
precisione gli obiettivi che si intendono raggiungere attraverso l’intera
indagine statistica.
Si possono fissare degli obiettivi generali o degli obiettivi più specifici.
La successiva preparazione dei mezzi o strumenti da usare deve essere
tale da permettere il raggiungimento degli obiettivi fissati e quindi è fatta
in funzione dei risultati che si vogliono ottenere.
2)Oggetto e limiti dell’indagine:
Per oggetto della rilevazione si intende il fenomeno preso in esame, definito con
la massima cura e tale da permettere il raggiungimento degli obiettivi fissati.
Per quanto riguarda i limiti di tempo, questi possono far riferimento ad un
istante preciso o a undato periodo di tempo.
Riguardo ai limiti di spazio la rilevazione può essere fatta su un territorio più o
meno vasto.
La scelta dipende, dagli obiettivi che si vogliono raggiungere.
Limiti di spazio sono anche quelli riferiti a particolari categorie dell’oggetto
dell’indagine.
Modalità della rilevazione…
La raccolta dei dati si può distinguere , riguardo al modo, in:
Automatica se sono gli stessi interessati a fornire le
informazioni sui fenomeni che li riguardano(denuncia di nascite,
morte e trasferimenti) .
Riflessa  se viene fatta direttamente da organi preposti a tale
scopo(censimenti,indagini di mercato).
Rispetto alla durata le rilevazioni si distinguono in:
Continue se vengono fatte senza interruzione (ad esempio
rilevazioni anagrafiche dei nati, dei morti ecc.).
Periodiche se vengono fatte a intervalli regolari di tempo
(censimenti con periodicità decennale ecc.).
Occasionali se vengono fatte una volta tanto per indagini su
fenomeni particolari (ad esempio rilevazioni dei danni di un
terremoto ecc.).
Organi per la rilevazione statistica…
Gli organi che eseguono le rilevazioni possono essere:
Privati se la raccolta dei dati viene eseguita da un privato, o da un ente
privato.
Pubblici quando il fenomeno collettivo, oggetto dell’indagine è di grande
interesse pubblico (ad esempio, fenomeni demografici, economici ecc.)e
richiede una grande quantità di mezzi a disposizione e una notevole
organizzazione.
In Italia esiste un organismo dedito agli studi di statistica:l’ Istituto
Centrale di statistica(Istat) che ha sede in Roma.
L’Istat ha il compito di redigere le statistiche sui numerosi aspetti
dell’amministrazione dello stato e di eseguire i censimenti.
Inoltre crea alcune pubblicazioni periodiche tra cui: “Il Bollettino Mensile di
Statistica, l’Annuario Statistico Italiano, il Compendio Statistico Italiano.
In quanto al mezzo di raccolta, distinguiamo fra:
Registri nei quali la raccolta dei dati avviene mediante un ordine alfabetico
o cronologico;
Questionari moduli prestampati che pongono una serie di domande a cui
l’interessato dovrà rispondere,(vengono usati nelle rilevazioni riflesse );
Schede moduli particolari che contengono tutte le informazioni necessarie
a una unità statistica, (ad esempio nelle biblioteche,autore, titolo ecc…).
Rilevazioni totali e rilevazioni per
campioni…
Una rilevazione si dice:
Totalese viene viene estesa a tutti gli elementi di una popolazione
statistica;
Per campione se viene fatta solo su alcuni elementi della popolazione, scelti
con criteri opportuni.
La più importante rilevazione totale è costituita dal Censimento attraverso
cui si può conoscere la consistenza numerica della popolazione, la sua
distribuzione per sesso, per età, stato civile ecc….
In Italia il primo censimento generale della popolazione fu eseguito il31
dicembre 1861, cioè nell’anno della proclamazione del regno.
Altri censimenti furono fatti ad intervalli di tempo più o meno regolari.
La direzione del censimento è affidata all’ Istat, che emana delle istruzioni
per preparare il piano topografico del comune in cui il territorio verrà
suddiviso in frazioni geografiche, e ogni frazione geografica in sezioni di
censimento.
Le rilevazioni campionarie…
Nella realtà si ricorre molto spesso a indagini parziali, dette
rilevazioni campionarie, quando:
occorre contenere i costi;
occorre ottenere più tempestivamente i risultati;
non è possibile procedere diversamente;
La scelta del campione deve essere fatta in modo che esso sia:
Rappresentativodeve cioè possedere le stesse caratteristiche
della popolazione da esaminare.
Sufficientemente ampiopiù il campione è numeroso, più i risultati
che fornisce sono significativi.
Spoglio dei dati: Tabelle di
spoglio…
Una volta la rilevazione delle unità statistiche si può procedere alla
formazione dei dati statistici, attraverso l’operazione di spoglio delle unità
stesse.
Lo spoglio comprende:
L’enumerazionecon la quale le schede, i questionari, i moduli vengono contati
e, nello stesso tempo, controllati, al fine di fornire i dati sull’estensione della
rilevazione.
Questa fase è molto importante perché permette di conoscere
immediatamente l’entità delle <<evasioni>> che, in numero elevato possono
anche influenzare l’attendibilità dei risultati.
La classificazioneche consiste di raggruppare i dati ottenuti in categorie,
classi, a seconda delle intensità o delle qualità dei caratteri rivelati.
Lo spoglio materialeche si effettua riportando i dati , già enumerati e
classificati, in prospetti chiamati tabelle di spoglio.
I due tipi di spoglio…
L’intera operazione di spoglio può essere effettuata in due modi:
Manualmente,(spoglio manuale).
attraverso l’elaboratore elettronico,(spoglio automatico).
Nello spoglio manuale si riportano i dati nelle tabelle di spoglio, preparate in base al fenomeno
osservato. Le tabelle sono costituite da tre colonne: la prima contiene, nelle diverse righe, le
varie modalità del carattere considerato; la seconda,un po’ più larga, contiene le “tacche”che
si riferiscono a ciascuna unità esaminata; la terza contiene le frequenze delle varie modalità.,
che si ottengono contando le tacche per ogni riga.
ESEMPIO: Volendo preparare una tabella che classifichi i 24 alunni della 3°A di un certo istituto
tecnico, secondo l’anno di nascita, relativamente all’anno scolastico 1988-1989, partiamo alla
raccolta dei vari anni.’
‘71-’72-’70-’72-’72-’72-’72-’72-’73-’72-’72-’72-’71-’70-’71-’72-’73-’72-’72-’70-’72-’72-’72-’72.
Prepariamo ora la tabella di spoglio:
Questo tipo di spoglio viene chiamato
singolo(limitato ad un solo carattere:
“anno di nascita”), per distinguerlo
dallo spoglio incrociato.
Anno
di
nascita
Tacche
Frequenza
1970
\\\
3
1971
\\\
3
1972
\\\\\\\\\\\\\\\\
16
1973
\\
2
Totale
24
Lo spoglio incrociato…
Se conosciamo, dei 24 alunni dell’esempio precedente, anche il sesso, possiamo preparare il
prospetto di spoglio incrociato tra anno di nascita e sesso.
Lo scopo di uno spoglio
incrociato, è quello di mettere in
evidenza l’esistenza di relazioni
fra i due caratteri.
Nel caso dell’esempio appena
fatto, serviva a collegare il
sesso con l’insuccesso scolastico.
Il metodo dello spoglio manuale
è applicato nel caso di piccole
indagini, mentre quando i
caratteri sono molti e il numero
di unità è grande,si ricorre allo
spoglio automatico.
Anno
di
nascita
Maschi
Femmine Frequenz
a maschi
Frequenza
femmine
1970
\\
\
2
1
1971
\
\\
1
2
1972
\\\\\\\\
\\\\\\\\
8
8
1973
\
\
1
1
In questo caso occorre:
Codificare i dati assegnando un numero a ogni modalità di ciascun carattere qualitativo.
Procedere alla registrazione dei dati codificati su dischi magnetici.
Predisporre il calcolatorecaricando un programma di spoglio;
Inserire i dati già registrati;
Fornire le informazioni sugli spogli singoli e incrociati che bisogna effettuare.
Una completata l’intera procedura, lo spoglio automatico verrà eseguito in modo velocissimo e con la
massima precisione.
Sistemazione dei dati:Serie e
Seriazione…
Una tabella a semplice entrata è costituita da due colonne, la prima riporta le varie
modalità del carattere qualitativo, o le varie intensità del carattere quantitativo in
esame, la seconda riporta le frequenze o i valori rilevati.
Se il carattere è qualitativo la successione dei dati rilevati è detta Serie
statistica, se invece il carattere è quantitativo la successione dei dati è detta
Seriazione statistica. Diamo ora un esempio di una serie statistica.
Esempio n° 1)
Distribuzione degli studenti italiani secondo il grado delle scuole, Anno scolastico
1992-93.
Si tratta di una serie
statistica.
Ad ogni modalità del
carattere qualitativo è
associata una
frequenza assoluta,
dove per frequenza
assoluta intendiamo il
numero delle unità
statistiche che godono
di una certa proprietà.
Grado delle scuole
N. alunni iscritti
Scuole materne
1.564.733
Scuole elementari
2.949.030
Scuole medie
2.059.430
Scuole superiori
2.820.563
Totale
9.393.756
Continuo Serie e Seriazione…
Esempio n°2)
Autovetture per la quale è stata pagata la tassa di proprietà.
E’ una serie storica temporale in quanto i dati
rilevati sono riferiti a intervalli di tempo.
Le serie storiche sono serie di notevole
importanza per lo studio di un fenomeno nel suo
evolversi nel tempo.
Esempio n°3)
Rilevazioni delle abitazioni occupate in Italia
secondo il numero di stanze nel 1981.
N°Stanze
N°Abitazioni
1
300.364
2
1.791.887
3
3.761.695
4
5.616.939
5
3.520.498
6 o più
2.550.369
Totale
17.541.752
Anni
Autovetture
1986
23.495.460
1987
24.320.167
1988
25.290.250
1989
26.267.431
1990
27.415.828
La tabella qui di fianco indicata
dalla freccia azzurra, rappresenta
una seriazione rispetto ad un
carattere quantitativo discreto.
Seriazioni, estremi, classi…
Esempio n°4)
Distribuzione dei comuni dell’ Italia per classi di superficie al 31-12-1991.
Classi di superficie( in migliaia di ha)
N°comuni
La seguente tabella rappresenta
un seriazione rispetto ad un
Fino a 1
1.741
carattere quantitativo continuo.
1 --------| 2
2.061
Nella tabella qui di fianco a ogni
intervallo, appartiene, l’estremo
2 --------| 4
2.093
destro, e non il sinistro, ma
4 --------| 6
883
potremmo fare benissimo il
6 --------| 10
742
contrario.
La prima e l’ultima classe possono
10 --------| 25
513
non contenere un estremo, perché
Oltre i 25
68
i valori possono essere diradati, e
Totale
8.101
in questo caso sono dette classi
aperte.
Il numero di classi varia fra un minimo di 5 e un massimo di 20. Per scegliere l’ampiezza di ogni
modulo si considera il campo di variazione del fenomeno osservato.
Per la determinazione della 1° classe si cerca di non fare coincidere l’estremo sinistro con una
osservazione effettiva. Definiamo ora:
Limite inferiore della classe, l’estremo sinistro dell’intervallo.
Limite superiore della classe, l’estremo destro dell’intervallo.
Intervallo di classe, insieme dei valori contenuti tra due limiti.
Ampiezza della classe, la differenza tra limite superiore e limite inferiore.
Valore centrale della classe, la semi-somma dei due limiti.
Le distribuzioni statistiche nelle quali i dati sono Frequenze assolute; vengono dette Distribuzioni di
Frequenza.
Tabelle a doppia entrata…
S possono eseguire delle rilevazioni su un insieme universo classificando le unità statistiche
contemporaneamente rispetto a due o più caratteri;tali rilevazioni si rappresentano
mediante tabelle a doppia entrata.
Le tabelle a doppia entrata,rappresentanti distribuzioni di frequenza possono essere:
di Contingenzase i due caratteri sono entrambi qualitativi,
di Correlazionese i due caratteri sono entrambi quantitativi,
Mistese uno dei due caratteri è qualitativo e l’altro quantitativo.
Vediamo un esempio di tabella a doppia entrata:
N°Vani
Questa qua di fianco è una tabella
di correlazione
Componenti famiglia
1
Totali
2
3
4
5
6
1
10 4
1
0
0
0
15
2
6 10 5
2
0
0
23
3
3 10 12
8
2 1
36
4
1
3
8
4
2 2
20
5
0
1
2
1
1 1
6
Totali
20 28 28
15 5 4
100
Le tabelle composte…
Le tabelle composte sono tabelle formate da più colonne che si riferiscono a
varie caratteristiche di uno stesso fenomeno, anche senza legame fra esse.
Alcune di queste sono utilizzate per confrontare due serie storiche e hanno
particolare importanza.
Vediamone un esempio:
Reddito
Familiare
Pro capite
Familiare
Pro capite
Percentual
e consumo
su reddito
1980
943
294
854
267
90,6
1981
1.111
347
1.005
314
90,4
1982
1.310
409
1.174
367
89,7
1983
1.458
483
1.269
421
87,1
1984
1.641
544
1.417
469
86,3
Anni
Spesa
Queste tabelle
permettono,
come indicato
nell’ultima
colonna, di
confrontare
modalità
diverse
riferendosi
però alla
stessa
popolazione
statistica.
MUTABILI E VARIABILI STATISTICHE
Prendendo in considerazione le distribuzioni di
frequenza, a cui a ogni modalità del carattere,(sia esso
qualitativo o quantitativo)è associata una
frequenza,introduciamo le definizioni di mutabile
statistica e di variabile statistica.
1a
variabile statistica è definita dall’insieme dei valori
osservati di un carattere quantitativo e dalle frequenze
a essi associate.
Una
mutabile statistica è definita dall’insieme delle
modalità osservate di un carattere qualitativo e delle
frequenze a esse associate.
Nel caso della variabile i valori sono indicati con
x1,x2,…xnsi hanno le distribuzioni 1a e 1b.
Frequenze
assolute
X1
X2
Y1
Y2
1b
Valori
X1
X2
-
-
Una
Ai valori della variabile si possono associare al posto
delle frequenze assolute, le frequenze relative, che si
ottengono dividendo ogni frequenza per la loro somma.
Valori
-
F1=Y1/N
F2=Y2/N
Fi =Yi/N
Xi
Yi
Xi
-
-
-
Xn
Yn
Xn
I=n
Nel caso della variabile continua e le determinazioni sono
raggruppate in classi si possono avere le distribuzioni 2a
e 2b.
-Si definiscono inoltre frequenze relative cumulate le
frequenze che associano a ogni valore della variabile
discreta(o a ogni classe della var. continua), la somma
della rispettiva frequenza relativa con le frequenze
dei valori precedenti.L’insieme delle modalità del
carattere con le corrispondenti frequenze relative
cumulate, si definisce distribuzione di frequenze relative
cumulate.Se vogliamo poi ottenere le frequenze
percentuali basterà moltiplicare le frequenze relative
per 100.
X1|-X2
-
-
X1|-X2
-
Fi =Yi/N
 Yi = N
I=1
Frequenze
relative
F1=Y1/N
F2=Y2/N
Yn
I=n
Classi
X0|-X1
-
Xn-1|- Xn
2b
Y1
Y2
Yi
-
Fn =Yn/N
I=1
Frequenze
assolute
X0|-X1
-
 fi = 1
I=1
Classi
-
I=n
 Yi = N
2a
Frequenze
relative
-
Xn-1|-Xn
-
-
Fn =Yn/N
I=n
 fi = 1
I=1
RAPPRESENTAZIONI GRAFICHE
I dati raccolti in tabelle si possono rappresentare graficamente .I
grafici, essendo di facile lettura, permettono di capire l’andamento di un
fenomeno. Analizziamo ora i diversi tipi di rappresentazione grafica:
A) RAPPRESENTAZIONE GRAFICA MEDIANTE DIAGRAMMI CARTESIANI
I diagrammi cartesiani sono usati soprattutto per rappresentare serie
storiche e seriazioni discrete. Le unità di misura sui due assi cartesiani
sono generalmente diverse.Nei diagrammi cartesiani solitamente si
collegano con una spezzata i punti rappresentativi delle coppie di valori,
soprattutto nel caso di grafici di serie storiche (tale spezzata mette in
evidenza l’evoluzione del fenomeno nel tempo). Nel caso di
rappresentazione di seriazioni si segnano con un tratto marcato le
ordinate dei punti (diagramma a segmenti).
- Nella diapositiva successiva verranno rappresentati graficamente con
diagrammi cartesiani esempi di distribuzioni di frequenze relative
cumulate.
Nel caso di seriazioni con valori discreti,riportando i dati della tabella
sottostante, si ottiene il seguente grafico:
FREQUENZE
*
RELATIVE
N.
STANZE
N.
ABITAZIONI
FREQ.
RELAT.
FREQ. REL.
CUMULATE
1
2
3
4
5
6 e più
300.364
1.791.887
3.761.695
5.616.939
3.520.498
2.550.369
0.0171
0.1022
0.2144
0.3202
0.2007
0.1454
0.0171
0.1193
0.3337
0.6539
0.8546
1.0000
totale
17.541.752
1.0000
*
Rilevazione della abitazioni occupate in italia
secondo il n° di stanze nel 1981
CUMULATE
1.00.90.80.70.60.50.40.30.20.1|
|
|
|
|
1
2
3
4
5
N° STANZE
Se invece si ha una seriazione a valori continui suddivisi in classi, si collegano i
valori delle frequenze cumulate mediante una spezzata ,supponendo che
nell’intervallo di ciascuna classe vi sia una distribuzione uniforme delle
frequenze.Si ottiene la cosiddetta poligonale delle frequenze cumulate,riportando
i dati della tabella sottostante si ottiene il seguente grafico:
*
FREQUENZE
Classi in
superfici
N.di
comuni
Freq.relat
cumulate
Fino a 1
1 -|2
2 -|4
4 -|6
6 -|10
10 -|25
Oltre 25
1.741
2.061
2.093
883
742
513
68
0,2149
0,4693
0,7277
0,8367
0,9283
0,9916
1,0000
totale
8.101
*
Distribuzione dei Comuni dell’ Italia
per classi di superficie al 31.12.1991
RELATIVE
CUMULATE
1.00.90.80.70.60.5-
0.40.30.20.1| | |
|
|
|
|
0 1 2
4
6
10
25
CLASSI DI
SUPERFICI
B) ISTOGRAMMI
Si usano gli istogrammi per rappresentare seriazioni continue con i dati raggruppati in
classi. Fissato un sistema di assi cartesiani ortogonali, sulle ascisse si riportano tanti
intervalli consecutivi quante sono le classi;su questi intervalli si costruiscono dei
rettangoli le cui aree sono proporzionali alle frequenze.Con gli istogrammi la somma
delle aree di tutti i rettangoli è proporzionale alla somma delle frequenze.Vediamo ora
un esempio di istogramma:
Cilindrate
(in cm3)
N.
autovetture
500 -|1000
1000-|1500
1500-|2000
Oltre 2000
433.963
491.798
281.239
50.340
totale
1.257.340
600000
n° autovetture
*
400000
200000
0
cilindrata (in cm^3)
Le classi hanno tutte la stessa ampiezza,tranne l’ultima che è aperta.In caso
di classi aperte o si chiudono indicando un valore estremo logico,oppure si
trascurano,quando il rapporto espresso in percentuale fra la frequenza di tale
classe a il valore tot. delle frequenze è relativamente piccolo.
*
Ripartizione delle autovetture italiane
prodotte nell’anno 1981 secondo la cilindrata
C ) DIAGRAMMI IN COORDINATE POLARI
I diagrammi in coordinate polari sono utilizzati per rappresentare particolari
serie storiche , dette cicliche,dove le modalità del carattere si ripetono dopo un
certo periodo. Con origine in un punto O ,detto polo, si tracciano tante semirette
quante sono le modalità, in modo che gli angoli fra due semirette consecutive siano
eguali e sulle semirette, a partire dal polo, si riportano i dati, e i punti così
ottenuti si collegano con una spezzata. Riportando i dati della tabella sottostante,
si ottiene il seguente grafico:
*
MESI
VIAGGIATORI
Gennaio
Febbraio
Marzo
Aprile
Maggio
Giugno
Luglio
Agosto
Settembre
Ottobre
Novembre
Dicembre
*
(in migliaia)
34.175
32.245
33.114
33.921
31.477
28.389
27.503
25.174
29.482
29.561
33.029
28.426
MG
AP
MR
GG
FB
LG
GN
AG
DC
ST
OT
Traffico viaggiatori sulle Ferrovie dello Stato nei mesi dell’anno 1980
NV
D ) ORTOGRAMMI
Per rappresentare serie storiche e serie territoriali,si possono utilizzare gli
ortogrammi, costituiti da rettangoli di basi eguali e di altezze proporzionali alle
intensità del fenomeno.Si possono anche accostare rettangoli riferiti a sessi, o ad
anni, o a paesi diversi allo scopo di effettuare confronti.
Diamo un esempio di ortogramma a partire dalla seguente tabella.
Agricoltura
Industria
Altre attività
Disoccupati
Maschi
(in
migliaia)
Femmine
(in migliaia)
962
5.100
7.184
493
545
1.637
4.998
352
8-
POPOLAZIONE PER CONDIZIONE E SESSO
76543-
Maschi
Femmine
210-
| Agricoltura | Industria
|
Altre
attività
|Disoccupati |
E ) ALTRE RAPPRESENTAZIONI GRAFICHE
Oltre alle rappresentazioni grafiche che abbiamo visto in precedenza, ne esistono delle
altre:
- i cartogrammi, che si utilizano per rappresentare serie territoriali,si realizzano
riportando su una carta geografica,mediante simboli convenzionali o colorazioni
diverse,le intensità osservate nelle varie parti nelle quali è diviso un territorio.
- gli ideogrammi, che consistono nel rappresentare figure più o meno grandi in relazione
all’intensità del fenomeno.
- i settori circolari di un cerchio o di un semicerchio, che si usano per rappresentare certe
distribuzioni di frequenza nelle quali la totalità del fenomeno viene ripartita in modalità
rappresentate da settori i cui angoli al centro sono proporzionali alle intensità del
fenomeno.
- i diagrammi a tre dimensioni, che sono rappresentazioni fatte attraverso figure solide e
hanno la caratteristica di essere molto significativi;vengono spesso indicati col nome di
stereogrammi e sono usati,in genere, per rappresentare i dati di tabelle a doppia
entrata.
Le rappresentazioni grafiche con l’uso di fogli
elettronici
Le rappresentazioni grafiche di tabelle statistiche possono essere effettuate
mediante fogli elettronici (chiamati comunemente F.E.).
Gli F.E. fanno parte di una vasta gamma di programmi applicativi che permettono di
Utilizzare i PC anche senza conoscere a fondo le tecniche di programmazione.
Gli F.E. trovano applicazione in molti campi in quanto permettono elaborazioni
automatiche di tutti i tipi di problemi rappresentati in tabelle.
La rapidità e la facilità con cui si apprende l’uso del programma ha fatto hanno
favorito il suo successo.Tra i più conosciuti F.E.ricordiamo:Exel , Multiplan , Visical.
La caratteristica comune a questi è quella di mettere in condizione, a chi li utilizza,di
non sbagliare in quanto tutte le operazioni vengono descritte chiaramente sullo
schermo tramite”menù gerarchici”.
Oltre a ciò è prevista una opzione di “help”per la quale ,utilizzando un particolare
tasto,sullo schermo appare una spiegazione dell’ operazione in corso di svolgimento.
Un foglio elettronico è un enorme tabellone suddiviso in caselle identificati da una
coppia di coordinate(riga,colonna)che possono contenere numeri o testi.
Sullo schermo è visibile solo una parte del foglio che,tramite le frecce posso
spostare.
Si possono creare presentazioni grafiche scegliendo ogni volta fra le diverse opzioni
possibili.
Le rilevazioni mediante questionario
I questionari attualmente rappresentano uno dei metodi più diffusi nelle ricerche di
mercato,nei sondaggi,e negli studi.
a)la predisposizione del modello
Per la realizzazione di un questionario è essenziale tener presenti gli obiettivi che
s’intendono raggiungere dall’indagine.
Per prima cosa occorre precisare che un questionario è uno stampato contenente un
numero di domande alle quali l’interessato deve rispondere;è preferibile utilizzare
domande a risposta chiusa perché facilitano la codifica dei dati raccolti e la loro
elaborazione.
Le domande devono essere compilate con linguaggio semplice e comprensibile.
Il questionario generalmente è diviso in due parti:una prima parte contiene le
domande necessarie a ottenere i dati base,una seconda contiene domande più
specifiche,che permettono di ottenere le informazioni necessarie al tipo di indagine
che si vuole svolgere.
Prima di somministrare il questionario occorre fornire agli interessati la spiegazione per la
compilazione.
Continuo…
b)la codifica dei dati
La fase successiva è quella della somministrazione del questionario;si passa poi
all’enumerazione
dei questionari pervenuti,indispensabile al fine di un successivo controllo per la correzione
degli
errori nella fase dello spoglio.Per la codifica dei dati,occorre predisporre un tabulato che
riprenda
le domande del questionario.Ogni riga del tabulato conterrà le risposte del questionario.
c) Lo spoglio e la tabulazione dei dati
Dopo aver riportato tutti i questionari, in codice ,sul tabulato si potrà procedere con lo
spoglio e
la tabulazione dei dati.
Nel caso di uno spoglio semplice ,basterà contare,colonna per colonna,come sono distribuite
le
risposte alle varie domande.
Dopo aver corretto gli errori i dati vengono sistemati in tabelle semplici o così come si
presentano
o trasformandoli in frequenze percentuali.
Nel caso di uno spoglio incrociato vanno esaminati ,ad incrocio, i valori contenuti nelle
colonne.
Ringraziamo per aver scelto di
assistere alla nostra
presentazione:
-Pisciotta Michela
-Lai Stafania
- Zuccalà Ilaria
Scarica