Introduzione alla statistica - Università degli Studi della Basilicata

16/04/2012
GEOMATEMATICA
Dott.ssa ELVIRA DI NARDO
Dipartimento di Matematica e Informatica
http://www.unibas.it/utenti/dinardo/
• G. Ciotoli, M. Finoia “Dalla Statistica alla Geostatistica: Introduzione all’analisi
dei dati geologici ed ambientali” ARACNE (2005)
• STATVIEW
Che cos’è la statistica?
La statistica è una scienza
costituita da una serie di
metodologie utilizzate per
la raccolta, per l’analisi, per
la presentazione e l’interpretazione dei dati .
Cercheremo di rispondere alle seguenti domande:
-Se assumiamo che il campione di osservazioni che dobbiamo studiare
è rappresentativo del gruppo da cui proviene, cosa possiamo dire
riguardo al gruppo?
-Con quale probabilità possiamo dire che il gruppo di osservazioni che
sto studiando è simile al gruppo originario?
1
16/04/2012
Popolazione:
insieme di tutti gli elementi
di interesse in uno studio
Campione:
Sottoinsieme della popolazione.
Cercheremo di rispondere alle seguenti domande:
-Se assumiamo che il campione di osservazioni che dobbiamo studiare
è rappresentativo del gruppo da cui proviene, cosa possiamo dire
riguardo al gruppo?
-Con quale probabilità possiamo dire che il gruppo di osservazioni che
sto studiando è simile al gruppo originario?
CAMPIONE
STATISTICA DESCRITTIVA
DATI
STATISTICA INFERENZIALE
METODI ESPLORATIVI
TEORIA DELLA PROBABILITA’
Riassunti delle informazioni
contenute nei dati mediante
procedure aritmetiche e/o
grafiche
- Verifica di ipotesi
- Previsioni
- Interpretazione
- Costruzione di modelli generali
per descrivere la popolazione
2
16/04/2012
E’ significativa la differenza tra la composizione di graniti
appartenenti a due rocce intrusive differenti?
ESEMPIO
Nella tabella sono riportati i valori della percentuale di quarzo contenuta in due rocce intrusive. Per ogni roccia sono stati prelevati 8 campioni.
Al fine di classificare i due campioni
di roccia, esiste una differenza significativa tra le due serie di campioni?
Esiste una ciclicità nella stratificazione di una sequenza
carbonatica?
ESEMPIO
E’ possibile analizzare
la natura delle transizioni da uno strato
all’altro anziché le
posizioni relative degli
strati nella sequenza.
3
16/04/2012
L’approccio sperimentale
1. Conoscenza del territorio
Investigazione preliminare del sito per la ricostruzione di un modello
concettuale del fenomeno studiato. Ex: possibile combinazione sito sorgente di contaminazione.
2. Pianificazione attività conoscitive
3. Campionamento
4. Procedure di trattamento dei dati
5. Descrizione statistica
6. Scelta dei test
7. Analisi della distribuzione spaziale
8. Elaborazione delle mappe tematiche
DATI
VARIABILE QUALITATIVA O
CATEGORIALE
SCALA NOMINALE
: etichette non confrontabili
SCALA ORDINALE
: etichette confrontabili
VARIABILE QUANTITATIVA
DISCRETI
CONTINUI
NUMERI
INTERI
NUMERI
REALI
Dati relativi o ad intervalli
(ex: temperatura – zero variabile)
Dati assoluti
(ex: peso/lunghezza – zero fisso)
Dati chiusi
(ex: dati in forma di percentuale)
Dati di direzione
(ex: sono espressi in angoli, la direzione rispetto al nord del piano di
una stratificazione)
4
16/04/2012
ID = numero progressivo del campione
X(m) = longitudine geografica in metri
Y(m) = latitudine geografica in metri
Nome = denominazione dell’acqua
Comune = località in cui è situata la sorgente
Prov = provincia
T(°C) = temperatura dell’acqua sorgente
pH = concentrazione degli ioni H+
Cond = conducibilità elettrica in OHM
- 9999 = dato mancante
Parametri chimico-fisici e alla composizione chimica di alcune acque minerali italiane
FONTE DEI DATI
PRIMARIA
DATI SPERIMENTALI
SECONDARIA
DATI BIBLIOGRAFICI
DATI DI CAMPAGNA
DATI DI OSSERVAZIONE
5
16/04/2012
TIPI DI ERRORI
Errori sistematici: dipendono dagli strumenti e dalle tecniche di
misura utilizzate (strumenti tarati male).
Errori casuali – white noise
L’accuratezza è la vicinanza
di un valore misurato al suo
valore reale
– dipende dallo strumento.
50
La precisione è la vicinanza
di misure ripetute al
medesimo valore
A
B
C
D
Un valore può essere preciso ma non accurato.
Tutti i colpi centrano il bersaglio e
sono molto vicini = accuratezza
e precisione.
I colpi sono tutti nello stesso posto,
ma lontani dal centro del bersaglio
= scarsa accuratezza e buona precisione
I colpi sono dispersi attorno al centro
ma la loro media coincide con
quella del bersaglio = accuratezza e
bassa precisione.
I colpi sono dispersi attorno al centro e la loro media non coincide
con quella del bersaglio = bassa accuratezza e bassa precisione.
6
16/04/2012
Come leggere da un
grafico precisione ed
accuratezza.
La popolazione è rappresentata da tutte le misure ipoteticamente
possibili che possono essere effettuate sull’entità oggetto di studio.
- Composizione di tutti i graniti del mondo;
- Dimensioni di tutti gli esemplari di una specie di trilobite;
- Il contenuto in elementi in traccia di tutti i sedimenti fluviali
POPOLAZIONE IPOTETICA: intera entità del fenomeno studiato esistente – misure granulometriche di un orizzonte sabbioso che affiora
in superficie e che è stato parzialmente eroso.
POPOLAZIONE ESISTENTE: porzione rimanente dell’intera entità (orizzonte sabbioso) che rappresenta la popolazione oggetto di studio.
POPOLAZIONE DISPONIBILE: la popolazione esistente da cui è possibile
estrarre un campione rappresentativo
7
16/04/2012
Le Fasi Dell’ANALISI
DESCRIZIONE DEI
DATI
DATA
SET
MISURE
INFERENZA
Conclusioni
CAMPIONE
POPOLAZIONE
CAMPIONAMENTO
- Pianificazione
- Previsione
- Intervento
Tecniche statistiche
•
•
•
•
•
•
•
•
Statistica descrittiva
Statistica Matematica
Statistica Inferenziale
Statistica parametrica e non parametrica
Tecniche di statistica univariata
Tecniche di statistica bivariata
Analisi delle serie temporali
Tecniche di analisi spaziale
8
16/04/2012
TECNICHE DI CAMPIONAMENTO
• Campionamento ragionato: la selezione dell’unità è effettuata sulla
base delle conoscenze pregresse sull’area investigata.
-Lo studio è condotto a piccola scala
-Numero di campioni piccolo
- individuazione di aree anomale
TECNICHE DI CAMPIONAMENTO
• Campionamento casuale: la selezione dell’unità è
effettuata in modo
tale che tutte le unità abbiano la stessa probabilità di essere selezionate. Necessaria popolazione omogenea.
-Poco controllabili spazio/tempo
- si ignorano informazioni pregresse
9
16/04/2012
TECNICHE DI CAMPIONAMENTO
• Campionamento stratificato: la selezione dell’unità è effettuata per
gruppi (strati) che sono poi campionati separatamente.
- Monitoraggio temporale
• Campionamento sistematico: la
selezione dell’unità è effettuata nel
tempo e nello spazio secondo uno schema predefinito
- Dati prelevati secondo una griglia a maglia quadrata
- Dati prelevati ad intervalli regolari nel tempo
- Copertura uniforme, progettazione griglia semplice, incrementare il dettaglio in certe
aree
• Campionamento pesato: la selezione dell’unità è una combinazione
tra campionamento casuale e campionamento ragionato.
- Consigliato in presenza di un costo elevato di misure.
10