16/04/2012 GEOMATEMATICA Dott.ssa ELVIRA DI NARDO Dipartimento di Matematica e Informatica http://www.unibas.it/utenti/dinardo/ • G. Ciotoli, M. Finoia “Dalla Statistica alla Geostatistica: Introduzione all’analisi dei dati geologici ed ambientali” ARACNE (2005) • STATVIEW Che cos’è la statistica? La statistica è una scienza costituita da una serie di metodologie utilizzate per la raccolta, per l’analisi, per la presentazione e l’interpretazione dei dati . Cercheremo di rispondere alle seguenti domande: -Se assumiamo che il campione di osservazioni che dobbiamo studiare è rappresentativo del gruppo da cui proviene, cosa possiamo dire riguardo al gruppo? -Con quale probabilità possiamo dire che il gruppo di osservazioni che sto studiando è simile al gruppo originario? 1 16/04/2012 Popolazione: insieme di tutti gli elementi di interesse in uno studio Campione: Sottoinsieme della popolazione. Cercheremo di rispondere alle seguenti domande: -Se assumiamo che il campione di osservazioni che dobbiamo studiare è rappresentativo del gruppo da cui proviene, cosa possiamo dire riguardo al gruppo? -Con quale probabilità possiamo dire che il gruppo di osservazioni che sto studiando è simile al gruppo originario? CAMPIONE STATISTICA DESCRITTIVA DATI STATISTICA INFERENZIALE METODI ESPLORATIVI TEORIA DELLA PROBABILITA’ Riassunti delle informazioni contenute nei dati mediante procedure aritmetiche e/o grafiche - Verifica di ipotesi - Previsioni - Interpretazione - Costruzione di modelli generali per descrivere la popolazione 2 16/04/2012 E’ significativa la differenza tra la composizione di graniti appartenenti a due rocce intrusive differenti? ESEMPIO Nella tabella sono riportati i valori della percentuale di quarzo contenuta in due rocce intrusive. Per ogni roccia sono stati prelevati 8 campioni. Al fine di classificare i due campioni di roccia, esiste una differenza significativa tra le due serie di campioni? Esiste una ciclicità nella stratificazione di una sequenza carbonatica? ESEMPIO E’ possibile analizzare la natura delle transizioni da uno strato all’altro anziché le posizioni relative degli strati nella sequenza. 3 16/04/2012 L’approccio sperimentale 1. Conoscenza del territorio Investigazione preliminare del sito per la ricostruzione di un modello concettuale del fenomeno studiato. Ex: possibile combinazione sito sorgente di contaminazione. 2. Pianificazione attività conoscitive 3. Campionamento 4. Procedure di trattamento dei dati 5. Descrizione statistica 6. Scelta dei test 7. Analisi della distribuzione spaziale 8. Elaborazione delle mappe tematiche DATI VARIABILE QUALITATIVA O CATEGORIALE SCALA NOMINALE : etichette non confrontabili SCALA ORDINALE : etichette confrontabili VARIABILE QUANTITATIVA DISCRETI CONTINUI NUMERI INTERI NUMERI REALI Dati relativi o ad intervalli (ex: temperatura – zero variabile) Dati assoluti (ex: peso/lunghezza – zero fisso) Dati chiusi (ex: dati in forma di percentuale) Dati di direzione (ex: sono espressi in angoli, la direzione rispetto al nord del piano di una stratificazione) 4 16/04/2012 ID = numero progressivo del campione X(m) = longitudine geografica in metri Y(m) = latitudine geografica in metri Nome = denominazione dell’acqua Comune = località in cui è situata la sorgente Prov = provincia T(°C) = temperatura dell’acqua sorgente pH = concentrazione degli ioni H+ Cond = conducibilità elettrica in OHM - 9999 = dato mancante Parametri chimico-fisici e alla composizione chimica di alcune acque minerali italiane FONTE DEI DATI PRIMARIA DATI SPERIMENTALI SECONDARIA DATI BIBLIOGRAFICI DATI DI CAMPAGNA DATI DI OSSERVAZIONE 5 16/04/2012 TIPI DI ERRORI Errori sistematici: dipendono dagli strumenti e dalle tecniche di misura utilizzate (strumenti tarati male). Errori casuali – white noise L’accuratezza è la vicinanza di un valore misurato al suo valore reale – dipende dallo strumento. 50 La precisione è la vicinanza di misure ripetute al medesimo valore A B C D Un valore può essere preciso ma non accurato. Tutti i colpi centrano il bersaglio e sono molto vicini = accuratezza e precisione. I colpi sono tutti nello stesso posto, ma lontani dal centro del bersaglio = scarsa accuratezza e buona precisione I colpi sono dispersi attorno al centro ma la loro media coincide con quella del bersaglio = accuratezza e bassa precisione. I colpi sono dispersi attorno al centro e la loro media non coincide con quella del bersaglio = bassa accuratezza e bassa precisione. 6 16/04/2012 Come leggere da un grafico precisione ed accuratezza. La popolazione è rappresentata da tutte le misure ipoteticamente possibili che possono essere effettuate sull’entità oggetto di studio. - Composizione di tutti i graniti del mondo; - Dimensioni di tutti gli esemplari di una specie di trilobite; - Il contenuto in elementi in traccia di tutti i sedimenti fluviali POPOLAZIONE IPOTETICA: intera entità del fenomeno studiato esistente – misure granulometriche di un orizzonte sabbioso che affiora in superficie e che è stato parzialmente eroso. POPOLAZIONE ESISTENTE: porzione rimanente dell’intera entità (orizzonte sabbioso) che rappresenta la popolazione oggetto di studio. POPOLAZIONE DISPONIBILE: la popolazione esistente da cui è possibile estrarre un campione rappresentativo 7 16/04/2012 Le Fasi Dell’ANALISI DESCRIZIONE DEI DATI DATA SET MISURE INFERENZA Conclusioni CAMPIONE POPOLAZIONE CAMPIONAMENTO - Pianificazione - Previsione - Intervento Tecniche statistiche • • • • • • • • Statistica descrittiva Statistica Matematica Statistica Inferenziale Statistica parametrica e non parametrica Tecniche di statistica univariata Tecniche di statistica bivariata Analisi delle serie temporali Tecniche di analisi spaziale 8 16/04/2012 TECNICHE DI CAMPIONAMENTO • Campionamento ragionato: la selezione dell’unità è effettuata sulla base delle conoscenze pregresse sull’area investigata. -Lo studio è condotto a piccola scala -Numero di campioni piccolo - individuazione di aree anomale TECNICHE DI CAMPIONAMENTO • Campionamento casuale: la selezione dell’unità è effettuata in modo tale che tutte le unità abbiano la stessa probabilità di essere selezionate. Necessaria popolazione omogenea. -Poco controllabili spazio/tempo - si ignorano informazioni pregresse 9 16/04/2012 TECNICHE DI CAMPIONAMENTO • Campionamento stratificato: la selezione dell’unità è effettuata per gruppi (strati) che sono poi campionati separatamente. - Monitoraggio temporale • Campionamento sistematico: la selezione dell’unità è effettuata nel tempo e nello spazio secondo uno schema predefinito - Dati prelevati secondo una griglia a maglia quadrata - Dati prelevati ad intervalli regolari nel tempo - Copertura uniforme, progettazione griglia semplice, incrementare il dettaglio in certe aree • Campionamento pesato: la selezione dell’unità è una combinazione tra campionamento casuale e campionamento ragionato. - Consigliato in presenza di un costo elevato di misure. 10