analisi dati e metodi statistici - INFN Cagliari

ANALISI DATI E METODI
STATISTICI
L.M. Fisica, Università di Cagliari
Docente: Alessandro De Falco
[email protected]
Tel: 070 675 4824
Web: http://gruppo3.ca.infn.it/defalco/analisi_dati
1
1
Principio di falsificabilità
Criterio teorizzato da Karl Popper per discriminare tra ciò che è
scienza e ciò che non lo è
Un asserto è scientifico o empirico, secondo Popper, se da esso
seguono delle conseguenze passibili di osservazioni, che possono
confermare o falsificare le teorie da cui derivano
Le teorie scientifiche, per essere tali, devono essere falsificabili
Le teorie controllabili, che pertengono alla scienza, si
contrappongono alle teorie non controllabili, che pertengono alla
metafisica
Alessandro De Falco, INFN Cagliari
2
3/4/14
Quando si effettua una misura (ma anche quando
si dà una previsione teorica) bisogna fornire
almeno due valori:
Il valore misurato e la sua incertezza
O meglio:
Il valore misurato, la sua incertezza statistica
e la sua incertezza sistematica
Alessandro De Falco, INFN Cagliari
3
3/4/14
Analisi dati e statistica
Proprietà delle distribuzioni degli eventi
Es: un gruppo di cavie viene trattato con un farmaco.
Un gruppo di 25 elementi, trattato col farmaco A, cresce del 10%
Un gruppo di 10 elementi, trattato col farmaco B, cresce del 3%
A è più efficace di B?
Conoscenza delle distribuzioni, dei loro valori medi e delle
dispersioni intorno al valore medio.
Il numero di cavie è sufficiente a discriminare tra i due campioni?
Campionamento
Es: In esperimenti sulla crescita dei cristalli è essenziale mantenere
esattamente il rapporto tra componenti differenti.
Su 500 cristalli, 20 sono analizzati. Quale conclusione si può trarre
sulla composizione dei restanti 480?
Alessandro De Falco, INFN Cagliari
4
3/4/14
Test di ipotesi
Permette di stabilire se un certo risultato è in grado di
avvalorare ovvero contraddire una teoria
Stima di parametri
Di una legge nota (per esempio il decadimento radioattivo)
bisogna stabilire i parametri caratterizzanti basandosi su un
certo numero di osservazioni.
Le misure sperimentali sono delle variabili casuali caratterizzate
da distribuzioni. La natura casuale può essere determinata dalle
caratteristiche del campione in studio e/o dalla precisione limitata
dell'esperimento.
Alessandro De Falco, INFN Cagliari
5
3/4/14
Probabilità e statistica: outline
Elementi di teoria delle probabilità
Variabili casuali e distribuzioni
Alcune distribuzioni caratteristiche
Campionamento
Metodo della massima verosimoiglianza
Metodo dei minimi quadrati
Analisi della varianza
...
Alessandro De Falco, INFN Cagliari
6
3/4/14
Probabilità e statistica: testi
A.G. Frodesen et al: Probability and statistics in Particle Physics
Ottimo testo anche se non recente
Purtroppo è fuori catalogo
...ma si trova in bibilioteca (e qualcuno l'ha messo su web)
manca il metodo Monte Carlo
G. Bohm, G. Zech: Introduction to Statistics and Data Analysis for Physicists
Verlag Deutsches Elektronen-Synchrotron
http://www-library.desy.de/preparch/books/vstatmp_engl.pdf
G. Cowan:
A. Rotondi et al:
R. Barlow:
Alessandro De Falco, INFN Cagliari
Statistical Data Analysis
Probabilità, Statistica e Simulazione (Springer)
Statistics (Wiley)
7
3/4/14
Materiale didattico a supporto
Trasparenze:
si trovano in http://gruppo3.ca.infn.it/analisi_dati
Raccomandazione:
Le trasparenze sono schematiche e possono contenere degli errori di
battitura
dunque non si devono usare le slides come se fossero delle
dispense
servono solo come promemoria per agevolare la ricerca degli
argomenti nei testi
Alessandro De Falco, INFN Cagliari
8
3/4/14
Dove faremo lezione
Nuova aula di informatica: aula 304 dell'asse didattico 5
(edificio della biblioteca)
Aula 304, terzo piano
Alessandro De Falco, INFN Cagliari
9
3/4/14
Supporto per il calcolo
Supporto per il calcolo:
è disponibile una macchina virtuale con linux in due versioni:
distribuzione Centos5
S.O. host a 64 bit o a 32 bit
Nella macchina virtuale sono installati root, geant3, emacs, gcc ed il
debugger ddd
Virtualizzazione mediante VirtualBox
(software per l' esecuzione di macchine virtuali open source)
Supporto offerto solo per questa macchina virtuale, con questo root preinstallato, e con
questo software di virtualizzazione
La macchina virtuale è installata in alcune macchine dell'aula di
informatica
E' possibile scaricarla: mandatemi un'email per ottenere il link
(indicatemi la versione che vi occorre: 32 o 64 bit)
File compresso con gzip: ~2 GB. File espanso: ~6 GB
Alessandro De Falco, INFN Cagliari
10
3/4/14
VirtualBox
https://www.virtualbox.org/
Download: https://www.virtualbox.org/wiki/Downloads
Alessandro De Falco, INFN Cagliari
11
3/4/14
Come usare la macchina virtuale
Una volta installato VirtualBox sulla vostra macchina, scaricate il file
Centos_[versione].gz al link che vi ho indicato
e scompattatelo.
Troverete un file con estensione .qcow
Lanciate VirtualBox
Premete New
Compilate i campi
e andate avanti
Alessandro De Falco, INFN Cagliari
12
3/4/14
Quanta memoria? Dipende dal vostro computer
Nel mio caso, dedico 2GB di ram, ovvero metà della RAM che ho a
disposizione
Sistemi con poca memoria potrebbero essere sovraccaricati dall'uso
della macchina virtuale
Alessandro De Falco, INFN Cagliari
13
3/4/14
Finalmente potete caricare il file fisica.qcow
Selezionate Use an existing virtual hard drive file e scegliete fisica.qcow
Infine Create la macchina
Alessandro De Falco, INFN Cagliari
14
3/4/14
A questo punto possiamo far partire la nostra macchina virtuale
User: fisica
password: fisica
Alessandro De Falco, INFN Cagliari
15
3/4/14
Nella macchina virtuale è stato già installato root
Il file .bashrc nella home directory (eseguito automaticamente ad ogni
login) contiene la definizione di alcune variabili d'ambiente necessarie
per far funzionare
correttamente root
Alessandro De Falco, INFN Cagliari
16
3/4/14
Installazione di root senza l'uso della
macchina virtuale
In http://root.cern.ch/drupal/ troverete le istruzioni per scaricare ed
installare root su diverse piattaforme
In diversi casi (in particolare sotto windows) è disponibile un pacchetto
che rende l'installazione semplice
Avrete poi bisogno di un compilatore c++, di un buon editor...
I più temerari possono provare a scaricare il codice sorgente e
compilare root (soluzione che viene adottata abitualmente da chi usa
root quotidianamente per la ricerca)
Download->Building root
Alessandro De Falco, INFN Cagliari
17
3/4/14
Che cosa è root
Root è un potente frame di calcolo
basato sul C++ sviluppato per
l'analisi dati in fisica
E' ampiamente diffuso in fisica delle
particelle
Il software degli esperimenti di LHC è
più o meno pesantemente basato
su root
E' utilizzato anche in altri settori della fisica, ed in altri campi
(astronomia, biologia, finanza, medicina)
http://root.cern.ch/drupal/content/about
Alessandro De Falco, INFN Cagliari
18
3/4/14
Che cosa useremo di root
Istogrammi (1D, 2D, n-D)
Funzioni
Fit
generazione di numeri casuali
Librerie matematiche e statistiche
Input/Output
Rappresentazione grafica
Classi per la trattazione di vettori, quadrivettori di Lorentz
database delle particelle elementari
Interfaccia per la simulazione dei rivelatori (codice di trasporto Geant3)
.....
Alessandro De Falco, INFN Cagliari
19
3/4/14
Che cosa dovremo conoscere per usare
root
E' necessario avere una conoscenza basilare del C++
Elementi di base del C
I/O
loop, if
funzioni
puntatori e referenze
Elementi di base sulla programmazione ad oggetti
Classi e loro struttura
Incapsulamento
Ereditarietà
Inoltre dovremo imparare ad usare le classi principali di root, e i trucchi
che ci permettono di usare i numerosi metodi delle numerose classi
senza dover ricordare tutto a memoria
Alessandro De Falco, INFN Cagliari
20
3/4/14
Nel seguito verranno trattati rapidamente i punti salienti della
programmazione in C++ e dell'uso di root
Queste conoscenze sono dei prerequisiti per lo svolgimento del corso
Senza queste conoscenze non sarà possibile effettuare gli esercizi
D'altra parte questo non è un corso di programmazione
Approccio 'pragmatico': imparo quello che mi serve allo scopo senza
curarmi troppo dei dettagli
Chi dovrà utilizzare intensivamente la programmazione in C++ è
caldamente invitato a svolgere uno studio più approfondito sui manuali
Si presuppone che alcuni elementi siano già noti e che gli studenti
abbiano in ogni caso qualche esperienza di programmazione
(possibilmente in C/C++)
Alessandro De Falco, INFN Cagliari
21
3/4/14