ANALISI DATI E METODI STATISTICI L.M. Fisica, Università di Cagliari Docente: Alessandro De Falco [email protected] Tel: 070 675 4824 Web: http://gruppo3.ca.infn.it/defalco/analisi_dati 1 1 Principio di falsificabilità Criterio teorizzato da Karl Popper per discriminare tra ciò che è scienza e ciò che non lo è Un asserto è scientifico o empirico, secondo Popper, se da esso seguono delle conseguenze passibili di osservazioni, che possono confermare o falsificare le teorie da cui derivano Le teorie scientifiche, per essere tali, devono essere falsificabili Le teorie controllabili, che pertengono alla scienza, si contrappongono alle teorie non controllabili, che pertengono alla metafisica Alessandro De Falco, INFN Cagliari 2 3/4/14 Quando si effettua una misura (ma anche quando si dà una previsione teorica) bisogna fornire almeno due valori: Il valore misurato e la sua incertezza O meglio: Il valore misurato, la sua incertezza statistica e la sua incertezza sistematica Alessandro De Falco, INFN Cagliari 3 3/4/14 Analisi dati e statistica Proprietà delle distribuzioni degli eventi Es: un gruppo di cavie viene trattato con un farmaco. Un gruppo di 25 elementi, trattato col farmaco A, cresce del 10% Un gruppo di 10 elementi, trattato col farmaco B, cresce del 3% A è più efficace di B? Conoscenza delle distribuzioni, dei loro valori medi e delle dispersioni intorno al valore medio. Il numero di cavie è sufficiente a discriminare tra i due campioni? Campionamento Es: In esperimenti sulla crescita dei cristalli è essenziale mantenere esattamente il rapporto tra componenti differenti. Su 500 cristalli, 20 sono analizzati. Quale conclusione si può trarre sulla composizione dei restanti 480? Alessandro De Falco, INFN Cagliari 4 3/4/14 Test di ipotesi Permette di stabilire se un certo risultato è in grado di avvalorare ovvero contraddire una teoria Stima di parametri Di una legge nota (per esempio il decadimento radioattivo) bisogna stabilire i parametri caratterizzanti basandosi su un certo numero di osservazioni. Le misure sperimentali sono delle variabili casuali caratterizzate da distribuzioni. La natura casuale può essere determinata dalle caratteristiche del campione in studio e/o dalla precisione limitata dell'esperimento. Alessandro De Falco, INFN Cagliari 5 3/4/14 Probabilità e statistica: outline Elementi di teoria delle probabilità Variabili casuali e distribuzioni Alcune distribuzioni caratteristiche Campionamento Metodo della massima verosimoiglianza Metodo dei minimi quadrati Analisi della varianza ... Alessandro De Falco, INFN Cagliari 6 3/4/14 Probabilità e statistica: testi A.G. Frodesen et al: Probability and statistics in Particle Physics Ottimo testo anche se non recente Purtroppo è fuori catalogo ...ma si trova in bibilioteca (e qualcuno l'ha messo su web) manca il metodo Monte Carlo G. Bohm, G. Zech: Introduction to Statistics and Data Analysis for Physicists Verlag Deutsches Elektronen-Synchrotron http://www-library.desy.de/preparch/books/vstatmp_engl.pdf G. Cowan: A. Rotondi et al: R. Barlow: Alessandro De Falco, INFN Cagliari Statistical Data Analysis Probabilità, Statistica e Simulazione (Springer) Statistics (Wiley) 7 3/4/14 Materiale didattico a supporto Trasparenze: si trovano in http://gruppo3.ca.infn.it/analisi_dati Raccomandazione: Le trasparenze sono schematiche e possono contenere degli errori di battitura dunque non si devono usare le slides come se fossero delle dispense servono solo come promemoria per agevolare la ricerca degli argomenti nei testi Alessandro De Falco, INFN Cagliari 8 3/4/14 Dove faremo lezione Nuova aula di informatica: aula 304 dell'asse didattico 5 (edificio della biblioteca) Aula 304, terzo piano Alessandro De Falco, INFN Cagliari 9 3/4/14 Supporto per il calcolo Supporto per il calcolo: è disponibile una macchina virtuale con linux in due versioni: distribuzione Centos5 S.O. host a 64 bit o a 32 bit Nella macchina virtuale sono installati root, geant3, emacs, gcc ed il debugger ddd Virtualizzazione mediante VirtualBox (software per l' esecuzione di macchine virtuali open source) Supporto offerto solo per questa macchina virtuale, con questo root preinstallato, e con questo software di virtualizzazione La macchina virtuale è installata in alcune macchine dell'aula di informatica E' possibile scaricarla: mandatemi un'email per ottenere il link (indicatemi la versione che vi occorre: 32 o 64 bit) File compresso con gzip: ~2 GB. File espanso: ~6 GB Alessandro De Falco, INFN Cagliari 10 3/4/14 VirtualBox https://www.virtualbox.org/ Download: https://www.virtualbox.org/wiki/Downloads Alessandro De Falco, INFN Cagliari 11 3/4/14 Come usare la macchina virtuale Una volta installato VirtualBox sulla vostra macchina, scaricate il file Centos_[versione].gz al link che vi ho indicato e scompattatelo. Troverete un file con estensione .qcow Lanciate VirtualBox Premete New Compilate i campi e andate avanti Alessandro De Falco, INFN Cagliari 12 3/4/14 Quanta memoria? Dipende dal vostro computer Nel mio caso, dedico 2GB di ram, ovvero metà della RAM che ho a disposizione Sistemi con poca memoria potrebbero essere sovraccaricati dall'uso della macchina virtuale Alessandro De Falco, INFN Cagliari 13 3/4/14 Finalmente potete caricare il file fisica.qcow Selezionate Use an existing virtual hard drive file e scegliete fisica.qcow Infine Create la macchina Alessandro De Falco, INFN Cagliari 14 3/4/14 A questo punto possiamo far partire la nostra macchina virtuale User: fisica password: fisica Alessandro De Falco, INFN Cagliari 15 3/4/14 Nella macchina virtuale è stato già installato root Il file .bashrc nella home directory (eseguito automaticamente ad ogni login) contiene la definizione di alcune variabili d'ambiente necessarie per far funzionare correttamente root Alessandro De Falco, INFN Cagliari 16 3/4/14 Installazione di root senza l'uso della macchina virtuale In http://root.cern.ch/drupal/ troverete le istruzioni per scaricare ed installare root su diverse piattaforme In diversi casi (in particolare sotto windows) è disponibile un pacchetto che rende l'installazione semplice Avrete poi bisogno di un compilatore c++, di un buon editor... I più temerari possono provare a scaricare il codice sorgente e compilare root (soluzione che viene adottata abitualmente da chi usa root quotidianamente per la ricerca) Download->Building root Alessandro De Falco, INFN Cagliari 17 3/4/14 Che cosa è root Root è un potente frame di calcolo basato sul C++ sviluppato per l'analisi dati in fisica E' ampiamente diffuso in fisica delle particelle Il software degli esperimenti di LHC è più o meno pesantemente basato su root E' utilizzato anche in altri settori della fisica, ed in altri campi (astronomia, biologia, finanza, medicina) http://root.cern.ch/drupal/content/about Alessandro De Falco, INFN Cagliari 18 3/4/14 Che cosa useremo di root Istogrammi (1D, 2D, n-D) Funzioni Fit generazione di numeri casuali Librerie matematiche e statistiche Input/Output Rappresentazione grafica Classi per la trattazione di vettori, quadrivettori di Lorentz database delle particelle elementari Interfaccia per la simulazione dei rivelatori (codice di trasporto Geant3) ..... Alessandro De Falco, INFN Cagliari 19 3/4/14 Che cosa dovremo conoscere per usare root E' necessario avere una conoscenza basilare del C++ Elementi di base del C I/O loop, if funzioni puntatori e referenze Elementi di base sulla programmazione ad oggetti Classi e loro struttura Incapsulamento Ereditarietà Inoltre dovremo imparare ad usare le classi principali di root, e i trucchi che ci permettono di usare i numerosi metodi delle numerose classi senza dover ricordare tutto a memoria Alessandro De Falco, INFN Cagliari 20 3/4/14 Nel seguito verranno trattati rapidamente i punti salienti della programmazione in C++ e dell'uso di root Queste conoscenze sono dei prerequisiti per lo svolgimento del corso Senza queste conoscenze non sarà possibile effettuare gli esercizi D'altra parte questo non è un corso di programmazione Approccio 'pragmatico': imparo quello che mi serve allo scopo senza curarmi troppo dei dettagli Chi dovrà utilizzare intensivamente la programmazione in C++ è caldamente invitato a svolgere uno studio più approfondito sui manuali Si presuppone che alcuni elementi siano già noti e che gli studenti abbiano in ogni caso qualche esperienza di programmazione (possibilmente in C/C++) Alessandro De Falco, INFN Cagliari 21 3/4/14