Università degli Studi di Torino Facoltà di Scienze MM.FF.NN Corso di Laurea in Scienze Biologiche Scheda programmi corsi NOME CORSO : Elaborazione informatica dei dati sperimentali SSD: INF/01-MAT/06 Numero codice: 1.Docenza Docente: Maria Teresa Giraudo Roberta Sirovich Tel.: 011-6702850 Fax: 011-6702878 e-mail: [email protected] [email protected] Docente: Cristina Bosco Massimiliano Depierro Tel.: 011-6702850 Fax: 011-6702878 e-mail: bosco @di.unito.it [email protected] 2.Finalità Statistica: introdurre lo studente alla Statistica di base e all’analisi di dati sperimentali. 3. Obiettivi Statistica: lo studente impara ad utilizzare gli strumenti informatici più comuni e a svolgere l’analisi statistica standard di dati sperimentali. 4. Pre-requisiti in ingresso e competenze minime in uscita Pre-requisiti (in ingresso) nessuno Insegnamenti fornitori Competenze minime (in uscita) Capacità di trattare dati sperimenali semplici Insegnamenti fruitori 5. Metodologia didattica La metodologia didattica impiegata consiste in: Parte di Statistica: Lezione frontale: 24 ore (3 crediti Statistica) Laboratorio: 18 ore (1 credito Statistica) 6. Programma, articolazione e carico didattico Argomento Ore Data ultima revisione 6 giugno 2005 - Rev. 01 – Mod15 Pagina 1 di 3 Ore Ore di studio Università degli Studi di Torino Facoltà di Scienze MM.FF.NN Corso di Laurea in Scienze Biologiche Scheda programmi corsi Lez. Statistica descrittiva Probabilità: definizione di probabilità di un evento, legge della somma e legge del prodotto, indipendenza, probabilità condizionata, le variabili aleatorie Stima puntuale, intervalli di confidenza, test di ipotesi Test di bontà del fit, tabelle di contingenza Regressione lineare, analisi della varianza 4 8 6 3 3 Esercit. 4 personale 4 4 6 Introduzione all'uso del computer in ambiente Windows: - il file system e la relativa terminologia - acquisizione e salvataggio di dati Il foglio elettronico Excel per l'analisi statistica dei dati: - introduzione a Excel - importazione di dati da file esterni - celle e riferimenti a intervalli lineari e matriciali - riferimenti assoluti e relativi - calcoli e formule - funzioni built-in (es. SOMMA e CERCA.VERT) - formattazione dei dati - costruzione di grafici - funzioni logiche booleane (AND (E), OR (O), NOT(NON)) e condizionali (SE) - ordinamento di dati - filtri automatici e avanzati - formule matriciali (REGR.LIN, TENDENZA) Introduzione al programma di scrittura LaTex: - il programma TeXNicCenter e la sua configurazione per l'utilizzo con MikTex - scrittura di un documento con LaTex - compliazione in pdf di un documento LaTex L'ambiente di sviluppo R per l'analisi statistica dei dati: - introduzione ed installazione del software R - uso della console e linguaggio di input e output di R - lo storage dei dati in R: vettori, array, matrici, data-frame, liste, database - istruzioni e funzioni per la manipolazione dei dati in R - plot Statistica descrittiva: distribuzione di frequenza per dati singoli e dati raggruppati, istogramma, grafico stem and leaf, indici statistici (media campionaria, moda, mediana, varianza campionaria e deviazione standard, range, coefficiente di variazione, skewness, curtosi, percentili e quartili), box plot, ouliers, indici statistici per dati raggruppati (media, varianza e mediana). Data ultima revisione 6 giugno 2005 - Rev. 01 – Mod15 Pagina 2 di 3 Università degli Studi di Torino Facoltà di Scienze MM.FF.NN Corso di Laurea in Scienze Biologiche Scheda programmi corsi Elementi di calcolo delle probabilità: esperimento probabilistico, spazio campionario, eventi, probabilità. Indipendenza, regole della somma e del prodotto, probabilità condizionata. Variabili aleatorie: distribuzione, funzione di distribuzione cumulata, valore medio e varianza. Distribuzione di variabili aleatorie note: binomiale, Poisson, normale, esponenziale. Legge dei grandi numeri, teorema del limite centrale. Statistica inferenziale: intervalli di confidenza per media, varianza, proporzione, differenza tra medie, rapporto tra varianze, differenza di proporzioni. Test di ipotesi unilaterali e bilaterali: regione critica, errori di prima e seconda specie, potenza. Test per media, varianza, proporzione, differenza tra medie, rapporto tra varianze, differenza di proporzioni. Test per la differenza tra medie di campioni accoppiati. Test del chi quadro per la bontà del fit, test di Kolmogorov-Smirnov, normal probability plot. Tabelle di contingenza. Regressione lineare: modelli lineari; test per il coefficiente di correlazione di Pearson; stima dei coefficienti della retta di regressione; grafico dei residui. Analisi della varianza a una via. 7. Materiale per lezioni e esercitazioni: Laboratorio Informatico, R. 8. Materiale didattico I testi base consigliati per il corso sono: M. M. Triola e M. F. Triola Statistica per le discipline biosanitarie, Pearson. F. Crivellari, Analisi Statistica dei dati con R, Apogeo. M.R. Middleton (2004) Analisi statistica con Excel, Apogeo 9. Modalità di verifica/esame L'esame si svolge, di norma, come segue: Analisi di un set di dati assegnato in aula informatizzata e risposta scritta ad alcune domande. Data ultima revisione 6 giugno 2005 - Rev. 01 – Mod15 Pagina 3 di 3