SSMT - Statistica
Pioda
SM3 - K3
Fallstudium 2 - MCV e dintorni
È dato un insieme di osservazioni fatte sull MCV di una serie di pazienti1. Trovate sul
blog il collegamento al file .csv
Attività con Gnumeric
a) Si determini se c’è una differenza significativa tra i valori delle donne e i valori
degli uomini. (T test tra medie indipendenti!)
b) Si determini se c’è una relazione tra l’MCV e l’età del paziente; saranno necessari:
i. il coefficiente r di Pearson;
ii. la regressione e la determinazione dei limiti di confidenza per pendenza e
intercetta.
iii. il controllo della significatività della regressione (test per H0 0 eseguito
sul valore di r 2 e con il metodo ANOVA3 fornito da Gnumeric);
iv. il coefficiente non parametrico ρ di Spearmann4
c) Scrivere un rapporto di massimo una pagina con il commento ai risultati ottenuti.
Attività con R
Eseguire in alternativa i punti a) e b) con R. In particlare serviranno:
i. cor() che svolge le correlazioni di Pearson, Spearmann e Kendall e cor.test()
ii. modello<-glm(y ∽ x) per la regressione, anova(modello) per la verifica col test
anova, confint(modello) per trovare i limiti di confidenza. Si cerchi in rete la sintassi di utilzzo dei rispettivi comandi.
iii. plot() per visualizzare il grafico e abline() per tracciare la retta calcolata.
1. Dati del lavoro di statistica del secondo anno di S. Roman, 2009, per gentile concessione.
2. http://212.117.109.134/~gfwp/tab_trm/inferenza_regressioni.pdf, Soliani cap. 18.
3. http://212.117.109.134/~gfwp/tab_trm/anova.pdf
4. http://212.117.109.134/~gfwp/tab_trm/nonparametrici.pdf, Soliani cap. 21.
1