FUNCTIONS DI UTILITA’ GENERALI x<-c(x_1,x_2,…) % per costruire vettori x<-rep(n,a) % per costruire un vettore contenente n volte l’elemento in a sum(x) % per sommare il contenuto del vettore x cumsum(x) % per somme parziali cumulate del contenuto del vettore x dati<-read.table(‘path’,header=TRUE) % per leggere i dati for (i in 1:n) {…} % ciclo for length(x) % lunghezza del vettore x read.table(“Path”) % legge i dati in un file e li inserisce direttamente in un data-frame basename(getwd()) % per conoscere la directory corrente di lavoro dirname(getwd()) % per conoscere il path della directory corrente di lavoro sort(dati) % ordinamento dei dati max(dati) % massimo dei dati min(dati) % minimo dei dati Statistica descrittiva obj<-hist(dati) % produce l’istogramma di un campione univariato % altri parametri di input: prob = TRUE (per le frequenze relative), col=’nomecolore’ (per il colore da associare alle barre), labels = TRUE (per le etichette sulle barre), xlim = range(x_1,x_2) (per l’intervallo rappresentato sull’asse delle ascisse) ylim = range(y_1,y_2) (per l’intervallo rappresentato sull’asse delle ordinate) breaks = numero (numero delle classi) breaks=c(x_1,x_2,…) (estremi delle classi) obj<-table(dati) % per costruire tabelle data<-data.frame(obj) % per costruire dataframe str(obj) % per visualizzare i vettori associati al dataframe obj density(dati) % stimatore kernel di densità da sovrapporre all’istogramma mean(dati) % media del campione dati sd(dati) % deviazione standard del campione dati diff(range(dati)) % campo di variazione dei dati summary(dati) % quartili boxplot(dati) % costruzione di un box-plot % altri parametri di input: horizontal = TRUE (per un box-plot orizzontale), col=’nomecolore’ (per il colore da associare alle barre) outliers<-boxplot(dati) % per gestire gli outliers dati %in% outliers$out % per conoscere la loro posizione all’interno del campione skewness(dati) % coefficiente di asimmetria del campione dati kurtosis(dati) % curtosi del campione dati ecdf(dati) % funzione di ripartizione del campione dati points(x,y,pch=no.) % per sovrapporre punti su di un grafico obj<-cut(x,c,right=TRUE) % per ripartire I dati contenuti nel vettore x negli intervalli (chiusi a destra se right=TRUE) i cui estremi sono contenuti in c. table(obj) % per costruire una tabella con l’output della function obj qqnorm (dati) % normal plot del campione dei dati qqline(dati, distribution) % aggiunge una linea ad un qqplot secondo la distribuzione assegnata nella variabile distribution plot.ecdf(dati,col.points='…',col.hor='…’) % grafico a gradini della funzione di ripartizione del campione dati prop.table(obj1) % calcolo delle frequenze relative Costruzione grafico a torta percentlabels<- round(100*B/sum(B), 1) % costruzione delle frequenze relative pielabels<- paste(percentlabels, "%", sep="") % in forma di carattereù pie(B, main="Capelli", col=rainbow(4), labels=pielabels, cex=0.8) % torta legend('topleft', c('Biondi','Castani','Neri','Rossi'), cex=0.8, fill=rainbow(4)) % leggenda plot.ecdf(ore_frame$ORE,col.points='blue',col.hor='red',lwd=4,main='F. Rip. empirica') % costruzione grafico funzione di ripartizione empirica par(new=TRUE) % mantenere la finestra grafica corrente aperta % costruzione grafico funzione di ripartizione empirica ecdfx<-ecdf(ore_frame$ORE) % costruzione funzione di ripartizione empirica ecdfx(x) % valore della funzione di ripartizione empirica quantile(ore_frame$ORE,prob) % quantile della funzione di ripartizione empirica barplot(dati) % costruzione del box-plot boxplot(ore_frame$ORE,col='red',main='Box-plot ore') % costruzione del box-plot Le misure numeriche mean(ore_frame$ORE) media<-pesi%*%valori/sum(pesi) wtd.quantile(valori,frequenze) wtd.mean(valori,frequenze) wtd.Ecdf(valori,frquenze) skewness(valori) summary(valori) IQR(valori) var(valori) sd(valori) cor(X,Y) ) lm(y ~ x) % media % media pesata % quantili per tabelle (libreria Hmisc) % media per tabelle % funzione di ripartizione per tabelle % coefficiente di asimmetria % quartili % intervallo interquartile % varianza dei dati % deviazione standard dei dati % coefficiente di correlazione tra X e Y % retta di regressione