FUNCTIONS DI UTILITA’ GENERALI
x<-c(x_1,x_2,…)
% per costruire vettori
x<-rep(n,a)
% per costruire un vettore contenente n volte l’elemento in a
sum(x)
% per sommare il contenuto del vettore x
cumsum(x)
% per somme parziali cumulate del contenuto del vettore x
dati<-read.table(‘path’,header=TRUE)
% per leggere i dati
for (i in 1:n) {…}
% ciclo for
length(x)
% lunghezza del vettore x
read.table(“Path”)
% legge i dati in un file e li inserisce direttamente in un data-frame
basename(getwd())
% per conoscere la directory corrente di lavoro
dirname(getwd())
% per conoscere il path della directory corrente di lavoro
sort(dati)
% ordinamento dei dati
max(dati)
% massimo dei dati
min(dati)
% minimo dei dati
Statistica descrittiva
obj<-hist(dati)
% produce l’istogramma di un campione univariato
% altri parametri di input: prob = TRUE (per le frequenze relative),
col=’nomecolore’ (per il colore da associare alle barre),
labels = TRUE (per le etichette sulle barre),
xlim = range(x_1,x_2) (per l’intervallo rappresentato
sull’asse delle ascisse)
ylim = range(y_1,y_2) (per l’intervallo rappresentato
sull’asse delle ordinate)
breaks = numero (numero delle classi)
breaks=c(x_1,x_2,…) (estremi delle classi)
obj<-table(dati)
% per costruire tabelle
data<-data.frame(obj) % per costruire dataframe
str(obj)
% per visualizzare i vettori associati al dataframe obj
density(dati)
% stimatore kernel di densità da sovrapporre all’istogramma
mean(dati)
% media del campione dati
sd(dati)
% deviazione standard del campione dati
diff(range(dati))
% campo di variazione dei dati
summary(dati)
% quartili
boxplot(dati)
% costruzione di un box-plot
% altri parametri di input: horizontal = TRUE (per un box-plot orizzontale),
col=’nomecolore’ (per il colore da associare alle barre)
outliers<-boxplot(dati) % per gestire gli outliers
dati %in% outliers$out % per conoscere la loro posizione all’interno del campione
skewness(dati)
% coefficiente di asimmetria del campione dati
kurtosis(dati)
% curtosi del campione dati
ecdf(dati)
% funzione di ripartizione del campione dati
points(x,y,pch=no.)
% per sovrapporre punti su di un grafico
obj<-cut(x,c,right=TRUE) % per ripartire I dati contenuti nel vettore x negli intervalli (chiusi a destra
se right=TRUE) i cui estremi sono contenuti in c.
table(obj)
% per costruire una tabella con l’output della function obj
qqnorm (dati)
% normal plot del campione dei dati
qqline(dati, distribution) % aggiunge una linea ad un qqplot secondo la distribuzione assegnata
nella variabile distribution
plot.ecdf(dati,col.points='…',col.hor='…’)
% grafico a gradini della funzione di ripartizione del campione dati
prop.table(obj1)
% calcolo delle frequenze relative
Costruzione grafico a torta
percentlabels<- round(100*B/sum(B), 1)
% costruzione delle frequenze relative
pielabels<- paste(percentlabels, "%", sep="") % in forma di carattereù
pie(B, main="Capelli", col=rainbow(4), labels=pielabels, cex=0.8)
% torta
legend('topleft', c('Biondi','Castani','Neri','Rossi'), cex=0.8, fill=rainbow(4))
% leggenda
plot.ecdf(ore_frame$ORE,col.points='blue',col.hor='red',lwd=4,main='F. Rip. empirica')
% costruzione grafico funzione di ripartizione empirica
par(new=TRUE)
% mantenere la finestra grafica corrente aperta
% costruzione grafico funzione di ripartizione empirica
ecdfx<-ecdf(ore_frame$ORE)
% costruzione funzione di ripartizione empirica
ecdfx(x)
% valore della funzione di ripartizione empirica
quantile(ore_frame$ORE,prob)
% quantile della funzione di ripartizione empirica
barplot(dati)
% costruzione del box-plot
boxplot(ore_frame$ORE,col='red',main='Box-plot ore')
% costruzione del box-plot
Le misure numeriche
mean(ore_frame$ORE)
media<-pesi%*%valori/sum(pesi)
wtd.quantile(valori,frequenze)
wtd.mean(valori,frequenze)
wtd.Ecdf(valori,frquenze)
skewness(valori)
summary(valori)
IQR(valori)
var(valori)
sd(valori)
cor(X,Y) )
lm(y ~ x)
% media
% media pesata
% quantili per tabelle (libreria Hmisc)
% media per tabelle
% funzione di ripartizione per tabelle
% coefficiente di asimmetria
% quartili
% intervallo interquartile
% varianza dei dati
% deviazione standard dei dati
% coefficiente di correlazione tra X e Y
% retta di regressione