Está en la página 1de 2

examen=read.table("datos.

txt",header=T)

y=examen$Ventas
x1=examen$VMA
x2=examen$Ant
x3=examen$SBase
x4=examen$Com
x5=examen$Edad

# DIVIDIR LA HOJA DE GR�FICOS


par(mfrow=c(2,3))
# COMPARAR GRAFICAMENTE
plot(x1,y,main="Gr�fico de dispersi�n",xlab="Ventas mes anterior",ylab="Ventas")
plot(x2,y,main="Gr�fico de dispersi�n",xlab="Antiguedad",ylab="Ventas")
plot(x3,y,main="Gr�fico de dispersi�n",xlab="Sueldo base",ylab="Ventas")
plot(x4,y,main="Gr�fico de dispersi�n",xlab="Comisi�n",ylab="Ventas")
plot(x5,y,main="Gr�fico de dispersi�n",xlab="Edad",ylab="Ventas")

x=cbind(x1,x2,x3,x4,x5)

#Linear fit
fit=lm(y~(x))

#Info modelo
summary(fit)

#ANOVA
summary(aov(y~x))

#Residuos
e=residuals(fit)

par(mfrow=c(3,2))
#Histograma de residuos
hist(e,main="Histograma de residuos",xlab="Residuos",col="blue")
boxplot(e)

#Gr�fico Q-Q plot de residuos


qqnorm(e,ylab="Residuos estandarizados",col="blue")
qqline(e,col="red")

#Test Anderson Darling (paquete nortest)


library(nortest)
s=sqrt(48)
s
ad.test(e,mean=0, sd=6.298)

#Residuos estandarizados (paquete MASS)


library(MASS)
se=stdres(fit)
library(nortest)
ad.test(se)

#Gr�fico de dispersi�n residuos estandarizados


plot(se,main="Gr�fico de dispersi�n residuos
estandarizados",col="blue",ylab="Residuos estandarizados")
# TestGoldfeld y Quandt (paquete lmtest)
library(lmtest)
gqtest(fit)

#Gr�fico de dispersi�n de los residuos


plot(e,main="Gr�fico de dispersi�n de los residuos",col="blue",ylab="Residuos")

# Test Durbin Watson (paquete lmtest)


library(lmtest)
dwtest(fit)

# Diagn�sticos utilizando Gr�ficos


plot(fit)

# multicolinealidad
cor(x,x)

xy=cbind(y, x1, x2, x3, x4, x5)


cor(xy, xy)

# mejor conjunto de variables predictoras (best Subsets)


library(leaps)
attach(examen)
leaps<-regsubsets(y~x, data=examen, nbest=1)

# resultados
summary(leaps)

# gr�ficos by best subset


library(car)

# r2 para cada modelo seleccionado


subsets(leaps, statistic="rsq")

# r2 ajustado para cada modelo seleccionado


subsets(leaps, statistic="adjr2")

# cme para cada modelo seleccionado


subsets(leaps, statistic="rss")

# cp para cada modelo seleccionado


subsets(leaps, statistic="cp", ylim=c(4, 6))

# cp para cada modelo seleccionado


subsets(leaps, statistic="cp", ylim=c(0, 5))

También podría gustarte