Está en la página 1de 14

Avance Final

Estefano Pacheco A00835025

2022-09-07

R Markdown
Modelo de regresion lineal
Y=read.csv("Camaro.csv")
Y

## Precio Ant Kilometraje Promedio Excelente unico.Due


## 1 60000 9 112 1 0 1
## 2 54000 9 159 0 0 1
## 3 59900 8 192 0 0 1
## 4 110000 7 90 1 0 0
## 5 79760 7 80 0 0 1
## 6 78000 7 133 0 0 1
## 7 56000 7 170 0 0 1
## 8 136000 6 112 0 1 0
## 9 125900 6 106 1 0 0
## 10 74000 6 96 0 0 1
## 11 149000 5 88 1 0 0
## 12 136000 5 108 0 0 1
## 13 135900 5 100 1 0 1
## 14 129520 5 96 0 0 1
## 15 129000 5 88 0 0 1
## 16 96000 5 120 0 0 1
## 17 193900 4 71 1 0 0
## 18 193500 4 60 0 1 0
## 19 191900 4 71 1 0 1
## 20 170000 4 88 1 0 1
## 21 159900 4 74 0 0 1
## 22 139900 4 90 0 0 1
## 23 129000 4 104 0 0 1
## 24 287000 3 47 0 1 0
## 25 239300 3 37 0 0 0
## 26 237000 3 44 0 1 0
## 27 220000 3 50 1 0 0
## 28 152000 3 72 0 0 1
## 29 397760 2 29 0 1 0
## 30 320000 2 31 0 1 0
## 31 353000 1 15 0 1 0

##Modelo grupal
plot(Y$Precio,Y$Ant,main="Correlacion precio y antiguedad",pch=20,col="blue")
abline(lm(Y$Ant~Y$Precio),col="red")

cor.test(Y$Precio,Y$Ant)

##
## Pearson's product-moment correlation
##
## data: Y$Precio and Y$Ant
## t = -9.6132, df = 29, p-value = 1.603e-10
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.9370874 -0.7499323
## sample estimates:
## cor
## -0.8724384

r1=cor(Y$Precio,Y$Ant)
round(r1,6)

## [1] -0.872438

##Modelo de regresion ajuste


B=lm(Y$Ant~Y$Precio)
summary(B)
##
## Call:
## lm(formula = Y$Ant ~ Y$Precio)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.0195 -0.5261 -0.1923 0.5230 2.1466
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.049e+00 3.788e-01 21.250 < 2e-16 ***
## Y$Precio -1.993e-05 2.074e-06 -9.613 1.6e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.995 on 29 degrees of freedom
## Multiple R-squared: 0.7611, Adjusted R-squared: 0.7529
## F-statistic: 92.41 on 1 and 29 DF, p-value: 1.603e-10

El valor del coeficiente de determinacion es del 76% lo que es bueno ya que se explica un
76% de la variabilidad de Y en la variable x ## Ecuacion del modelo de regresion
B$coefficients

## (Intercept) Y$Precio
## 8.049382e+00 -1.993352e-05

##Pruebas de regresion poblacional HIpotesis de Betas H0: β1 = 0 H1: β1 ≠ 0 se infiere que


β1 es significativa
##Graficos residuales ##Matriz de correlacion
plot(Y, col="blue")
round(cor(Y),2)

## Precio Ant Kilometraje Promedio Excelente unico.Due


## Precio 1.00 -0.87 -0.86 -0.08 0.71 -0.66
## Ant -0.87 1.00 0.84 0.12 -0.50 0.46
## Kilometraje -0.86 0.84 1.00 -0.03 -0.54 0.60
## Promedio -0.08 0.12 -0.03 1.00 -0.35 -0.18
## Excelente 0.71 -0.50 -0.54 -0.35 1.00 -0.64
## unico.Due -0.66 0.46 0.60 -0.18 -0.64 1.00

##Histohrama y qqnorm de los residuales


qqnorm(B$residuals, pch=19, col="red")
hist(B$residual, col="pink", main="Histograma de residuales",
xlab="residuales", ylab="frecuencia")

Puedo asumir que


los errores de este modelo no siguen una distribucion normal de campana, se puede ver en
el grafico un punt de apex sin embargo el resto de la grafica no cumple con lo conocido con
normalidad por esto asumimos que los erroes no siguen una distribucion normal.

grafica de Yestimado vs residuales


plot(B$fitted.values,B$residuals, col="red")
abline(h=0,col="blue")

Los errores en esta


grafica no parecen cumplir con la constande una media igual a 0 #Grafico de residuales vs
orden
plot(B$residuals, pch=19, col="red", main="Gráfico de errores vs orden",
xlab="número de observación", ylab="residuales")
Los errores no
parecen ser independientes ya que parece que existe un patron decendente. ## Revisión de
los supuestos de regresión ### Revisando el supuesto de Distribución Normal de los
errores Ho Los errores siguen una distribución Normal Ha Los errores no siguen una
distribución Normal alpha=0.05
shapiro.test(B$residuals)

##
## Shapiro-Wilk normality test
##
## data: B$residuals
## W = 0.9626, p-value = 0.3413

Los errores no siguen una distribucion normal ### Supuesto de que la media de los
errores es cero Ho media=0 Ha media diferente de cero alpha=0.05
t.test(B$residuals)

##
## One Sample t-test
##
## data: B$residuals
## t = 4.5833e-16, df = 30, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -0.3588199 0.3588199
## sample estimates:
## mean of x
## 8.052658e-17

xb=mean(B$residuals)
n=20
s=sd(B$residuals)
te=(xb-0)/(s/sqrt(n))
valorp=2*(1-pt(te,n-1))
round(valorp,20)

## [1] 1

se rechaza Ho por que el valor P no es igual a 0


##Modelo individual
plot(Y$Precio,Y$Kilometraje,main="Correlacion precio y
antiguedad",pch=20,col="blue")
abline(lm(Y$Ant~Y$Precio),col="red")

cor.test(Y$Precio,Y$Ant)

##
## Pearson's product-moment correlation
##
## data: Y$Precio and Y$Ant
## t = -9.6132, df = 29, p-value = 1.603e-10
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.9370874 -0.7499323
## sample estimates:
## cor
## -0.8724384

r1=cor(Y$Precio,Y$Ant)
round(r1,6)

## [1] -0.872438

##Modelo de regresion ajuste


C=lm(Y$Kilometraje~Y$Precio)
summary(B)

##
## Call:
## lm(formula = Y$Ant ~ Y$Precio)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.0195 -0.5261 -0.1923 0.5230 2.1466
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.049e+00 3.788e-01 21.250 < 2e-16 ***
## Y$Precio -1.993e-05 2.074e-06 -9.613 1.6e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.995 on 29 degrees of freedom
## Multiple R-squared: 0.7611, Adjusted R-squared: 0.7529
## F-statistic: 92.41 on 1 and 29 DF, p-value: 1.603e-10

El valor del coeficiente de determinacion es del 76% lo que es bueno ya que se explica un
76% de la variabilidad de Y en la variable x ## Ecuacion del modelo de regresion
B$coefficients

## (Intercept) Y$Precio
## 8.049382e+00 -1.993352e-05

##Pruebas de regresion poblacional HIpotesis de Betas H0: β1 = 0 H1: β1 ≠ 0 se infiere que


β1 es significativa
##Graficos residuales ##Matriz de correlacion
plot(Y, col="blue")
round(cor(Y),2)

## Precio Ant Kilometraje Promedio Excelente unico.Due


## Precio 1.00 -0.87 -0.86 -0.08 0.71 -0.66
## Ant -0.87 1.00 0.84 0.12 -0.50 0.46
## Kilometraje -0.86 0.84 1.00 -0.03 -0.54 0.60
## Promedio -0.08 0.12 -0.03 1.00 -0.35 -0.18
## Excelente 0.71 -0.50 -0.54 -0.35 1.00 -0.64
## unico.Due -0.66 0.46 0.60 -0.18 -0.64 1.00

##Histohrama y qqnorm de los residuales


qqnorm(C$residuals, pch=19, col="red")
hist(C$residual, col="pink", main="Histograma de residuales",
xlab="residuales", ylab="frecuencia")
grafica de Yestimado vs residuales
plot(C$fitted.values,C$residuals, col="red")
abline(h=0,col="blue")

#Grafico de residuales vs orden


plot(C$residuals, pch=19, col="red", main="Gráfico de errores vs orden",
xlab="número de observación", ylab="residuales")
Revisión de los supuestos de regresión
Revisando el supuesto de Distribución Normal de los errores
Ho Los errores siguen una distribución Normal Ha Los errores no siguen una distribución
Normal alpha=0.05
shapiro.test(C$residuals)

##
## Shapiro-Wilk normality test
##
## data: C$residuals
## W = 0.93123, p-value = 0.04737

Supuesto de que la media de los errores es cero


Ho media=0 Ha media diferente de cero alpha=0.05
t.test(C$residuals)

##
## One Sample t-test
##
## data: C$residuals
## t = -3.4162e-17, df = 30, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -7.698968 7.698968
## sample estimates:
## mean of x
## -1.287822e-16

xb=mean(C$residuals)
n=20
s=sd(C$residuals)
te=(xb-0)/(s/sqrt(n))
valorp=2*(1-pt(te,n-1))
round(valorp,20)

## [1] 1

También podría gustarte