Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Jesus Pereira M
lOMoAR cPSD| 15394286
Tarea 9
#a Cree una variable EngineDispln3 que contenga el desplazamiento del motor en pulgadas
c´ubicas. Una p´ulgada c´ubica es equivalente a 16.3871 cent´ımetros c´ubicos.
#Redondee al entero mas cercano.
cor(datos$MPG,df$EngineDispln3)
#d Ajuste un modelo lineal simple que relacione millas de carretera por gal´on (y) al
#desplazamiento del motor (x) utilizando m´ınimos cuadrados.
Jesus Pereira M
lOMoAR cPSD| 15394286
y <− datos$MPG[des]
y_1 <− predict(model,data.frame('EngineDispln3' = c(114)))
#pregunta 2
# En el archivo reg2.csv presenta datos sobre el precio de venta y los impuestos anuales
#para 24 casas.
Jesus Pereira M
lOMoAR cPSD| 15394286
#b Encuentre el precio de venta medio dado que los impuestos pagados son x = 7, 50.
predict(model2,data.frame(Tax_miles = 7.5))
y <− d2$Precio_miles[index]
y_h2 <− predict(model2,data.frame(Tax_miles = 5.8980))
#d Calcule el y ajustado para cada valor de xi usado para ajustar el modelo. Luego
#construya una grafica de y versus el correspondiente valor observado yi
plot(d2$Precio_miles,y_hats2)
#f Elabore una grafica de probabilidad normal de los residuales e interprete esta presentacion
Jesus Pereira M
lOMoAR cPSD| 15394286
qqnorm(model2_standares,
# el modelo que se observa se distribuyen como una normal dado que los residuos
estandarizados se
# estan muy cercanos a la linea diagonal que representa a la distribucion normal
par(mfrow = c(1,2))
plot(y_hats2,residuos2,
xlab = 'Valores ajustados',
ylab = 'Residuos')
plot(d22$Tax_miles,residuos2,
xlab = 'X',
ylab =
'Residuos')
par(mfrow = c(1,1))
# Dado que los puntos del grafico de dispersion se encuentrna muy dispersos es dificil
# confirmar de que la varianza se comporta como una constante,
# se debe realizar una prueba de homocedasticidad
Jesus Pereira M
lOMoAR cPSD| 15394286
#pregunta 3
#Se cree que la cantidad de libras de vapor utilizadas por mes por una planta qu´ımica est´a
#relacionada con la temperatura ambiente promedio (en grados Farenheit) para ese mes. #El
uso y la temperatura del a˜no pasado se muestran en el archivo reg3.csv.
model3$coefficients['Temp']
y <− df3$Libras_Miles[index]
Jesus Pereira M
lOMoAR cPSD| 15394286
#e Calcule el y ajustado para cada valor de xi usado para ajustar el modelo. Luego
#construya una grafica de y versus el correspondiente valor observado yi
plot(df3$Libras_Miles,y_hats3)
#g Elabore una grafica de probabilidad normal de los residuales e interprete esta presentacion
model3_stdres <− rstandard(model3)
qqnorm(model3_stdres,
xlab = 'Residuos Estandarizados',
ylab = 'Distribucion normal')
qqline(model3_stdres)
Jesus Pereira M
lOMoAR cPSD| 15394286
plot(y_hats3,residuos3,
xlab = 'Valores ajustados',
ylab = 'Residuos')
plot(df3$Temp,residuos3,
xlab = 'X',
ylab =
'Residuos')
par(mfrow = c(1,1))
# De acuerdo a la grafica realizada podemos observar que los puntos rondan un valor
constante
# como se mustra el comportamiento de diferentes por lo que se puede decir#
que se cumple el supuesto de varianza constante
#Pregunta 4
#c) Establezca un modelo de regresion lineal simple donde la variable dependiente sea
#la utilidad y la independiente sea el numero de empleados. lnterprete sus resultados.
model4_1 <− lm(UTlLlDAD~EMPLEADOS,data = df4)
Jesus Pereira M
lOMoAR cPSD| 15394286
summary(model4_1)
# Por otro lado, se puede decir que si la empresa contata un empleado más la utilidad#
aumentara¡ en 202.01 unidades monetarias
#se puede observar que al ingresar la variable ventas, la variable empleados deja de ser
significativa, mientras que
# la variabel ventas si es significativa.
#Por otro lado, si observamos el estaditico F, podemos decir que el modelo es significativo de
manera global
#e) Adicione en su modelo de regresion del literal anterior el sector productivo al que
#pertenece la empresa. lnterprete sus resultados.
# Las variables que son significativas para el modelo son Ventas, como las siguientes
Jesus Pereira M
lOMoAR cPSD| 15394286
# categorias de la variable sector productivo que son las categorias construccion e inmobiliaria
#Pregunta 5
#a
model5 <− lm(expenses~age,data = df5)
# Supuesot de independencia
plot(model5$residuals)
# dado que en el los residuos no presenta un patron definido podemos decir que se#
cumple el supuesot de independencia entre los errores
# Supuesto de Normalidad
# Test de normalidad
shapiro.test(model5$residuals)
Jesus Pereira M
lOMoAR cPSD| 15394286
# Test de multicolinealidad
# elmodelo es univariado
#b
model5_b <− lm(expenses~age+satisfaction+stay,data = df5)
# Supuesot de independencia
plot(model5_b$residuals)
# Supuesto de Normalidad
# Test de normalidad
shapiro.test(model5_b$residuals)
# Test de multicolinealidad
vif(model5_b)
Jesus Pereira M
lOMoAR cPSD| 15394286
#c
model5_c <− lm(expenses~age+satisfaction+stay+accommodation,data = df5)
# Supuesot de independencia
plot(model5_c$residuals)
# Supuesto de Normalidad
# Test de normalidad
shapiro.test(model5_c$residuals)
# Test de multicolinealidad
vif(model5_c)
#d
model5_d <− lm(expenses~age+satisfaction+stay+accommodation+sex,data = df5)
# SUpuesot de independencia
plot(model5_d$residuals)
# Supuesto de Normalidad
# Test de normalidad
shapiro.test(model5_d$residuals)
Jesus Pereira M
lOMoAR cPSD| 15394286
# Test de multicolinealidad
vif(model5_d)
Jesus Pereira M