Está en la página 1de 6

Universidad de Costa Rica

Facultad de Ingeniería
Escuela de Ingeniería Industrial
Caso 1
CASO#1
CASO

1. Con base en los datos en el archivo de Excel “Caso#1-Data.xlsx” favor


completar los siguientes objetivos. Tome en consideración que la variable
dependiente siempre será el precio de la casa.
a. Seleccionar de manera justificada una variable independiente para
generar un modelo de regresión lineal simple. Establezca claramente la
metodología utilizada para seleccionar dicha variable y descartar las
otras.
Se realizaron regresiones lineales con cada una de las variables hasta que se
encontraron dos variables que sobresalían de las demás: Área de construcción (A4) y
Cantidad de baños (A2). Las regresiones se hicieron en Minitab con un 95% de
confianza. La variable A4 tuvo un R2 de 0.706 mientras que la variable A2 tuvo un R 2
de 0.7770. Sin embargo, aunque A2 posee un mejor coeficiente de determinación, se
escogió la variable A4 debido a que posee un R2 aceptable y además al realizar el
gráfico de predicciones se encontró que los valores se distribuían mejor dentro de los
intervalos de confianza que los valores para la variable A2 (El gráfico de A4 se
muestran en la parte c y el gráfico de A2 en Anexos).
b. Establezca los límites de confianza de predicción para dicho modelo e
interprete los resultados evaluando el modelo contra un valor de la
variable independiente de su selección.
Con un 95% de confianza para x=2.12

7.0915 < y < 12.8695

c. Grafique su modelo e intervalos de confianza de las predicciones.


Figura 1. Gráfico de predicciones con intervalos de confianza para Áreas de
construcción.

d. Indique y utilice todas las pruebas y supuestos para asegurar la


confianza en sus resultados y justificar sus respuestas.
Se utilizó la prueba de R2 para escoger la variable con mejor ajuste en este caso A4
con un valor de 0.706 fue la variables escogida debido a que las demás variables en
ocasiones presentaban valores de R2 cercanos a cero por eso se desecharon. Además
los valores del P-value para el coeficiente B1 era menor al nivel de significancia (0.05)
por tanto se acepta la hipótesis alternativa donde B1≠0.
2. Objetivo competidor. Seleccione de manera justificada 4 variables para
desarrollar un modelo de regresión lineal múltiple que maximice la precisión.
Utilice todas las herramientas y supuestos necesarios para validar el modelo.
Grafique el modelo y el intervalo de confianza de predicción.
Para escoger las variables que se utilizaron en este análisis, se utilizó la herramienta
del programa minitab llamada “Best Subsets” la cual analiza entre todas las variables y
realiza combinaciones entre ellas para obtener así combinaciones óptimas para realizar
una regresión ya sea múltiple o lineal.

Después de realizar dicho análisis se obtuvo que las 4 variables más significativas,
según minitab, fueron las variables A2 (Cantidad de baños), A11 (Cantidad de
chimeneas), A10 (Tipo de casa), A12 (Provincia).

Después de realizar una discusión entre los integrantes del grupo se concluyó lo
siguiente:

 La cantidad de baños está relacionada con el tamaño de la casa, así mientras


más baños posea la casa más grande será la misma (generalmente) y se
considera un indicador importante.
 La cantidad de chimeneas se relaciona con el lujo, por lo que una casa al tener
una o más chimeneas se puede considerar como lujosa por lo que se puede
considerar como un indicador en la variación del precio de la casa.
 El tipo de casa es una variable importante a considerar, debido a que entre más
más pisos posea una casa generalmente hay más metros cuadrados de
construcción y además esta variable se puede relacionar con el lujo.
 La ubicación por provincia es importante ya que dependiendo de la ubicación el
precio de una casa puede variar considerablemente.

Al realizar el análisis en MINITAB, se encontró que las variables categóricas (A10 y


A12) tenían varias opciones de constantes. Después de investigar se encontró que
cuando se tienen variables categóricas se crean distintos niveles de predicción, razón
por la cual MINITAB da distintintos tipos de variables.

Para escoger cuál de las constantes se utilizaría se tomó en cuenta el P-value de cada
una de las constantes y se escogió el de menor valor siendo estas las constantes 4.038
(A10) con un P-value de 0.000 y -2.876 (A12) con un P-value de 0.005. Por lo que al
final la ecuación de regresión múltiple quedaría de la siguiente forma:
𝐴1 = 0.25 + 6.711𝐴2 + 1.431𝐴11 + 4.038𝐴10 − 2.876𝐴11

Con un coeficiente de determinación de 0.9302.

Figura 2. Gráfico de dispersión de la regresión múltiple.


3. Objetivo adicional. Programe en R el modelo de regresión lineal para los datos
tal que se cumplan los siguientes aspectos:
a. Importar datos de Excel a R Studio
b. Encontrar la ecuación lineal ajustada con la variable seleccionada en la
pregunta (a)
c. Graficar y exportar el gráfico a un archivo .png llamado
GraficoCaso1.png
d. Debe entregar el código en un archivo .R y la imagen en .png
Figura 3. Gráfica en R.

Los demás documentos se anexan en el correo electrónico.

Anexos
Figura 4. Gráfica de predicciones Cantidad de baños.

También podría gustarte