Está en la página 1de 4

Uso de Técnicas Estadísticas para el Análisis de Datos

Análisis de Regresión Lineal Múltiple


José Ramón Vicente Gil

Para comenzar a trabajar sobre este conjunto de datos primeramente es importante


verificar que el archivo cuente con las especificaciones requeridas por Watson
Analytics para que este muestre una buena calidad en los datos y el análisis sea lo
más preciso posible.

Variable Variables
Dependiente Independientes

Como se puede observar en la captura anterior no existen datos faltantes, los


encabezados de cada columna son las variables a analizar dentro del modelo de
regresión y correlación, del lado izquierdo de la tabla se encuentra el precio del
inmueble que para este ejemplo funcionará como la variable de respuesta, mientras
que las otras 7 variables encuadradas en color naranja serán consideradas como
las variables independientes.
Primeramente utilicé un gráfico de espiral para ver la realción con la que cuentan
las variables independientes con el precio de el inmueble.

Con esta gráfica podemos concluir que la combinación de las variables garage y
bedrooms son las que mayor impacto tienen en sobre el precio del inmueble, así
mismo podemos observar que la mayoría de las combinaciones muestran a la
variable bethroom como importante dentro del análsisi, por último la variable garage
es la que más impacta al resultado de manera individual.
Para corroborar estos datos y poder proponer un nuevo análisis eliminando las
variables que no ayuden mucho con el ajuste del modelo realicé un análisis de
varianza con ayuda de minitab para poder eliminar las variables que
probabilisticamente se encuentren fuera del nivel de significancia esperado.
Como podemos observar
en el P-Value de las
variables Distance y
Twnship su nivel es muy
alto lo que nos indica que
estas no estan teniendo
mucho impacto sobre el
precio final de la vivienda,
por ello decidí eliminarlas y
realizar un segundo análisis
para ver lo obtenido.
Uso de Técnicas Estadísticas para el Análisis de Datos
Análisis de Regresión Lineal Múltiple
José Ramón Vicente Gil

Todos los P-Values son


menores que el nivel de
significancia establecido
en 0.05.

Como podemos observar en este nuevo análisis todas las variables se encuentran
dentro de los parámetros establecidos para considerar que estas están influyendo
directamente al precio final del inmueble, por ello procedí a proponer una ecuación
de regresión que nos ayude a calcular el precio de un inmueble.

Con la obtención del de la ecuación de regresión podemos calcular el precio de una


vivienda de acuerdo a las características con las que esta cuente, en la zona en la
que se desarrolló el problema, ahora bien, podemos minimizar el precio del
problema para observar las características con las que contaría el inmueble como
se muestra a continuación.
Como podemos observar este inmueble
no contaría con estacionamiento ni
alberca, tendría 1 ½ baños, 2 recámaras
y un tamaño de 1593 ft^2, el precio de
esta vivienda sería de $130.8 y se
encontraría dentro del intervalo de
confianza que va de $109.4 a $152.2.
El problema solicita realizar un segundo análisis con la distancia desde el centro
como la varible independiente, este para mi no tiene mucha utilidad ya que como lo
mostré anteriormente Distance es una variable que aporta poca información al
problema.

Como podemos observar en los


P-Values varios de ellos son
mayores a 0.05 que es el nivel
de significancia permitido para
problemas de este tipo.

Por esta razón es inútil continuar un análisis con Distance como variable regresora,
ya que los resultados se encontrarían en un intervalo de confianza bastante amplio
y por tanto impredecible. Como conclusión a este segundo análisis solicitado por el
problema, se puede aseverar que la distancia al centro y la localidad en la que se
encuentran estos inmuebles no son de importancia para calcular el precio de venta.

También podría gustarte