Está en la página 1de 4

Exploración y Predicción de datos

Estudio de Ventas de Casas -Venice Florida-

Introducción
En este caso en particular, se utilizará la herramienta predicción Watson Analytics (un
software con plataforma online creado por la empresa IBM) para el caso venta de casas de
Venice Florida. En el presente caso de estudio, los resultados se presentan en dos partes, en
la primera parte, la variable dependiente será el precio, siendo las variables independientes
Número de recamaras (Bedrooms). Extensión de la casa en pies2 (Size), Piscina: 1= si, 0=
no (Pool), Distancia desde el centro de la ciudad (Distance), Municipio (Twnship), Cochera
anexa 1= si, 0= no, Número de baños (baths). Para la segunda parte de los resultados a
presentarse en el presente caso de estudio, se utilizará como variable dependiente distancia
desde el centro.

Objetivo
Realizar un análisis de correlaciones para el caso de venta de casas de Venice Florida
utilizando el software ofimático con plataforma online Watson Analytics.

Resultados

Análisis de correlación (tarjet: precio)


En primer lugar, el reporte de calidad de los datos es muy bueno, tal como se observa:

JUAN C. HERNÁNDEZ
Tal como muestra los datos en el software Watson Analytics, las variables independientes
tienen un grado de correlación referente a la predicción del precio de venta. Los datos
arrojados muestran los siguientes niveles de predicción:

Variable dependiente: Precio

Variables independientes:
Garage (28% de grado de predicción del precio)

Sin embargo, el propio software arroja que las variables precio y habitaciones combinadas
pueden representar mejor el modelo hasta un 45.7%. Esto nos induce a filosofar que el
precio no está correlacionado con una sola variable sino que puede describirse
principalmente a través de un análisis multivariable.

Habitaciones (22% de grado de predicción del precio)

JUAN C. HERNÁNDEZ
En este caso las variables habitaciones y tamaño combinadas ofrecen una mejor
representación del precio con una predicción de 49.4%.

El número de baños (baths 14% de predicción del precio).

Para este tercer evento, la mezcla entre el número de baños y el número de habitaciones
ofrecen un nivel de pronóstico de 35%.

En analogía a la distancia a partir del centro, no está catalogada entre el top de relación con
el precio, por lo que puede esta variable no ser significativa para expresar la variable
dependiente precio.

Análisis de correlación (tarjet: distancia desde el centro)


Tomando como variable dependiente a la distancia desde el centro, se obtiene el siguiente
resultado:

Este resultado indica que la variable garaje describe el modelo en 12.9%.

JUAN C. HERNÁNDEZ
Conclusiones
De acuerdo a lo obtenido en los resultados del análisis de correlaciones se obtiene que la
variable precio está descrita por las variables garaje en un 28%, número de habitaciones en
un 22% y el número de baños en 14%. Este nivel de correlación puede incrementar
significativamente si se utilizan modelos multivariables de regresión. Si se toma en cuenta
el cuestionamiento inicial, el que la casa tenga una cochera es más determinante que si esta
tiene piscina.

JUAN C. HERNÁNDEZ

También podría gustarte