Está en la página 1de 13

ADMINISTRACIÓN

Y NEGOCIOS

REGRESION LINEAL SIMPLE

Parte 2 Evaluación.

NOMBRE: Marco Bustamante, Camila Parra.


CARRERA: Ingeniería en Administración de empresas.
ASIGNATURA: Estadística.
PROFESOR: Katty Espinoza.
FECHA: 03/07/2022.
Introducción
Como bien se conoce, la regresión lineal es una medida matemática, que nos permite conocer el
comportamiento de las variables, donde encontramos una X independiente y una Y dependiente
y que el resultado de “Y” se ve afectada por “X”.

Dentro de esta medida de regresión, podemos encontrar una covarianza, que básicamente es
para conocer la relación de las variables que puede ser inversa o directa.

No obstante, también existe una herramienta que permite conocer la fuerza que tiene cada par
de variable, conocida como coeficiente de correlación y un coeficiente de determinación que
permite conocer el poder que tiene X sobre Y.

A continuación, a través de la presente evaluación, se busca analizar y poner en práctica lo


aprendido en la unidad de regresión lineal, buscando la relación en los valores de viviendas
cercanos a la estación de trenes, realizar una comparación entre todos los pares de variables y
determinar que variables explica mejor el precio de una propiedad.

Además, realizar la construcción de un modelo de regresión a partir de la ecuación de la recta


dada por el grafico de dispersión y sus variables, el cual nos facilita la compresión de forma más
eficiente en base a la relación que existe entre las variables.

2
ACTIVIDAD 1

A) Realice una gráfica de dispersión de todos los pares de variables presentes en la base de
datos, considerando a la variable “Valor” como dependiente, debe incluir el modelo y el
coeficiente de determinación.

Antigüedad (X), Valor (Y)

Covarianza: -117,0194198.

Se concluye que el que el tipo de relación que existe entre las variables es inverso, ya que
a medida que aumentan los años(antigüedad), el valor de la propiedad disminuye.

Coeficiente de correlación: -0,1

Se concluye que la relación lineal entre las variables es muy débil ya que es un -0,1,
teniendo una pendiente negativa. (ANEXO 1)

Coeficiente de determinación: R2 = 0,0059. = 0,59%

La variabilidad de los años en que la propiedad fue inscrita por primera vez se ve afectada
en un 0,59% de la variabilidad de “Y” valor de la propiedad en (UF).

3
Superficie (X) Valor (Y)

Covarianza: -1,139401005

Se puede decir que el tipo de relación que existe entre las variables es inverso, ya que a
medida que aumenta el porcentaje de superficie construida, el valor de la propiedad
disminuye.

Coeficiente de correlación: -0.02

La fuerza de la relación lineal es muy débil, ya qué es -0,02, teniendo una pendiente
negativa. (ANEXO 1)

Coeficiente de determinación: R2= 0,0006 = 0,06%

La variabilidad del porcentaje de la superficie construida de la propiedad se ve afectada


en un 0,06% de la variabilidad de “Y” valor de la propiedad en (UF).

4
Supter (X) Valor (Y)

Covarianza: 25936,13719

La covarianza indica que hay una relación o influencia directa entre las variables debido a
que entre mayor sea la superficie del terreno mayor será el valor de la propiedad.

Coeficiente de correlación: 0,70

La fuerza de la relación lineal que existe entre las variables es levemente fuerte ya que es
0,70, teniendo una pendiente positiva. (ANEXO 1)

Coeficiente de determinación: R2= 0,4917 = 49,17%

La variabilidad de la superficie de la propiedad se ve afectada en un 49,17% de la


variabilidad de “Y” valor de la propiedad en (UF).

5
Distancia (X) Valor (Y)

Covarianza: -228,6138618

El tipo de relación que existe entre las variables es inversa, ya que a medida que
aumenta la distancia desde la estación de trenes hacia las viviendas el valor de la
propiedad disminuye.

Coeficiente de Correlación: -0,90

La fuerza de la relación lineal entre las variables es fuerte ya que es -0,90, teniendo una
pendiente negativa. (ANEXO 1)

Coeficiente de determinación: R2: 0.8147 = 81,47%

La variabilidad que hay entre la distancia de la propiedad se ve afectada en un 81,47 % de


la variabilidad de “Y” valor de la propiedad en (UF).

En Conclusión, de acuerdo con los datos analizados, la variabilidad DISTANCIA que la


Superintendencia de Viviendas y Urbanismo público, es la que explica mejor el valor
monetario de la propiedad, ya que la variabilidad DISTANCIA (X) explica en un 81,47% la
variabilidad de VALOR "Y" en relación con las otras variables.

6
ACTIVIDAD 2

A) Crear la variable “Superficie construida (en metros cuadrados)” considerando los


metros cuadrados del terreno y el porcentaje de construcción (se multiplican).

La tabla realizada con la variable nueva se encuentra en el Excel.

B) Un colega menciona que la variable “superficie construida” es la que mejor explica el


valor de la propiedad que cualquier otra variable independiente analizada la actividad
1. ¿Cuál es la opinión respecto a la afirmación del colega? justifique su respuesta
realizando un análisis completo de la situación.

RELACION ENTRE VALOR (EN UF) SEGUN SUPERFICIE CONSTRUIDA (EN M2)

5000
4500
4000 f(x) = 6.08783953503452 x + 2128.12465226944
3500 R² = 0.297771798075846
3000
VALOR (UF)

2500
2000
1500
1000
500
0
0.0000 100.0000 200.0000 300.0000 400.0000
SUPERFICIE CONSTRUIDA (M2)

Covarianza : 12598,05

La covarianza indica que hay una relación o influencia directa entre las variables, por
lo que a mayor superficie del terreno construida, mayor será el valor de la propiedad.

Coeficiente de Correlación : 0,55

La fuerza de relación que existe entre las variables es levemente fuerte ya que es
0,55, teniendo una pendiente positiva. (ANEXO 1)

Coeficiente de Determinación : R² = 0,2978 = 29,78%

La variabilidad que hay entre superficie construida de la propiedad (X), se ve afectada


en un 29,78% de la variabilidad de "Y" Valor de la propiedad en (UF).

7
C) Finalmente, según todo el análisis realizado ¿cuál variable explica mejor el valor de la
propiedad?

De acuerdo con los análisis realizados en las variables en la actividad 1, en


comparación a la variable Superficie construida - Valor de la propiedad (UF) se puede
concluir que la variable Distancia (km) - Valor de la propiedad (UF) sigue siendo la que
mejor explica el valor de la propiedad que cualquier otra variable, ya que la
DISTANCIA afecta en un 81,47% la variabilidad de VALOR(UF) de la propiedad.

D) Considerando la respuesta anterior, muestre el modelo de regresión lineal (que según


usted explica mejor el valor) mostrando el coeficiente de determinación. Explique
cada uno de los parámetros del modelo lineal (pendiente e intercepto) e interprete el
coeficiente de determinación.

Modelo de regresión lineal simple:

VALOR (Y) = -917,91* DISTANCIA (X) + 4304,6+ei

PENDIENTE: Por cada aumento en 1 km en “X” Distancia, “Y” Valor en UF disminuye en


-917,91 UF.

INTERCEPTO: Cuando la Distancia “X” es igual a 0 el resultado del valor de la propiedad


“Y” es igual al intercepto, es decir 434,6 UF

COEFICIENTE DE DETERMINACIÓN : La variabilidad de Distancia (km) explica en un


81,47% la variabilidad del valor de la propiedad (UF).

E)  De acuerdo con el modelo construido en el ejercicio anterior (letra d), ¿Cuál sería la
condición para que la propiedad tenga un valor de 3000 UF?

La condición para que la propiedad tenga un valor de 3000 UF es que la distancia sea
de 1,4 KM.

8
ACTIVIDAD 3

A) Crear la variable “sector” considerando la división territorial (sector A y sector B).

Las variables creadas se encuentran en el Excel.

B) Desde la superintendencia informaron que “quizás” es conveniente realizar dos modelos


de regresión para explicar el valor de la propiedad: Un modelo para el Sector A y otro
modelo para el Sector B. Considere como variable dependiente “valor” y como variable
independiente la elegida por usted en el ejercicio (c y d) de la Actividad 02. Construya los
dos modelos de regresión lineal (Uno para el sector A y otro para el sector B), mostrando
el coeficiente de determinación.

SECTOR A

RELACION ENTRE VALOR (EN UF) SEGUN SECTOR A (MANOR A


1 KM)
5000
4500
4000
f(x) = − 943.133288032466 x + 4246.5825280466
3500 R² = 0.617572233668063
VALOR (EN UF)

3000
2500
2000
1500
1000
500
0
0 0.2 0.4 0.6 0.8 1 1.2
SECTOR A (MENOR A 1 KM)

Covarianza : -57,92780544

Se puede decir que el tipo de relación que existe entre las variables es inversa, ya que a
medida que aumenta la distancia del sector A, el valor de la propiedad disminuye.

Coeficiente de Correlación : -0,79

La fuerza de relación entre las variables es fuerte ya que es -0,79, teniendo una pendiente
negativa. (ANEXO 1)

Coeficiente de Determinación: R2 = 0,6176 = 61,76%.


9
La variabilidad que hay entre el sector A de la propiedad, se ve afectada en un 61,76% de
la variabilidad de "Y" Valor de la propiedad en (UF).

Modelo de regresión lineal:

Valor (Y) = -943,13 * Sector A (X)+ 4246,6 + ei

SECTOR B
RELACION ENTRE VALOR (EN UF) SEGUN SECTOR B (MAYOR A
1 KM Y HASTA 2 KM)
4000
3500
f(x) = − 1230.13529342561 x + 4836.97071887374
3000 R² = 0.725414157812414
VALOR (EN UF)

2500
2000
1500
1000
500
0
0.8 1 1.2 1.4 1.6 1.8 2 2.2
SECTOR B (DESDE 1 KM HASTA 2 KM)

Covarianza : -91,45676478

Se puede decir que el tipo de relación que existe entre las variables es inversa, ya que a
medida que aumenta la distancia del sector B, el valor de la propiedad disminuye.

Coeficiente de Correlación : -0,85

La fuerza de relación entre las variables es fuerte ya que es -0,85, teniendo una pendiente
negativa. (ANEXO 1)

Coeficiente de Determinación: R2 = 0,7254 = 72,54%

La variabilidad que hay entre el sector B de la propiedad, se ve afectada en un 72,54% de


la variabilidad de "Y" Valor de la propiedad en (UF).

Modelo de regresión lineal:

Valor (Y) = -1230,1* Sector B (X) +4837 +ei.

10
C) ¿Cuál es su opinión respecto a la información de la superintendencia? ¿Es conveniente
realizar dos modelos de regresión para explicar el valor de la propiedad? Justifique su
respuesta realizando un análisis de los resultados anteriores.

De acuerdo a la analizado, se puede decir que para poder hacer una comparación por
sector si es necesario separarlos ya que según lo desarrollado los datos nos entregan que
el SECTOR B que la Superintendencia de Viviendas y Urbanismo informó, es la que explica
mejor el valor monetario de la propiedad, ya que la variabilidad del sector afecta en un
73,28% la Variabilidad del valor de "Y" en relación con la variable SECTOR A, Pero aun así
la variabilidad que mejor presenta el modelo de regresión lineal simple de acuerdo a las
variables si no se separara por sector seria la variable DISTANCIA (KM) ya que afecta en
un 81,47% la variabilidad de "Y" VALOR (UF).

11
Anexos

Anexo 1, Coeficiente de Correlación Lineal

12
Conclusión
Se identificaron y se caracterizaron las variables más relevantes de acuerdo al valor de las propiedades
cercanas a la estación de trenes en la ciudad de Chillán y otras variables relacionadas a dichas viviendas,
las cuales fueron: Distancia, Spter, % Const, Años, Superficie construida, Sector A y Sector B.

Se realizo la formulación del modelo regresión línea simple, en cuanto a las variables más relevantes, y a
partir de este, se concluye que la variabilidad Distancia (x) es la que explica en un 81,47% la variabilidad
de Valor de la propiedad (UF) (Y).

Los modelos de regresión líneas son muy importantes para para cualquier tipo de organización
independiente de su rubro y/o actividad económica, ya que estos ayudan a mejorar la productividad,
poder minimizar costos, poder disminuir fallas en procesos, entre otras.

El modelo de regresión lineal permite identificar la relación que existe entre las diferentes variables y
como estas afectan el resultado de otra variable, es decir, permite identificar cual es la variable que más
causa – efecto tiene respecto a la variable independiente.

13

También podría gustarte