Está en la página 1de 5

LECTURA CUATRO – ANÁLISIS DE REGRESIÓN

En la administración actual el análisis de regresión es una herramienta


fundamental. Tienen dos propósitos principales: por un lado, entender la
relación entre las variables como gastos, por ejemplo. Por otra parte, el
objetivo es predecir el valor de una variable basándose en el valor de otra.
Veremos a continuación entonces el desarrollo del modelo lineal simple. En
cualquiera de los modelos de regresión la variable que trata de predecirse
se llama variable dependiente o de respuesta. Se dice que el valor de la
variable dependiente depende del valor de una variable independiente,
la cual también se conoce como variable explicativa o predictoria.

Diagramas de dispersión

Los diagramas de dispersión nos permiten observar la relación que hay


entre variables, donde la variable independiente se ubica en el eje
horizontal y la variable dependiente en el eje vertical. Para estudiar este
caso acudiremos al siguiente ejemplo.
La compañía Casa Moderna remodela casas viejas. Un dato histórico de la
compañía ha revelado que el precio por la cantidad de volumen de
trabajos de remodelación depende de la nómina del área donde está
establecida la compañía. La relación de ventas y nómina de Casa
Moderna se puede ver a continuación:

Ventas de Casa Moderna (cientos Nómina local (millones)


de miles)
6 3
8 4
9 6
5 4
4.5 2
9.5 5

Los expertos en economía predicen que el año entrante la nomina local


será de 600 millones y Casa Moderna quiere hacer una planeación de
acuerdo con estos datos.
En la siguiente gráfica se puede apreciar un diagrama de dispersión
correspondiente a los datos de la tabla anterior. Los valores más altos de la
nómina parecen producir mayores ventas. Aunque no existe una relación
absoluta ya que no todos los puntos se encuentran sobre una línea recta,
hay una relación. En el gráfico se dibuja una línea entre todos estos puntos
para ayudar a comprender la conexión que existe entre la nómina y las
ventas. Como no todos los puntos están sobre la recta, es fácil errar si se
intenta predecir las ventas con base en la nómina utilizando esta línea o
cualquier otra. Se podrían dibujar múltiples segmentos de línea a lo largo
de los puntos pero no se sabría cual representa la relación verdadera; con
el análisis de regresión podemos saber esta relación.

10
9
8
Ventas ($100.000)

7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7
Nomina ($100 millones)

Regresión lineal simple

En general en los modelos de regresión existe un supuesto implícito de que


hay una relación entre las variables. También está presente cierto error
aleatorio que no es posible predecir. El modelo de regresión lineal simple es

Y = β 0 + β1 X + ε
Donde:
Y = variable dependiente (variable de respuesta)
X = variable independiente (variable predictora o explicativa)
β 0 = ordenada al origen (valor de Y cuando X = 0)
β1 = pendiente de la recta de regresión
ε = error aleatorio

Los valores verdaderos de la ordenada al origen y de la pendiente no se


conocen con anticipación, por lo cual se estiman usando datos de
muestra. La ecuación de regresión basada en datos de muestra está dada
por:
Ŷ= b0 + b1 X
Donde:
Ŷ= valor pronosticado de Y
En el ejemplo de Casa Moderna se trata de predecir las ventas, por esto la
variable dependiente es representada por Y. Para ayudar a que este
objetivo se cumpla la variable independiente (X) será la nómina. La línea
que está dibujada en la gráfica anterior representa la minimización de los
errores. Entonces el error está definido como

Error = (valor real) – (valor pronosticado)


е=Y–Ŷ

La ecuación de la regresión lineal simple es:

Ŷ = b0 + b1 X
Además, por medio de las siguientes ecuaciones se puede calcular el
origen y la pendiente:

X =
∑ X = Promedio (media) de valores de X
n

Y=
∑Y = Promedio (media) de valores de Y
n

b1 =
∑ ( X − X )(Y − Y )
∑(X − X ) 2

b0 = Y − b1 X

Coeficiente de correlación

El coeficiente de correlación también se relaciona con el coeficiente de


determinación. Con el coeficiente de correlación podemos medir el grado
de solidez de la relación lineal. Generalmente se expresa con la letra r y
toma valores entre 1 y -1. A continuación presentaremos algunos
diagramas de dispersión para diferentes valores de r, la cual está definida
como
r = ± r2

Tipo 1: Correlación positiva perfecta:


r = +1
7

0
0 2 4 6 8

Tipo 2: Correlación positiva:


0<r<1
7

0
0 2 4 6 8 10

Tipo 3: Sin correlación:


r=0
9
8
7
6
5
4
3
2
1
0
0 2 4 6 8

Tipo 4: Correlación negativa perfecta:


r = -1
7

0
0 2 4 6 8

También podría gustarte