Está en la página 1de 8

Estadística y pronósticos

para la toma de decisiones

Regresión lineal simple y


regresión lineal múltiple

Tema 14: Transformaciones de


modelos de regresión no
lineales
Introducción
Los administradores de negocios tratan de identificar las causas del ausentismo de los empleados para poder
tomar medidas para controlarlo o reducirlo. El análisis de regresión es un método para determinar variables que
están relacionadas con el ausentismo de los trabajadores. El primer paso sería definir una medida Y para el aus-
entismo de los empleados; por ejemplo, el número de inasistencias por mes. El siguiente paso sería definir un
conjunto de variables independientes que podrían estar relacionadas con Y. Finalmente, se relaciona Y con las
variables independientes utilizando un modelo de regresión múltiple, y se ajusta el modelo al conjunto de datos.

Si la ecuación de predicción por mínimos cuadrados resultante proporciona un buen ajuste de los datos, es
decir, si permite predecir una medida Y del ausentismo con un pequeño error de predicción, se concluirá que al
menos una de las variables independientes aporta información para predecir Y.

Tema 14: Transformaciones de modelos de regresión no lineales


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
02
Explicación
Aunque el modelo de regresión lineal simple supone una línea recta entre Y y X, en general, un modelo lineal
de regresión se refiere al grado u orden en las β (por ejemplo, β2 no está presente), las variables de predicción
(las X) pueden tomar varias formas y la metodología de regresión lineal sigue siendo apropiada. Los modelos
de regresión pueden ser usados para modelar relaciones complejas entre Y y X (o muchas X) o para modelar
una relación de línea recta entre la variable Y y alguna función (transformación) de X.

Ejemplo

En un estudio de variables que afectan la productividad en el negocio de abarrotes al menudeo, W. S. Good


usa el valor agregado por hora de trabajo para medirla. Él define al valor agregado como el “excedente [dinero
generado por el negocio] disponible para pagar mano de obra, muebles accesorios y equipo”. Los datos de
acuerdo con la relación el valor agregado por hora de trabajo Y y el tamaño X de la tienda de abarrotes de-
scrita en el artículo de Good para diez tiendas de abarrotes ficticias se muestran enseguida. Se establecerá
un modelo para relacionar Y con X:

Datos en relación con el tamaño de tienda y el valor agregado


Tienda Valor agregado por hora de Tamaño de la tienda (miles
trabajo Y de pies cuadrados) X
1 4.08 21.0
2 3.40 12.0
3 3.51 25.2
4 3.09 10.4
5 2.92 30.9
6 1.94 6.8
7 4.11 19.6
8 3.16 14.5
9 3.75 25.0
10 3.60 19.1

Se puede investigar la relación entre Y y X por inspección de la gráfica de los datos. La gráfica hace pensar
que la productividad Y se incrementa con el tamaño de la tienda X hasta que se alcanza un punto óptimo. Ar-
riba de ese tamaño, la productividad tiende a disminuir. La relación parece curvilínea y un modelo cuadrático
podría ser apropiado.

Tema 14: Transformaciones de modelos de regresión no lineales


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
03
4

0
5 10 15 20 25 30 35
TAMAÑO DE LA TIENDA (X)

Con el ejemplo anterior, se usó Minitab para ajustar un modelo cuadrático a los datos y graficar la curva de
predicción cuadrática junto con los puntos de datos graficados. Se prueba la hipótesis para ver la idoneidad
del modelo a ajustar.

Análisis de regresión polinomial: Y vs. X

La ecuación de regresión es:

Y = - 0.1594 + 0.3919 X - 0.009495 X**2


S = 0.250298 R-cuad. = 87.9% R-cuad. (ajustado) = 84.5%
Análisis de varianza
Fuente GL SC MC F P
Regresión 2 3.19889 1.59945 25.53 0.001
Error 7 0.43855 0.06265
Total 9 3.63744
Análisis de varianza secuencial
Fuente GL SC F P
Lineal 1 0.80032 2.26 0.171
Cuadrática 1 2.39858 38.29 0.000

Tema 14: Transformaciones de modelos de regresión no lineales


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
04
Análisis de regresión: Y vs. X, X cuadrada

La ecuación de regresión es:


Y = - 0.159 + 0.392 X - 0.00949 X cuadrada

Predictor Coef. Coef. de EE T P


Constante -0.1594 0.5006 -0.32 0.760
X 0.39193 0.05801 6.76 0.000
X_cuad -0.009495 0.001535 -6.19 0.000

S = 0.250298 R-cuad. = 87.9% R-cuad. (ajustado) = 84.5%

Análisis de varianza

Fuente GL SC MC F P
Regresión 2 3.1989 1.5994 25.53 0.001
Error residual 7 0.4385 0.0626
Total 9 3.6374

Fuente GL SC sec.
X 1 0.8003
X cuadrada 1 2.3986
De la impresión mostrada anteriormente, puede observarse que la ecuación de regresión es:

Ŷ=-0.1594 + 0.3919 X - 0.009495 X2

La gráfica de la ecuación se presenta enseguida:

Tema 14: Transformaciones de modelos de regresión no lineales


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
05
Gráfica de línea ajustada
Y= -0.1594 + 0.3919 X
-0.009495 X**2
S 0.250298
R-cuad 87.9%
R cuad (ajustado) 84.5%
4

0
5 10 15 20 25 30 35

(X)

Para evaluar el modelo se realiza la prueba de hipótesis, con un nivel de significancia de 0.01:

1. Establecimiento de hipótesis
H0 : β1= β2 = 0
En oposición a:
Ha: al menos a pendiente es diferente de cero

2. Estadística de prueba
En la impresión anterior puede verse que:
Fcalculada = 25.53

Tema 14: Transformaciones de modelos de regresión no lineales


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
06
3. Regla de decisión

Rechazar H0 si Fcalculada = 25.53 es mayor que Fteórica = F27 (0.01)

4. Conclusión

Puesto que Fcalculada = 25.53 es mayor que Fteórica = 9.55, se rechaza H0.

Esto es el ajuste global del modelo, que es significativo. Esto quiere decir que al menos una variable inde-
pendiente tiene efecto en Y.

En cuanto a las pruebas de t para variables individuales, se probará si el término cuadrático es significativo; el
término lineal.

1. Establecimiento de hipótesis

H0 : β2 = 0 (el término cuadrático x2 no es significativo, no afecta a Y).

En oposición a:

Ha : β2 ≠ 0 (el término cuadrático x2 es significativo, afecta a Y).

2. Estadística de prueba

b − β i −0.009495 − 0
t calculada = i = = −6.19
Sbi 0.00153

3. Regla de decisión, α = 0.01

Rechazar H0 si |tcalculada| = |- 6.19| = 6.19 es mayor que tteórica.

En donde:
t teórica =tα / 2 ( n − k − 1) = t0.01/ 2 ( 7 ) = t0.005 ( 7 ) = 3.499

En donde el valor de tteórica se obtuvo de la tabla de t.

4. Conclusión

Puesto que |tcalculada| = 6.19 es mayor que tteórica = 3.499, se rechaza H0. Esto es, existe evidencia, el término
cuadrático, x2, es significativo, es decir, afecta a Y.
De la impresión anterior, puede apreciarse que los valores absolutos de tcalculada para b1 y b2, son superiores
a tteórica = 3.499, esto es, ambas pendientes son significativas.

Tema 14: Transformaciones de modelos de regresión no lineales


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
07
Checkpoint
Asegúrate de comprender:

• Las transformaciones en la variable independiente.


• Cómo medir el ajuste con las diferentes transformaciones.

Referencias bibliográficas
Hanke, J. E., y Wichern, D. W. (2010). Pronósticos en los negocios (9ª ed.). México: Pearson

Levin, R., y Rubin, D. (2010). Estadística para administración y economía (7ª ed.). México. Pearson edu-
cación

Rodríguez, J., Pierdant, E., y Rodríguez, C. (2016). Estadística para administración (2ª ed.). México: Editorial
Patria

Tema 14: Transformaciones de modelos de regresión no lineales


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
08

También podría gustarte