EJERCICIO DE REGRESION LINEAL MULTIPLE

El gerente de ventas de una compañía de refacciones para automóviles, quiere
desarrollar un modelo para predecir, en el mes de junio, las ventas anuales totales para
una región. Si las ventas regionales se pueden predecir, entonces se podrán estimar las
ventas totales de la compañía. El número de distribuidoras de la región que mantiene en
inventario las refacciones de la compañía y el número de automóviles registrados para
cada región, desde el primero de junio, son las dos variables de predicción que el gerente
quiere investigar. Este obtiene los siguientes datos.
Región
1
2
3
4
5
6
7
8
9
10
11

Ventas (millones)
y
52.3
26.0
20.2
16.0
30.0
46.2
35.0
3.5
33.1
25.2
38.2

Número de
distribuidoras
2011
2850
650
480
1694
2302
2214
125
1840
1233
1699

Número de
automóviles reg.
24.6
22.1
7.9
12.5
9.0
11.5
20.5
4.1
8.9
6.1
9.5

a) Analice la matriz de correlación b) ¿Son válidos los coeficientes de regresión? c)
¿Cuál es el error involucrado en el pronóstico para región 1 d) Indique cómo se calculó el
error estándar de la estimación e) ¿Cómo puede mejorar esta ecuación de regresión?
Análisis de Regresión Múltiple
----------------------------------------------------------------------------Variable dependiente: Y
----------------------------------------------------------------------------Error
Estadístico
Parámetro
Estimación
estándar
T
P-Valor
----------------------------------------------------------------------------CONSTANTE
10,1093
7,21956
1,40026
0,1990
X2
0,0109889
0,00520014
2,11319
0,0675
X3
0,19466
0,639844
0,304231
0,7687
----------------------------------------------------------------------------Análisis de Varianza
----------------------------------------------------------------------------Fuente
Suma de cuadrados
GL Cuadrado medio Cociente-F
P-Valor
----------------------------------------------------------------------------Modelo
1043,66
2
521,832
4,91
0,0405
Residuo
849,564
8
106,196
----------------------------------------------------------------------------Total (Corr.)
1893,23
10
R-cuadrado = 55,1262 porcentaje
R-cuadrado (ajustado para g.l.) = 43,9077 porcentaje
Error estándar de est. = 10,3051
Error absoluto medio = 6,22424
Estadístico de Durbin-Watson = 2,45921 (P=0,1735)
Autocorrelación residual en Lag 1 = -0,401176

Y = 10,1093 + 0,0109889*X2 + 0,19466*X3

41 25.6 36.1 34.6700 1.51 -33.1 1840 8.51 30 1694 9 36.5 31.69 a) El número de distribuidoras se relaciona con las ventas anuales y es una buena variable de predicción potencial.51 -16.51 -6. El número de automóviles registrados tiene una relación moderada con las ventas anuales y. c) el error involucrado en el pronóstico para la región 1 es 15.2 1699 9.5 125 4.8 32.51 9. la multicolinealidad está presente y causa que los coeficientes de regresión no sean confiables.1 36.3 2011 24.3 e) Se deben probar nuevas variables de predicción El gerente decide investigar una nueva variable de predicción: el ingreso personal en la región.Matriz de correlación de los estimadores de los coeficientes ----------------------------------------------------------------------------CONSTANTE X2 X3 CONSTANTE 1.5480 X2 0.5 36.51 -1.7390 1.9 36.9 36.5 36.2 1233 6.79 d) Del análisis de varianza obtenemos el valor de residuo =10.0000 ----------------------------------------------------------------------------y X2 X3 Pronóstico ME 52.51 1.1 36.5 36.79 26 2850 22.7 . Los datos para esta nueva variable son: Región 1 2 3 4 Ingreso Personal (miles de millones) 98.31 16 480 12.0000 0.6700 X3 0.51 20. no será un buen predictor junto con el número de distribuidoras b) NO. debido a la multicolinealidad .5 36.69 35 2214 20.51 46.2 2302 11.51 -11.51 -20.5480 0.51 -10.31 38.7390 0.51 3.1 36.51 -3.0000 0.2 650 7.51 15.01 33.

9177 2.8 94.73091 0.167499 2.2402 porcentaje Error estándar de est.0377914 10.013595 . = 2.01049 (P=0.66798 Error absoluto medio = 1.0000 ----------------------------------------------------------------------------Análisis de Varianza ----------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor ----------------------------------------------------------------------------Modelo 1843. l) realice una prueba con un nivel de significancia del 5% para determinar si el ingreso personal y el número de automóviles registrados deben usarse para predecir las vetas m) ¿Qué modelo debe usar el gerente? n) Interprete el coeficiente de regresión estimados para la ecuación del punto j o) ¿Son válidos estos coeficientes de regresión? p) Analice la exactitud de este modelo Ejecución 1 Análisis de Regresión Múltiple ----------------------------------------------------------------------------Variable dependiente: Y ----------------------------------------------------------------------------Error Estadístico Parámetro Estimación estándar T P-Valor ----------------------------------------------------------------------------CONSTANTE -3.8268 7 7.6 19.3682 porcentaje R-cuadrado (ajustado para g.1309 X2 0.51648 0.400576 0.467 86.0000 Residuo 49.7 67.457426 0.9 61.29017 -1.0293 X4 0.32 0.4483) Autocorrelación residual en Lag 1 = -0.4 3 614.6 f) ¿Es el ingreso personal por región una buena variable de predicción potencial? g) ¿Qué porcentaje de la varianza en las ventas se explicará usando solamente el ingreso personal como variable de predicción? h) ¿Qué porcentaje de la varianza en las ventas se explicará usando las tres variables de predicción? i) ¿Explica la ecuación de predicción de la ejecución número 1 un porcentaje significativo de la varianza en las ventas? Pruebe a un nivel de significancia del 5% j) Realice una prueba con un nivel de significancia del 5% para determinar si se debe usar cada una de las tres variables de predicción k) Realice una prueba con un nivel de significancia del 5% para determinar si el ingreso personal y el número de distribuidoras deben usarse para predecir las ventas.) = 96.11812 ----------------------------------------------------------------------------Total (Corr.) 1893.00157212 1.4 85.7 67.5 6 7 8 9 10 11 68.65087 Estadístico de Durbin-Watson = 2.00238409 0.5996 0.23 10 R-cuadrado = 97.71066 0.l.1732 X3 0.

5642 porcentaje R-cuadrado (ajustado para g.548 0.2052 porcentaje Error estándar de est.385301 0.0129 X4 0.0000 Residuo 66.913 8 12.548 0.59 0.936 X2 0.60819 2.0000 Residuo 102.00161745 3.57292 Estadístico de Durbin-Watson = 1.) 1893.739 0.6294 porcentaje Error estándar de est.670 0.49259 0.0269 2.0020 X4 0. = 2.87655 Error absoluto medio = 2.1964 8 8.40 0.0000 0.) 1893.670 1.17004 (P=0.32 2 895.0611 (P=0.00514754 0.13821 4.562076 0.58666 Error absoluto medio = 2.0568) Autocorrelación residual en Lag 1 = 0.0000 ----------------------------------------------------------------------------- .100016 Ejecución 3 Análisis de Regresión Múltiple ----------------------------------------------------------------------------Variable dependiente: Y ----------------------------------------------------------------------------Error Estadístico Parámetro Estimación estándar T P-Valor ----------------------------------------------------------------------------CONSTANTE -1.27455 ----------------------------------------------------------------------------Total (Corr.0000 0. = 3.1825 0.8641 ----------------------------------------------------------------------------Total (Corr.0348932 12.936 0.620922 0.63165 0.l.l.18538 Estadístico de Durbin-Watson = 2.46799 -1.556 X3 0.23 10 R-cuadrado = 94.23 10 R-cuadrado = 96.0001 ----------------------------------------------------------------------------Análisis de Varianza ----------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor ----------------------------------------------------------------------------Modelo 1790.2940) Autocorrelación residual en Lag 1 = -0.281 X4 0.3281 0.556 0.66847 0.Ejecución 2 Análisis de Regresión Múltiple ----------------------------------------------------------------------------Variable dependiente: Y ----------------------------------------------------------------------------Error Estadístico Parámetro Estimación estándar T P-Valor ----------------------------------------------------------------------------CONSTANTE -4.739 1.1414 X3 0.298956 Matriz de correlación de los estimadores de los coeficientes ----------------------------------------------------------------------------CONSTANTE X2 X3 X4 CONSTANTE 1.0000 ----------------------------------------------------------------------------Análisis de Varianza ----------------------------------------------------------------------------Fuente Suma de cuadrados GL Cuadrado medio Cociente-F P-Valor ----------------------------------------------------------------------------Modelo 1827.5035 porcentaje R-cuadrado (ajustado para g.158 69.86116 -0.) = 93.) = 95.0502448 7.5895 X2 0.281 1.03 2 913.430169 0.516 110.0000 0.

000 y 0.0001 respectivamente. por tanto se rechaza la hipótesis nula y el gerente concluye que la ecuación de regresión muestral explica un porcentaje significativo de la varianza en las ventas j) Las hipótesis adecuadas son: El ingreso personal ( es una variable significativa.f) Si. l) Las variables que deben probarse están en la ejecución número 2.0293 por el contrario el número de distribuidoras no es una variable significativa k) Las variables que deben probarse están en la ejecución número 3.000 y como . Las hipótesis adecuadas son: La hipótesis nula se rechaza de acuerdo con los p-valores 0. el gerente concluye que ambas variables explican una porción significativa de la varianza en las ventas. por tanto el gerente concluye que ambas variables explican una parte significativa de la varianza en las ventas.000 respectivamente. adecuadas son: Las hipótesis La hipótesis nula se rechaza de acuerdo con los p-valores 0.0020 y 0. lo mismo que el número de registros ( ya que el p-valor es 0. se observa que el p-valor del modelo es 0.0129 y 0. . el ingreso personal tiene una fuerte relación con las ventas anuales g) h) i) Las hipótesis nula y alternativa son: En la salida del análisis de varianza de la ejecución 1.

5% de la varianza en las ventas y debe ser bastante adecuado. Cada pronóstico se aleja alrededor de 2. p) El modelo explica el 96. Si el ingreso personal aumenta en mil millones. las ventas aumentarán en promedio de 430.170 o) Los coeficientes de regresión deben ser válidos. Si el número de automóviles registrados en la región aumenta en un millón. mientras que el número de automóviles registrados se deja constante. ya que las variables 3 y 4 tiene una relación muy fuerte entre ellas ( de manera que la multicolinealidad no es un problema.920.m) El gerente de ventas debe elegir el modelo que incluye a los automóviles registrados y al ingreso personal por que explican un mayor porcentaje de la varianza n) La ecuación es .877 millones (el valor de la desviación estándar de la estimación) (Ejecución número 2) . las ventas aumentarán en un promedio de 620. mientras que el ingreso personal se mantiene constante.

Sign up to vote on this title
UsefulNot useful