Está en la página 1de 31

Seminario de Investigacin de Mercados

0011 0010 1010 1101 0001 0100 1011

MS07 Regresin

Anlisis de Regresin Mltiple


0011 0010 1010 1101 0001 0100 1011

Multivariate data analysis Joseph F. Hair Jr. et al Prentice Hall, 2010


0011 0010 1010 1101 0001 0100 1011

Ch. 4

Multiple Regression Analysis

Anlisis de Regresin Mltiple


0011 0010 1010 1101 0001 0100 1011

Tcnica funcional utilizada para predecir el valor de una variable dependiente (razn) a partir del conocimiento de dos o ms variable independientes (razn).
Se utiliza tambin para comprender mejor la relacin funcional entre la variable dependiente y las variables de pronstico (independientes).

La interpretacin de los resultados se basa en los coeficientes Beta, que representan el efecto de las variables independientes sobre la variable dependiente. La habilidad del modelo para predecir el valor de la variable dependiente est dada por el coeficiente de determinacin R2. La frmula general del modelo es: Y = b1X1 + b2X2 + b3X3 +
. . . bmXm + k

Jos Ignacio Dominguez

2
4

Anlisis de Regresin Mltiple


0011 0010 1010 1101 0001 0100 1011

Al tener 2 o ms variables independientes (de pronstico) es necesario considerar cul o cules de ellas explican mejor el comportamiento de la variable dependiente?

No es necesario incluir todas las variables independientes en la ecuacin cuando algunas de ellas explican en forma similar el comportamiento de la variable dependiente.
Es decir, cuando estn correlacionadas entre s.
Jos Ignacio Dominguez

2
5

Anlisis de Regresin Mltiple


0011 0010 1010 1101 0001 0100 1011

De hecho, cuando 2 o ms variables independientes estn muy relacionadas entre s existe una condicin de multicolinealidad, que origina varios problemas:
Es probable que los errores estndar sean muy altos. No se estiman con precisin los coeficientes de regresin. Es posible que las magnitudes y los signos de los coeficientes de regresin cambien de una muestra a la siguiente. Se hace difcil evaluar la importancia relativa de las variables independientes.

Jos Ignacio Dominguez

2
6

Medidas de Multicolinealidad
0011 0010 1010 1101 0001 0100 1011

Tolerancia
Para cada variable independiente, equivale a la proporcin de varianza que es explicada por las otras variables independientes.

Si se acerca a 1.000 significa que las otras variables NO explican tanta varianza como esta, por lo que se considera que existe poca multicolinealidad.

Jos Ignacio Dominguez

2
7

Medidas de Multicolinealidad
0011 0010 1010 1101 0001 0100 1011

VIF (variance inflation factor)


Se calcula como la inversa de la Tolerancia para cada variable independiente. Se interpreta como el factor con que se incrementa el error de estimacin como resultado de la interaccin de las otras variables independientes.

Si se acerca a 1.000 significa que las otras variables NO incrementan el error , por lo que se considera que existe poca multicolinealidad.
Jos Ignacio Dominguez

2
8

Ejemplo Bancos
0011 0010 1010 1101 0001 0100 1011

v1 v2 v3 v4 v5 v6

Chicos cobran menos que grandes Grandes se equivocan ms Cajeras no necesitan ser amigables Me conozcan personalmente Trato impersonal, no trabajara Mi banco ideal sera uno pequeo, en el que me trataran muy bien
Jos Ignacio Dominguez

2
9

Anlisis de Regresin Mltiple


v1 v2 v3 v4 v5 v6 1 0 3 0 7 7 5 2 5 3 7 3 2 3 3 9 9 4 9 9 9 4 7 7 9 0 0 2 5 3 0 1 6 6 4 6 6 1 4 5 2 2 7 5 4 3 6 3 3 8 1 3 1 7 7 3 9 5 5 9 1 1 3 10 7 1 5 4 2 2 11 8 7 3 9 9 8 12 3 0 2 6 4 3 13 3 2 8 2 1 1 14 7 8 2 8 8 8 15 0 2 0 7 8 4 X6= Mi banco ideal sera uno pequeo,en el que me trataran muy bien
10

Anlisis de Regresin Mltiple


Correlations
v1 Chicos cobran menos que grandes v2 Grandes se equivocan ms v3 Cajeras no necesitan ser amigables v4 Me conozcan v5 Trato personalme impersonal, nte no trabajara

v1 Chicos cobran menos que grandes v2 Grandes se equivocan ms v3 Cajeras no necesitan ser amigables v4 Me conozcan personalmente v5 Trato impersonal, no trabajara v6 Banco ideal: pequeo, traten bien 0.610 0.016 0.469 0.078 -0.018 0.949 -0.096 0.732 0.379 0.164

0.230 0.409 0.190 0.498 0.319 0.247 0.689 0.004

-0.832 0.000 -0.774 0.001 -0.393 0.147

0.927 0.000 0.762 0.001

0.832 0.000

Las variables v2 y v4 tienen una alta correlacin con la variable que se desea predecir (v6); al mismo tiempo, no estn correlacionadas entre ellas. La variable v5 tambin tiene una alta correlacin con v6, pero al mismo tiempo la tiene con v4.
Ya que v4 y v5 estn correlacionadas (miden lo mismo, son redundantes) no necesitan estar ambas en una ecuacin de regresin mltiple.

Puede calcularse una ecuacin de Regresin Mltiple con v2 y v4 como variables de pronstico (independientes).
11

Anlisis de Regresin Mltiple


Model Summary(b) Model R R Square Adjusted R Square Std. Error of the Estimate 1 0.942 0.888 0.869 0.885 a Predictors: (Constant), Me conozcan personalmente, Grandes se equivocan ms b Dependent Variable: Banco ideal: pequeo, traten bien Coefficients(a) Model

Unstandardized Coefficients Standardized Coefficients t Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) -0.798 0.550 -1.451 0.172 Grandes se equivocan ms 0.474 0.083 0.565 5.742 0.000 0.964 1.037 Me conozcan personalmente 0.574 0.086 0.655 6.652 0.000 0.964 1.037 Dependent Variable: Banco ideal: pequeo, traten bien

La habilidad de prediccin del modelo es muy alta, segn lo indica la R2 = .888 Existe muy poca multicolinealidad, ya que cada variable independiente explica el 96.4% de la varianza de la dependiente y los errores de estimacin se elevan en tan solo 3.7%.

12

Anlisis de Regresin Mltiple


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 v2 3 3 9 7 0 1 4 3 5 1 7 0 2 8 2 v4 7 3 9 0 6 5 6 7 1 4 9 6 2 8 7 v6 5 3 9 2 4 2 3 3 3 2 8 3 1 8 4 pronosticada 4.6 2.3 8.6 2.5 2.6 2.5 4.5 4.6 2.1 2.0 7.7 2.6 1.3 7.6 4.2

La ecuacin general de regresin es: v6 = .474*v2 + .574*v4 - .798


13

Anlisis de Regresin Mltiple


0011 0010 1010 1101 0001 0100 1011

Para evitar el problema de la multicolinealidad, puede seguirse un procedimiento de Regresin Progresiva, en el que se incluye, o se excluye, en el modelo una variable independiente a la vez.

Aunque es posible que las variables independientes (de pronstico) se incluyan, o se supriman, incorrectamente.
Jos Ignacio Dominguez

2
14

Mtodos de Regresin Progresiva


0011 0010 1010 1101 0001 0100 1011

Inclusin Progresiva (Forward) (Adelante).


Al comienzo, no hay variables de pronstico en la ecuacin de regresin, sino que se introducen una a la vez, siempre que se cumplan determinados criterios especificados en trminos de razn F. El orden en que se incluyen las variables se basa en la aportacin de la varianza explicada. El procedimiento termina cuando no hay variables que cumplan con el criterio de inclusin.

Jos Ignacio Dominguez

2
15

Inclusin Progresiva
Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 0.832 0.692 0.668 1.411 2 0.951 0.905 0.889 0.817 3 0.969 0.938 0.921 0.687 a Predictors: (Constant), Trato impersonal, no trabajara b Predictors: (Constant), Trato impersonal, no trabajara, Chicos cobran menos que grandes c Predictors: (Constant), Trato impersonal, no trabajara, Chicos cobran menos que grandes, Grandes se equivocan ms Coefficients(a) Model

Unstandardized Coefficients Standardizedt Coefficients Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) 1.093 0.630 3.522 0.004 Trato impersonal, no trabajara 0.632 0.117 0.832 5.405 0.000 1.000 1.000 2 (Constant) -0.895 0.518 0.613 0.551 Trato impersonal, no trabajara 0.666 0.068 0.877 9.789 0.000 0.991 1.009 Chicos cobran menos que grandes 0.398 0.077 0.463 5.174 0.000 0.991 1.009 3 (Constant) -0.682 0.443 0.269 0.793 Trato impersonal, no trabajara 0.590 0.065 0.776 9.051 0.000 0.764 1.309 Chicos cobran menos que grandes 0.252 0.088 0.293 2.859 0.016 0.534 1.872 Grandes se equivocan ms 0.221 0.090 0.263 2.441 0.033 0.484 2.065 Dependent Variable: Banco ideal: pequeo, traten bien

El Modelo 2 ofrece el mejor balance entre valor de R2 e indicadores de baja multicolinealidad.

Mtodos de Regresin Progresiva


0011 0010 1010 1101 0001 0100 1011

Eliminacin Progresiva (Backward) (Atrs).

Al comienzo, toadas las variables de pronstico estn en la ecuacin de la regresin y se suprimen una por una de acuerdo con la razn F. El procedimiento termina cuando no hay variables que cumplan con el criterio de eliminacin.
Jos Ignacio Dominguez

2
17

Eliminacin Progresiva

Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 0.969 0.939 0.905 0.755 2 0.969 0.939 0.914 0.717 3 0.969 0.938 0.921 0.687 a Predictors: (Constant), Trato impersonal, no trabajara, Chicos cobran menos que grandes, Grandes se equivocan ms, Cajeras no necesitan s b Predictors: (Constant), Trato impersonal, no trabajara, Chicos cobran menos que grandes, Grandes se equivocan ms, Cajeras no necesitan s c Predictors: (Constant), Trato impersonal, no trabajara, Chicos cobran menos que grandes, Grandes se equivocan ms Coefficients(a) Model

Unstandardized Coefficients StandardizedtCoefficients Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) -1.102 1.439 -0.200 0.846 Chicos cobran menos que grandes 0.235 0.143 0.273 1.642 0.135 0.245 4.081 Grandes se equivocan ms 0.198 0.132 0.236 1.492 0.170 0.272 3.670 Cajeras no necesitan ser amigables 0.069 0.227 0.087 0.302 0.769 0.081 12.274 Me conozcan personalmente 0.035 0.323 0.040 0.110 0.915 0.050 20.015 Trato impersonal, no trabajara 0.618 0.235 0.813 2.633 0.027 0.071 14.052 2 (Constant) -0.975 1.069 -0.178 0.862 Chicos cobran menos que grandes 0.246 0.094 0.287 2.627 0.025 0.514 1.944 Grandes se equivocan ms 0.195 0.124 0.232 1.578 0.146 0.282 3.545 Cajeras no necesitan ser amigables 0.052 0.163 0.067 0.321 0.755 0.142 7.030 Trato impersonal, no trabajara 0.636 0.159 0.837 4.005 0.002 0.140 7.136 3 (Constant) -0.682 0.443 0.269 0.793 Chicos cobran menos que grandes 0.252 0.088 0.293 2.859 0.016 0.534 1.872 Grandes se equivocan ms 0.221 0.090 0.263 2.441 0.033 0.484 2.065 Trato impersonal, no trabajara 0.590 0.065 0.776 9.051 0.000 0.764 1.309 Dependent Variable: Banco ideal: pequeo, traten bien

Mtodos de Regresin Progresiva


0011 0010 1010 1101 0001 0100 1011

Solucin Progresiva (Stepwise) (Pasos Sucesivos).


Se combinan la inclusin y la eliminacin progresivas. En cada paso, se incluye la variable independiente con el menor valor de F. Si una de las variables que ya est incluida aumenta significativamente su valor de F, es retirada del modelo. El procedimiento termina cuando no hay variables que cumplan son el criterio de eliminacin o exclusin.
Jos Ignacio Dominguez

2
19

Solucin Progresiva
Model Summary Model R R Square Adjusted R Square Std. Error of the Estimate 1 0.832 0.692 0.668 1.411 2 0.951 0.905 0.889 0.817 3 0.969 0.938 0.921 0.687 a Predictors: (Constant), Trato impersonal, no trabajara b Predictors: (Constant), Trato impersonal, no trabajara, Chicos cobran menos que grandes c Predictors: (Constant), Trato impersonal, no trabajara, Chicos cobran menos que grandes, Grandes se equivocan ms Coefficients(a) Model

Unstandardized Coefficients Standardizedt Coefficients Sig. Collinearity Statistics B Std. Error Beta Tolerance VIF 1 (Constant) 1.093 0.630 3.522 0.004 Trato impersonal, no trabajara 0.632 0.117 0.832 5.405 0.000 1.000 1.000 2 (Constant) -0.895 0.518 0.613 0.551 Trato impersonal, no trabajara 0.666 0.068 0.877 9.789 0.000 0.991 1.009 Chicos cobran menos que grandes 0.398 0.077 0.463 5.174 0.000 0.991 1.009 3 (Constant) -0.682 0.443 0.269 0.793 Trato impersonal, no trabajara 0.590 0.065 0.776 9.051 0.000 0.764 1.309 Chicos cobran menos que grandes 0.252 0.088 0.293 2.859 0.016 0.534 1.872 Grandes se equivocan ms 0.221 0.090 0.263 2.441 0.033 0.484 2.065 Dependent Variable: Banco ideal: pequeo, traten bien

El Modelo 2 ofrece el mejor balance entre valor de R2 e indicadores de baja multicolinealidad.

Mtodos de Regresin Progresiva


0011 0010 1010 1101 0001 0100 1011

Los procedimientos progresivos no necesariamente producen ecuaciones de regresin ptimas, en el sentido de que produzcan R2 ms grandes para cierto nmero de variables de pronstico.

Es posible que quede sin incluirse una variable importante, o que otras menos importantes entren en la ecuacin.

Debe seleccionarse el modelo que tenga una mayor R2 y un menor problema de multicolinealidad. Aunque con frecuencia estos dos criterios son difciles de conciliar para la Regresin Mltiple

Jos Ignacio Dominguez

2
21

Conclusin
0011 0010 1010 1101 0001 0100 1011

Conclusin
0011 0010 1010 1101 0001 0100 1011

La regresin mltiple muestra una solucin ms slida al problema de prediccin del comportamiento de una variable, gracias a la utilizacin de mltiples variables de pronstico. Si bien esto permite desarrollar modelos de comportamiento ms completos, hay que tener cuidado con la condicin de multicolinealidad. No debemos olvidar que la Regresin Mltiple aplica nicamente cuando todas las variables estn expresadas a un nivel de medicin de razn. Los procedimientos progresivos NO dan ecuaciones de regresin ptimas, en el sentido de que produzcan R2 ms grande para cierto nmero de variables de pronstico. Debe seleccionarse el modelo que tenga una mayor R2 y un menor problema de multicolinealidad. Aunque con frecuencia estos dos criterios son difciles de conciliar.
Otro criterio puede ser considerar cuntas y cules variables entran a la ecuacin

Jos Ignacio Dominguez

2
23

Actividades Prxima Semana


0011 0010 1010 1101 0001 0100 1011

Aplicacin Prctica #2
Prediccin de la Satisfaccin

Jos Ignacio Dominguez

2
24

Laboratorio de SPSS
0011 0010 1010 1101 0001 0100 1011

Regresin Mltiple

Prediccin de la Satisfaccin
0011 0010 1010 1101 0001 0100 1011

Obtener 3 modelos de regresin mltiple para predecir el nivel de satisfaccin de los clientes con mtodos de Regresin Progresiva (Forward, Backward y Stepwise).
Analyze / Regression / Linear
Method: en lugar de ENTER hay que elegir cada mtodo Plots: Dependent (Y) vs ADJPRED (X) Method: en lugar de ENTER hay que elegir cada mtodo Statistics: Estimates, Model Fit, Collinearity Diagnostics

Proponer el mejor modelo posible, justificando su respuesta al comparar valores de R2, diagnsticos de multicolinealidad y grficas de ajuste de los datos que pronostica cada modelo. Concluir con respecto a las implicaciones que sus hallazgos tienen para que la empresa tome decisiones sobre los niveles de satisfaccin de sus clientes.

Jos Ignacio Dominguez

2
26

Inclusin Progresiva

La habilidad de prediccin del modelo 3 es la ms alta, segn lo indica la R2 = .230

Inclusin Progresiva

La habilidad de prediccin del modelo 2 no es ms alta que la del modelo 3 (R2=.198), pero muestra que hay una menor multicolinealidad. Ecuacin 2:
CCG= 0.562*Accesibilidad a los RV + 0.565* Cotizaciones competitivas + 5.408

Eliminacin Progresiva

La habilidad de prediccin del modelo 10 es ms alta, segn lo indica la R2 = .248 pero el modelo 11 muestra una menor multicolinealidad. Ecuacin 2:
CCG= 0.401*Accesibilidad a los RV + 0.442* Cotizaciones competitivas + .273*Exactitud en emisin facturas + .344*Vanguardia en tecnologa + 4.570

Solucin Progresiva

La habilidad de prediccin del modelo 3 es ms alta, segn lo indica la R2 = .230 y existe casi la multicolinealidad que en el modelo 2
Ecuacin 3:
CCG= 0.484*Accesibilidad a los RV + 0.462* Cotizaciones competitivas + .395*Vanguardia en tecnologa + 4.809

Comparacin de los Modelos

Debe seleccionarse el modelo que tenga una mayor R2 y un menor problema de multicolinealidad. Aunque con frecuencia estos dos criterios son difciles de conciliar para la Regresin Mltiple. Otro criterio puede ser considerar cuntas y cules variables entran a la ecuacin

También podría gustarte