Está en la página 1de 17

UNIVERSIDAD NACIONAL HERMILIO VALDIZÁN

FACULTAD DE ECONOMÍA

MULTICOLINEALIDAD
La edad y la Experiencia laboral
deterninan los salarios...?

Dr. ENRIQUE CASTRO Y CÉSPEDES


encaces12@hotmail.com
3.-MULTICOLINEALIDAD
(COLINEALIDAD)
3.1 INTRODUCCION
Un problema de los DATOS, cuando se esta
ajustando un modelo de regresión múltiple, y
tiene los siguientes aspectos:
 Concepto de colinealidad,
 Implicancias practicas,
 Como detectar su presencia,
 Cuando es realmente un problema,
 Como tratar este problema.
3.2.- CONCEPTO DE COLINEALIDAD

Asociación o dependencia significativa entre DOS o


mas REGRESORES.
 PERFECTA: dependencia total é
incapacidad el proceso de estimación
 IMPERFECTA: alta dependencia, y
origina perturbaciones en la inferencia
Estadistica.
 LEVE: Baja dependencia y no
constituye mayormente un problema
DIAGRAMAS DE BALLENTINE

X1 X2
X1 X2

No hay colinealidad
Colinealidad moderada

X1 X2

Colinealidad Alta
La superposición entre los círculos indican el
grado de colinealidad que existe.
3.3. IMPLICANCIAS PRACTICAS

MULTICOLINEALIDA
D
VARIANZAS Y
COVARIANZAS R2 y Fcal Elevados
GRANDES
ESTADISTICOS- “t” NO
SIGNIFICATIVOS
 Inestabilidad en i-
 Sobrestimacion 
Subestimacion
INFERENCIA
 Intervalos de
ESTADISTICA
confianza grandes POCO CONFIABLES
3.4. DIAGNOSTICO DE LA
MULTICOLINEALIDAD
REGLAS

EMPIRICAS INDICES TECNICOS


Numero Condición>1000
R ALTO (>0.8)
2

K=(1 / k) ; 1 >...> k
 Muchos “t”CAL
 Indice Condición > 30
no significativos
=Raíz cuadrada de K
rxy >0.5
i:Eigenvalores de X”X
DETALLE DE LOS INDICADORES
>0.8 Colinealidad severa

Si los valores rxy


[0.5-0.8) Colinealidad Alta
están entre [lmoderada
[0-0.2) Colinealidad Leve.
>1000 colinealidad severa
Si los valores de [100-1000] colinealidad moderada
K están entre
<100 Colinealidad Leve

>30 Colinealidad severa


Si los valores de  [10-30] Colinealidad moderada
están entre
<10 Colinealidad Leve.
4.5.-APLICACIÓN NUMERICA:
Que factores determinan los salarios....?
Variable Coefficient Std. Error t-Statistic Prob.
C 70.22167 43.19947 1.625522 0.1097
EDUCACION 15.87766 3.730338 4.256361 0.0001
EXPERIENCIA 3.619120 2.071823 1.746829 0.0861
SEXO 38.08307 24.56542 1.550272 0.1267
EDAD -1.10736 0.515275 -0.730801 0.4679
R-squared 0.434111 Adjusted R-squared .393690
S.E. of regression 75.52641 sum squared resid 319437.3

F-statistic 10.73982 Prob(F-statistic) 0.000002

La variable EXPERIENCIA tiene su poder de


explicación confundida con EDAD y SEXO
MATRIZ DE CORRELACIONES

Y X1 X2 X3 X4
SALARIO 1.000 0.525 0.390 0.434 0.266
EDUCACION 1.000 0.128 0.242 0.170
EXPERIENCIA 1.000 0.365 0.838
SEXO 1.000 0.084
EDAD 1.000

4 3 2 1
0.107280 0.793771 1.075504 2.023444
1 / 4=18.86
CORRELACION ENTRE EDAD Y
EXPERIENCIA LABORAL
70

60

50
EDAD

40

30

20 Dependencia Lineal
10
0 10 20 30 40 50

EXPERIENCIA

Solo una de ellas debe


considerarse en el modelo final
CORRELACION ENTRE EDUCACION Y
EXPERIENCIA LABORAL
15

E D U C A C IO N

10

Poca Dependencia Lineal


0
0 10 20 30 40 50

EXPERIENCIA

Las dos variables pueden estar


conjuntamente en el modelo final
Ajuste eliminando Edad
Variable Coefficient Std. Error t-Statistic Prob.
C 43.07675 21.96671 1.961001 0.0548
EDUCACION 15.23362 3.609897 4.219959 0.0001
EXPERIENCIA 2.294693 0.999900 2.294923 0.0254 SEXO
46.61862 21.52269 2.166022 0.0345
R-squared0.428714 Sum squared resid 322483.8
F-statistic 14.25828 Prob(F-statistic) 0.000000
Ajuste eliminando SEXO

Variable Coefficient Std. Error t-Statistic Prob.

INTERCEPTO 53.00307 22.15652 2.392211 0.0200


EDUCACION 16.88673 3.638851 4.640676 0.0000
EXPERIENCIA 3.047100 0.967001 3.151081 0.0026

R-squared 0.381691 Mean dependent var 171.5082


Adjusted R-squared 0.360370 S.D. dependent var 96.99547
F-statistic 17.90214 Prob(F-statistic) 0.000001

RESIDUALES DEL MODELO
CON 3 VARIABLES: educación,Experiencia y sexo

300

200

100

-100 06 Residuos
Grandes; Los
-200
5 10 15 20 25 30 35 40 45 50 55 60
residuos 44,50 y
58 deben ser
SALARIO Residuals
eliminados
REGRESION
ELIMINANDO 03 RESIDUOS MAS GRANDES
Sample: 1 58
Included observations: 58

Variable Coefficient Std. Error t-Statistic Prob.

C 72.56728 11.99895 6.047804 0.0000


EXPERIENCIA 1.723849 0.537407 3.207716 0.0023
EDUCACION 8.838194 2.012867 4.390848 0.0001
SEXO 34.30376 11.53435 2.974052 0.0044
R-squared 0.519378 Mean dependent var 153.4828
Adjusted R-squared 0.492677 S.D. dependent var 56.36698
S.E. of regression 40.14830 Akaike info criterion 10.28951
Sum squared resid 87041.83 Schwarz criterion 10.43161
Log likelihood -294.3958 F-statistic 19.45147
Durbin-Watson stat 2.085892 Prob(F-statistic) 0.000000
3.6.- CONCLUSIONES
Las variables mas importantes para explicar los salarios son
EDUCACION, Y EXPERIENCIA LABORAL

La tercera variable SEXO, aun esta correlacionado


medianamente con EDUCACION

La variable SEXO también esta correlacionado


medianamente con EXPERIENCIA LABORAL

La variable SEXO puede eliminarse del modelo y así tener


un subconjunto no correlacionado, pero R2 baja a 38%

Es mejor retener la variable SEXO en el modelo, pues su


correlación es moderada, y así conservar el R2 en el 43%
FIN

También podría gustarte