APÉNDICE AL CAPÍTULO 6
ALGUNOS COMENTARIOS SOBRE LA ECUACIÓN DE MINCER1
La ecuación de Mincer es probablemente la ecuación más estimada por estudiantes de econometría
en cursos de pregrado. En efecto s una ecuación muy útil para muchos fines porque sirve de base para
muchas aplicaciones en diferentes áreas. Sin embargo, es importante mencionar algunos de los
problemas que los con frecuencia se plantean alrededor del uso de esta ecuación sin tener en cuenta
las precauciones necesarias.
La forma estimada más común de la ecuación de Mincer es la siguiente:
= +
donde:
yi es el logaritmo del ingreso laboral de la persona i
X es una matriz de variables explicatorias que, como mínimo, incluye lo siguiente: un
intercepto, una medida de la cantidad de educación (por ejemplo, años de educación),
medidas de la experiencia laboral de la persona (generalmente en una forma que sea
consistente con efectos marginales decrecientes asociados con esta variable) y, algunas veces,
también una variable dummy que identifique el sexo de la persona.
Además de lo anterior, muchas veces se incluyen otras variables como series de dummies
identificando sectores económicos, características socioeconómicas o familiares, etc.
β Son los parámetros asociados con las variables incluidas y, dado que la variable dependiente
se define en términos logarítmicos, se pueden interpretar como porcentajes. Miden el efecto
marginal (porcentual) de las variables en X. Así, por ejemplo, si una de las variables es el
número de años de educación, el coeficiente asociado se interpreta como el porcentaje en que
cada año adicional de educación aumenta los ingresos. Con alguna frecuencia las variables
en X incluyen combinaciones de la misma variable (por ejemplo, la experiencia que incluye
en forma cuadrática para captar efectos marginales decrecientes); en esos casos el efecto
marginal de dicha variable está dado por combinaciones de los coeficientes estimados.
ui es un error aleatorio que supuestamente capta el efecto de otros factores no incluidos en la
regresión. Se supone que este error tiene unas características estadísticas como son el de tener
un valor esperado de cero, una distribución normal, una varianza constante y ser
independiente de las variables que se incluyen en la regresión.
El primer comentario que se debe hacer tiene que ver con las variables que se incluyen en la regresión.
Comencemos con la variable dependiente, los ingresos laborales. Dependiendo de las fuentes de
información estadística, esta es una variable que generalmente se mide con un error grande, más
específicamente, esta variable se tiende a subestimar en la mayoría de los casos. Si el grado de
subestimación es igual para todos lo niveles de ingreso el efecto posiblemente es solo el de afectar el
nivel del intercepto. Sin embargo, este no es generalmente el caso, con frecuencia el grado de
estimación aumenta a medida que aumentan los ingresos. El efecto de no corregir este problema es
1
Preparado en Abril 2020.
J. Tenjo 1
que puede sesgar los estimadores de los βs. Desafortunadamente, casi nunca hay bases suficientes
para corregir esta subestimación.
Otro problema es que el modelo implícitamente supone que los ingresos laborales tienen una
distribución normal. Como éstos se expresan en forma logarítmica es posible que se ajusten a dicha
distribución2. Sin embargo, si la distribución del logaritmo de los ingresos no es suficientemente
cercana la una distribución normal (hay pruebas estadísticas para comprobar esto) los métodos
usuales de estimación (mínimos cuadrados, por ejemplo) nos son aconsejables.
Con respecto a las variables explicatorias algunos comentarios son los siguientes: Los errores de
medición de dichas variables en general son más que en los ingresos y pueden producir sesgos en los
coeficientes. Uno de los problemas comunes es la medida de experiencia que generalmente no se
obtiene de las bases de datos sino se estima como combinación de otras variables3. Estas medidas
generalmente sobreestiman la experiencia de algunos grupos de personas y genera sesgos en los
coeficientes. Otro ejemplo es la medida de la educación. Implícitamente se supone que la educación
de las personas es comparable cuando en general no lo es, no solo por diferencias en calidad, sino por
el tipo de educación (especialmente después de terminar la educación básica). Sobre este punto
volveremos más adelante.
Con frecuencia se incluyen otras variables que identifican características de las personas, del tipo de
trabajo o de los sectores productivos. Una de estas variables es el sexo de la persona, con la cual
generalmente no hay muchos problemas porque se supone es exógeno (no determinado por las
variables explicatorias del modelo). Sin embargo, si puede ayudar a determinar variables explicatorias
como los niveles educativos o de experiencia efectiva y eso puede disminuir la precisión de algunos
estimadores. El problema más grave existe cuando se incluyen variables para identificar sectores
económicos, tamaños de empresas, etc. En estos casos el supuesto de que las variables explicatorias
son realmente exógenas no se cumple. Por ejemplo, el sector económico en que trabaja una persona
puede depender del nivel educativo que ella tenga. Estos procedimientos, aunque usados con alguna
frecuencia, pueden general sesgos en los estimadores y problemas de selectividad difíciles de
resolver.
Finalmente, vale la pena decir algo sobre las variables no incluidas en la regresión de Mincer. Hay
variables que influyen en la determinación de los ingresos que no se incluyen porque no se tiene
información sobre ellas (puede que no sean observables). El modelo de regresión supone que el efecto
de estas variables es captado por el término de error. Sin embargo, para que la no inclusión de estas
variables no afecte las estimaciones de los efectos marginales de las variables sí incluidas, se requiere
que no haya correlación entre las variables incluidas y las no incluidas.
Dentro de este tema, un problema que algunos investigadores hay comentado mucho y es el de la
falta de medidas de calidad de la educación y habilidades innatas de las personas. Generalmente estas
variables no se incluyen porque son difíciles de medir. Sin embargo, se puede argumentar que ambas
2
Los ingresos laborales generalmente no tienen una distribución normal porque la cola de la derecha (ingresos
altos) generalmente es mucho más larga que la de la izquierda. Además, hay un tope mínimo porque no hay
ingresos negativos. Sin embargo, cuando se expresan en forma logarítmica este problema se puede solucionar
en parte, pero no completamente.
3
Con frecuencia se usa una medida de experiencia potencial que se mide como la edad del individuo menos los
años de educación menos 5. Esta medida supone que las personas entran a sector educativo a los 5 años y que
estudian de tiempo completo. Estos supuestos no siempre son correctos, pero, aunque lo fueran, la experiencia
que afecta los ingresos es la experiencia efectiva que puede no tener nada que ver con la potencial.
J. Tenjo 2
afectan las medidas de cantidad de educación. Por ejemplo, hay personas que tienen habilidades
especiales que les facilita el estudio y que hacen que las personas lleguen más lejos en sus carreras
educativas (tengan más educación). Esas mismas habilidades les pueden permitir obtener mayores
ingresos en el mercado laboral. Sin embargo, como no se incluyen la habilidad como una variable
explicativa (por falta de información), su efecto queda captado por la variable educación. Esto hace
que el coeficiente asociado a la educación esté sobrevaluado, es decir que sobre estime el verdadero
efecto de la educación. Algo similar sucede con la calidad de la educación. Se puede decir que la
calidad mejora la productividad de las personas, pero también hace que la personas que reciben
educación de mejor calidad estudien más. En este caso la contribución de la calidad la capta la
cantidad de educación y por lo tanto el no tener una medida de calidad lleva a sobre estimar el efecto
de los años de educación.
Un último comentario. El modelo supone que las personas están en equilibrio de largo plazo, lo cual
no necesariamente es cierto (por ejemplo, puede haber personas con bajos ingresos en el momento de
la recolección de información, pero con potenciales ingresos muy altos en el futuro) y también supone
que el ingreso laboral refleja la productividad de las personas, lo cual no es del todo cierto.
Los comentarios anteriores (que no agotan el tema) tampoco son hechos con el fin de que no se use
el modelo de Mincer. Esta es una herramienta muy valiosa para el análisis empírico. Es simplemente
para ayudar a los estudiantes a analizar críticamente los resultados de este instrumento y a pensar más
sobre lo difícil que es hacer buena investigación empírica.
J. Tenjo 3