Está en la página 1de 22

Este trabajo trata de plantear un modelo

econométrico que defina las variables


que componen el ingreso monetario de
los dominicanos.

Determinantes del
Salario en la República
Dominicana para el Año
2011
Econometría, Trabajo Final
Universidad Autónoma de Santo Domingo

Julia M. George Brito 100350214


Prof. Francisco Ramírez
22 de Junio 2020
Tabla de Contenido
Introducción ................................................................................................................................................. 3
Pregunta de Investigación............................................................................................................................ 4
Hipótesis ....................................................................................................................................................... 4
Revisión de la Literatura .............................................................................................................................. 4
Marco Teórico Referencial ....................................................................................................................... 4
Evidencia Empírica ................................................................................................................................... 4
Especificación del Modelo a Estimar ........................................................................................................... 5
El Modelo de Mincer: Especificación ....................................................................................................... 5
Descripción de los Datos .............................................................................................................................. 6
Análisis de los Datos ..................................................................................................................................... 7
Estadísticas descriptivas: histogramas, correlaciones, análisis de atípicos. .......................................... 7
Histogramas:............................................................................................................................................. 7
Grafica 1 Grafica2 ....................................................................................................................... 7
Grafica 3 Grafica4 ....................................................................................................................... 7
Graficas de dispersión: ............................................................................................................................. 8
Grafica 5 Grafica6 ....................................................................................................................... 8
Grafica 7 Grafica8 ....................................................................................................................... 8
Resultados de la Estimación: ....................................................................................................................... 9
Estimación y Análisis del Modelo Econométrico .................................................................................... 9
Estimación Preliminar .......................................................................................................................... 9
Cuadro 1................................................................................................................................................ 9
Validación del Modelo ............................................................................................................................... 10
Pruebas de Evaluación de las Estimaciones: forma funcional, heterocedasticidad,
multicolinealidad ................................................................................................................................ 10
Forma Funcional o Prueba RESET ...................................................................................................... 10
Cuadro 2.............................................................................................................................................. 10
Prueba de Heterocedasticidad ............................................................................................................... 10
Cuadro 3.............................................................................................................................................. 10
Prueba de Muticolinealidad (vif) ........................................................................................................... 10
Cuadro 4.............................................................................................................................................. 10
Resultado Hausman Test........................................................................................................................ 11
Cuadro 5.............................................................................................................................................. 11

1
Corrigiendo el Modelo ........................................................................................................................... 11
Cuadro 6.............................................................................................................................................. 11
Histogramas:........................................................................................................................................... 12
Grafica 9 Grafica10 ................................................................................................................... 12
Grafica 11 Grafica12 ............................................................................................................... 12
Conclusión .................................................................................................................................................. 13
Anexo .......................................................................................................................................................... 14
Versiones donde se detectaron los problemas de inconsistencia del modelo. ................................... 14
Resultados de la Estimación: ................................................................................................................. 14
Cuadro 7.............................................................................................................................................. 14
Validación del Modelo ............................................................................................................................... 14
Forma Funcional o Prueba RESET .......................................................................................................... 14
Cuadro 8.............................................................................................................................................. 14
Prueba de Heterocedasticidad ............................................................................................................... 15
Cuadro 9.............................................................................................................................................. 15
Prueba de Muticolinealidad (vif) ........................................................................................................... 15
Cuadro 10............................................................................................................................................ 15
Cuadro 11............................................................................................................................................ 15
Modelo de Regresión ANCOVA .................................................................................................................. 16
ANOVA .................................................................................................................................................... 17
Cuadro 12............................................................................................................................................ 17
ANCOVA .................................................................................................................................................. 17
Cuadro 13............................................................................................................................................ 17
Implementando MC2E ............................................................................................................................... 18
Estimando el modelo agregando una variable dummy, estado civil (casado). ................................ 18
Cuadro 14............................................................................................................................................ 18
Validación del Modelo ........................................................................................................................... 20
Forma Funcional o Prueba RESET .......................................................................................................... 20
Cuadro 15............................................................................................................................................ 20
Referencias ................................................................................................................................................. 21

2
Introducción
La teoría del capital humano ha sido ampliamente utilizada, tanto a nivel teórico como empírico, para
analizar las diferencias salariales entre individuos con diferentes stocks educativos (Becker, 1964).
Existe una gran tradición de análisis económico que confirma que los individuos más educados perciben
salarios más altos, experimentan menor desempleo y trabajan en ocupaciones más prestigiosas que los
individuos menos educados.
Esta es una percepción creciente de que la educación juega un papel fundamental en el análisis moderno
de la economía laboral y de capital humano. Nuestro objetivo es apreciar el rol de la econometría al
calcular el rendimiento cuantitativo de la educación, pero tomaremos en cuenta más variables explicativas
para la obtención de un modelo más consistente.
Decía Adam Smith (1776): “Un hombre educado a costa de mucho trabajo y tiempo. . . puede ser
comparado con una …. máquina costosa. ... El trabajo que aprenda a realizar ... más allá de los salarios
habituales de la mano de obra corriente, repondrá todo el gasto de su educación”.
Así, puede decirse, comenzó el interés de los economistas en la educación como una inversión en la
economía.
En esta ocasión el análisis será realizado para la República Dominicana con datos del 2011.

3
Pregunta de Investigación
Las preguntas de investigación son las siguientes:
• ¿Es posible explicar el total de los ingresos de las personas con las variables educación,
experiencia, sexo o género y zona donde habita el individuo (rural/urbano) en la República
Dominicana?
• ¿Cuál es el efecto de estas variables en el salario?

Hipótesis
(𝐻0 ): El resultado de esta estimación arrojara un modelo consistente.
(𝐻1 ): El resultado de esta estimación arrojara un modelo inconsistente.

Revisión de la Literatura
Marco Teórico Referencial
Aller, R. A., & Arce, M. U. (1999) realizan una investigación sobre la discrimación salarial por sexo en
España. El método que utilizan es el de Oaxaca (1973) y entre sus resultados destacan que la diferencia
de salarios entre hombres y mujeres no se debe a una discriminación del sector hacia el género femenino,
sino que la tardía incorporación de la mujer al mercado laboral, así como la segregación sectorial y
ocupacional constituyen el origen fundamental de las diferencias salariales por sexo.
Becker (1985) formula un modelo de análisis de covarianza en el cual trata de explicar el salario de los
profesores de universidades públicas en base a sus años de experiencia laboral y si la provincia pertenece
al Noreste, Norte-centro o Sur de Estados Unidos.
De la Riga y Ugidos (1995) realizan una investigación económica en donde estudian las diferencias de
brechas salariales entre hombres y mujeres del sector privado. En su investigación concluyen que existen
diferencias de medias marcadas en las remuneraciones entre los 2 géneros, y proponen planes equitativos
a través de los sindicatos de la ciudad de Bilbao (España). La variable educación resulta estadísticamente
significativa para ambos géneros, sobre todo para los hombres, ya que los mismos escogen en su mayoría
carreras altamente remuneradas. Otras variables que resultan significativas y con relación positiva al
salario por hora son el estado civil y la antigüedad del trabajador dentro de la empresa.
Mizala et al. (2011) realizan un estudio en América Latina para medir la diferencia salarial entre el sector
público y el privado para el periodo 1992-2007. Los países analizados fueron: Argentina, Bolivia, Brasil,
Chile, Colombia, Costa Rica, El Salvador, Honduras, Panamá, Paraguay y Uruguay. Las variables que
incluyeron en sus modelos fueron: años de educación, ingreso por hora de los empleos, edad, experiencia,
estado civil, sexo e inflación. Entre sus hallazgos indican que el trabajador medio del sector público gana
más que su homólogo/privado, y que este diferencial aumentó durante el periodo de estudio. Diferencias
importantes a lo largo de la distribución de los salarios también se muestran en los resultados; de hecho,
los funcionarios públicos, en los percentiles más altos de la distribución de los salarios en general, ganan
menos que sus equivalentes del sector privado.
Evidencia Empírica
Jacod Mincer (1974), creo la Función de ingresos de Mincer el cual es un modelo uniecuacional,
desarrollado que explica el salario en función de la escolaridad y la experiencia.
Con el propósito analizar la contribución de la educación al crecimiento se desarrollaron en el siglo pasado
dos enfoques que resultan en gran medida complementarios: el de la tasa de rendimiento elaborado por

4
J. Mincer (1974), cuyo método permite apreciar la contribución de cada año de escolaridad dentro de una
“función de ingresos” microeconómica.
Mincer plantea que las habilidades que determinan los salarios son observables y estas, a su vez, no se
distribuyen normalmente. Los supuestos que establece son los siguientes:
1. Todos los individuos tienen habilidades idénticas y las mismas oportunidades para ocuparse. Estas
ocupaciones difieren en la cantidad de formación que requieren.
2. El flujo de ingresos recibidos es constante durante la vida laboral. Este modelo plantea que cada año
adicional de formación retrasa las ganancias que el individuo percibe y, consecuentemente, cada año
retrasado será compensado con ganancias superiores cuando el individuo ingrese al mercado laboral. Este
retorno, evidentemente, dependerá de los costos soportados para recibir la formación y estos, a la vez,
dependen del tiempo dedicado al mismo, en dos formas: el costo de oportunidad; que representa dejar
de recibir ingresos durante el período de entrenamiento y el costo por el servicio educativo.
En la ecuación tradicional de Mincer son estimados los coeficientes de un modelo semilogarítmico, usando
como variable dependiente el logaritmo de los ingresos y como variables independientes los años de
educación. Los datos utilizados para su estimación provienen habitualmente de datos de sección
transversal.
Modelo tradicional de Mincer o modelo teorico:
𝑳𝒏(𝒀) = 𝜷𝟎 + 𝜷𝟏 𝑺 + 𝜷𝟐 𝑬𝒙𝒑 + 𝜷𝟑 𝑬𝒙𝒑𝟐 + 𝜺
En este modelo, Y son los ingresos del individuo; S es el número de años de educación formal completada;
Exp son los años de experiencia laboral; ε es un término de perturbación aleatoria que se distribuye según
una Normal (0, σε 2).

Especificación del Modelo a Estimar


El Modelo de Mincer: Especificación
Como ya ha sido mencionado el modelo de Mincer explica la relación empírica existente entre los ingresos
salariales que obtienen los individuos en el mercado de trabajo y su capital humano como (nivel educativo
y experiencia laboral) conocidos como la determinación de ingresos y este es el modelo que tomaremos
como base.
El modelo que estimaremos se le agregaran otras variables cualitativas que han sido analizadas en
estudios ya mencionados, así que según la revisión de la literatura previa, en trabajos similares como el
de Aller, R. A., & Arce, M. U. que colocaron la variable género o el de Becker que agrego la variable
demográfica resultaron las variables más significativas al momento de explicar el comportamiento del
salario, teniendo como resultado el modelo siguiente:
𝐥𝐧(𝑺𝒂𝒍𝒂𝒓𝒊𝒐) = 𝜷𝟎 + 𝜷𝟏 𝒆𝒅𝒖𝒄 + 𝜷𝟐 𝒆𝒙𝒑𝒆𝒓 + 𝜷𝟑 𝒆𝒙𝒑𝒆𝒓𝟐 + 𝒉𝒐𝒎𝒃𝒓𝒆 + 𝒖𝒓𝒃𝒂𝒏𝒐 + 𝒖
Donde: Ln(Salario) es el logaritmo de los ingresos por hora; educ es el número de años de educación
recibid; exper son los años de experiencia laboral; 𝐸𝑥𝑝𝑒𝑟 2 es el cuadrado de la experiencia; hombre: como
variable género; urbano como variable demográfica; ia; 𝛽𝑗 (j=0,1,2,3) son parámetros a estimar u: es el
término de perturbación aleatoria o el error.
Como se mencionó, las variables cualitativas son el sexo y zona donde habita el individuo (demográfia). El
sexo tiene dos categorías: hombre y mujer, por lo que se incluiría una variable dummy (2 = hombre; 1 =

5
mujer). La zona donde habita el individuo tiene dos opciones: rural o urbana por lo que se incluirán dos
variables dummy (0 = urbano; 1 = rural).

Descripción de los Datos


Se trata de un estudio de corte transversal el cual se llevó a cabo con los datos procedentes de la Encuesta
Nacional de Fuerza de Trabajo (ENFT) para el período 2011, la cual se realiza dos veces al año (abril y
octubre) por el Banco Central de la República.
La ENFT se divide en cuatro módulos los cuales son:
Hogar: Lugar donde un individuo o grupo de individuos habita, creando en ellos la sensación de seguridad
y calma, también se puede definir como la persona o conjunto de personas, sean o no parientes, que
residen habitualmente en una misma vivienda particular, ocupándola total o parcialmente; que se rigen
por un presupuesto común y que comparten en común sus alimentos.
Vivienda: Es una edificación cuya principal función es ofrecer refugio y habitación a las personas,
protegiéndolas de las inclemencias climáticas y de otras amenazas, también se puede definir como todo
local formado por un cuarto o conjunto de cuartos estructuralmente separados e independientes,
destinados al alojamiento de uno o más hogares.
Miembro: Son todas aquellas personas que comen y duermen habitualmente en el hogar y que han
permanecido por lo menos tres, de los 12 meses precedentes a la encuesta, también se puede definir
como aquellas personas que dependen habitualmente del presupuesto de gastos comunes del hogar y
han residido de manera continua en la vivienda la mayor parte de los últimos tres meses o tienen intención
de fijar su residencia en la vivienda encuestada.
Ocupación: Es el conjunto de tareas laborales determinadas por el desarrollo de la técnica, la tecnología
y la división del trabajo.
La encuesta: La encuesta nacional de fuerza de trabajo está concebida para ofrecer informaciones
generales sobre el mercado de trabajo de la Republica Dominicana.
Muestra: Para la estimación de las ecuaciones de mincer trabajamos con individuos a partir de los 18 años
de edad, los que nos deja con un total de 10,091 observaciones.
Las variables a utilizar son:
• educ creada a partir de las variables, EFT_ULT_NIVEL_ALCANZADO y EFT_ULT_ANO_APROBADO.
• expe creada a partir de las variables EFT_EDAD-6-educ.
• salario creado a partir de la variable EFT_PERIODO_ING_OCUP_PRINC.
• mujer una variable binaria creada a partir de la variable EFT_SEXO que asume el valor 1 cuando
la persona es mujer y 2 si es hombre.
• urbano una variable binaria creada a partir de la variable EFT_ZONA_RESIDE que toma el valor 1
cuando el individuo vive en una zona urbana y 0 si vive en una zona rural.

6
Análisis de los Datos
Estadísticas descriptivas: histogramas, correlaciones, análisis de atípicos.
Histogramas:
Grafica 1 Grafica2

Fuente: R-Studio. Elaboración: Autor. Fuente: R-Studio. Elaboración: Autor.

De acuerdo a los resultados obtenidos en las gráficas 1 y 2 se puede observar que el salario por hora en
hombre es mayor que el salario por hora en mujer, es decir, que los hombres aportan más al salario que
las mujeres.
Grafica 3 Grafica4

Fuente: R-Studio. Elaboración: Autor. Fuente: R-Studio. Elaboración: Autor.


De acuerdo a los resultados obtenidos en las gráficas 3 y 4 se puede observar que los individuos de la zona
urbana cuentan con más años de educación que los individuos de la zona rural.

7
Graficas de dispersión:
Grafica 5 Grafica6

Fuente: R-Studio. Elaboración: Autor. Fuente: R-Studio. Elaboración: Autor.

Grafica 7 Grafica8

Fuente: R-Studio. Elaboración: Autor. Fuente: R-Studio. Elaboración: Autor.

De acuerdo a los resultados obtenidos en las gráficas 5,6,7 y 8 se puede observar la correlación existente
entre la variable salario_hora respecto a las variables exper, educ, mujer y urbano. Donde nos muestra su
mayor correlación en la gráfica 5 correspondiente a salario_hora y exper.

8
Resultados de la Estimación:
Estimación y Análisis del Modelo Econométrico
Estimación Preliminar
Utilizando el método de mínimos cuadrados ordinarios y en base a los datos obtenidos a través de la
encuesta de la EFT se alcanzaron los siguientes resultados:

Cuadro 1
Resultado Modelo Lineal 2
===============================================
Dependent variable:
---------------------------
salario_hora
-----------------------------------------------
educ 7.000***
(0.400)

exper 1.000***
(0.100)

urbano -9.000***
(3.000)

casado -2.000***
(0.700)

mujer -20.000***
(3.000)

Constant 24.000***
(7.000)

-----------------------------------------------
Observations 10,091
R2 0.040
Adjusted R2 0.040
Residual Std. Error 129.000 (df = 10085)
F Statistic 85.000*** (df = 5; 10085)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

Fuente: R-Studio. Elaboración: Autor.

En el anexo del trabajo se presentan las versiones del modelo donde se detectaron los problemas de
consistencia del modelo y que llevaron al modelo que se presenta a continuación, cabe destacar que en
la descripción de las variables a utilizar no se incluye la variable dummy casado debido a que esta fue
incluida luego de realizar algunas pruebas que se encuentran en el anexo.

Los resultados de la estimación del modelo de Mincer se recogen en el cuadro 1 con algunos ajustes
realizados para probar la consistencia del modelo.
La ecuación resultante fue:
𝐬𝐚𝐥𝐚𝐫𝐢𝐨 = 𝟐𝟒. 𝟎𝟎𝟎 + 𝟕. 𝟎𝟎𝟎𝒆𝒅𝒖𝒄 + 𝟏. 𝟎𝟎𝟎𝒆𝒙𝒑𝒆𝒓 − 𝟗. 𝟎𝟎𝟎𝒖𝒓𝒃𝒂𝒏𝒐 − 𝟐. 𝟎𝟎𝟎𝒄𝒂𝒔𝒂𝒅𝒐 − 𝟐𝟎. 𝟎𝟎𝟎𝒎𝒖𝒋𝒆𝒓

9
El modelo tiene los signos esperado respecto a la educación con un signo positivo que nos dice que por
cada año de educación el salario se incrementa en 24,000 en esta nueva ecuación se optó por eliminar el
logaritmo (salario) ya que era la manera en que el modelo era consistente, por su parte la experiencia
incrementa el salario en 1,000$, la experiencia al cuadrado fue eliminado porque era una variable con
sesgos, mientras que para mujer hace que el salario disminuya 20,000$ y para urbano disminuye 9,000$.
Antes de realizar más inferencia sobre los resultados obtenidos se debe realizar pruebas de validación del
modelo, a saber, de sesgo de especificación, forma funcional, heterocedasticidad y multicolinealidad, para
comprobar que el modelo estimado cumpla con los supuestos del modelo clásico de regresión lineal
normal.

Validación del Modelo


Pruebas de Evaluación de las Estimaciones: forma funcional, heterocedasticidad, multicolinealidad
Forma Funcional o Prueba RESET
Cuadro 2
RESET test

data: mod3
RESET = 80, df1 = 2, df2 = 10000, p-value <2e-16

Fuente: R-Studio. Elaboración: Autor.

De acuerdo al resultado arrojado en la prueba de RESET en el cuadro 2, el p-value <2e-16, es decir, el


modelo no es consistente.
En este caso se rechaza la hipótesis nula (𝐻0 ) de que el modelo es consistente y se acepta la hipótesis
alternativa (𝐻1 ) de que no lo es. Por el momento el modelo tiene sesgo de información, se puede deber a
que el modelo este omitiendo variables que puedan explicar los resultados del mismo.
Prueba de Heterocedasticidad
Cuadro 3
studentized Breusch-Pagan test

data: mod3
BP = 10, df = 5, p-value = 0.06

Fuente: R-Studio. Elaboración: Autor.

De acuerdo al resultado arrojado en la prueba de heterocedasticidad en el cuadro 3, el p-value = 0.06,


es decir, el modelo es consistente, no existe heterocedasticidad.
En este caso se acepta la hipótesis nula (𝐻0 ) de que el modelo es consistente y se rechazza la hipótesis
alternativa (𝐻1 ) de que no lo es.
Prueba de Muticolinealidad (vif)
Cuadro 4
educ exper urbano casado mujer
2 2 1 1 1

10
Fuente: R-Studio. Elaboración: Autor.

Si el vif es mayor o igual a 10 hay problemas de colinealidad o de multicolinealidad en la variable, así que
de acuerdo a la prueba de multicolinealidad el modelo es consistente.
Así que, de igual forma en este caso se acepta la hipótesis nula (𝐻0 ) de que el modelo es consistente y se
rechaza la hipótesis alternativa (𝐻1 ) de que no lo es.
Resultado Hausman Test
Cuadro 5
t test of coefficients:

Estimate Std. Error t value Pr(>|t|)


(Intercept) 24.0774 6.8723 3.50 0.00046 ***
educ 6.8637 0.3708 18.51 < 2e-16 ***
exper 0.9681 0.0996 9.72 < 2e-16 ***
urbano -8.9714 2.7928 -3.21 0.00132 **
casado -2.1456 0.6735 -3.19 0.00145 **
mujer -20.1375 2.7946 -7.21 6.2e-13 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Fuente: R-Studio. Elaboración: Autor.

Hausman Test (1978), provee un contraste de endogeneidad. Estima la forma reducida de la variable
explicativa endógena mediante su regresión sobre todas las exógenas de la ecuación estructural y los
instrumentos.
Al observar los resultados de Pr(>|t|) y nos guiamos de la cantidad de (***) lo que nos indica que nuestra
prueba es significativa y se corrigió el sesgo.

Corrigiendo el Modelo
Cuadro 6
Call:
lm(formula = salario_hora ~ educ + exper + urbano + casado +
mujer, data = ENFT_Abril_2011)

Coefficients:
(Intercept) educ exper urbano casado mujer
24.077 6.864 0.968 -8.971 -2.146 -20.137

Fuente: R-Studio. Elaboración: Autor.

La nueva ecuación será:


𝒔𝒂𝒍𝒂𝒓𝒊𝒐 = 𝟐𝟒. 𝟎𝟕𝟕 + 𝟔. 𝟖𝟔𝟒𝒆𝒅𝒖𝒄 + 𝟎. 𝟗𝟔𝟖𝒆𝒙𝒑𝒆𝒓 − 𝟖. 𝟗𝟕𝟏𝒖𝒓𝒃𝒂𝒏𝒐 − 𝟐. 𝟏𝟒𝟔𝒄𝒂𝒔𝒂𝒅𝒐 − 𝟐𝟎. 𝟏𝟑𝟕𝒎𝒖𝒋𝒆𝒓

El modelo nos indica que en promedio por cada año de educación el salario se incrementa a 24,077$ por
su parte el valor de la experiencia es menor al de la ecuación base el salario es de 6,864$, en el caso de la
variable urbano este disminuye -8,971$, la variable casado aumenta a -2,146$ y por último la variable
mujer aumenta a -20,137$.

11
Histogramas:
Grafica 9 Grafica10

Fuente: R-Studio. Elaboración: Autor. Fuente: R-Studio. Elaboración: Autor.


De acuerdo a los resultados obtenidos en las gráficas 9 y 10 se puede observar que el salario por hora en
casados es mayor que el salario por hora en solteros, es decir, que los casados aportan más al salario que
los solteros.

Grafica 11 Grafica12

Fuente: R-Studio. Elaboración: Autor. Fuente: R-Studio. Elaboración: Autor.


De acuerdo a los resultados obtenidos en las gráficas 11 y 12 se puede observar que los individuos de la
zona urbana cuentan con un nivel de salario más alto que los individuos de la zona rural.

12
Conclusión
Dados los resultados de esta investigación se pudo comprobar que el grado de preparación académica de
un individuo en la República Dominicana para el 2011, si afecta de manera significativa a la obtención de
un salario superior, es decir, finalizar un año adicional de educación se asociaba a incrementar el ingreso
a 7.000$RD en promedio, de igual modo en el nivel de experiencia (cuando un individuo obtiene un año
más de experiencia esto se traduce en un incremento en promedio del salario de 1.000$RD. En cuanto
la variable experiencia al cuadrado fue eliminada porque no paso la prueba de multicolinealidad (ver
anexo cuadro 10).

En el caso de la variable dummy género, el resultado fue negativo en la ecuación, pero en las gráficas 1 y
2 se pudo observar claramente la desigualdad salarial que existe entre hombre y mujer, es decir el hombre
gana más que la mujer, pero sin importar eso se decidió utilizar mujer en la ecuación en vez de hombre y
el modelo arrojo un resultado consistente en 2 de las pruebas realizadas.

Respecto a la variable dummy demografía, al igual que con la de género su resultado fue negativo, pero
paso la prueba de multicolinealidad, en las gráficas 3 y 4 se pudo observar que los individuos de zona
urbana tienen mayores años de educación que los de la zona rural lo cual es algo bastante lógico, otro
aspecto lógico es que en las gráficas 11 y 12 los individuos de la zona urbana tengan mayor nivel de salario
que los de la zona rural.

Y por último al agregar la variable instrumental (ver anexo cuadro 14) estado civil, esta también dio como
resultado un valor negativo, pero al comparar las gráficas 9 y 10 se puedo observar que el individuo
casados tiene mayor salario que el individuo soltero.

Al realiza la validez del modelo este no paso la prueba de RESET pero uno de los problemas de esta prueba
es que no nos indica como corregir el modelo, así que para hacer algunas correcciones realizamos el
Hausman Test, y para confirmar de manera más contundente si el resulto cumplía con la hipótesis nula y
las preguntas de investigación se realizaron dos pruebas más, las cuales fueron la de heterocedasticidad
y la de multicolinealidad y estas el modelo si lo paso. Así que al modelo pasar dos pruebas de tres se
decide que sí, que el nivel de ingreso de los dominicanos puede ser explicados por las variables educación,
experiencia, género y demografía, y se le debe agregar otra variable que indico ser importante la cual es
estado civil (ver anexo cuadro 14).

Debido a que el primer modelo estimado no paso la prueba RESET, pero también tenía heterocedasticidad
y colinealidad, para corregir estos sesgos utilizamos lo que fue la regresión ANCOVA (ver anexo cuadro
13), variables instrumentales y MC2E (ver anexo cuadro 14) y de igual modo el modelo continúo siendo
inconsistente. Se rechazo la hipótesis nula (𝐻0 ) y se aceptó la hipótesis alternativa (𝐻1 ), esta parte se
puede ver más detallada en el anexo del trabajo. Por estas mismas razones se optó por corregir el modelo
de una manera más drástica, modificando el modelo clásico de Mincer donde el salario debería de ir de
manera logarítmica y cambiándolo a lineal, es decir, se cambió de un modelo log-lin a uno lin-lin, y así se
obtuvieron los resultados esperados.

Debido a los resultados del modelo lineal, la inversión en educación, esencialmente en educación
universitaria, puede ser considerada como una buena base o una plataforma efectiva para promover el
creciente y la movilidad social en la República Dominicana y la experiencia también es una variable de
suma importancia, y si comparamos con la realidad esto es así.

13
Anexo
Versiones donde se detectaron los problemas de inconsistencia del modelo.
Resultados de la Estimación:
Cuadro 7
Resultado Modelo Lineal 1
===============================================
Dependent variable:
---------------------------
log(salario_hora)
-----------------------------------------------
educ 0.070***
(0.002)

exper 0.030***
(0.001)

I(exper2) -0.0003***
(0.00002)

mujer -0.300***
(0.020)

urbano -0.100***
(0.020)

Constant 3.000***
(0.040)

-----------------------------------------------
Observations 10,091
R2 0.200
Adjusted R2 0.200
Residual Std. Error 0.700 (df = 10085)
F Statistic 381.000*** (df = 5; 10085)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01

Fuente: R-Studio. Elaboración: Autor.

La ecuación resultante será:


𝐥𝐨𝐠(𝒔𝒂𝒍𝒂𝒓) = 𝟑. 𝟎𝟎𝟎 + 𝟎. 𝟎𝟕𝟎𝒆𝒅𝒖𝒄 + 𝟎. 𝟎𝟑𝟎𝒆𝒙𝒑𝒆𝒓 − 𝟎. 𝟎𝟎𝟎𝟑𝒆𝒙𝒑𝒆𝒓𝟐 − 𝟎. 𝟑𝟎𝟎𝒎𝒖𝒋𝒆𝒓 − 𝟎. 𝟏𝟎𝟎𝒖𝒓𝒃𝒂𝒏𝒐

Antes de realizar alguna inferencia sobre los resultados obtenidos se debe realizar pruebas de validación
del modelo.

Validación del Modelo


Forma Funcional o Prueba RESET
Cuadro 8
RESET test

data: mod1
RESET = 100, df1 = 2, df2 = 10000, p-value <2e-16

14
Fuente: R-Studio. Elaboración: Autor.

De acuerdo al resultado arrojado en la prueba de RESET en el cuadro 8, el p-value <2e-16, es decir, el


modelo no es consistente. Así que se rechaza la hipótesis nula (𝐻0 ) de que el modelo es consistente y se
acepta la hipótesis alternativa (𝐻1 ) de que no lo es.
Prueba de Heterocedasticidad
Cuadro 9
studentized Breusch-Pagan test

data: mod1
BP = 70, df = 5, p-value = 9e-14

Fuente: R-Studio. Elaboración: Autor.

De acuerdo al resultado arrojado en la prueba de heterocedasticidad en el cuadro 9, el p-value = 9e-14,


es decir, el modelo no es consistente, si existe heterocedasticidad.
Prueba de Muticolinealidad (vif)
Cuadro 10
educ exper I(exper2) mujer urbano
2 11 10 1 1

Fuente: R-Studio. Elaboración: Autor.

Si el vif es mayor o igual a 10 hay problemas de colinealidad o de multicolinealidad en la variable, pero


como son dos variables el problema es entonces de colinealidad según los datos obtenidos en el cuadro
10.
Para corregir esto se estimará nuevamente el modelo omitiendo las variables que tiene colinealidad las
cuales son: exper y exper2.

Cuadro 11
Contraste de Resultado Modelos Lineales
=================================================================================================
Dependent variable:
-----------------------------------------------------------------------------
log(salario_hora)
(1) (2) (3)
-------------------------------------------------------------------------------------------------
educ 0.070*** 0.070*** 0.080***
(0.002) (0.002) (0.002)

exper 0.030*** 0.009***


(0.001) (0.001)

I(exper2) -0.0003*** 0.0001***


(0.00002) (0.00001)

mujer -0.300*** -0.200*** -0.200***


(0.020) (0.020) (0.020)

15
urbano -0.100*** -0.100*** -0.100***
(0.020) (0.020) (0.020)

Constant 3.000*** 4.000*** 3.000***


(0.040) (0.030) (0.040)

-------------------------------------------------------------------------------------------------
Observations 10,091 10,091 10,091
R2 0.200 0.100 0.100
Adjusted R2 0.200 0.100 0.100
Residual Std. Error 0.700 (df = 10085) 0.700 (df = 10086) 0.700 (df = 10086)
F Statistic 381.000*** (df = 5; 10085) 366.000*** (df = 4; 10086) 412.000*** (df = 4; 100
86)
=================================================================================================
Note: *p<0.1; **p<0.05; ***p<0
.01

Fuente: R-Studio. Elaboración: Autor.

De acuerdo a los resultados obtenidos en la estimación del cuadro 11 las ecuaciones resultantes son:

Modelo base:
𝐥𝐨𝐠(𝒔𝒂𝒍𝒂𝒓) = 𝟑. 𝟎𝟎𝟎 + 𝟎. 𝟎𝟕𝟎𝒆𝒅𝒖𝒄 + 𝟎. 𝟎𝟑𝟎𝒆𝒙𝒑𝒆𝒓 − 𝟎. 𝟎𝟎𝟎𝟑𝒆𝒙𝒑𝒆𝒓𝟐 − 𝟎. 𝟑𝟎𝟎𝒎𝒖𝒋𝒆𝒓 − 𝟎. 𝟏𝟎𝟎𝒖𝒓𝒃𝒂𝒏𝒐

Modelo sin exper:


𝐥𝐨𝐠(𝒔𝒂𝒍𝒂𝒓) = 𝟒. 𝟎𝟎𝟎 + 𝟎. 𝟎𝟕𝟎𝒆𝒅𝒖𝒄 + 𝟎. 𝟎𝟎𝟎𝟏𝒆𝒙𝒑𝒆𝒓𝟐 − 𝟎. 𝟐𝟎𝟎𝒎𝒖𝒋𝒆𝒓 − 𝟎. 𝟏𝟎𝟎𝒖𝒓𝒃𝒂𝒏𝒐

Modelo sin exper2:


𝐥𝐨𝐠(𝒔𝒂𝒍𝒂𝒓) = 𝟑. 𝟎𝟎𝟎 + 𝟎. 𝟎𝟖𝟎𝒆𝒅𝒖𝒄 + 𝟎. 𝟎𝟎𝟗𝒆𝒙𝒑𝒆𝒓 − 𝟎. 𝟐𝟎𝟎𝒎𝒖𝒋𝒆𝒓 − 𝟎. 𝟏𝟎𝟎𝒖𝒓𝒃𝒂𝒏𝒐

En la ecuación sin exper respecto al modelo base la variable constante aumente a 4.000 es decir el salario
promedio sin importar las demás variables será 400$, otro cambio a destacar es el de la variable exper2
la cual pasa a positivo y su valor es de 0.0001 y por último la variable hombre de igual modo disminuye a
-0.200 aunque se mantiene negativa.
En la ecuación sin exper2 respecto al modelo base la variable educación aumenta a 0.080 que nos dice
que en promedio que por cada año de educación el logaritmo de salario se incrementa en un 8%.

Modelo de Regresión ANCOVA


Modelamiento de la función a estimar: modelo de regresión ANCOVA en dos etapas de Heckman.

La corrección de Heckman (el método de dos etapas, lambda de Heckman o el método Heckit) es
cualquiera de una serie de métodos estadísticos relacionados desarrollados por James Heckman de 1976
a 1979, que permiten que el investigador para corregir el sesgo de selección. Los problemas de sesgo de
selección son endémicos a casi todos los problemas econométricos aplicados, que hacen que la técnica
de Heckman original, y las mejoras posteriores de sí mismo y de los demás, sean indispensables en
econometría aplicada.
El ANCOVA es una fusión del ANOVA y de la regresión lineal múltiple. Es un procedimiento estadístico que
permite eliminar la heterogeneidad causada en la variable de interés (variable dependiente) por la
influencia de una o más variables cuantitativas (covariables).

16
Una vez obtenida toda la información necesaria para la investigación, se utilizando la metodología
econométrica para la inferencia. Se estructuró un modelo de regresión ANCOVA (análisis de covarianza)
ya que las variables independientes son cualitativas y cuantitativas.
ANOVA
Cuadro 12
Analysis of Variance Table

Response: log(salario_hora)
Df Sum Sq Mean Sq F value Pr(>F)
educ 1 606 606 1149.8 < 2e-16 ***
exper 1 124 124 235.2 < 2e-16 ***
I(exper2) 1 113 113 214.1 < 2e-16 ***
mujer 1 129 129 244.6 < 2e-16 ***
urbano 1 32 32 59.9 1.1e-14 ***
Residuals 10085 5314 1
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Fuente: R-Studio. Elaboración: Autor.


Al observar los resultados de Pr(>|t|) en el cuadro 12 y nos guiamos de la cantidad de (***) lo que nos
indica es que nuestra prueba es significativa así que para llevar a cabo el ANCOVA no se cumple con el
supuesto de independencia que lo que busca es que no sea significativo el resultado.
ANCOVA
Cuadro 13
Call:
lm(formula = log(salario_hora) ~ educ * exper * I(exper2) * mujer *
urbano, data = ENFT_Abril_2011)

Residuals:
Min 1Q Median 3Q Max
-2.862 -0.462 -0.048 0.402 4.114

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2.44e+00 4.11e-01 5.94 2.9e-09 ***
educ 1.07e-01 3.32e-02 3.22 0.00131 **
exper 1.39e-01 3.94e-02 3.52 0.00044 ***
I(exper2) -3.35e-03 1.12e-03 -3.00 0.00273 **
mujer -1.12e-01 2.93e-01 -0.38 0.70349
urbano 1.04e+00 7.16e-01 1.45 0.14750
educ:exper -3.62e-03 3.33e-03 -1.09 0.27746
educ:I(exper2) 3.40e-05 1.04e-04 0.33 0.74323
exper:I(exper2) 2.29e-05 9.54e-06 2.40 0.01639 *
educ:mujer 3.64e-03 2.29e-02 0.16 0.87343
exper:mujer -6.06e-02 2.89e-02 -2.10 0.03618 *
I(exper2):mujer 1.97e-03 8.47e-04 2.33 0.02004 *
educ:urbano -8.05e-02 6.03e-02 -1.34 0.18164
exper:urbano -8.15e-02 6.50e-02 -1.25 0.21026
I(exper2):urbano 1.54e-03 1.77e-03 0.87 0.38464
mujer:urbano -4.49e-01 5.38e-01 -0.83 0.40417
educ:exper:I(exper2) 3.65e-07 1.00e-06 0.36 0.71572

17
educ:exper:mujer 2.18e-03 2.37e-03 0.92 0.35696
educ:I(exper2):mujer -4.44e-05 7.62e-05 -0.58 0.56002
exper:I(exper2):mujer -1.60e-05 7.46e-06 -2.14 0.03224 *
educ:exper:urbano 5.01e-03 5.83e-03 0.86 0.39028
educ:I(exper2):urbano -9.58e-05 1.78e-04 -0.54 0.59161
exper:I(exper2):urbano -8.83e-06 1.45e-05 -0.61 0.54228
educ:mujer:urbano 2.58e-02 4.31e-02 0.60 0.54951
exper:mujer:urbano 4.89e-02 4.88e-02 1.00 0.31623
I(exper2):mujer:urbano -1.25e-03 1.33e-03 -0.94 0.34606
educ:exper:I(exper2):mujer -4.32e-08 7.62e-07 -0.06 0.95480
educ:exper:I(exper2):urbano 4.35e-07 1.71e-06 0.25 0.79906
educ:exper:mujer:urbano -2.58e-03 4.17e-03 -0.62 0.53564
educ:I(exper2):mujer:urbano 6.48e-05 1.28e-04 0.51 0.61325
exper:I(exper2):mujer:urbano 9.89e-06 1.10e-05 0.90 0.36785
educ:exper:I(exper2):mujer:urbano -4.18e-07 1.25e-06 -0.34 0.73750
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.7 on 10059 degrees of freedom


Multiple R-squared: 0.172, Adjusted R-squared: 0.17
F-statistic: 67.5 on 31 and 10059 DF, p-value: <2e-16

Fuente: R-Studio. Elaboración: Autor.


De acuerdo a los datos obtenidos en el cuadro 13 se cumple el supuesto de homogeneidad de las
pendientes de regresión ya que las interacciones son mayor a 0.05 excepto a exper:I(exper2), exper:mujer,
exper:I(exper2):mujer, I(exper2):mujer, pero en todas las demás sí.
Hasta ahora no cumplimos con el supuesto de independencia, pero si con el supuesto de homogeneidad
de las pendientes de regresión los cuales son exigidos por el ANCOVA. A pesar de eso vamos a suponer
que cumplimos con ambos supuestos obteniendo como resultado el modelo siguiente:
El modelo utilizado para esta estimación en nuestra herramienta R-Studio es:
𝐥𝐧(𝑺𝒂𝒍𝒂𝒓𝒊𝒐) ~ 𝒆𝒅𝒖𝒄 ∗ 𝒆𝒙𝒑𝒆𝒓 ∗ 𝜷𝟑 𝒆𝒙𝒑𝒆𝒓𝟐 ∗ 𝒉𝒐𝒎𝒃𝒓𝒆 ∗ 𝒖𝒓𝒃𝒂𝒏𝒐 ∗ 𝒖
Seria nuestro modelo ideal con efectos principales siempre y cuando hubiera cumplido con la
independencia y la homogeneidad de las pendientes de regresión, es decir, para hacer un modelo con los
efectos principales se debe cumplir con los supuestos de ANCOVA. Así que este resultado lo que nos indica
es que el modelo tiene sesgos a pesar de las correcciones.

Implementando MC2E
Estimando el modelo agregando una variable dummy, estado civil (casado).
En la siguiente estimación agregaremos una varible dummy (6 = soltero; 2 = casado) con el propósito de
tratar de corregir los sesgos del modelo. Para incluir la variable estado civil tomamos como referencia la
investigación de De la Riga y Ugidos (1995).

Cuadro 14
Comparando las Estimaciones por MCO y MC2E
============================================================================================
Dependent variable:
------------------------------------------------------------------------
log(salario_hora)

18
OLS instrumental
variable
(1) (2) (3)
--------------------------------------------------------------------------------------------
educ 0.070*** 0.070*** 0.070***
(0.002) (0.002) (0.002)

exper 0.030*** 0.030*** 0.030***


(0.001) (0.002) (0.001)

I(exper2) -0.0003*** -0.0003*** -0.0003***


(0.00002) (0.00002) (0.00002)

mujer -0.300*** -0.300*** -0.300***


(0.020) (0.020) (0.020)

urbano -0.100*** -0.100*** -0.100***


(0.020) (0.020) (0.020)

casado -0.020***
(0.004)

Constant 3.000*** 3.000*** 3.000***


(0.040) (0.040) (0.040)

--------------------------------------------------------------------------------------------
Observations 10,091 10,091 10,091
R2 0.200 0.200 0.200
Adjusted R2 0.200 0.200 0.200
Residual Std. Error 0.700 (df = 10085) 0.700 (df = 10084) 0.700 (df = 10085)
F Statistic 381.000*** (df = 5; 10085) 321.000*** (df = 6; 10084)
============================================================================================
Note: *p<0.1; **p<0.05; ***p<0.01

Fuente: R-Studio. Elaboración: Autor.


De acuerdo a los resultados obtenidos en la estimación del cuadro 14 las ecuaciones resultantes son:
Modelo base:
𝐥𝐨𝐠(𝒔𝒂𝒍𝒂𝒓) = 𝟑. 𝟎𝟎𝟎 + 𝟎. 𝟎𝟕𝟎𝒆𝒅𝒖𝒄 + 𝟎. 𝟎𝟑𝟎𝒆𝒙𝒑𝒆𝒓 − 𝟎. 𝟎𝟎𝟎𝟑𝒆𝒙𝒑𝒆𝒓𝟐 − 𝟎. 𝟑𝟎𝟎𝒎𝒖𝒋𝒆𝒓 − 𝟎. 𝟏𝟎𝟎𝒖𝒓𝒃𝒂𝒏𝒐

Modelo con Dummy Estado Civil:


𝐥𝐨𝐠(𝒔𝒂𝒍𝒂𝒓) = 𝟒. 𝟎𝟎𝟎 + 𝟎. 𝟎𝟕𝟎𝒆𝒅𝒖𝒄 + 𝟎. 𝟎𝟎𝟎𝟏𝒆𝒙𝒑𝒆𝒓𝟐 − 𝟎. 𝟐𝟎𝟎𝒎𝒖𝒋𝒆𝒓 − 𝟎. 𝟏𝟎𝟎𝒖𝒓𝒃𝒂𝒏𝒐 − 𝟎. 𝟐𝟎𝒄𝒂𝒔𝒂𝒅𝒐

Esta nueva variable no realizo ningún cambio en la ecuación, de hecho, arrojo un resultado negativo de -
0.20 lo que nos indica que no es significativa la variable casado.
Así que de igual modo con el modelo base la hipótesis nula (𝐻0 ) se rechaza el modelo continúa siendo
inconsistente.

19
Validación del Modelo
Forma Funcional o Prueba RESET
Al agregar una variable instrumental se decidió realizar la prueba RESET nuevamente para determinar si
el modelo se ajustó correctamente o no.

Cuadro 15
RESET test

data: mod
RESET = 100, df1 = 2, df2 = 10000, p-value <2e-16

Fuente: R-Studio. Elaboración: Autor.


De acuerdo al resultado arrojado en la prueba de RESET en el cuadro 11, el p-value <2e-16, es decir, el
modelo no es consistente igual que en el modelo base.
Así que se rechaza la hipótesis nula (𝐻0 ) de que el modelo es consistente y se acepta la hipótesis
alternativa (𝐻1 ) de que no lo es.

20
Referencias

Salas Velasco, Manuel; 1996; Determinantes Salariales en el mercado Laboral de los Títulos
Universitarios.

file:///C:/Users/Julia%20George/Downloads/Econometria/Econometria%20repetida/Trabajo%20Final%
20Salario/Salas.pdf

Zambrona Monserrate, Manuel Andrés; Factores Determinantes del Salariales del Sector Privado en el
Ecuador para el Año 2013; Escuela Superior Politécnica del Litoral (ESPOL).

file:///C:/Users/Julia%20George/Downloads/Econometria/Econometria%20repetida/Trabajo%20Final%
20Salario/Dialnet-FactoresDeterminantesDelSalarioDelSectorPrivadoEnE-5803764.pdf

Zambrona Monserrate, Manuel Andrés; Sanchez-Loor, Daniel A.; Factores Determinantes del Salariales
del Sector Privado en el Ecuador para el Año 2014; Jornal Information.

https://www.elsevier.es/en-revista-cuadernos-economia-329-articulo-factores-determinantes-del-
salario-del-S0210026615000394

21

También podría gustarte