Está en la página 1de 19

Rendimientos de la educación en México:

Aproximaciones estadísticas utilizando Stata


Ángel Cruz.
Especialista en Software Estadístico. acruz@multion.com
Agenda

 Introducción.

 Problemas de medición.

 Método de estimación.

 Base y estimaciones.

 Conclusiones.
Introducción

La mayor inversión en el capital humano es aquella en la que los individuos aumentan sus capacidades en el
sector productivo por medio de una mayor escolaridad.

¿ Qué estamos buscando?

 La educación superior impacta de manera positiva el ingreso de los individuos.

 Determinar factores relacionados al entorno económico y familiar que afecten la decisión de los individuos de
entrar en un programa de educación superior.

 Obtener una medida que muestre la diferencia en los ingresos obtenidos por personas que cuentan con educación
superior y aquellas que no.
Introducción

El modelo de capital humano de Mincer (1974), es la base teórica de los estudios del salario en función de
variables que incrementen la productividad de los individuos. El objetivo era comprobar la relación entre
capital humano e ingresos y luego medir estadísticamente los retornos de la educación con la ecuación…

log(𝑆𝑎𝑙𝑎𝑟𝑖𝑜𝑖 ) = 𝛼 + 𝛽1 𝐸𝑑𝑢𝑐𝑎𝑐𝑖ó𝑛𝑖 + 𝛽2 𝐸𝑥𝑝𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑖 + 𝛽3 𝐸𝑥𝑝𝑒𝑟𝑖𝑒𝑛𝑐𝑖𝑎𝑖2 + 𝑒𝑖


𝑖 = 1, … , 𝑁

… a través de Mínimos Cuadrados Ordinarios.


Problemas de medición
El estimador MCO resultado de la ecuación minceriana presenta sesgos importantes:

i. Correlación entre la escolaridad y la pendiente de la función de ingreso.


ii. Las capacidades de los individuos se captan por medio del intercepto de la regresión, y este se
correlaciona con la escolaridad.
iii. Sesgo por autoselección: surge cuando la extracción de la muestra no se realiza con la misma
probabilidad para todos los elementos.

 Muestra no aleatoria, por tanto, no podemos realizar estimaciones poblacionales sino sólo de la muestra.

Solución 1. Método de Variables


. No soluciona iii.
Instrumentales.

¿ Cómo vamos a calcular el rendimiento de la educación ?


Problemas de medición

A través del método cuasi experimental mediante el análisis comparativo entre un grupo de tratamiento y de
control. (Evaluación de un programa)

Método cuasi experimental: no se puede asegurar una equivalencia inicial entre los grupos debido a que no
hubo ninguna asignación aleatoria en la conformación de los mismos.

Se logra aislar a las variables observables características entre el grupo de tratamiento (personas con nivel de
educación superior) y el grupo control (personas que no llegaron al nivel superior de educación); con esto,
podemos evaluar las diferencias atribuidas al nivel de educación en el salario de las personas.

Modelo de Heckman
Método de estimación
Las personas reciben un salario Y, independientemente de si reciben el tratamiento (educación superior) o
no, por lo cual podemos decir que 𝒀𝟏 representa el resultado obtenido por las personas que recibieron el
tratamiento, mientras que 𝒀𝟎 es el resultado para aquellos que no obtuvieron el tratamiento.

Para evaluar el efecto del tratamiento debemos medir una variable no observable que podemos definir
como 𝒀𝟏 - 𝒀𝟎 .

𝑫 = 𝒁𝜽 + 𝑼𝑫 (1)
𝒀𝟏 = 𝜷𝟏 𝑿 + 𝑼𝟏 (2)
𝒀𝟎 = 𝜷𝟎 𝑿 + 𝑼𝟎 (3)

(1) Función de una variable latente: decisión de la persona de participar o no en el programa educativo (var.
latente), explicada por 𝒁 variables independientes.

𝑫 = 𝟎 , individuos sin tratamiento.


𝑫 = 𝟏 , individuos con tratamiento.

Conexión entre los mecanismos de elección individual y las variables independientes 𝑿 en (2) y (3).
Restricción: el mecanismo de elección debe incluir al menos un elemento en 𝒁 que no se encuentre en 𝑿.
Método de estimación

Heckman bietápico.
Modelo Probit

Mínimos Cuadrados
Ordinarios
Base y Estimaciones

 Base:  Variables:
 Encuesta Nacional de Ingresos y Gastos de los  Tratamiento,
Hogares (ENIGH), 2016.
 Salario del individuo,
o Individuos que:  Edad,
 Viven con sus padres al momento de levantar la  Experiencia,
encuesta,
 Experiencia al cuadrado,
 Reportan sueldos positivos,
 Tamaño del hogar,
 Entre 22 y 65 años,
 Nivel de educación de la madre, y
 Trabajan más de 20 horas a la semana.
 Nivel de educación del padre.
Base y Estimaciones: variable latente
. tab treatment

treatment Freq. Percent Cum.

0 10,500 71.35 71.35


1 4,216 28.65 100.00

Total 14,716 100.00


Base y Estimaciones: características
. sum tam_h edu_p edu_m lsal edad exper if treatment==1, sep(0)

Variable Obs Mean Std. Dev. Min Max

tam_h 4,216 4.508776 1.710596 2 14


edu_p 2,973 11.89405 4.837453 0 23
edu_m 4,026 11.20964 4.429631 0 23
lsal 4,216 3.525349 .8793003 -1.262473 6.539107
edad 4,216 29.51162 6.999533 22 62
exper 4,216 5.711338 6.763725 0 38

. sum tam_h edu_p edu_m lsal edad exper if treatment==0, sep(0)

Variable Obs Mean Std. Dev. Min Max

tam_h 10,500 5.325048 2.350747 2 21


edu_p 7,137 7.647051 3.813989 0 23
edu_m 9,788 7.334798 3.781504 0 23
lsal 10,500 2.92652 .7261124 -1.162618 6.032882
edad 10,500 30.98171 8.207696 22 64
exper 10,500 14.36924 9.100907 1 53
Base y Estimaciones: probit
. probit treatment edu_m edu_p exper exper2 sal_jef tam_h

Iteration 0: log likelihood = -4091.6596


Iteration 1: log likelihood = -2437.9455
Iteration 2: log likelihood = -2404.0232
Iteration 3: log likelihood = -2403.9094
Iteration 4: log likelihood = -2403.9094

Probit regression Number of obs = 6,758


LR chi2(6) = 3375.50
Prob > chi2 = 0.0000
Log likelihood = -2403.9094 Pseudo R2 = 0.4125

treatment Coef. Std. Err. z P>|z| [95% Conf. Interval]

edu_m .0400025 .0065592 6.10 0.000 .0271467 .0528582


edu_p .0633612 .0059834 10.59 0.000 .0516339 .0750885
exper -.2647934 .0076438 -34.64 0.000 -.279775 -.2498118
exper2 .006155 .0002555 24.09 0.000 .0056542 .0066558
sal_jef .1003832 .0197613 5.08 0.000 .0616518 .1391146
tam_h -.1043898 .0115793 -9.02 0.000 -.1270848 -.0816949
_cons .0756513 .1152253 0.66 0.511 -.1501861 .3014888
Base y Estimaciones: efectos marginales
. predict p
. mfx

Marginal effects after probit


y = Pr(treatment) (predict)
= .20452974

variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X

edu_m .0113502 .00187 6.08 0.000 .007694 .015007 8.70331


edu_p .017978 .00171 10.54 0.000 .014635 .021321 9.10284
exper -.0751319 .00231 -32.46 0.000 -.079669 -.070595 8.96981
exper2 .0017464 .00008 22.53 0.000 .001594 .001898 131.082
sal_jef .0284825 .00562 5.07 0.000 .017473 .039492 3.30311
tam_h -.0296193 .00324 -9.14 0.000 -.035973 -.023266 5.64575

. gen lambda=normalden(p)/normal(p)
Base y Estimaciones: mínimos cuadrados ordinarios
. regress lsal exper exper2 edu_m edu_p lambda

Source SS df MS Number of obs = 6,758


F(5, 6752) = 117.80
Model 365.541805 5 73.1083611 Prob > F = 0.0000
Residual 4190.56115 6,752 .620639981 R-squared = 0.0802
Adj R-squared = 0.0796
Total 4556.10296 6,757 .674278964 Root MSE = .78781

lsal Coef. Std. Err. t P>|t| [95% Conf. Interval]

exper .0721251 .009175 7.86 0.000 .0541392 .0901111


exper2 -.0018369 .0002461 -7.46 0.000 -.0023194 -.0013545
edu_m .0139615 .0032529 4.29 0.000 .0075847 .0203382
edu_p .0144737 .0033577 4.31 0.000 .0078916 .0210559
lambda -1.863405 .2123033 -8.78 0.000 -2.279586 -1.447223
_cons 3.544516 .1204454 29.43 0.000 3.308405 3.780627
Base y Estimaciones: ATE
. reg lsal edu_m edu_p exper exper2 lambda if treatment==1
. predict y1
. reg lsal edu_m edu_p exper exper2 lambda if treatment==0
. predict y0
. gen d=y1-y0
. sum d
. return list
. scalar TIR=(exp( `r(mean)' )-1)*100
. display TIR
. sum educacion if treatment==1
. scalar mean1=r(mean)
. sum educacion if treatment==0
. scalar mean0=r(mean)
. sca difm=mean1-mean0
. di difm
. sca ATE=TIR/difm
. di ATE
Base y Estimaciones: ATE

Tasa de Retorno = 79.5 %

Los individuos que cuentan con, en promedio, 18 años de educación, tienen un


salario 79.5% mayor que una persona que ha estudiado, en promedio, 10 años.

Average Treatment Effect = 10.7%

Un individuo que esté estudiando la educación superior, al añadir un año más de


estudios, puede esperar un salario 10.7% mayor.
Base y Estimaciones: Propensity Score Matching

. atts lsal treatment, pscore(mypscore) blockid(myblock) comsup boot reps(100) dots

Average Treatment on the Treated = 5.02%

Un individuo que ha recibido el tratamiento tiene un rendimiento 5.02% mayor


que aquel que no la ha recibido.
Base y Estimaciones: comando heckman
. heckman lsal exper exper2 edu_m edu_p, select(treatment = edu_m edu_p exper exper2 tam_h s
> al_jef) twostep

Heckman selection model -- two-step estimates Number of obs = 6,758


(regression model with sample selection) Selected = 1,985
Nonselected = 4,773

Wald chi2(4) = 192.25


Prob > chi2 = 0.0000

Coef. Std. Err. z P>|z| [95% Conf. Interval]

lsal
exper .1608797 .02078 7.74 0.000 .1201516 .2016078
exper2 -.0040591 .0006474 -6.27 0.000 -.005328 -.0027902
edu_m .0110839 .0065007 1.71 0.088 -.0016572 .023825
edu_p .005205 .0069718 0.75 0.455 -.0084595 .0188694
_cons 3.051856 .1409745 21.65 0.000 2.775551 3.328161

treatment
edu_m .0400025 .0065592 6.10 0.000 .0271467 .0528582
edu_p .0633612 .0059834 10.59 0.000 .0516339 .0750884
exper -.2647934 .0076437 -34.64 0.000 -.2797748 -.2498119
exper2 .006155 .0002555 24.09 0.000 .0056542 .0066558
tam_h -.1043898 .0115792 -9.02 0.000 -.1270846 -.0816951
sal_jef .1003832 .0197612 5.08 0.000 .061652 .1391144
_cons .0756513 .1152246 0.66 0.511 -.1501848 .3014875

/mills
lambda -.400024 .1280625 -3.12 0.002 -.6510219 -.1490261

rho -0.45290
sigma .88325159
Conclusiones

Las variables que tienen que ver con el entorno familiar en general (tamaño del hogar) y en
particular (salario del jefe del hogar, educación de los padres), así como la propia experiencia
laboral del individuo, influyen de forma determinante en la elección de participar en un
programa de educación superior.

Esto con la finalidad de poder obtener ingresos mayores en un futuro debido a la inversión e
capital humano, en donde los factores menos preponderantes en este punto de vida
productiva propia del individuos son los relativos al nivel educativo de sus padres.

También podría gustarte