Está en la página 1de 8

Universidad del Valle

Facultad de Ciencias Sociales y Económicas

Técnicas de Evaluación de Impacto


Taller 2 - Programa de entrenamiento laboral

Rachell Rodriguez Prada - 2400398 MEA


Jhoan Gilbert Cuaran Mueses - 1832072
Juan David Ramirez Perez -2125084

Marzo 2024
1. Generar las 10.000 observaciones de la variable a partir de la distribución
binomial.
Usando la biblioteca dplyr y la función rbinom(10,000,1,0.2), se crean 10,000 observaciones en las cuales
el 20% será sometido a tratamiento, es decir, se inscribirán en el programa de formación laboral.

#Generación del tratamiento D


library ( dplyr )

set . seed (1234)

D = rbinom ( 1 0 0 0 0 , 1 , 0 . 2 )

2. ¿Cuántas personas recibieron tratamiento?


De acuerdo con la simulación, alrededor de 1986 individuos serán sometidos a tratamiento, lo que implica
su participación en el programa de formación laboral.

#Personas que reciben el tratamiento


mean (D) * 10000

3. Generar las 10.000 observaciones de la variable de habilidad


Usando el comando runif(), se crea la variable que representa las capacidades inherentes de los individuos.

#Generación de habilidad no observada a


a = runif (10000 ,0 ,1)
mean ( a )
hist (a)

4. Generar las 10.000 observaciones de la variable empleado


Se lleva a cabo la simulación de la variable de empleo binaria, la cual tiene una probabilidad de adquirir
el valor 1, indicando la condición de empleado, según una estructura particular establecida.

1
#Generación de la variable empleado L

p _ empleo = 0 . 7 5 * a + 0 . 2 5 *D
L= rbinom ( 1 0 0 0 0 , 1 , p_ empleo )
table (L)
mean ( L )

5. ¿Cuántas tratados (en porcentaje) consiguieron empleo y cuantos conti-


núan desempleados (en porcentaje)?
Se realiza la regresión entre L y el tratamiento D, para saber los porcentajes.

#Regresión entre L y el tratamiento D

m1 = lm ( L ~ D)
summary ( m1 )

#Resultado del modelo

Call :
lm ( formula = L ~ D)

Residuals :
Min 1Q Median 3Q Max
−0.6279 −0.3770 −0.3770 0.6230 0.6230

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( I n t e r c e p t ) 0.376965 0.005411 69.66 <2e −16 * * *
D 0.250930 0.012143 20.66 <2e −16 * * *
−−−

Con esto en consideración, la suma del coeficiente junto con el intercepto proporcionarán la probabilidad
de que una persona que recibió tratamiento obtenga empleo. Como resultado, el 62.78% logró empleo y el
37.22% no lo hizo.

2
6. Generar las 10.000 observaciones del vector de error aleatorio
Se genera el error con la función rnorm()

#Error aleatorio
e = rnorm ( 1 0 0 0 0 , 0 , 1 )

7. Generar las 10.000 observaciones de la variable de salario


Creamos la variable y . Esta variable sigue una estructura específica.

#Generación de la variable de salario


alfa0 = 5
alfa = 1
y = a l f a 0 + a l f a *D + 10 * a + e
hist (y)
mean ( y )

8. Estime el efecto del programa de entrenamiento laboral sobre la probabi-


lidad de obtener empleo
Para calcular el efecto, se realiza un modelo de regresión de L con respecto a D (Modelo del punto 5).

#Modelo
Call :
lm ( formula = L ~ D)

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( I n t e r c e p t ) 0.376965 0.005411 69.66 <2e −16 * * *
D 0.250930 0.012143 20.66 <2e −16 * * *
−−−

Observamos que el programa tiene un impacto de alrededor del 25% en la probabilidad de obtener
empleo.

3
9.

10. Solo para las personas que tienen empleo (L=1) Estime mediante MCO
la regresión:
#Modelo 2

Call :
lm ( formula = y [ L == 1 ] ~ D[ L == 1 ] )

Residuals :
Min 1Q Median 3Q Max
−8.2512 −1.8104 0.3143 2.0950 5.8508

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( I n t e r c e p t ) 11.60949 0.04807 241.499 < 2 e −16 * * *
D[ L == 1 ] 0.47552 0.08894 5 . 3 4 7 9 . 4 2 e −08 * * *
−−−

La salida de la regresión indica que el impacto del programa en el salario de las personas es de 0.47552.
Sin embargo, al simular el salario de las personas, el efecto del programa era α=1.
Por lo tanto, se puede concluir que este estimador está sesgado. Para identificar qué podría estar causando
este sesgo en el efecto, debemos referirnos a los Diagramas Acíclicos Dirigidos (DAG) para determinar cuál
es el problema.

4
Figura 1: DAG 1

Basados en el DAG se puede apreciar que, existe un camino de puerta trasera Y ← a → L ← D (Linea
rosada). Este camino de puerta trasera se genera dado que, la variable L , la cual es colisionador, esta
estratificada. Esto se debe a que existe un sesgo de selección, ya que, solo se puede apreciar el salario de una
persona si esta trabaja. Esto provoca que, el camino de puerta trasera se genere y el estimador sea sesgado.

11. Solo para las personas que tienen empleo (L=1) Estime mediante MCO
la regresión:
#Modelo 3
Call :
lm ( formula = y [ L == 1 ] ~ D[ L == 1 ] + a [ L == 1 ] )

Residuals :
Min 1Q Median 3Q Max
−3.3778 −0.6989 −0.0096 0.6818 3.6091

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )

5
( Intercept ) 4.98423 0.04489 111.03 <2e −16 * * *
D[ L == 1 ] 1.06223 0.03360 31.62 <2e −16 * * *
a [ L == 1 ] 9.99926 0.06203 161.19 <2e −16 * * *
−−−

Aquí se puede observar que el coeficiente de la variable de tratamiento, es decir, el efecto promedio del
programa en el salario, es aproximadamente igual al estimado en la simulación inicial, que representa el
efecto causal real. Por lo tanto, se estaría corrigiendo el sesgo en el estimador del programa a través del sesgo
de selección que originaba el camino de puerta trasera.

Figura 2: DAG 2

En el anterior DAG, es posible ver que, el camino de puerta trasera Y ← a → L ← D se cierra (linea negra)
a causa de que se estratifica la variable que describe las habilidades intrínsecas de las personas. Dejando solo
la relación directa de D hacia Y (linea verde); el verdadero efecto causal.

12. Con todas las 10.000 estime mediante MCO la regresión:


Se realiza la regresión con todas las observaciones. Aunque pueda parecer poco realista que una persona
sin empleo tenga salario, esto se hace con el propósito de entender por qué no habría sesgo al estimar de esta

6
manera.

#Modelo 4

Call :
lm ( formula = y ~ D + a )

Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( Intercept ) 4.97977 0.02088 238.47 <2e −16 * * *
D 1.02008 0.02516 40.55 <2e −16 * * *
a 10.01186 0.03501 285.93 <2e −16 * * *
−−−

Figura 3: DAG 3

En este DAG, se nota que el camino de puerta trasera Y ← a → L ← D se bloquea. Esto ocurre debido a
que L actúa como colisionador, lo que impide la existencia de dicho camino de puerta trasera. Este resultado
se logra gracias a la inclusión de todas las observaciones, lo cual elimina el sesgo de selección.

También podría gustarte