Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Marzo 2024
1. Generar las 10.000 observaciones de la variable a partir de la distribución
binomial.
Usando la biblioteca dplyr y la función rbinom(10,000,1,0.2), se crean 10,000 observaciones en las cuales
el 20% será sometido a tratamiento, es decir, se inscribirán en el programa de formación laboral.
D = rbinom ( 1 0 0 0 0 , 1 , 0 . 2 )
1
#Generación de la variable empleado L
p _ empleo = 0 . 7 5 * a + 0 . 2 5 *D
L= rbinom ( 1 0 0 0 0 , 1 , p_ empleo )
table (L)
mean ( L )
m1 = lm ( L ~ D)
summary ( m1 )
Call :
lm ( formula = L ~ D)
Residuals :
Min 1Q Median 3Q Max
−0.6279 −0.3770 −0.3770 0.6230 0.6230
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( I n t e r c e p t ) 0.376965 0.005411 69.66 <2e −16 * * *
D 0.250930 0.012143 20.66 <2e −16 * * *
−−−
Con esto en consideración, la suma del coeficiente junto con el intercepto proporcionarán la probabilidad
de que una persona que recibió tratamiento obtenga empleo. Como resultado, el 62.78% logró empleo y el
37.22% no lo hizo.
2
6. Generar las 10.000 observaciones del vector de error aleatorio
Se genera el error con la función rnorm()
#Error aleatorio
e = rnorm ( 1 0 0 0 0 , 0 , 1 )
#Modelo
Call :
lm ( formula = L ~ D)
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( I n t e r c e p t ) 0.376965 0.005411 69.66 <2e −16 * * *
D 0.250930 0.012143 20.66 <2e −16 * * *
−−−
Observamos que el programa tiene un impacto de alrededor del 25% en la probabilidad de obtener
empleo.
3
9.
10. Solo para las personas que tienen empleo (L=1) Estime mediante MCO
la regresión:
#Modelo 2
Call :
lm ( formula = y [ L == 1 ] ~ D[ L == 1 ] )
Residuals :
Min 1Q Median 3Q Max
−8.2512 −1.8104 0.3143 2.0950 5.8508
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( I n t e r c e p t ) 11.60949 0.04807 241.499 < 2 e −16 * * *
D[ L == 1 ] 0.47552 0.08894 5 . 3 4 7 9 . 4 2 e −08 * * *
−−−
La salida de la regresión indica que el impacto del programa en el salario de las personas es de 0.47552.
Sin embargo, al simular el salario de las personas, el efecto del programa era α=1.
Por lo tanto, se puede concluir que este estimador está sesgado. Para identificar qué podría estar causando
este sesgo en el efecto, debemos referirnos a los Diagramas Acíclicos Dirigidos (DAG) para determinar cuál
es el problema.
4
Figura 1: DAG 1
Basados en el DAG se puede apreciar que, existe un camino de puerta trasera Y ← a → L ← D (Linea
rosada). Este camino de puerta trasera se genera dado que, la variable L , la cual es colisionador, esta
estratificada. Esto se debe a que existe un sesgo de selección, ya que, solo se puede apreciar el salario de una
persona si esta trabaja. Esto provoca que, el camino de puerta trasera se genere y el estimador sea sesgado.
11. Solo para las personas que tienen empleo (L=1) Estime mediante MCO
la regresión:
#Modelo 3
Call :
lm ( formula = y [ L == 1 ] ~ D[ L == 1 ] + a [ L == 1 ] )
Residuals :
Min 1Q Median 3Q Max
−3.3778 −0.6989 −0.0096 0.6818 3.6091
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
5
( Intercept ) 4.98423 0.04489 111.03 <2e −16 * * *
D[ L == 1 ] 1.06223 0.03360 31.62 <2e −16 * * *
a [ L == 1 ] 9.99926 0.06203 161.19 <2e −16 * * *
−−−
Aquí se puede observar que el coeficiente de la variable de tratamiento, es decir, el efecto promedio del
programa en el salario, es aproximadamente igual al estimado en la simulación inicial, que representa el
efecto causal real. Por lo tanto, se estaría corrigiendo el sesgo en el estimador del programa a través del sesgo
de selección que originaba el camino de puerta trasera.
Figura 2: DAG 2
En el anterior DAG, es posible ver que, el camino de puerta trasera Y ← a → L ← D se cierra (linea negra)
a causa de que se estratifica la variable que describe las habilidades intrínsecas de las personas. Dejando solo
la relación directa de D hacia Y (linea verde); el verdadero efecto causal.
6
manera.
#Modelo 4
Call :
lm ( formula = y ~ D + a )
Coefficients :
E s t i m a t e Std . E r r o r t v a l u e Pr ( > | t | )
( Intercept ) 4.97977 0.02088 238.47 <2e −16 * * *
D 1.02008 0.02516 40.55 <2e −16 * * *
a 10.01186 0.03501 285.93 <2e −16 * * *
−−−
Figura 3: DAG 3
En este DAG, se nota que el camino de puerta trasera Y ← a → L ← D se bloquea. Esto ocurre debido a
que L actúa como colisionador, lo que impide la existencia de dicho camino de puerta trasera. Este resultado
se logra gracias a la inclusión de todas las observaciones, lo cual elimina el sesgo de selección.