Está en la página 1de 15

Pilar Alcalde

3.9 Regresión lineal simple:


Variables binarias
Caravaggio, Narciso, 1599
1. Variables Binarias

1. ¿Qué es una variable binaria? ¿Para qué sirve? Y cómo se


define?
2. ¿Cómo se interpretan los parámetros de la FRP con una
variable binaria?
3. ¿Cómo se interpretan los coeficientes de la FRM con una
variable binaria?
4. ¿Cómo podemos saber si la diferencia entre dos categorías
es significativa?
2. Variables binarias para experimentos
2. Experimentos

1. ¿Es el estimador OLS un buen estimador para el efecto


causal? ¿Qué habría pasado con datos administrativos?
2. Testee si la diferencia de medias es significativa o no.
Encuentre el valor p y el intervalo de confianza al 95%.
3. Testee si el nivel de habilidades promedio de las comunas no
seleccionadas es significativa o no.
4. ¿Cuál es el problema de omitir el intercepto en este modelo?
Explique claramente usando ecuaciones.
2. Experimentos

5. ¿Cuáles serían los coeficientes si se define la variable D=1 si


el alumno vive en una comuna no seleccionada?
Encuéntrelos y justifique.
6. Al estimar con errores robustos, la desviación estándar de la
pendiente cambia a 0.04467. Testee nuevamente si la
diferencia de medias es significativa o no. Encuentre el valor
p y el intervalo de confianza al 95%.
3. Variables categóricas sin orden
Tenemos una muestra de salarios de profesores, por sexo y grado académico

Salario promedio Magíster Doctorado Coef Valor coef St. Err.


Hombre 24.916,14 24.568,83 24916.14 1573.757
Mujer 22.410 20.936 -347.31 1980.267
-2506.14 3338.442
-3980.14 2438.054

1. ¿Por qué usamos sólo tres variables binarias?


2. Muestre que los coeficientes corresponden a las diferencias de salario
promedio entre los grupos.
3. ¿Qué pasaría si el grupo de referencia fuera las mujeres con doctorado?
Muestre la regresión y los nuevos coeficientes.
4. ¿Cómo testearía si las diferencias entre grupos son significativas o no?
3. Aplicaciones
4. Variables categóricas con orden
Salario promedio por rango académico
35000
30000

Coef Valor coef St. Err. 25000


20000

11663.14 1066.946 15000


10000

5952.779 482.7553 5000


0
R=1 / Cátedra R=2 / Asistente R=3 / Asociado

R continua R set binarias

Coef Valor coef St. Err. R continua R set binarias


17768.67 705.4582 R=1 / Cátedra 17615.92 17768.67
5407.262 1066.553 R=2 / Asistente 23568.7 23175.93
11890.28 972.407 R=3 / Asociado 29521.48 29658.95

1. ¿Cómo obtenemos los valores de la tabla?


2. ¿Cuál regresión se prefiere?
4. Aplicaciones
Actividad con datos
Bertrand y Mullainathan “Are Emily and Greg More Employable that
Lakisha and Jamal? A Field Experiment on Labor Market Discrimination,”
American Economic Review” 2004, Vol. 94, no. 4.

https://medium.com/@brooke.cusmano/are-emily-and-greg-more-employable-than-lakisha-and-jamal-13d11dfac511
Actividad con datos
Generamos variables binarias para repetir el análisis del experimento
. tab race

race | Freq. Percent Cum.


------------+-----------------------------------
black | 2,435 50.00 50.00
white | 2,435 50.00 100.00
------------+-----------------------------------
Total | 4,870 100.00

. gen black= race=="black"

. gen black_v2=0

. replace black_v2=1 if race=="black"


(2435 real changes made)

. tab black

black_v2 | Freq. Percent Cum.


------------+-----------------------------------
0 | 2,435 50.00 50.00
1 | 2,435 50.00 100.00
------------+-----------------------------------
Total | 4,870 100.00

https://media.pearsoncmg.com/ph/bp/bp_stock_econometrics_4_cw/content/datapages/stock04_data13.html
Actividad con datos
Repetimos el análisis del experimento

Mean call_back
Black = 0 | .0965092
black = 1 | .0644764

. reg call_back black, robust

Linear regression Number of obs = 4870


F( 1, 4868) = 16.93
Prob > F = 0.0000
R-squared = 0.0035
Root MSE = .27164

------------------------------------------------------------------------------
| Robust
call_back | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
black | -.0320329 .007785 -4.11 0.000 -.0472949 -.0167708
_cons | .0965092 .0059853 16.12 0.000 .0847753 .1082431
------------------------------------------------------------------------------

¿Es la diferencia entre grupos significativa? ¿Cuál es el intervalo de


confianza?

https://media.pearsoncmg.com/ph/bp/bp_stock_econometrics_4_cw/content/datapages/stock04_data13.html
Actividad con datos
. reg call_back black if female==0, robust

Linear regression Number of obs = 1124


F( 1, 1122) = 3.84
Prob > F = 0.0504
R-squared = 0.0034
Root MSE = .26131

------------------------------------------------------------------------------
| Robust
call_back | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
black | -.0304079 .0155236 -1.96 0.050 -.0608665 .0000507
_cons | .0886957 .0118669 7.47 0.000 .0654119 .1119794
------------------------------------------------------------------------------

. reg call_back black if female==1, robust

Linear regression Number of obs = 3746


F( 1, 3744) = 13.19
Prob > F = 0.0003
R-squared = 0.0035
Root MSE = .2747

------------------------------------------------------------------------------
| Robust
call_back | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
black | -.0326469 .0089878 -3.63 0.000 -.0502683 -.0150255
_cons | .0989247 .0069246 14.29 0.000 .0853484 .112501
------------------------------------------------------------------------------

https://media.pearsoncmg.com/ph/bp/bp_stock_econometrics_4_cw/content/datapages/stock04_data13.html
Actividad con datos
. reg call_back black if high==0, robust

Linear regression Number of obs = 2424


F( 1, 2422) = 4.76
Prob > F = 0.0292
R-squared = 0.0020
Root MSE = .2607

------------------------------------------------------------------------------
| Robust
call_back | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
black | -.0231023 .0105901 -2.18 0.029 -.0438688 -.0023358
_cons | .0849835 .0080133 10.61 0.000 .0692699 .1006971
------------------------------------------------------------------------------

. reg call_back black if high==1, robust

Linear regression Number of obs = 2446


F( 1, 2444) = 12.86
Prob > F = 0.0003
R-squared = 0.0052
Root MSE = .28193

------------------------------------------------------------------------------
| Robust
call_back | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
black | -.0408831 .0114009 -3.59 0.000 -.0632394 -.0185267
_cons | .1079313 .0088764 12.16 0.000 .0905253 .1253374
------------------------------------------------------------------------------

https://media.pearsoncmg.com/ph/bp/bp_stock_econometrics_4_cw/content/datapages/stock04_data13.html
Pilar Alcalde
3.9 Regresión lineal simple:
Variables binarias
Caravaggio, Narciso, 1599

También podría gustarte