Está en la página 1de 6

Econometría básica

Taller #1
(Soluciones)
1. Suponga que la universidad le pide que encuentre la relación entre horas semanales estudiando ( ) y horas semanales
trabajando ( ). ¿Tiene sentido caracterizar este problema como estudio causa trabajo o como trabajo causa estudio?
Explique.
Tenemos dos posibilidades
Estudio causa trabajo
Trabajo causa estudio
Cualquiera de estas elecciones tiene problemas. Los estudiantes tienen una cantidad de horas a la semana fijas para
dedicar a estudio o trabajo. La elección de la fracción de tiempo que cada estudiante decida dedicar a cada actividad
depende de sus preferencias (habilidad, gusto por el estudio/trabajo, antecedentes educativos familiares) como de
sus restricciones (presupuesto familiar, mercado laboral). Pero, en cualquier caso, es difícil argumentar que una
persona que una persona trabaje porque estudia o estudia porque trabaja. Por ello, ambas opciones son equivocadas.

1
2. Usualmente se considera que el entrenamiento de los empleados es importante para incrementar su productividad. Suponga
que le encargan evaluar si más entrenamiento incrementa la productividad de los trabajadores. Pero, en vez de tener datos
de los trabajadores, usted tiene datos a nivel de firma. En particular, para cada firma, usted tiene información sobre la
cantidad de horas por trabajador (entrenamiento) y el número de unidades producidas sin defectos por hora por trabajador
(producción)
(i) Escriba claramente la idea ceteris paribus detrás de esta pregunta de investigación.
Un efecto ceteris paribus de una variable sobre otra es el efecto que ésta tiene manteniendo todos los otros factores
fijos o constantes. Un análisis ceteris paribus del efecto del entrenamiento de los trabajadores sobre su productividad
sería insesgado siempre que no existan otros factores que otros factores estén correlacionados con estas variables. Es
decir, si dos firmas son exactamente iguales, con excepción del número de horas de entrenamiento, entonces
cualquier diferencia en la productividad de sus trabajadores puede ser calificada como el efecto del entrenamiento en
la productividad.
(ii) ¿Le parece que la decisión de la empresa de capacitar a sus trabajadores sea independiente de las características de
éstos? ¿cuáles son algunas de estas características observables y no observables de estos trabajadores?
Lo más seguro es que la firma elija qué trabajadores entrenar en función de sus características. Estas pueden incluir
cosas medibles como educación, experiencia y productividad. Otras pueden ser características no observables como
habilidad, perseverancia y compromiso.
(iii) Nombre un factor, que no sea una característica de los trabajadores, que influya en su productividad. Explique.
La productividad del trabajador no depende únicamente de sus propias características. Factores tales como la
tecnología, el capital disponible y la calidad de sus supervisores es clave. Mayor capacidad tecnológica y capital
disponible puede permitir una mayor productividad obtenida del trabajador. De igual forma, bajo una buena
supervisión, es menor probable que el trabajador haga un mal trabajo.
(iv) Si encontrase una correlación positiva entre producto y entrenamiento ¿usted habría encontrado de forma convincente
que mayor entrenamiento lleva a mayor productividad? Explique.
Encontrar entre entrenamiento y productividad de los trabajadores es insuficiente para establecer una relación causal
entre estas variables. Una posibilidad es que las firmas más productivas atraen a los trabajadores más productivos a
los que, adicionalmente, entrena más. Es decir, puede que las firmas productivas entrenen más a sus trabajadores
para asegurarse que sean productivos, pero si estos trabajadores son productivos desde antes de tomar el
entrenamiento, puede que esto sea solo una pérdida de tiempo (o incluso sea negativo para los trabajadores).

2
Con Stata
3. Utilice los datos en GEIH.dta para el siguiente ejercicio.
(i) Utilice el comando para describir el contenido de la base.

Con el comando obtenemos lo siguiente


. describe

Contains data from C:\Users\adria\Dropbox\Work\Javeriana\clases\econometría básica\data\process\geih.dta


obs: 778,238
vars: 27 27 Jan 2019 19:26
size: 35,020,710

storage display value


variable name type format label variable label

anio int %9.0g año


mes byte %9.0g mes
area byte %10.0g area urbano/rural
dpto byte %18.0g dpto departamento
ciudad byte %15.0g ciudad ciudad
edad int %9.0g edad
genero byte %9.0g gender género
e_civil byte %40.0g e_civil estado civil
relacion byte %26.0g relacion relación con el/la jefe/a de hogar
estrato byte %9.0g estrato
edu_anios byte %8.0g años de educación
edu_nivel byte %23.0g edu_level
nivel de educación
en_f_laboral byte %10.0g inlf participación laboral
estado_laboral byte %21.0g labor_state
labor state in main occupation
antig_firm int %9.0g tenure in firm (months)
horas_semana int %9.0g horas trabajadas a la semana
sector1d byte %55.0g sector1d sector ISIC Rev3 1 digit
anio_mes int %tm Year-Month
salario_hora float %9.0g salario por hora en pesos
salario_mes float %9.0g salario por mes en pesos
lsalario_mes float %9.0g
lsalario_hora float %9.0g
exp int %9.0g
hombre byte %9.0g
mujer byte %9.0g
casado byte %9.0g
genero_casado byte %14.0g genero_casado

Sorted by:

Que nos aporta información sobre las características de cada una de las variables en la base.
(ii) Encuentre el promedio de horas semanales trabajadas promedio en la muestra. ¿Cuáles son el número de horas máximo
y mínimo? (Ayuda: Utilice el comando )

La información de horas trabajadas está contenida en la variable _ . Utilizando el comando


en esta variable tenemos
. summarize horas_semana

Variable Obs Mean Std. Dev. Min Max

horas_semana 356,485 44.9201 16.8116 1 130

Donde vemos que las horas semanales trabajadas promedio es de 44.9 horas. El mínimo es de una hora y el máximo
de 130.

3
(iii) ¿Cuántos hombres y mujeres hay en la muestra? ¿Cuáles son los porcentajes respectivos? (Ayuda: Utilice el comando
)

La variable de sexo se encuentra contenida en la variable . Utilizando el comando en esta variable


tenemos
. tab genero

género Freq. Percent Cum.

Male 367,123 47.17 47.17


Female 411,115 52.83 100.00

Total 778,238 100.00

Donde vemos que hay 367,123 hombres y 411,115 mujeres en la muestra, con porcentajes respectivos de 47.2% y 52.8%.
(iv) Encuentre el promedio de horas semanales trabajadas promedio de hombres y mujeres. ¿Qué grupo trabaja más horas?
¿Qué cree que explique esto? (Ayuda: Utilice el comando )

Utilizando las variables _ y en el comando tenemos


. table genero, c(mean horas_semana)

género mean(horas_~a)

Male 48.8087
Female 40.22174

Donde vemos que los hombres trabajan un promedio de 48.8 horas, mientras que el promedio respectivo para las
mujeres es de 40.2. Esto claramente indica una diferencia aproximada de 8.6 horas en favor de los hombres. Existen
diversas explicaciones para este fenómeno. La clásica se relaciona con la división de tareas al interior del hogar en
función del género, donde el hombre trabaja más tiempo mientras la mujer dedica mayor cantidad de horas a las
tareas del hogar.

4
4. Use los datos en BWGHT.dta para responder esta pregunta.
(i) Utilice el comando para describir el contenido de la base.
Usando el comando describe obtenemos
. describe

Contains data from C:\Users\adria\Dropbox\Work\Javeriana\clases\econometría básica - pregrado\data\original\wooldridge\BWGHT.DTA


obs: 1,388
vars: 14 3 Jun 1997 13:47
size: 49,968

storage display value


variable name type format label variable label

faminc float %9.0g 1988 family income, $1000s


cigtax float %9.0g cig. tax in home state, 1988
cigprice float %9.0g cig. price in home state, 1988
bwght int %8.0g birth weight, ounces
fatheduc byte %8.0g father's yrs of educ
motheduc byte %8.0g mother's yrs of educ
parity byte %8.0g birth order of child
male byte %8.0g =1 if male child
white byte %8.0g =1 if white
cigs byte %8.0g cigs smked per day while preg
lbwght float %9.0g log of bwght
bwghtlbs float %9.0g birth weight, pounds
packs float %9.0g packs smked per day while preg
lfaminc float %9.0g log(faminc)

Sorted by:

Donde se observa que tenemos una base con 1,388 observaciones y 14 variables. También vemos que estas variables
se refieren, entre otras, a peso del bebé al nacer, cigarrillos fumados durante embarazo y otras variables
socioeconómicas de la madre.
(ii) ¿Cuántas mujeres hay en la muestra? ¿cuántas han fumado durante su embarazo?
Vemos que hay 1388 observaciones en las variables y no tenemos ninguna variable que indique sexo, por lo que
debemos suponer que estas 1388 corresponden a mujeres. En cambio, observe que si se tiene una variable que
indica el número de cigarrillos que la madre fumó. La forma más sencilla de usar esta variable es por medio del
comando
. tab cigs

cigs smked
per day
while preg Freq. Percent Cum.

0 1,176 84.73 84.73


1 3 0.22 84.94
2 4 0.29 85.23
3 7 0.50 85.73
4 9 0.65 86.38
5 19 1.37 87.75
6 6 0.43 88.18
7 4 0.29 88.47
8 5 0.36 88.83
9 1 0.07 88.90
10 55 3.96 92.87
12 5 0.36 93.23
15 19 1.37 94.60
20 62 4.47 99.06
30 5 0.36 99.42
40 6 0.43 99.86
46 1 0.07 99.93
50 1 0.07 100.00

Total 1,388 100.00

Donde vemos que 1176 mujeres no fumaron, resultando en que − = que si lo hicieron.

5
(iii) ¿Cuál es el número promedio de cigarrillos fumados por día? ¿es el promedio una buena medida de la mujer “típica”
en este caso? Explique.

Para ver el número promedio de cigarrillos fumados por día simplemente usamos en comando sum en
. sum cigs

Variable Obs Mean Std. Dev. Min Max

cigs 1,388 2.087176 5.972688 0 50

De donde tenemos un promedio de 2.09 mujeres que no fumaron. En este promedio debemos considerar que hay una
gran mayoría de mujeres que no fuman, es decir, 1176 de 1388 mujeres tienen = .
(iv) Entre las mujeres que fumaron durante su embarazo ¿cuál es el número promedio de cigarrillos fumados por día?
¿cómo se compara con su respuesta en (iii) y por qué?
Si, en cambio, estimamos el promedio para las mujeres fumadoras tenemos
. sum cigs if cigs > 0

Variable Obs Mean Std. Dev. Min Max

cigs 212 13.66509 8.690907 1 50

De donde tenemos un promedio de 13.7, mucho más alto que para todas las mujeres. Esto ocurre porque estamos
descartando a la gran mayoría de mujeres con = .

(v) Encuentre el promedio de ℎ en la muestra. ¿Por qué hay solo 1192 observaciones que se usan para obtener
este promedio?

Ahora usamos el comando sum en


. sum fatheduc

Variable Obs Mean Std. Dev. Min Max

fatheduc 1,192 13.18624 2.745985 1 18

Obteniendo un promedio de 13.2. La razón de que tenemos solo 1192 observaciones es porque no tenemos información
sobre educación del padre para 196 observaciones, las cuáles son excluidas del cálculo del promedio de .
. count if fatheduc == .
196

Nota: En Stata se registra “dato faltante” o “missing” con un punto (.) en la observación.
(vi) Reporte el ingreso familiar promedio y su desviación estándar en dólares.

Para esto usamos el comando sum en


. sum faminc

Variable Obs Mean Std. Dev. Min Max

faminc 1,388 29.02666 18.73928 .5 65

Donde vemos que el ingreso familiar promedio es de 29.027 y su desviación estándar es de 18.739, ambas medidas en
miles de dólares (observe el describe). Esto significa que el ingreso promedio, en dólares, es de 29,027 y su desviación
estándar 18,739.

También podría gustarte