Está en la página 1de 7

MICROECONOMETRÍA (EF73)

EXAMEN FINAL
Ciclo 2020-01

Profesor(es) : Luis Ledesma / César Mora


Sección(es) : EN73 / EX72 / EN7Z

Indicaciones:

o Las respuestas deberán ser desarrolladas de manera individual en un archivo de Word u otro procesador
de textos.
o Las partes de las respuestas en cuyo desarrollo se requieran operaciones matemáticas/ estadísticas,
podrán ser realizadas a mano. Dicha resolución deberá realizarse con lapicero azul o negro de forma
clara y ordenada. Se puede capturar la imagen de la resolución mediante escáner o fotografía, para luego
ser pegada/añadida en el archivo de respuestas en la sección que corresponda. Tener en cuenta que la
claridad de la imagen y el orden de presentación influirán en la calificación final.
o Para la resolución del examen, los estudiantes contarán con 2 horas, y al culminar tendrán que colgar su
archivo de respuestas en el aula virtual, incluyendo claramente sus datos antes de que venza el plazo
determinado.
o Sólo se deberá subir un archivo pdf por estudiante. Caso contrario, el examen no será evaluado.

PARTE 1: MANEJO DE CONCEPTOS (4 PUNTOS)

1. Responda al detalle las siguientes preguntas (2 puntos cada una)

a. Defina cuándo una variable dependiente es censurada y cuando es truncada. Proporcione un ejemplo
empírico para la presencia de truncamiento y censura de la variable dependiente en un modelo de
regresión.

Solución:

El truncamiento significa que una parte de la población no se muestrea. Por ejemplo, una encuesta
que sólo considera individuos por debajo de un nivel definido de ingresos; por lo tanto, no hay
información sobre las variables dependientes e independientes disponibles para el grupo excluido.
Por otro lado, la censura se daría si la variable dependiente no se observa por encima o por debajo
de un umbral, generándose que la medición de la variable sea acotada a un valor determinado; pero
que no involucra la exclusión de unidades observadas.

Un ejemplo de truncamiento sería si en una encuesta que recopila información de empresas, sólo
considere una submuestra de empresas con un volumen de ventas por debajo de cierto umbral, y
con ello, se procede a estimar un modelo de regresión para explicar el volumen de ventas en función
de los insumos de trabajo y capital. En el caso de la censura, no se acotaría a una submuestra de
empresas (no habría exclusión en la muestra), no obstante, el rango del volumen de ventas podría
estar limitado a un intervalo determinado o a un umbral (por ejemplo, volumen de ventas mayores a
“Z”. se reportarían como “Z o más”).

Página 1 de 4
b. Explique detalladamente en qué circunstancias se presenta y cómo se podría corregir el problema
de sesgo de selección. ¿Qué condiciones permitirían usar dicha corrección?

Solución:

En términos generales, el problema de sesgo de selección parte del hecho de contar con una muestra
truncada, lo que representa la ausencia de información proveniente de una submuestra no incluida
en el análisis; en consecuencia, esto puede causar un sesgo (por ejemplo, en el caso de las muestras
autoseleccionadas). En este caso, se podría utilizar el modelo de Heckman para identificar y corregir
el sesgo de selección. No obstante, para estimar dicho modelo, es necesario contar con la
información de las variables explicativas de la submuestra excluida, es decir, de la submuestra que
no reporta valores en la variable dependiente. Esto permitirá estimar la función de selección,
generalmente estimada utilizando un modelo probit [Mayor puntaje si además se detalla los
supuestos del modelo de Heckman].

PARTE 2: ANÁLISIS APLICADO (10 PUNTOS)

2. (6 puntos) Una investigadora está estudiando los gastos anuales por concepto de salud en la población
peruana entre 25 y 65 años. Para ello cuenta con un panel balanceado de 3000 personas, observadas
por un período total de 5 años. Ella plantea la siguiente especificación:

Yit =  0 +  ( seguroit ) + i + vit

En dicha expresión el subíndice “i” representa a un individuo particular, mientras que el subíndice “t”
representa el año en el que se hizo la observación. Yit representa el gasto anual en servicios de salud
(en soles); mientras que seguroit es una dummy que toma el valor 1 si el individuo cuenta con seguro de
salud, y 0 en otro caso. Finalmente  i es un término que captura características no observables del
individuo “i” que son invariables en el tiempo; mientras que vit es un error independiente e idénticamente
distribuido.

Responda las siguientes preguntas:

a. La investigadora contrata un asistente de investigación, cuyos conocimientos en Econometría no son muy


sólidos. El asistente está pensando en estimar el parámetro  usando el comando “reg” en STATA, pero
antes de hacerlo consulta con usted que es un conocedor, luego de haber llevado el curso de
Microeconometría. ¿Cuál sería su consejo al respecto? Explique de forma detallada la respuesta. (2
puntos)

Solución:

La respuesta debe discutir las limitaciones del uso de modelos Pooled en cuanto a sus supuestos:
• La existencia de la heterogeneidad no observada, impide que se optimice la consistencia y eficiencia,
puesto que  2  0 . Se genera un problema de variable omitida no observada.

Por ende, la recomendación debe ser utilizar modelos para datos de panel:

Página 1 de 4
b. Gracias a su consejo, el asistente sabe ahora que la heterogeneidad no observada puede ser de
naturaleza fija o aleatoria; sin embargo, se siente confundido y no sabe cuál de ellas utilizar en el contexto
del modelo planteado. ¿Qué tipo de especificación le recomendaría usar para abordar la heterogeneidad,
y por qué? Explique claramente los supuestos de la opción elegida, y escriba el modelo final que el
asistente deberá plantear para estimar el parámetro de interés  . ¿Qué propiedades tendrá dicho
parámetro? (2 puntos)

Solución:

La respuesta debe presentar los supuestos del modelo elegido:

Efectos fijos: E  seguroiti   0, E  seguroit vis  = 0


Efectos aleatorios: E  seguroiti  = 0, E  seguroit vis  = 0

Cualquier respuesta es correcta, pero deben explicar por qué consideran que los eta se correlacionan o
no con la dummy de seguro.

El estimador obtenido será consistente siempre, mientras que su nivel de eficiencia dependerá del grado
de correlación de la variable “seguro” con los etas (heterogeneidad no observada) para el caso de efectos
fijos; mientras que para el caso de efectos aleatorios no será eficiente debido a la correlación serial y la
varianza.

c. La investigadora revisa la estimación que hizo su asistente y está de acuerdo. Sin embargo, para añadir
mayor robustez a los resultados encontrados, le pide que realice una comparación de sus resultados con
la alternativa de estimación no aplicada. ¿Cómo se aplicaría el test de comparación? Explique en qué
consiste dicho Test, así como las hipótesis a evaluar, y qué resultado es el que debería esperar el asistente
para que la estimación realizada en (b), efectivamente sea la mejor opción (2 puntos)

Solución:

Presentar y explicar el test de Hausman:

( FE (WG ) −  RE ( MCGF ) ) ' VFE (WG ) − VRE ( MCGF )  (  FE (WG ) −  RE ( MCGF ) )   k2

Hipótesis nula:
• Los efectos individuales NO están correlacionados con las variables exógenas (es decir existen efectos
aleatorios)
• En ese sentido, si se rechaza la H0 se debe aplicar Efectos Fijos
• Si la H0 no se rechaza, entonces es preferible utilizar la especificación de efectos aleatorios.

3. (4 puntos) Un grupo de egresados de la UPC expertos en microfinanzas han decidido establecer una
iniciativa de capacitación en negocios para pequeñas microempresarias que venden en pequeños
mercados de barrio. Como parte de su iniciativa ellos buscan apoyo de la municipalidad de Villa El
Salvador, pues dicha institución se encuentra a cargo de la gestión de dichos mercados. Los estudiantes

Página 1 de 4
están interesados en analizar cómo una capacitación de 48 horas brindada por ellos mismos, podrían
incrementar las ventas de las microempresarias, así como su nivel de ahorro.

Los estudiantes plantean la siguiente ecuación para analizar si su capacitación tiene efectos sobre dichas
variables de interés:

Yi =  0 +  Di +  X i + ui

Donde Yi representa a la variable de interés, Di es una variable dummy que toma el valor 1 si la
microempresaria recibe una capacitación, y 0 en otro caso; mientras que X i es un vector de
características observables (edad, sexo, nivel educativo, etc.) Finalmente, ui es un término de error con
las características deseadas.

a. Una limitación existente, es que los egresados no cuentan con financiamiento para llevar a cabo su
iniciativa, por lo que uno de ellos sugiere presentar su propuesta a diversas ONGs brindando
evidencia de que funciona. La egresada Carlita sugiere utilizar la ENAHO e identificar en ella a las
microempresarias en dicha base de datos, y definir como “tratadas” a aquellas que han recibido
alguna capacitación de al menos diez horas, y como “control” a todas las demás que no hayan
recibido capacitación. Ella afirma que de este modo podría encontrar el efecto de la capacitación
realizando la estimación previamente presentada.
¿Qué opina usted de dicha propuesta? Brinde su opinión técnica con argumentos referentes a los
supuestos del modelo, la muestra bajo análisis y las potenciales debilidades de los estimadores
propuestos usando ecuaciones mostrando su explicación con el mayor detalle posible haciendo
referencia a las variables utilizadas. (2 puntos)

Solución:
Usar dichos datos no asegura el cumplimiento del supuesto de independencia incondicional, pues la
variable de tratamiento no es independiente de las características observables y no observables de
las mujeres.
La propuesta es inadecuada, pero podría ser corregida si se utiliza métodos Cuasi experimentales
como el Propensity Score Matching bajo el cumplimiento del supuesto de independencia condicional.

b. Luego de algunas semanas, los estudiantes obtienen financiamiento de una empresa privada, el cual
les permitirá realizar encuestas a 1000 microempresarias. Si la municipalidad de Villa El Salvador se
ofrece a ayudarles con las tareas logísticas y de coordinación con las microempresarias para
aplicarles las encuestas de recojo de información, y les brinda en préstamo un local equipado para
las capacitaciones.
Según lo descrito, ¿se podrá realizar un estudio experimental?, ¿qué condiciones se tendrían que
cumplir? ¿cómo usted abordaría dicho estudio? (2 puntos)

Solución:
Sí se podría realizar un estudio experimental si es que la capacitación es asignada de manera
aleatoria (cumplimiento de la independencia incondicional), añadido a un escenario en que se cumpla
el perfect compliance, es decir que todas las mujeres asignadas aleatoriamente participen, y las que
fueron asignadas al grupo de control no participen de la capacitación.

Página 1 de 4
Se levantaría información de línea de base sobre las ventas y otras variables, previa a la capacitación
(tratamiento) y luego de brindada la capacitación y unos meses, se podría aplicar una segunda ronda
de encuestas para conocer cómo cambiaron las variables de interés gracias al tratamiento aplicando
una regresión usando la ecuación brindada:

Yi =  0 +  Di +  X i + ui

PARTE 3: ANÁLISIS DE RESULTADOS DE REGRESIÓN (6 puntos)

4. Imagine que tiene acceso a datos de encuestas telefónicas cuyo objetivo fue determinar la demanda de
una manzana "ecológicamente amigable". Cada familia recibió (al azar) un conjunto de precios para las
manzanas normales y las manzanas con etiqueta ecológica. Se les preguntó cuántos kilos (kg.) de cada
tipo de manzana comprarían. Su objetivo es analizar la demanda de manzanas ecológicas.

a. Usted toma los datos y realiza un primer análisis exploratorio de la cantidad demandada reportada
de manzanas con etiqueta ecológica, como en la siguiente tabla:

donde: ecolbs = cantidad demandada de manzanas ecológicas

Como ecolbs se utilizará como variable dependiente en el análisis, ¿qué tiene de particular su
distribución? ¿Qué implicaría si estas observaciones se estiman con un modelo OLS y con el modelo
Tobit? (1.5 puntos)

Solución:

Hay 248 observaciones en la muestra con cantidad demandada 0, es decir no hubo demanda de
dicho producto en 248 casos. Esta concentración de datos alrededor de cero (punto de masa) se
debe al hecho de que la cantidad demandada es registrada recién cuando se realiza al menos una
compra (ecolbs > 0). Por lo tanto, el modelo presenta una variable dependiente con valores de rango
limitado; siendo recomendable la utilización de un modelo Tobit en vez de un modelo OLS, dada la
presencia de un punto de masa. Si bien el uso del método OLS permite predecir valores para la
Página 1 de 4
variable dependiente, estos pueden resultar negativos; asimismo, las estadísticas de inferencia sólo
podrían ser válidas asintóticamente, ya que la distribución de errores no es normal. Además, los
números reportados parecen estar redondeados a 1/3, 1/2 o 2/3; por lo tanto, la variable ecolbs
aparentaría no tiene una distribución continua. Esto también viola la suposición de errores normales,
pero en este caso también violaría la suposición del modelo Tobit.

b. Considerando los resultados de la siguiente salida:

donde: ecolbs = cantidad demandada de manzanas ecológicas


ecoprc = precio de las manzanas con etiqueta ecológica
regprc = precio de manzanas regulares
faminc = ingreso familiar, miles
hhsize = tamaño del hogar

¿Qué variables son significativas al nivel del 1%? Discuta los signos de los coeficientes en las
variables de precio. ¿Qué puede decir acerca de la magnitud de los efectos estimados de las
variables sobre la cantidad demandada? (1.5 puntos)

Solución:

Sólo las variables de precio, ecoprc y regprc, son estadísticamente significativas al nivel del 1%. Los
signos de los coeficientes de precios concuerdan con la teoría básica de la demanda: el efecto del
precio propio es negativo y el efecto del precio cruzado para el bien sustituto (manzanas normales)
es positivo. Los coeficientes del modelo del modelo Tobit no son informativos para la magnitud del
efecto parcial, pero se puede considerar los signos de los coeficientes para determinar el sentido o
la dirección del efecto parcial de las variables explicativas con la dependiente (es por ello que se
pudo realizar el análisis de los signos en la relación de los precios con la demanda).

c. Si se re-estima el modelo mediante OLS, obtenemos los siguientes resultados:

Página 1 de 4
¿Por qué las estimaciones OLS son más pequeñas que las estimaciones del modelo Tobit? En
términos de bondad de ajuste, ¿es el modelo Tobit mejor que el modelo lineal clásico? (1.5 puntos)

Solución:

Las estimaciones de OLS son más pequeñas que las estimaciones de Tobit porque las estimaciones
de OLS son efectos parciales estimados en E(ecolbs | X), mientras que los coeficientes de Tobit se
deben escalar para que sean comparables. En esta aplicación, los factores de escala parecen ser
pequeños. Asimismo, el modelo Tobit y el modelo OLS no serían comparables en términos de bondad
de ajuste, dado que el primer caso estamos ante un modelo no lineal (pseudo R cuadrado de
McFadden), mientras que el segundo, está basado estrictamente en un modelo lineal (R cuadrado
convencional).

d. Evalúe la siguiente afirmación: “Debido a que el R cuadrado en los resultados anteriores son muy
pequeños, los efectos estimados del precio son probablemente inconsistentes”. (1.5 puntos)

Solución:

Esta declaración no es correcta. En el presente caso, el análisis se podría enfocar en los efectos
del precio ceteris paribus (porque las variables de precio están establecidas de manera exógena),
sin embargo, no necesariamente podríamos explicar la mayor parte de la variación en ecolbs con las
variables explicativas consideradas en el modelo. En efecto, no es muy sorprendente encontrar que
la demanda de un producto ficticio, sea difícil de explicar.

Página 1 de 4

También podría gustarte