Está en la página 1de 5

Tarea: Modelos que incorporan variables

dicotómicas explicativas
Competencias:
El alumno estará en capacidad de estimar e interpretar los resultados de modelos
utilizando variables dicotómicas explicativas. Igualmente, podrá analizar el modelo como
un todo, tratando de comprobar correcta especificación.

Descripción de la Tarea:
A partir de las bases de datos que descargó con Gretl, desarrolle los siguientes ejercicios
y organice sus respuestas en un único archivo Word respetando el orden de las
preguntas. Incluya su nombre y apellido en la primera página. Por favor, lea y siga
cuidadosamente las instrucciones.

1. Un estudio llevado a cabo por la Federal Deposit Insurance Corporation (FDIC),


utiliza información de 91 bancos para analizar los factores que afectan el tiempo
que la FDIC gasta en examinar el desempeño de los bancos (Y, horas). La
variable Y entra al modelo en logaritmo (LnY), al igual que algunas de las
explicativas (prefijo Ln), en cuyo caso los coeficientes son elasticidades. En los
casos en los que las variables explicativas no están en logaritmo, los coeficientes
son semi-elasticidades (deben multiplicarse por 100 a la hora de interpretar). El
modelo resultante es:

LnY = 2.41 + 0.367 LnX1 + 0.222 LnX2 + 0.08 LnX3 – 0.175 D1 + 0.279 D2 +
0.563 D3 + 0.257 Z1 + U

R2= 0.766

Todas las variables, excepto D1, son estadísticamente significativas (recuerde que
basta que una cualidad sea significativa para que la variable también lo sea). Para
las variables explicativas:
X1: total de activos del banco
X2: número de oficinas que tiene el banco
X3: cociente entre los préstamos en riesgo de default y el total de préstamos del
banco
D1=1 si el manejo del banco bueno, cero en otro caso
D2=1 si el manejo del banco es adecuado, cero en otro caso
D3=1 si el manejo del banco es satisfactorio, cero en otro caso. Note que la
categoría de control es que el manejo del banco es malo.
Z1=1 si la inspección al banco se realiza conjuntamente con autoridades del
gobierno, cero en otro caso. Se pide que interprete los resultados (coeficientes y
ajuste). (3 puntos).

LnX = X1 + X2 Bancos + X3tiempo =D1

1 tiempo
D1 =

0 Bancos

En cuanto mayor tiempo en promedio el banco comparado con el tiempo cambia el


promedio el manejo de los activos del banco en cada año y los préstamos en
riesgo de default y el total de préstamos del banco.

LnX = X1 + X2 (Bancos 1 + tiempo 1) + Tiempo2+ X3 + D3

Cuanto más (menos) gana en promedio el tiempo por cada año de experiencia en
el banco.

INFt = X1 + X2 Z1t +X3+Dt + Xt D* Z2t +Ut

En cuanto la dirección de tiempo en la que gasta en examinar el desempeño de


los bancos es significativa sobre la variable de experiencia por año. los bancos
promedio son semi-elasticidades en tiempo logaritmo, los coeficientes se
desarrollan a un alza exponencial del préstamo total.
2. Para el modelo que estimó en la pregunta 1c de la tarea de la semana 4, pruebe la
correcta especificación del modelo y comente los resultados. Incluya hipótesis,
estadístico de prueba y decisión. (1 punto).
Ayuda: Para llevar a cabo el test de Ramsey, desde la pantalla de la salida de la
estimación vaya a CONTRASTES/RESET de Ramsey.

Modelo 1: MCO, usando las observaciones 1-57


Variable dependiente: cost
Desviaciones tipicas robustas ante heterocedasticidad, variante HC1

Coeficiente Desv. TÃpica Estadistico t valor p


const -796,075 142,170 -5,599 <0,0001 ***
miles 53,4507 3,22358 16,58 <0,0001 ***

Media de la vble. dep. 1426,632 D.T. de la vble. dep. 1151,186


Suma de cuad. residuos 10501755 D.T. de la regresión 436,9680
R-cuadrado 0,858491 R-cuadrado corregido 0,855919
F(1, 55) 274,9343 Valor p (de F) 4,69e-23
Log-verosimilitud -426,4135 Criterio de Akaike 856,8271
Criterio de Schwarz 860,9132 Crit. de Hannan-Quinn 858,4151

Contraste de especificación RESET -


Hipótesis nula: [La especificación es adecuada]
Estadístico de contraste: F(2, 53) = 48,5943
con valor p = P(F(2, 53) > 48,5943) = 1,02902e-012
lp

Regresión auxiliar para el contraste de especificación RESET


MCO, usando las observaciones 1-57
Variable dependiente: cost

coeficiente Desv. típica Estadístico t valor p


--------------------------------------------------------------
const −87,0533 109,063 −0,7982 0,4283
miles 8,91416 5,86259 1,521 0,1343
yhat^2 0,000476511 0,000120272 3,962 0,0002 ***
yhat^3 −4,94739e-08 3,05565e-08 −1,619 0,1114

Estadístico de contraste: F = 48,594339,


con valor p = P(F(2,53) > 48,5943) = 1,03e-012
a. El archivo de datos bwght.gdt del fichero de datos Kde Wooldridge contiene
información acerca del peso de recién nacidos (bwghtlbs, en libras) y el
hábito de fumar de la madre, además de otros factores que pueden afectar
el peso del bebé. Se pide:
b. Corra la regresión de bwghtlbs en función de male (toma valor 1 para
varones, cero en otro caso), white (toma valor 1 para recién nacidos de
raza blanca, cero en otro caso), cigs (número de cigarrillos fumados por la
madre por día durante el embarazo) y faminc (ingreso de la familia, en
miles de dólares). Muestre los resultados (1 punto).

Modelo 1: MCO, usando las observaciones 1-1388


Variable dependiente: male

Coeficiente Desv. Típica Estadístico t valor p


const 0,566304 0,0328618 17,23 <0,0001 ***
white −0,00940272 0,0342736 −0,2743 0,7839
cigs −0,00073562 0,00228229 −0,3223 0,7473
faminc −0,00125739 0,000763573 −1,647 0,0998 *

Media de la vble. dep. 0,520893 D.T. de la vble. dep. 0,499743


Suma de cuad. residuos 345,5501 D.T. de la regresión 0,499675
R-cuadrado 0,002436 R-cuadrado corregido 0,000274
F(3, 1384) 1,126775 Valor p (de F) 0,337011
Log-verosimilitud −1004,493 Criterio de Akaike 2016,985
Criterio de Schwarz 2037,928 Crit. de Hannan-Quinn 2024,817

Sin considerar la constante, el valor p más alto fue el de la variable 9 (White)

c. Interprete los coeficientes (2 puntos).


d. Pruebe la correcta especificación del modelo. Muestre los resultados del
test de Ramsey, las hipótesis y su conclusión (1 punto).
e. ¿Fumar afecta de manera estadísticamente significativa el peso del recién
nacido? Muestre con base en qué soporta su respuesta (1 punto).
f. Hasta ahora, el modelo solo le permite medir el efecto de la raza y del sexo
del bebé, por separado. ¿Qué debería hacer para incluir en el modelo el
efecto de ambas variables simultáneamente? Explique la manera de
construir la nueva variable, si es necesario y muestre cómo luciría el nuevo
modelo (1 punto).