Está en la página 1de 10

Solemne de Econometría I

Tiempo: 120 minutos

Semestre Otoño 2019


Profesores: Fernando Díaz
Víctor Macías
Ayudantes: Sebastián González
Juan Felipe Ly
Mauricio Vásquez

Pregunta 1 (30 puntos)


Considere el siguiente modelo:

Yi = α + βXi + ui

donde ui es independiente e idénticamente distribuido con media 0 y varianza σ 2


La variable X tiene las siguientes realizaciones: X1 = 1, X2 = 2, X3 = 3, X4 = 4, X5 = 5, X6 = 6.
Un econometrista estima la pendiente de esta regresión usando la siguiente expresión:

1
β̂ = (Y6 + Y5 − Y2 − Y1 )
8

(a) (15 puntos) Muestre que este estimador es insesgado


(b) (15 puntos) Derive su varianza y compare su varianza respecto al estimador de mínimos cuadrados
ordinarios. ¿Cuál estimador es más eficiente?

Solución:

(a) βb = 18 (α + 6β + u6 + α + 5β + u5 − α − 2β − u2 − α − β − u1 )

βb = 18 (8β + u6 + u5 − u2 − u1 )

βb = β + 18 (u6 + u5 − u2 − u1 )
b = β, porque E(ui ) = 0, ∀ i
E(β)
Por lo tanto, el estimador es insesgado.

1
(b) La varianza del estimador β̂ = 81 (Y6 + Y5 − Y2 − Y1 ) es:

2 2
b = 1 V ar(u6 + u5 − u2 − u1 ) = 4σ = σ
V ar(β)
64 64 16
donde cov(ui , uj ) = 0, ∀ i 6= j. La varianza del estimador de MCO es:

σ2 2σ 2
V ar(βbM CO ) = PN =
i=1 (xi − x)
2 35
PN 35
donde i=1 (xi − x)2 = 2 .
σ2 2σ 2
Dado que 16 > 35 , entonces βbM CO es más eficiente.

2
Pregunta 2 (15 puntos)
Un investigador considera que la relación entre consumo (Ct ) e ingreso (It ) debe ser estrictamente propor-
cional. Por ello, plantea el siguiente modelo:

Ct = β1 It + ut

(a) (10 puntos) Determine el estimador de MCO de β1


PT
(b) (5 puntos) ¿Se cumple i=1 ût = 0? Justifique su respuesta.

Solución:

(a) El problema a resolver es:

T
X
min (Ct − βb1 It )2
β1 i=1
b

y la condición de primer orden es:

T
X
−2 (Ct − βb1 It )It = 0
i=1

Despejando βb1 , se tiene:

PT
C t It
βb1M CO = Pi=1
T 2
i=1 It

PT PT
(b) i=1ût = 0 no necesariamente se cumple, ya que en este caso no se tiene la ecuación normal i=1 ût =
0 como ocurre en el modelo que se estima con un intercepto.

3
Pregunta 3 (25 puntos)
Considere el siguiente modelo de regresión lineal simple:

y = αyx + βyx x + u
donde αyx y βyx son parámetros (constantes) y u es un término de error. El siguiente modelo invierte los
roles de las variables x e y:

x = αxy + βxy y + v
donde αxy y βxy son parámetros (constantes) y v es un término de error.
Suponga que ambos modelos se estiman por Mínimos Cuadrados Ordinarios usando una muestra aleatoria
de tamaño n.

(a) (10 puntos) Muestre que el estadígrafo R2 obtenido de una regresión en que y es la variable dependiente
(o explicada) y x es la variable independiente (o explicativa) puede expresarse como:

Pn
2 [ (xi − x)(yi − y)]2
Ryx = Pn i=1 2
Pn 2
i=1 (xi − x) i=1 (yi − y)

(b) (5 puntos) Muestre formalmente que:

βbyx βbxy = R2

donde βbyx es el estimador MCO de una regresión de y sobre x, βbxy es el estimador MCO de una regresión de
x sobre y y R2 = Ryx 2 2
= Rxy (Ayuda: No necesita haber contestado (a) para responder esta pregunta. Puede
2
usar la expresión para Ryx de la pregunta anterior).

(c) (10 puntos) Las siguientes cantidades fueron calculadas a partir de una muestra de 200 observaciones:

n
X n
X n
X n
X n
X
xi = 11, 34 yi = 20, 72 x2i = 12, 16 yi2 = 84, 96 xi yi = 22, 13
i=1 i=1 i=1 i=1 i=1

Estime βbyx , βbxy para esta muestra en particular y obtenga el R2 usando la relación demostrada en (b).

Solución:

(a) Por definición,


Pn 2
2 yi − y)
(b
Ryx = Pni=1 2
i=1 (yi − y)
donde

4
ybi = βb0yx + βbyx xi

= y − βbyx x + βbyx xi

= y + βbyx (xi − x)
2
Reemplazando en la definición de Ryx ,
Pn 2
2 2 (xi − x)
Ryx = βyx Pi=1
b
n 2
i=1 (yi − y)

El estimador βbyx es por definición


Pn
i=1(xi − x) (yi − y)
βbyx = Pn 2
i=1 (xi − x)

Reemplazando arriba, obtenemos

"P #2 P
n n 2
2 i=1(xi − x) (yi − y) i=1 (xi − x)
Ryx = Pn 2 P n 2
i=1 (xi − x) i=1 (yi − y)
Pn 2
2 [ (xi − x) (yi − y)]
Ryx = Pn i=1 2 P n 2
i=1 (xi − x) i=1 (yi − y)

(b) Usando las definiciones de βbyx y βbxy ,

"P # "P #
n n
(xi − x) (yi − y)
i=1 i=1 (xi − x) (yi − y)
βbyx · βbxy = Pn 2 Pn 2
i=1 (xi − x) i=1 (yi − y)
Pn 2
[ i=1 (xi − x) (yi − y)]
= Pn 2 Pn 2
i=1 (xi − x) i=1 (yi − y)

(c)

Pn
(xi − x) (yi − y)
i=1
βbyx = Pn 2
i=1 (xi − x)
Pn
( xi yi ) − nxy
= Pi=1
n
( i=1 x2i ) − nx2

Usando los datos proporcionados,

5
Pn
i=1 xi 11, 34
x = =
n 200

= 0, 0567
Pn
i=1 yi 20, 72
y = =
n 200

= 0, 1036

Sustituyendo arriba,

22, 13 − 200 (0, 0567) (0, 1036)


βbyx = 2
12, 16 − 200 (0, 0567)
20, 955176
=
11, 517022

= 1, 820

Procedemos del mismo modo para obtener βbxy

Pn
i=1(xi − x) (yi − y)
βbxy = Pn 2
i=1 (yi − y)
Pn
( xi yi ) − nxy
= Pi=1
n
( i=1 yi2 ) − ny 2

Usando los datos proporcionados,

22, 13 − 200 (0, 0567) (0, 1036)


βbxy = 2
84, 96 − 200 (0, 1036)
20, 955176
=
82, 813408

= 0, 253

El R2 es por definición igual a

Pn 2
2 [(xi − x) (yi − y)]
i=1
R = Pn 2 Pn 2
i=1 (xi − x) i=1 (yi − y)
Pn 2
[( i=1 xi yi ) − nxy]
=  Pn n
( i=1 x2i ) − nx2 ( i=1 yi2 ) − ny 2
  P 

Usando los datos proporcionados,

6
20, 9551762
R2 =
11, 517022 · 82, 813408

= 0, 4604

Puede verificarse que


βbyx · βbxy = 0, 4604

7
Pregunta 4 (30 puntos)
Un analista político de la oposición está estudiando si los gastos de campaña afectan los resultados de las
elecciones. Dado que desde el gobierno se trabaja en un proyecto de ley que establece que todos los gastos
de campaña deben ser financiados con fondos públicos, los resultados del estudio pueden ser muy relevantes
para la aprobación de este proyecto. El modelo general que el analista ha estimado es el siguiente:

voteA = β1 + β2 lexpendA + β3 lexpendB + β4 prtystrA + µ (1)

donde voteA es el porcentaje de votos recibidos por el candidato A , expendA y expendB son los gastos del
campaña del candidato A y del candidato B, respectivamente y prtystrA es una medida de la popularidad
del partido del candidato A, medida como el porcentaje de votos que obtuvo el partido del candidato A en
la elección presidencial más reciente. En la ecuación (1), lexpendA y lexpendB corresponden al logaritmo
natural de los gastos del campaña del candidato A y B, respectivamente. El Cuadro 1 presenta la estadística
descriptiva para las variables del estudio. En el Gráfico 1, se presentan los gráficos de dispersión entre las
mismas.

Los resultados de las estimaciones preliminares que ha llevado a cabo el analista son los siguientes:

8
El analista ha estimado un modelo de regresión simple para cada una de las variables explicativas contra
voteA (modelos (1) al (3)), una especificación en que voteA se estima utilizando como variables explicativa los
gastos de campaña de ambos candidatos (modelo (4)) y finalmente una especificación que incluye, además,
la medida de la popularidad del partido del candidato A (modelo 5) y que corresponde al modelo general
presentado en la ecuación (1). Los resultados de estas estimaciones se presentan en el Cuadro 2. La matriz
de varianzas y covarianzas para la estimación del modelo (5) se presenta en el Cuadro 3.
En base a estos resultados:

(a) (5 puntos) Comente respecto de los resultados obtenidos por el analista: ¿Tienen los coeficientes
obtenidos los signos esperados? En particular, ¿cómo se relacionan los resultados de las estimaciones
de los modelos (1), (2) y (3) con los gráficos de dispersión presentados en el gráfico 1? ¿Son consistentes?
Explique sus respuestas.
(b) (5 puntos) Comparando los resultados obtenidos para los modelos (4) y (5), ¿le parece a usted que la
popularidad del partido del candidato A es relevante para explicar el porcentaje de votos recibidos por
ese candidato? ¿Le parece a usted que esta variable debe ser considerada? ¿Puede testear formalmente
su respuesta? Si puede, establezca la forma del test, incluyendo el estadígrafo de prueba, las hipótesis
nula y alternativa, la distribución muestral del estadígrafo de prueba bajo la nula, sus grados de libertad
y los criterios de no rechazo o rechazo.
(c) (5 puntos) ¿Cuál es la interpretación del coeficiente β1 (intercepto o constante)? Al analista le preocupa
el hecho de que el estimador de la constante es muy diferente entre el modelo (1) y los modelos (4) y
(5). ¿Puede explicar por qué sucede esto?
(d) (5 puntos) En base a los resultados obtenidos para el modelo (5), lleve a cabo un test de significancia
global del modelo utilizando el estadístico R2 . En su respuesta, establezca la forma del test, incluyendo

9
el estadígrafo de prueba, las hipótesis nula y alternativa, la distribución muestral del estadígrafo de
prueba bajo la nula, sus grados de libertad y los criterios de no rechazo o rechazo.
(e) (5 puntos) Construya un intervalo de confianza al 10% para el coeficiente de la variable lexpendA
obtenida en el modelo (5).
(f) (5 puntos) Utilizando los resultados del modelo (5), testee la siguiente afirmación: “Un aumento del
1% en los gastos del candidato A es compensado por un incremento del 1% en los gastos del candidato
B”. Establezca la forma del test, incluyendo el estadígrafo de prueba, las hipótesis nula y alternativa,
la distribución muestral del estadígrafo de prueba bajo la nula, sus grados de libertad y los criterios
de no rechazo o rechazo.

Solución:
(a) En efecto, todos los coeficientes obtenidos tienen los signos esperados. Además, los coeficientes de
lexpendA, lexpendB y prtystrA , en los modelos 1, 2 y 3, respctivamente, corresponden a las pendientes
de la recta estimada (en rojo) de los gráficos de la primera fila del Gráfico 1.
(b) El coeficiente de prtystrA en el modelo 5 es positivo y significativo al 5%. Formalmente, un test t es
de la forma:

H0 = 0 , H1 > 0
β̂prtystrA −0 0.152
t̂ = p 2
∼ t173−4 ⇒ t̂ = 0.062 = 2.45
σ̂prtystrA H0

P r [t169 < 2.25] = 0.9923


Por ende, β̂prtystrA es significativo al 1% en un test unilateral y signficativo al 5% en un test bilateral. En
rigor, el test debería ser unilateral, ya que la popularidad de un partido no debería afectar negativamente el
resultado de su candidato. Uno puede tener presunciones fundadas que el efecto es positivo.

(c) β1 = E [votaA |X2 = X3 = X4 = 0)] El intercepto es una estimación de la media poblacional la variable
dependiente -voteA - cuando las variables explicativas toman un valor de cero. La diferencia de valor
para β̂1 entre el modelo 1 y los modelos 4 y 5 se debe a que el primer modelo adolece de un sesgo por
omisión de variables relevantes.
(d) H0 : β2 = β3 = β4 = 0 , H1 : Al menos un β es distinto de cero.
R2 0.793
F̂ = k−1
1−R2
∼ Fk−1 ,n−k ⇒ F̂ = 3
1−0.793 = 215.8
n−k H0 169

P r [F3,169 < 215.8] = 0.0000


Por ende, se rechaza la nula a cualquier nivel estándar de significancia.
r
α
 
(1−α) ˆ (1−10%)
(e) ICβ2 2
ˆ βˆ2 ⇒ ICβ2
: β2 ± tn−k · var : 6.083 ± 1.654 · 0.382

donde t5%
169 = 1.654.

(f) H0 : β2 + β3 = 0 , H1 : β2 + β3 6= 0

t̂ = pβ̂2 +β̂3 −0 = q β̂2 +β̂3


∼ t173−4
ˆ (β̂2 +β̂3 )
var \ \ \ H0
var (β̂2 )+var (β̂3 )+2cov (β̂2 ,β̂3 )

6.083−6.615
⇒ t̂ = √
0.146+0.144−2·0.003
= −0.9983
P r [t169 < −0.9983] = 0.1598, con un valor p cercano al 32%. Por ende, no puede rechazarse la veracidad de
la afirmación.

10

También podría gustarte