Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Yi = α + βXi + ui
1
β̂ = (Y6 + Y5 − Y2 − Y1 )
8
Solución:
(a) βb = 18 (α + 6β + u6 + α + 5β + u5 − α − 2β − u2 − α − β − u1 )
βb = 18 (8β + u6 + u5 − u2 − u1 )
βb = β + 18 (u6 + u5 − u2 − u1 )
b = β, porque E(ui ) = 0, ∀ i
E(β)
Por lo tanto, el estimador es insesgado.
1
(b) La varianza del estimador β̂ = 81 (Y6 + Y5 − Y2 − Y1 ) es:
2 2
b = 1 V ar(u6 + u5 − u2 − u1 ) = 4σ = σ
V ar(β)
64 64 16
donde cov(ui , uj ) = 0, ∀ i 6= j. La varianza del estimador de MCO es:
σ2 2σ 2
V ar(βbM CO ) = PN =
i=1 (xi − x)
2 35
PN 35
donde i=1 (xi − x)2 = 2 .
σ2 2σ 2
Dado que 16 > 35 , entonces βbM CO es más eficiente.
2
Pregunta 2 (15 puntos)
Un investigador considera que la relación entre consumo (Ct ) e ingreso (It ) debe ser estrictamente propor-
cional. Por ello, plantea el siguiente modelo:
Ct = β1 It + ut
Solución:
T
X
min (Ct − βb1 It )2
β1 i=1
b
T
X
−2 (Ct − βb1 It )It = 0
i=1
PT
C t It
βb1M CO = Pi=1
T 2
i=1 It
PT PT
(b) i=1ût = 0 no necesariamente se cumple, ya que en este caso no se tiene la ecuación normal i=1 ût =
0 como ocurre en el modelo que se estima con un intercepto.
3
Pregunta 3 (25 puntos)
Considere el siguiente modelo de regresión lineal simple:
y = αyx + βyx x + u
donde αyx y βyx son parámetros (constantes) y u es un término de error. El siguiente modelo invierte los
roles de las variables x e y:
x = αxy + βxy y + v
donde αxy y βxy son parámetros (constantes) y v es un término de error.
Suponga que ambos modelos se estiman por Mínimos Cuadrados Ordinarios usando una muestra aleatoria
de tamaño n.
(a) (10 puntos) Muestre que el estadígrafo R2 obtenido de una regresión en que y es la variable dependiente
(o explicada) y x es la variable independiente (o explicativa) puede expresarse como:
Pn
2 [ (xi − x)(yi − y)]2
Ryx = Pn i=1 2
Pn 2
i=1 (xi − x) i=1 (yi − y)
βbyx βbxy = R2
donde βbyx es el estimador MCO de una regresión de y sobre x, βbxy es el estimador MCO de una regresión de
x sobre y y R2 = Ryx 2 2
= Rxy (Ayuda: No necesita haber contestado (a) para responder esta pregunta. Puede
2
usar la expresión para Ryx de la pregunta anterior).
(c) (10 puntos) Las siguientes cantidades fueron calculadas a partir de una muestra de 200 observaciones:
n
X n
X n
X n
X n
X
xi = 11, 34 yi = 20, 72 x2i = 12, 16 yi2 = 84, 96 xi yi = 22, 13
i=1 i=1 i=1 i=1 i=1
Estime βbyx , βbxy para esta muestra en particular y obtenga el R2 usando la relación demostrada en (b).
Solución:
4
ybi = βb0yx + βbyx xi
= y − βbyx x + βbyx xi
= y + βbyx (xi − x)
2
Reemplazando en la definición de Ryx ,
Pn 2
2 2 (xi − x)
Ryx = βyx Pi=1
b
n 2
i=1 (yi − y)
"P #2 P
n n 2
2 i=1(xi − x) (yi − y) i=1 (xi − x)
Ryx = Pn 2 P n 2
i=1 (xi − x) i=1 (yi − y)
Pn 2
2 [ (xi − x) (yi − y)]
Ryx = Pn i=1 2 P n 2
i=1 (xi − x) i=1 (yi − y)
"P # "P #
n n
(xi − x) (yi − y)
i=1 i=1 (xi − x) (yi − y)
βbyx · βbxy = Pn 2 Pn 2
i=1 (xi − x) i=1 (yi − y)
Pn 2
[ i=1 (xi − x) (yi − y)]
= Pn 2 Pn 2
i=1 (xi − x) i=1 (yi − y)
(c)
Pn
(xi − x) (yi − y)
i=1
βbyx = Pn 2
i=1 (xi − x)
Pn
( xi yi ) − nxy
= Pi=1
n
( i=1 x2i ) − nx2
5
Pn
i=1 xi 11, 34
x = =
n 200
= 0, 0567
Pn
i=1 yi 20, 72
y = =
n 200
= 0, 1036
Sustituyendo arriba,
= 1, 820
Pn
i=1(xi − x) (yi − y)
βbxy = Pn 2
i=1 (yi − y)
Pn
( xi yi ) − nxy
= Pi=1
n
( i=1 yi2 ) − ny 2
= 0, 253
Pn 2
2 [(xi − x) (yi − y)]
i=1
R = Pn 2 Pn 2
i=1 (xi − x) i=1 (yi − y)
Pn 2
[( i=1 xi yi ) − nxy]
= Pn n
( i=1 x2i ) − nx2 ( i=1 yi2 ) − ny 2
P
6
20, 9551762
R2 =
11, 517022 · 82, 813408
= 0, 4604
7
Pregunta 4 (30 puntos)
Un analista político de la oposición está estudiando si los gastos de campaña afectan los resultados de las
elecciones. Dado que desde el gobierno se trabaja en un proyecto de ley que establece que todos los gastos
de campaña deben ser financiados con fondos públicos, los resultados del estudio pueden ser muy relevantes
para la aprobación de este proyecto. El modelo general que el analista ha estimado es el siguiente:
donde voteA es el porcentaje de votos recibidos por el candidato A , expendA y expendB son los gastos del
campaña del candidato A y del candidato B, respectivamente y prtystrA es una medida de la popularidad
del partido del candidato A, medida como el porcentaje de votos que obtuvo el partido del candidato A en
la elección presidencial más reciente. En la ecuación (1), lexpendA y lexpendB corresponden al logaritmo
natural de los gastos del campaña del candidato A y B, respectivamente. El Cuadro 1 presenta la estadística
descriptiva para las variables del estudio. En el Gráfico 1, se presentan los gráficos de dispersión entre las
mismas.
Los resultados de las estimaciones preliminares que ha llevado a cabo el analista son los siguientes:
8
El analista ha estimado un modelo de regresión simple para cada una de las variables explicativas contra
voteA (modelos (1) al (3)), una especificación en que voteA se estima utilizando como variables explicativa los
gastos de campaña de ambos candidatos (modelo (4)) y finalmente una especificación que incluye, además,
la medida de la popularidad del partido del candidato A (modelo 5) y que corresponde al modelo general
presentado en la ecuación (1). Los resultados de estas estimaciones se presentan en el Cuadro 2. La matriz
de varianzas y covarianzas para la estimación del modelo (5) se presenta en el Cuadro 3.
En base a estos resultados:
(a) (5 puntos) Comente respecto de los resultados obtenidos por el analista: ¿Tienen los coeficientes
obtenidos los signos esperados? En particular, ¿cómo se relacionan los resultados de las estimaciones
de los modelos (1), (2) y (3) con los gráficos de dispersión presentados en el gráfico 1? ¿Son consistentes?
Explique sus respuestas.
(b) (5 puntos) Comparando los resultados obtenidos para los modelos (4) y (5), ¿le parece a usted que la
popularidad del partido del candidato A es relevante para explicar el porcentaje de votos recibidos por
ese candidato? ¿Le parece a usted que esta variable debe ser considerada? ¿Puede testear formalmente
su respuesta? Si puede, establezca la forma del test, incluyendo el estadígrafo de prueba, las hipótesis
nula y alternativa, la distribución muestral del estadígrafo de prueba bajo la nula, sus grados de libertad
y los criterios de no rechazo o rechazo.
(c) (5 puntos) ¿Cuál es la interpretación del coeficiente β1 (intercepto o constante)? Al analista le preocupa
el hecho de que el estimador de la constante es muy diferente entre el modelo (1) y los modelos (4) y
(5). ¿Puede explicar por qué sucede esto?
(d) (5 puntos) En base a los resultados obtenidos para el modelo (5), lleve a cabo un test de significancia
global del modelo utilizando el estadístico R2 . En su respuesta, establezca la forma del test, incluyendo
9
el estadígrafo de prueba, las hipótesis nula y alternativa, la distribución muestral del estadígrafo de
prueba bajo la nula, sus grados de libertad y los criterios de no rechazo o rechazo.
(e) (5 puntos) Construya un intervalo de confianza al 10% para el coeficiente de la variable lexpendA
obtenida en el modelo (5).
(f) (5 puntos) Utilizando los resultados del modelo (5), testee la siguiente afirmación: “Un aumento del
1% en los gastos del candidato A es compensado por un incremento del 1% en los gastos del candidato
B”. Establezca la forma del test, incluyendo el estadígrafo de prueba, las hipótesis nula y alternativa,
la distribución muestral del estadígrafo de prueba bajo la nula, sus grados de libertad y los criterios
de no rechazo o rechazo.
Solución:
(a) En efecto, todos los coeficientes obtenidos tienen los signos esperados. Además, los coeficientes de
lexpendA, lexpendB y prtystrA , en los modelos 1, 2 y 3, respctivamente, corresponden a las pendientes
de la recta estimada (en rojo) de los gráficos de la primera fila del Gráfico 1.
(b) El coeficiente de prtystrA en el modelo 5 es positivo y significativo al 5%. Formalmente, un test t es
de la forma:
H0 = 0 , H1 > 0
β̂prtystrA −0 0.152
t̂ = p 2
∼ t173−4 ⇒ t̂ = 0.062 = 2.45
σ̂prtystrA H0
(c) β1 = E [votaA |X2 = X3 = X4 = 0)] El intercepto es una estimación de la media poblacional la variable
dependiente -voteA - cuando las variables explicativas toman un valor de cero. La diferencia de valor
para β̂1 entre el modelo 1 y los modelos 4 y 5 se debe a que el primer modelo adolece de un sesgo por
omisión de variables relevantes.
(d) H0 : β2 = β3 = β4 = 0 , H1 : Al menos un β es distinto de cero.
R2 0.793
F̂ = k−1
1−R2
∼ Fk−1 ,n−k ⇒ F̂ = 3
1−0.793 = 215.8
n−k H0 169
donde t5%
169 = 1.654.
(f) H0 : β2 + β3 = 0 , H1 : β2 + β3 6= 0
6.083−6.615
⇒ t̂ = √
0.146+0.144−2·0.003
= −0.9983
P r [t169 < −0.9983] = 0.1598, con un valor p cercano al 32%. Por ende, no puede rechazarse la veracidad de
la afirmación.
10