Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Magno Econometría
Magno Econometría
ECONOMETRIA 1
CONTROLES 1
Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 1
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
Pregunta 2: Ud. dispone de los siguientes datos, donde Y es la variable dependiente y X
la variable explicativa. Complete la siguiente tabla con la informacin requerida:
Y
X
2
1
-2
0
1
4
3
1
1 .......
2 .......
Y
.......
.......
.......
.......
u
.......
.......
.......
.......
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Control 1
Pregunta 1: (30 puntos) Mientras mayor es el tamao de la muestra que disponemos, ms se
aproxima un estimador a su valor poblacional. Comente.
Si bien cuando el tamao de muestra aumenta, esta cada vez se parece ms a la poblacin, un
estimador para que en el lmite sea igual al valor poblacional tiene que cumplir con la propiedad de consistencia. Recordar que un estimador es simplemente una frmula o mtodo que nos
dice como aproximar un parmetro poblacional a travs de una muestra, existen estimadores
consistentes y otros que no lo son, a pesar que la muestra sea infinito un estimador puede ser
distinto a su valor verdadero, en este caso es inconsistente.
Pregunta 2: Suponga que la variable aleatoria yi esta compuesta por la suma de un componente fijo y uno aleatorio:
yi = xi + ui
|{z}
|{z}
f ijo
para
i = 1, ..., N
aleatorio
donde y =
N
1 X
yi
N i=1
x=
N
1 X
xi
N i=1
R:
y
= =
x
1
N
1
N
PN
i=1 yi
PN
i=1 xi
PN
i=1
= PN
i=1
yi
xi
+
=
PN
PN
PN
x
x
i=1 i
i=1 i
i=1 xi
PN
ui
= + Pi=1
N
i=1 xi
PN
i=1 ui
= PN
i=1 xi
Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3):
PN
i=1 E[ui ]
E[] = + P
N
i=1 xi
=
1
(1)
(2)
(3)
(4)
]2
E[ E[]
|{z}
=
=
=
=
=
V ()
E[ ]2
"P
N
i=1
PN
i=1
(
(
PN
xi
i=1
PN
ui
xi )2
2
i=1 xi )
utilizando
#2
(4)
1
"
#2
N
X
E
= PN
ui
( i=1 xi )2
i=1
"N
#
X
2
E
ui + N (N 1)ui uj
i=1
N
X
i=1
E[u2i ] +N (N 1) E[ui uj ]
| {z }
| {z }
0
n
PN
( i=1 xi )2
(30 PUNTOS)
El Error cuadrtico medio (ECM) se este estimador es igual a la varianza, ya que es un estimador insesgado:
=
ECM ()
+ [sesgo]2
V ()
| {z }
=
ECM ()
n 2
PN
( i=1 xi )2
(10 PUNTOS)
Por ltimo, el estimador es consistente ya que es insesgado es muestras pequeas (10 PUNTOS). Adems se puede demostrar que:
2
= Pn
lm V ()
N
n
( i=1 xi )2
1
n2 2
2
= lm
PN
P
2
N
2
n n(
n n
x
)
i=1 xi
i=1 i
lm
n (x)2
1
2
lm
=0
2 n
(x) | {z n}
lm
m.s
p
o
=
plim()
Econometra I
Profesores: Andrs Otero
Javiera Vsquez.
Otoo 2005
Control 1
Pregunta 1: (30 puntos) El nico problema de no incluir un trmino constante
en el Modelo de Regresin Lineal, es que no se garantiza que la recta de regresin
pase por las medias o equivalentemente que la suma de los errores estimados sea
igual a cero. Comente.
Falso, si bien el no incluir un trmino constante en el modelo de regresin lineal tiene el problema de no garantizar que la recta de regresin pase por las
medias ni que la suma de los errores estimados sea igual a cero, este no es el
nico problema. El no incluir el trmino constante genera sesgo en la estimacin
de la pendiente al obligar a que la recta pase por el origen, tal como se muestra
en el siguiente grfico:
. .sin.constante
con constante
.
.. . . . . .
. .. . . .
.. . . . . .
.
.
.
Sesgo en la estimacin de la pendiente,
provocado por la estimacin de un
modelo de regresin lineal sin constante
Suma
Promedio
1
2
Y
12
2
5
1
X
2
1
3
0
5
1.7
2.2
1.5
Y Y
7
-3
0
4
2 =
X X
0.5
-0.5
1.5
-1.5
(Y Y )(X X)
3.5
1.5
0
6
11
(X X)2
0.25
0.25
2.25
2.25
5
Y
6.1
3.9
8.3
1.7
5
Pn
i=1 (Y Y )(X
Pn
2
i=1 (X X)
X)
11
= 2,2
5
5.9
-1.9
-3.3
-0.7
0
Econometra I
Profesores:
Emerson Melo
Rodrigo Montero
Javiera Vsquez
Primavera 2005
Pauta Control 1
Rut:
.......................................
Ud. Dispone de 40 minutos para resolver este control, no puede hacer consultas a los ayudantes,
no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho
a reclamo. Contestar slo en el espacio disponible
Pregunta 1: Usted es gerente de costos de una prestigiosa empresa multinacional, y el gerente general, al cual todos llaman muy cariosamente Pato, lo llama a su oficina, y le plantea
el siguiente problema: ...existe la necesidad de justificar frente al directorio el esquema de remuneraciones que se aplica en la empresa. Como usted es alguien preparado, que ha estudiado
en la Universidad de Chile, necesito que me muestre cual es el premio que la empresa entrega a
sus trabajadores por cada ao de estudio que tienen (aos de escolaridad). La siguiente tabla
presenta la informacin de que usted dispone:
Salario (W )
150000
170000
185000
190000
215000
250000
550000
650000
800000
Nmero de trabajadores
10
5
4
8
9
10
5
4
5
Usted decide hacer un informe al respecto, y para ello debe dar respuesta a las siguientes
interrogantes. NOTA: trabaje todos los clculos con DOS decimales.
1. Plantee el modelo a estimar, definiendo claramente cada una de las variables involucradas.
(3 puntos)
Respuesta: Se debe estimar el siguiente modelo:
Wi = + Si + i
donde Wi corresponde al salario del trabajador i, Si corresponde a los aos de escolaridad
del trabajador i, y i representa el trminos de error, bien comportado. Los parmetros
a estimar vienen dados por y . Por lo tanto, el modelo plantea a priori una relacin
lineal y directa entre los aos de escolaridad y el salario de la persona.
1
2. Escriba y grafique la funcin objetivo. Ayuda: para graficar la funcin objetivo asuma que
slo existe un parmetro que debe ser estimado. (4 puntos)
Respuesta: La funcin objetivo a minimizar es:
mn
N
X
,
i=1
2i = mn
N
X
,
i=1
i )2
(Wi
S
Graficamente:
Funcin
objetivo
Solucin
PN
si wi
59941583, 33
= Pi=1
=
= 28804, 45
N
2
2080, 98
i=1 si
S = 306583, 33 (28804, 45 8, 98) = 47823, 34
=W
N
X
,
i=1
2i = mn
N
X
,
i=1
i )2
(Wi
S
PN
N
i )2
X
i=1 (Wi
S
i) = 0
= 2
(Wi
S
i=1
Por lo tanto:
N
X
i) = 0
(Wi
S
i=1
N
X
i=1
i = 0
Numericamente:
60
X
i=1
174, 07
i=1 si wi
= P
=
= 0, 08
N
2
2080,
98
s
i=1 i
= W S = 12, 46 (0, 08 8, 98) = 11, 71
donde si y wi representan los aos de escolaridad y el logaritmo del salario en desvos
representa el porcentaje de incremento
respecto de la media. El coeficiente estimado ()
en el salario por un ao adicional de escolaridad. Matemticamente:
ln(Wi )
1
=
dWi =
Si
Wi
6. Recuerde que Pato quiere conocer el premio salarial que la empresa entrega a sus trabajadores por cada ao de escolaridad. Cul sera? Ayuda: utilice el resultado encontrado
en (5). (4 puntos).
Respuesta: Por cada ao adicional de escolaridad el trabajador recibe un premio de
8 % en su salario.
Econometra I
Verano 2005-2006
Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.
Pregunta 1 (30 puntos)
Se tiene
Yi
E[Yi |Xi ]
E[Yi |Xi ]
E[ui |Xi ]
E[Yi |Xi ] + ui
E[E[Yi |Xi ]|Xi ] + ui
E[Yi |Xi ] + E[ui |Xi ]
0.
=
=
=
=
La principal diferencia que existe entre causalidad econmica y correlacin estadstica es que la primera es una relacin de causa-efecto en un sentido econmico. En cambio, la correlacin estadstica es simplemente una observacin estadstica que indica un grado de relacin lineal. La correlacin estadstica no necesariamente implica que una variable correlacionada con otra se comporte de una
forma cuando la variable con la que tiene la correlacin cambie, no hay necesariamente una causalidad. En el ejemplo dado en clases, existe un grado de relacin
entre la calidad de un vino y el clima, pero no se puede decir que el clima est
provocado por la calidad del vino.
(b) Explique la diferencia entre la representacin estocstica de la Funcin de Regresin Muestral y representacin estocstica de la Funcin de Regresin Poblacional.
Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Pauta Control 1
Pregunta 1: (30 puntos) Si un estimador converge, entonces este estimador es consistente.
Comente.
Esto no es necesariamente cierto, ya que el estimador puede converger a un valor distinto del
valor poblacional del parmetro. Slo si el estimador converge al verdadero valor del parmetro
(poblacional) este estimador es consistente.
Pregunta 2: (70 puntos) Suponga que la variable aleatoria yi esta compuesta por la suma
de un componente fijo y uno aleatorio:
yi = xi + ui
|{z}
|{z}
f ijo
para i = 1, ..., N
aleatorio
donde xi es una variable determinstica (fija), es un parmetro que mide la influencia de x sobre y y ui es una variable aleatoria independiente e idnticamente distribuida Normal N (0, 2 ).
Determine si el siguiente estimador de es insesgado, calcule su varianza y determine si es
consistente:
y
=
x
donde y =
N
1 X
yi
N i=1
x=
N
1 X
xi
N i=1
R:
y
= =
x
1
N
1
N
PN
i=1 yi
PN
i=1 xi
PN
i=1
= PN
i=1
yi
xi
+
PN
PN
PN
x
x
i=1 i
i=1 i
i=1 xi
PN
ui
= + Pi=1
N
i=1 xi
PN
i=1 ui
= PN
i=1 xi
Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3):
PN
i=1 E[ui ]
E[] = + P
N
i=1 xi
=
1
(1)
(2)
(3)
(4)
]2
E[ E[]
|{z}
=
=
=
=
=
V ()
E[ ]2
"P
N
i=1
PN
i=1
(
(
PN
xi
i=1
PN
ui
xi )2
i=1
xi )2
utilizando
#2
(4)
1
"
#2
N
X
= PN
E
ui
( i=1 xi )2
i=1
"N
#
X
2
E
ui + N (N 1)ui uj
i=1
N
X
i=1
E[u2i ] +N (N 1) E[ui uj ]
| {z }
| {z }
0
n
PN
( i=1 xi )2
(30 PUNTOS)
El Error cuadrtico medio (ECM) se este estimador es igual a la varianza, ya que es un estimador insesgado:
=
ECM ()
+ [sesgo]2
V ()
| {z }
=
ECM ()
n 2
PN
( i=1 xi )2
Para demostrar que es consistente, en el lmite el error cuadrtico medio (o varianza) debe ser
igual a cero, de esta forma el estimador converge en media cuadrtica a su verdadero valor, y
es estimador se dice consistente:
2
= Pn
lm V ()
N
n
( i=1 xi )2
n2 2
2
1
= lm
PN
P
2
N
2
n n(
n n
i=1 xi
i=1 xi )
lm
n (x)2
1
2
l
m
=0
2
(x) n
| {z n}
lm
m.s
p
o
=
plim()
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 1
Cov(X, Y )
X Y
P
= pP
xy
pP
y2
donde la letra en minsculas indica que la variable se encuentra en desvos respecto a la media. Por lo tanto:
x2
pP
y
= pP
x2
Es decir, el signo del estimador de va a depender del signo del coeficiente
de correlacin entre X e Y . Por lo tanto, el comente es verdadero.
Problema (14 puntos)
Considere el siguiente modelo:
Yi = + Xi + i
1
V ar()
35
=
>1
V ar( M CO )
32
ES decir, este estimador es menos eficiente que el estimador de mnimos
cuadrados ordinarios.
Econometra I
Semestre Primavera 2007
Control 1
Pauta Desarrollo
Profesores: Jose Miguel Benavente, Rodrigo Montero P.
Ayudantes: Rodrigo Bravo C., Felipe Ros B., Loreto Silva V.
Puntaje Total: 100 pts.
1. (50 Pts.) Considere el modelo de regresion lineal Y = X + con regresores determinsticos y
errores identica e independientemente distribuidos pero con primero momento igual a a, (i
iid(a, 2 ), i). Entonces si a es distinto de cero entonces V ar(M CO ) 6= 2 (X 0 X)1 y por ende el
estimador deja de ser eficiente.
Respuesta: Falso por los dos motivos siguientes:
Si E(u) = a, entonces V ar(M CO ) sigue siendo 2 (X 0 X)1 ya que el supuesto en el enunciado
no altera el hecho que var(u) = u2 I.
Si E(u) = a, el estimador M CO ya no es insesgado y por ende no podemos hablar de
eficiencia. Ya que es una propiedad que se aplica solo a los estimadores insesgados.
2. (50 Pts.) Demuestre que en un modelo de regresion lineal m
ultiple con k regresores, el estimador
insesgado de la varianza del error es:
Pn
ui 2
nk
i=1
Respuesta:
Primero, el vector de residuos estimados puede escribirse en funcion de los residuos poblacionales
de la siguiente forma:
u
= Mu
Donde M = In X(X 0 X)1 X 0 , matriz de dimension nx n idempotente y que satisface M X = 0.
Entonces: E(
u0 u
) = E(u0 M M u) = E(u0 M u), dada las caractersticas de la matriz M. Como u0 M u
es un escalar entonces E(u0 M u) = E[T r(u0 M u)].
Al cambiar el orden de las matrices queda:
E(u0 M u) = E[T r(u0 M u) = E[tr(M u0 u)] = T r[E(M u0 u)] = T r[M E(u0 u)] = T r[M u2 In ] =
u2 T r(M ) = u2 [T r(In) T r[X(X 0 X)1 X 0 ]] = u2 (n k)
Por lo tanto como E(u0 M u) = u2 (n k) para que la suma de los errores al cuadrado sea un
estimador insesgado de u2 debemos dividir por (n k).
Pn
Pn
ui 2
E( i=1 ui 2 )
(n k)u2
E(
) =
=
= u2
nk
nk
nk
i=1
1)
Comentes
a) Cuando hay variables omitidas en la regresin, que son determinantes de la variable
dependiente, entonces el estimador MCO de la variable incluida siempre estar
sesgado.
b) El teorema de Gauss-Markov prueba que, con errores homocedsticos, el estimador
OLS es insesgado.
c) Una de las condiciones importantes de Gauss-Markov es var(ui|X1,, Xn) = u2 , 0 <
1 t1 + t2 2
t1 ,t 2 t1t
1 = 0 y 2 = 0 : F =
.
2
2
t1 ,t2
Answer: For the case when there is no correlation between the two explanatory variables, the
formula reduces to a simple average of the squared t-statistics, i.e., F =
1 2 2
( t1 + t2 ) .
2
1 or 2
are nonzero (or both), then either t1 or t2 or both will be large. This
leads to a large F-statistic, and hence a rejection of the null hypothesis.
2)
Preguntas Largas
2.1)
Considere el modelo Yi = 1 X i + ui , donde ui = cX i2 ei y todos los X y e son i.i.d. y
distribuidos N(0,1).
a) Pruebe si son satisfechos cada uno de los supuestos extendidos del modelo de
regresin mltiple
b) Ser el estimador OLS de 1 eficiente?
c) Cmo estimara 1 por WLS?
Consider the model Yi =
distributed N(0,1).
(a)
1 X i + ui , where ui = cX i2 ei
Which of the Extended Least Squares Assumptions are satisfied here? Prove your assertions.
(b)
be efficient here?
2.2)
Se tienen datos de 104 pases para determinar cuales son los determinantes de las
diferencias entre calidad de vida (medido por nivel de inreso percpita) en el mundo.
Recuerde de su curso de Maroeconoma que el modelo de crecimiento neoclsico sugiere
que el nivel de producto por trabajador (ingreso per cpita) estn determinados, entre otros,
por la tasa de ahorro y el crecimiento de la poblacin. Para testear este modelo se corre la
siguiente regresin:
You have collected data for 104 countries to address the difficult questions of the determinants for
differences in the standard of living among the countries of the world. You recall from your
macroeconomics lectures that the neoclassical growth model suggests that output per worker (per
capita income) levels are determined by, among others, the saving rate and population growth rate. To
test the predictions of this growth model, you run the following regression:
Interpret the results. Do the signs correspond to what you expected them to be? Explain.
Answer: The Solow growth model predicts higher productivity with higher saving rates and
lower population growth. The signs therefore correspond to prior expectations. A 10
percent point increase in the saving rate results in a roughly 14 percent increase in
per capita income relative to the United States. Lowering the population growth rate
by 1 percent results in a 13 percent higher per capita income relative to the United
States. It is best not to interpret the intercept. The regression explains
approximately 62 percent of the variation in per capita income among the 104
countries of the world.
(b)
You remember that human capital in addition to physical capital also plays a role in
determining the standard of living of a country. You therefore collect additional data on the
average educational attainment in years for 1985, and add this variable (Educ) to the above
regression. This results in the modified regression output:
Upon checking the regression output, you realize that there are only 86 observations, since
data for Educ is not available for all 104 countries in your sample. Do you have to modify some
of your statements in (d)?
Answer: When comparing results, you should ensure that the sample is identical, since
comparisons are not valid otherwise.
(d)
Brazil has the following values in your sample: RelPersInc = 0.30, n = 0.021, sK = 0.169, Educ =
3.5. Does your equation overpredict or underpredict the relative GDP per worker? What
would happen to this result if Brazil managed to double the average educational attainment?
Answer: The predicted value for Brazil is 0.240. Hence the regression underpredicts Brazils
per capita income. Increasing Educ to 7.0 would result in a predicted per capita
income of 0.43, which is a substantial increase from both its current actual position
and the previously predicted value.
2.3) Una sub-muestra de la encuesta de CASEN 2003 tiene los siguientes datos de salarios
por hora individuales, edad y gnero. Leste en las noticias que por cada peso que gana un
hombre la mujer gana 0,7 pesos. Para testear est hiptesis, primero regresionas ingresos en
una variable binaria que toma el valor 1 si es mujer y 0 si es hombre, y una constante. Estos
son los resultados:
Testee la significancia de edad y gnero. Por qu crees que la edad juega un rol en la
determinacin de los salarios.
2.3)
A subsample from the Current Population Survey is taken, on weekly earnings of individuals,
their age, and their gender. You have read in the news that women make 70 cents to the $1
that men earn. To test this hypothesis, you first regress earnings on a constant and a binary
variable, which takes on a value of 1 for females and is 0 otherwise. The results were:
Perform a difference in means test and indicate whether or not the difference in the mean
salaries is significantly different. Justify your choice of a one-sided or two-sided alternative
test. Are these results evidence enough to argue that there is discrimination against females?
Why or why not? Is it likely that the errors are normally distributed in this case? If not, does
that present a problem to your test?
Answer: The t-statistic is -12.63, while the critical value is 1.64. The difference is therefore
statistically significant. A one-sided alternative was chosen since the claim is that
females make less than males. This represents little evidence of discrimination, since
attributes of males and females have not been included. Given that earnings
distributions are not normally distributed, the errors will also not be distributed
(b)
Test for the significance of the age and gender coefficients. Why do you think that age plays a
role in earnings determination?
Answer: The t-statistics are 9.36 for the age coefficient, and -13.00 for the gender coefficient.
Both of these values are greater than the (absolute) critical value from the standard
normal distribution (1.64). Hence you can reject the null hypothesis that these
coefficients are zero. Age proxies on the job training. A better proxy that has been
used frequently in the past is the Mincer experience variable (Age-Education-6).
Obviously this is a better proxy for some subsample of individuals than for others.
2.4)
1 =
X Y nXY
i =1
n
i i
X
i =1
2
i
nX
son 1 =
X 1iYi nX 1Y
i =1
n
X
i =1
2
1i
nX
y 2 =
i =1
n
2
1
Y nX 2Y
2i i
i =1
, a menos que
2
2i
nX 2
X
i =1
2i
X 1i = 0 .
For the simple linear regression model of Chapter 4, Yi = 0 + 1 X i + ui , the OLS estimator for the
n
= Y X , and =
intercept was
0
1
1
X Y nXY
i =1
n
i i
X
i =1
nX
=Y
X X
regression model Yi = 0 + 1 X 1i + 2 X 2 i + ui might be
0
1 1
2 2
n
=
,
1
X
i =1
n
X
i =1
Y nX 1Y
1i i
2
1i
nX
=
and
2
2
1
X
i =1
n
X
i =1
Y nX 2Y
2i i
nX 2
regression model with two explanatory variables, show that this cannot be the case.
Answer: To minimize the sum of squared prediction mistakes
n
(Y b
i =1
b1 X 1i b2 X 2 i )2
you need to take the following three derivatives with respect to b0 , b1 and b2 . This
results in
b0
i =1
i =1
(Yi b0 b1 X 1i b2 X 2i )2 = 2 (Yi b0 b1 X 1i b2 X 2i )
n
n
2
(
Y
b
b
X
b
X
)
2
(Yi b0 b1 X 1i b2 X 2 i ) X 1i
i 0 1 1i 2 2i
b1 i =1
i =1
n
n
(Yi b0 b1 X 1i b2 X 2 i ) 2 = 2 (Yi b0 b1 X 1i b2 X 2 i ) X 2 i
b2 i =1
i =1
The OLS estimators are those for which the derivatives are zero. Hence we get
n
X
X ) = 0;
=Y
X
X
2 (Yi
0
1 1i
2 2i
0
1 1
2 2
i =1
n
i =1
i =1
i =1
i =1
i =1
i =1
i =1
i =1
X
X ) X = 0; Y X =
2 (Yi
i 1i 0 nX 1 + 1 X12i + 2 X 2i X 1i
2i
1i
0
1 1i
2
X
X ) X = 0; Y X =
2 (Yi
i 2i 0 nX 2 + 2 X 22i + 1 X 2i X 1i
2i
2i
0
1 1i
2
=Y
X X .
It is clear that the first of these three expressions results in
0
1 1
2 2
However, the second (third) expression involves terms in X 2i ( X 1i ), hence the
n
=
formula cannot be simplified to
1
X 1iYi nX 1Y
i =1
n
X
i =1
n
X
i =1
2
1i
nX
2i
X 1i = 0 ).
2
1
=
(
2
X
i =1
n
X
i =1
Y nX 2Y
2i i
)
2
2i
nX 2
Control #1
Econometra I
Profesores: Tomas Rau y Javiera Vasquez
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda
26 de marzo, 2008
Tiempo Total: 30 Minutos.
1.
2.
Suponga que Ud. dispone de datos agragegados del Simce para colegios de dos comunas de Santiago:
Puente Alto y Recoleta, las cuales seran indexadas por los ndices p y r respectivamente. Los puntajes
ltimo,
promedios fueron Y p = 270 y Y r = 260 con varianzas muestrales dadas por Sp2 = 100 y Sr2 = 72. Por u
los tama
nos muestrales logrados fueron de np = 10 y nr = 12. A pesar de la importante diferencia de 10
puntos, personeros de la comuna de Recoleta insisten que la media en esa comuna sera mas alta que en
Puente Alto. Para ayudar a esclarecer esa diferencia, realice un test de diferencia de medias de la siguiente
hipotesis nula: H0 : p < r ante la alternativa H1 : p r . Asuma que las muestras son aleatorias simples
y utilice un nivel de significancia de = 5 % y luego = 1 %. Que puede inferir de los resultados de las
pruebas de hip
otesis?
R. Simplemente,
10
YpYr
t= q
= 2,5
=
4
Sp2 /np + Sr2 /nr
1
ademas, t5 %,20 = 1,725 y t1 %,20 = 2,528. Por lo tanto, t > t5 %,20 lo cual implica que se rechaza la
hipotesis nula que la media de Recoleta es mayor que la de Puente Alto a un 5 % de significancia. Por otro
lado, t < t1 %,20 , con lo cual no se rechaza la hipotesis nula a un 1 % de significancia. Luego, dado que la
signicancia es la probabilidad de cometer error de tipo I, vemos que se rechaza facilmente para estandares
convencionales (5 %) pero si somos un poco mas exigentes (o aversos al riesgo de cometer dicho error) no
rechazamos la hip
otesis nula. Dado el tama
no muestral y las propiedades asint
oticas de los estimadores, es
sensato usar un nivel de significancia de 5 % y asumir que existe un 5 % de probabilidad de cometer error de
tipo I e igualmente rechazar la hip
otesis nula.
Cuadro 1: Valores Crticos para una distribuci
on t-Student
n-k
1
2
3
4
5
.
.
20
21
22
23
90 %
3.078
1.886
1.638
1.533
1.476
95 %
6.314
2.92
2.353
2.132
2.015
97.50 %
12.71
4.303
3.182
2.776
2.571
99 %
31.82
6.965
4.541
3.747
3.365
99.50 %
63.66
9.925
5.841
4.604
4.032
1.325
1.323
1.321
1.319
1.725
1.721
1.717
1.714
2.086
2.080
2.074
2.069
2.528
2.518
2.508
2.500
2.845
2.831
2.819
2.807
CONTROLES 2
..
. .
Profesores+
Econometria
1 - .
J.M. U.enavenle, A. Otero y J. Vsquez.
- PRIMAVkA 2 0 0 4
.
.,
.I_
.,
<
C ONTROL 2
c
Nor11brc:
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Rut:
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ._.. . . .
control, no puede hacer consultas a los ayudantes, no puedo tener nada m& que l&piz en su escritorio, si contesta con l&piz mina no tiene
derecho a reclamo. Contestar ~610 en el espacio disponible
Pregunta 1: (30 puntos) En el modelo de regresibn lineal de una variable explicativa si la
variable independiente -Y no rara, entonces el estimador ,/$ ser igual al verdadero valor pobla-
....................................................................................................................
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..*.....................................
Pregunta 2: (70 puntos) En un modelo de regresin lineal con k variables explicativas,
Y = X/~+U. Demuestre que el estimador mnimos cuadrados ordinarios cumple con la condicin
de minimizar la suma de errores al cuadrado.
.$M,
N\J j& c
(hYn)
)JJM.=
.
YY
CQQ
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Control 2
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz
en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el
espacio disponible
Pregunta 1: (30 puntos) En el contexto de un Modelo de Regresin Lineal (MRL), la recta de regresin pasa por los valores promedios de la variable dependiente. Comente.
Este se cumple siempre que el modelo de regresin incluya un trmino constante, es la constante
justamente quien cumple el rol de asegurar que el promedio muestral del valor estimado de Y
se iguale con el promedio muestral de los valores observados
P de Y . Si el modelo incluye trmino
constante por condicin de primer orden se cumple que
ui = 0, y que el valor estimado de
la constante (1 ) es 1 = Y 2 X, de lo que deduce inmediatamente que la recta de regresin
pasa por los valores promedio: Y = 1 + 2 X. Por lo tanto, esta afirmacin es verdadera slo
si estamos hablando de un modelo que incluye trmino constante.
Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresin Lineal Simple:
Yi = 1 + 2 Xi + ui
para
i = 1, ..., N
2
0
5
10
6
18
7
20
= Y 2 X
P4
i=1 (Xi X) (Yi Y )
=
P4
2
i=1 (Xi X)
Promedio
Suma
Y
2
5
6
7
5
X
0
10
18
20
12
Y Y
-3
0
1
2
X X
-12
-2
6
8
(Y Y )(X X)
36
0
6
16
(X X)2
144
4
36
64
58
248
De esta forma,
2
58
= 0,233870968
248
5 0,233870968 12 = 2,193548387
Tambin se puede obtener los estimadores de 1 y 2 utilizando la forma matricial del estimador
MCO:
= (X 0 X)1 X 0 Y
utilizando la informacin disponible:
1
4 48
20
2,193548387
=
=
=
48 824
298
0,233870968
2
(40 puntos)
b. El estimador MCO de 2 es un modelo sin constante (Y = 2 X + u) es1 :
P4
i=1 Xi Yi
2 = P
4
2
i=1 Xi
Como el modelo no incluye constante, este estimador NO queda expresado en desvos con
respecto a la media. Utilizando la informacin disponible:
Promedio
Suma
1 Este
Y
2
5
6
7
5
X
0
10
18
20
12
Y X
0
50
108
140
X2
0
100
324
400
298
824
4
X
(Yi 2 Xi )2
i=1
CP O :
X
SE(2 )
=
2 (Yi 2 Xi )(Xi ) = 0
2
i=1
4
X
(Xi Yi + 2 Xi2 ) = 0
i=1
2 =
P4
i=1
P
4
X i Yi
i=1
Xi2
Por lo tanto,
2 = 0,361650485
Como podemos apreciar el valor estimado para 2 , es mayor que el en caso donde se incluye la
constante, esto porque al ser positiva la constante y omitirla se genera un sesgo hacia arriba del
parmetro de pendiente. Esto se puede apreciar grficamente en la siguiente figura, que dibuja
las recta de regresin estimadas de un modelo con y sin constante:
Modelo con
constante
Modelo sin
constante
Econometra I
Profesores: A. Otero y J. Vsquez.
Primavera 2004
Pauta Control 2
Pregunta 1: (30 puntos) En un modelo de regresin lineal simple: Yi = 1 +2 Xi +ui , mientras
menor es la varianza de los errores estimados y mientras mayor es la varianza muestral de la
variable explicativa, el estimador MCO de 2 es menos preciso. Comente.
Recordemos que la varianza del estimador MCO de 2 es:
2
=
2
i=1 (Xi X)
V ar(2 ) = Pn
n
n
2
=
2
n Vd
ar(X)
i=1 (Xi X)
Pn
donde Vd
ar(X) es el estimador muestral de la varianza de X. De esta forma, a medida que
aumenta la varianza de X y disminuye la varianza de u
, disminuye la varianza de 2 y el estimador es ms preciso. Con lo cual el comente es falso.
Pregunta 2: (70 puntos) Demuestre que en un modelo de regresin lineal mltiple con k
regresores, el estimador insesgado de la varianza del error es:
Pn
u
2
e2 = i=1 i
nk
Primero, el vector de residuos estimados puede escribirse en funcin de los residuos poblacionales de la siguiente forma:
u
= Mu
Donde M = In X(X 0 X)1 X 0 , matriz de dimensin nxn idempotente y que satisface M X = 0
E(
u0 u
) = E(u0 M 0 M u) = E(u0 M u), por las caractersticas de la matriz M.
Como u0 M u es un escalar E(u0 M u) = E[T r(u0 M u)]
Recordemos que la traza es un operador lineal y antes de introducir la esperanza podemos,
por propiedades de la traza, cambiar el orden de las matrices.
E(u0 M u) = E[T r(u0 M u) = E[tr(M uu0 )] = T r[E(M uu0 )] = T r[M E(uu0 )] = T r[M u2 In ] =
u2 T r(M ) = u2 [T r(In ) T r[X(X 0 X)1 X 0 ])] = u2 (n k)
Por lo tanto como E(
u0 u
) = u2 (n k) para que la suma de los errores al cuadrado sea un
estimador insesgado de u2 debemos dividir por (n k).
u2 =
u
0 u
nk
E(
u2 ) =
E(
u0 u
)
nk
2
(nk)u
nk
= u2
Econometra I
Profesores:
Emerson Melo
Rodrigo Montero
Javiera Vsquez
Primavera 2005
Pauta Control 2
Pregunta 1: (30 puntos) Si un estimador es insesgado, significa que no existe error de estimacin. Comente.
Falso, al tratar de aproximar un parmetro poblacional a partir de una muestra siempre
existe un error de estimacin, es inevitable debido a las fluctuaciones muestrales (Ver Figura).
Lo que sucede si es el estimador es insesgado es que este error de estimacin en promedio es
igual a cero y por lo tanto, en valor esperado el estimador es igual a su valor poblacional.
10 10 5
30
X 0 X = 10 56 63 X 0 Y = 77
5 63 115
56
a) (30 puntos) Encuentre la matriz (XX) y (XY) del modelo en desvos con respecto a la media.
Las matrices (XX) y (XY) del modelo original tienen la siguiente forma generalizada:
P
P
n
X
X
Y
2i
3i
i
P
P 2
P
P
X2i X3i X 0 Y = P Yi X2i
X 0 X = P X2i P X2i
P
2
X3i
X2i X3i
X3i
Yi X3i
y las matrices (XX) y (XY) del modelo en desvos con respecto a la media tiene la
siguiente forma generalizada:
P
P
(XP
(X2i X2 )2
(X2i X2 )(Yi Y )
2i X2 )(X3i X3 )
0
P
X 0X = P
X
Y
=
(X2i X2 )(X3i X3 )
(X3i X3 )2
(X3i X3 )(Yi Y )
Debemos determinar los valores al interior de estas ltimas matrices a partir de la informacin entregada:
P
Yi
30
Y =
=
=3
10
Pn
X2i
10
X2 =
=
=1
10
Pn
X3i
5
X3 =
=
= 0,5
n
10
X
X
2
2
(X2i X2 )2 =
X2i
n X2 = 56 10 1 = 46
X
X
2
2
X3i
n X3 = 115 10 (0,5)2 = 112,5
(X3i X3 )2 =
X
X
(X2i X2 )(X3i X3 ) =
X2i X3i nX2 X3 = 63 10 1 (0,5) = 68
X
(X3i X3 )(X2i X2 ) = 68
X
X
(X2i X2 )(Yi Y ) =
X2i Yi nX2 Y = 77 10 1 3 = 47
X
X
(X3i X3 )(Yi Y ) =
X3i Yi nX3 Y = 56 10 (0,5) 3 = 71
Con estos valores podemos computar ambas matrices:
46
68
47
X 0X =
X 0Y =
68 112,5
71
b) (30 puntos) Encuentre los estimadores MCO de 2 y 3
2
3
46
68
68 112,5
2
3
47
71
1
112,5
68
5175 4624
1
459,5
=
70
551
0,834
=
0,127
=
68
46
= Y 2 X2 3 X3
= 3 0,834 1 0,127 (0,5) = 2,23
47
71
Econometra I
Verano 2005-2006
Profesor
Jaime Ruiz-Tagle V.
Ayudante
Roberto Jaramillo M.
Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.
Pregunta 1 (30 puntos)
(a) Explique verbalmente en qu consiste el mtodo de Mnimos Cuadrados Ordinarios.
El mtodo MCO busca escoger los coecientes de regresin de tal manera que
la funcin de regresin muestral sea lo ms cercana a la funcin de regresin
poblacional, lo que esquivale a decir que trata de que los errores sean lo menor
posible. Sin embargo, si tomamos slo la minimizacin de la suma de los errores,
puede darse que estos se compensen entre ellos, dando que este valor sea muy
bajo, pero que el modelo estimado no sea bueno. Para solucionar este problema,
se minimiza la suma de los errores al cuadrado, lo que entrega una mayor ponderacin a los errores ms grandes.
(b) Enumere y explique 4 de los 9 supuestos detrs del mtodo de Mnimos Cuadrados Ordinarios.
Yi = 0 + 1 Xi + ui .
Py x
Px
1 =
i i
2
i
aritmtica de
,
xi = Xi X
donde
es la media
Xi ).
=0
Y = 0 + 1 X
(2)
(3)
P
yx
P i 2i
x
P i
xi (1 xi + ui )
P 2
=
x
P 2 iP
x i ui
x
= 1 P i2 + P 2
x
xi
Pi
xi ui
= 1 + P 2
xi
1 =
(4)
P z }| {
E(xi ui )
= 1 + P 2
xi
E[1 ] = 1
(5)
Universidad de Chile
Facultad de Economia y Negocios
Econometra I
Otoo 2006
Pauta Control 2
Profesoras: Claudia Sanhueza y Javiera Vsquez.
Pregunta 1: (70 puntos) Un modelo de regresion multiple incluye dos regresores: yi = 0 + 1 x1i + 2 x2i + i .
En este modelo se cumplen todos los supuestos clasicos vistos en clases y
ademas se cumple que la E(x1i x2i ) = 12 .
Suponga que un investigador estima el modelo sin considerar u omitiendo
b , el estimador MCO de , un estimador insesgado?.
la variable x2i . Es
1
1
Demuestre su respuesta. Ayuda: El modelo que estima este investigador tiene
un error estocastico ui = 2 x2i + i .
(10 puntos) Usando la ayuda. El modelo que estima el investigador es entonces:
yi = 0 + 1 x1i + ui , donde ui = 2 x2i + i
b1 expresado en desvios c/r a la media es:
(10 puntos) Por lo tanto
Xn
(x1i x1 ) (yi y)
i=1
b =
Xn
1
(x1i x1 )2
i=1
(x1i x1 ) (yi y)
i=1
b
= E
E
Xn
1
(x1i x1 )2
Xn i=1
= E
Xn
2
(x1i x1 )
i=1
Xn
Xn
2
1
(x1i x1 ) +
(x1i x1 ) (ui u)
i=1
i=1
= E
Xn
(x1i x1 )2
i=1
Xn
(x1i x1 ) (ui u)
i=1
= E 1 +
Xn
(x1i x1 )2
i=1
Xn
(x1i x1 ) (ui u)
i=1
b
E
= E 1 +
Xn
1
(x1i x1 )2
i=1
Xn
(x1i x1 ) [ 2 (x2i x2 ) + i ]
i=1
= E 1 +
Xn
(x1i x1 )2
i=1
Xn
Xn
(x1i x1 ) (x2i x2 )
(x1i x1 ) i
i=1
= E 1 + 2
+ Xi=1
Xn
n
(x1i x1 )2
(x1i x1 )2
i=1
i=1
(10 puntos) Asumiendo los supestos clasicos del modelo original se cumplen
y tenemos una muestra suficientemente grande:
b +
E
1
1
2
a
= 1 + 2
12
V ar (x1 )
12
+0
V ar (x1 )
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 2
Comente (6 puntos)
Mientras ms variables independientes se incluyan en el modelo, ms precisas
sern las estimaciones, pues se utilizar una mayor cantidad de informacin.
Respuesta. Falso. A medida que se incorporan ms regresores en la estimacin
se va perdiendo precisin en las estimacin. Esta situacin se aprecia claramente
en el diagrama de Ballentine Venn, que muestr cmo al incorporar regresores
adicionales acarrea una prdida de informacin para hacer la estimacin (rea
roja). Tericamente sera posible que no se produjera esta prdida si es que el
regresor adicional es completamente ortogonal a los ya incorporados. A modo de
ejemplo, considere el siguiente modelo:
Yi = 1 + 2 X2i + 3 X3i + i
La varianza para 2 viene dada por:
V ar(2 ) = P
2
2
x22 (1 r23
)
x2 x3 = 0),
P 2
1=
+ P 2i
yi
yi
Es decir:
P 2
P
P
i
22 x22i + 32 x23i
490
P 2
R =1 P 2 =
=
yi
yi
493
2
Departamento de Economa
Universidad de Chile
Econometra I
Control 2
5 de septiembre, Primavera 2007
Miguel Benavente y Rodrigo Montero
Profesores: Jose
Ayudantes: Rodrigo Bravo,Felipe Ros, Loreto Silva
ESS
T SS
(1)
b. Que se necesita para que este se pueda interpretar? (8 puntos) Se necesita que el modelo a
estimar posea una constante, as, el coeficiente de determinaci
on se encontrar
a entre 0 y 1.
Si no incluye constante, se sale de aquel rango y pierde sentido la interpretaci
on
c. Explique las desventajas que presenta (8 puntos) La principal desventaja es que R2 siempre
aumentar
a o al menos se mantendr
a igual al aumentar el numero de regresores. Se puede
llegar, entonces, a altos R2 con regresores que practicamente no explican el modelo
d. Que otro indicador alternativo pudiera utilizarse, y por que sera mas conveniente? (8 puntos)
Un indicador alternativo, dado lo anterior, es el R2 ajustado, el cual castiga la inclusion de
una variable poco relevante para el modelo, considerando los grados de liberdad restantes por
sumar variables explicativas. Con esto, la medida de bondad del ajuste incluso puede disminuir
2. Comente en no m
as de 10 lneas la siguiente aseveracion: Para que el estimador b de mnimos cuadrados ordinarios sea MELI, se necesita que los errores tengan una distribucion N
(0, 2 )(33puntos)
Falso. Basandonos en la Clase 6, para que un estimador de minimos cuadrados ordinarios sea
MELI, este debe ser Insesgado, un modelo lineal, y el mejor en el sentido de que cualquier otro
estimador con estas caractersticas tendr
a una varianza mayor. Si bien es cierto que es importante
que la esperanza de los errores sea cero tanto para estimar MCO como para el insesgamiento, esta
no es una propiedad exclusiva de la distribuci
on normal. Lo mismo ocurre para la homocedasticidad.
Ambas cosas pueden ocurrir sin distribuirse normalmente. Incluso, estas dos caracteristicas son
supuestos del metodo MCO, donde, en ningun supuesto se indica normalidad en los errores.
3. Suponga el siguiente modelo (34 puntos):
N(0, 2 )
yi = 0 + 1 xi + i
2 = 1
x0 x =
=
1
2
0,5
1
2
6
Departamento de Economa
Universidad de Chile
Plantear hipotesis:
H0 : 0 = 0
0 6= 0
H0 : 1 = 0
1 6= 0
e2 (X 0 X)1 = 1 (
)
2 1
64
3 1
b = 1
V ar()
1 21
b
V ar()
V ar(b1 ) =
1
2
0,5
tnk
t1 = 1 1 tnk
2
La hip
otesis nula se rechazar
a cuando ttabla < tcalculado
Pauta Control #2
Econometra I
Profesores: Tomas Rau y Javiera Vasquez
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda
9 de abril, 2008
Tiempo Total: 30 Minutos.
1.
1) En el modelo de k variables, el estimador MCO existe si, y solo si, la matriz X tiene inversa. (5 puntos)
R. Falso. En el caso general n > k solo se requiere que (X X)1 exista y no que X tenga inversa
(recuerde que solo las matrices cuadradas pueden tener inversa y Xnk ), luego en general el comente
es falso. Ahora, si k = n la matriz X es cuadrada y se requiere que (X X)1 = X 1 (X )1 y por lo
tanto necesitamos que X tenga inversa. S
olo en este caso particular el comente sera verdadero.
2) El modelo de regresion en desviaciones con respecto a la media no es muy u
til puesto que no podemos
estimar el intercepto. (5 puntos)
R. Falso, siempre se puede recuperar el intercepto. Por ejemplo, si la RRP es Yi = 1 + 2 Xi + ui , la
RRP en desviaci
on con respecto a la media es yi = 2 xi + u y podemos estimar 2 . Pero el intercepto
siempre se puede recuerar de la siguiente manera: 1 = Y 2 X.
2.
(yi 2 xi )2
luego
P
yi xi
2 = P 2
xi
ii) Obtenga la varianza de 2 y, sin necesidad de demostrar matematicamente, explique que ocurre si
n = 2. (10 puntos)
R. La varianza se puede obtener f
acilmente de la expresion que encontramos en (i) (ver clase 5)
E(2 2 )2 = E
luego
2
P
xi ui
P 2
xi
2
var(2 ) = P 2
xi
2
Si n = 2 tenemos que
P no2 se puede hacer inferencia en este caso puesto que no existe estimador de
2
(recuerde que
= u
/(n 2)).
CONTROLES 3
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Control 3
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz
en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el
espacio disponible
Pregunta 1: (30 puntos) Es mejor predecir un valor puntual de y 0 que el valor esperado
E(y 0 /x0 ), ya que uno hace lo primero con mayor precisin. Comente.
Falso, al tratar de predecir un valor puntal de y (y 0 ), el error de prediccin esta compuesto
de dos trminos, uno asociado a las diferencias entre el estimador de los parmetros y el valor
+ u.
poblacional de ellos y otro correspondiente al error intrnseco de y, es decir: e = x0 ( )
Sin embargo, cuando se predice simplemente el valor promedio condicional de y, se elimina del
error de prediccin, el error asociado a la desviacin de una observacin particular de y de su
La
valor promedio condicional, es decir, el error de prediccin en este caso es: ee = x0 ( ).
2
0
1 00
varianza del error de prediccin en el primer caso es: [1 + x (XX) x ], y en el segundo
0
caso es simplemente: 2 x0 (XX)1 x0 . Por lo tanto, la prediccin en el primer caso es menos
precisa que en el segundo.
Pregunta 2: (70 puntos) Con la informacin disponible sobre producto bruto real(Y), dias
laborales (L) y capital (K) para el sector agricola de Taiwan (1958-1972), se estima un modelo
de regresin lineal con las variables en logaritmos, de la siguiente forma:
ln(y) = 0 + 1 ln(L) + 2 ln(k) + u
A continuacin se presenta la estimacin realizada en Eviews:
Dependent Variable: LY
Method: Least Squares
Date: 12/31/04 Time: 13:57
Sample: 1958 1972
Included observations: 15
LY=C(1)+C(2)*LL+C(3)*LK
C(1)
C(2)
C(3)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Coefficient
Std. Error
t-Statistic
Prob.
-3.338455
1.498767
0.489858
2.449508
0.539803
0.102043
-1.362908
2.776509
4.800487
0.1979
0.0168
0.0004
0.074810
0.067158
19.28156
10.09653
0.207914
-2.170875
-2.029265
0.891083
donde:
- S.D dependent var (sy ) es la desviacin estndar de la variable dependiente, la que se construye
de la siguiente forma:
s
PN
2
i=1 (yi y)
sy =
N 1
qP 2
u
- S.E. of regression es el error estndar de la regresin ( = N ki ).
- Sum squared resid corresponde a la suma de los errores al cuadrado.
Adems se estima el siguiente modelo restringido:
ln(y) = 0 + ln(L) + ln(k) + u
Dependent Variable: LY
Method: Least Squares
Date: 12/31/04 Time: 13:58
Sample: 1958 1972
Included observations: 15
LY=C(1)+LL+LK
C(1)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Coefficient
Std. Error
t-Statistic
-5.673589
0.036429
-155.7450
0.539520
0.539520
0.141088
0.278681
8.608959
Prob.
0.0000
10.09653
0.207914
-1.014528
-0.967325
0.250752
R2 /(k 1)
Fk1,nk
(1 R2 )/(n k)
RSS
T SS
La suma de los errores al cuadrado (RSS) se puede obtener directamente de la tabla (Sum
squared resid), el valor es de 0.067158.
2
(yi y)2
= (0,207914)2 14
(yi y)2
= 0,60519524
i=1
N
X
i=1
0,067158
= 0,889030
0,60519524
El estadstico F calculado para la hiptesis nula de que todas las pendientes son igual a
cero es:
F =
0,889030/2
= 48,06885
(1 0,889030)/12
tc
2 + 3 1
tc
t12
1,498767 + 0,489858 1
q
q
P i t1/2,nk V ar(i ) i i + t1/2,nk V ar(i ) = 1
a un 95 % de confianza, t0,975,12 = 2,179.
De esta forma, el intervalo de confianza de 1 es:
P [1,498767 2,179 0,539803 1 1,498767 + 2,179 0,539803] = 0,95
P [0,32253626 1 2,67499774] = 0,95
Por otra parte, el intervalo de confianza de 2 es:
P [0,489858 2,179 0,102043 2 0,489858 + 2,179 0,102043] = 0,95
P [0,2675063 2 0,7122097] = 0,95
Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 3
Pregunta 1: (30 puntos) En una prueba de hiptesis cualquiera, la zona de rechazo nunca
cambia al cambiar la hiptesis nula. Comente.
Falso, cuando hacemos un test de hiptesis de la forma H0 : R = r para ver si rechazamos o
no la hiptesis nula debemos comparar el valor calculado del estadstico con el valor de tabla
de una distribucin F con q grados de libertad en el numerador y n k grados de libertad en
el denominador. Si bien el valor de tabla de la distribucin F no cambia con r (los valores que
testeamos bajo la hiptesis nula) si cambia con el nmero de hiptesis que estemos testeando (q).
Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresin Lineal Simple:
Yi = 1 + 2 Xi + ui
para i = 1, ..., N
4
0
10
20
12
36
14
40
1
4
96
40
4,3871
=
=
=
96 3296
1192
0,233870968
2
b. Testee la hiptesis nula conjunta de que 1 = 4,5 y 2 = 0,5.
Para testear H0 : 1 = 4,5, 1 = 0,5, utilizamos el siguiente estadstico F:
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
F(q,nk)
u
0 u
/(n k)
lo que se puede reescibir de la siguiente forma:
0 ]1 (R r)]/q F(q,nk)
[(R r)0 [RVd
ar()R
donde:
=
Vd
ar()
e2 (X 0 X)1
4,3871 4,5
0,1129
R r =
=
y
0,233870968 0,5
0,2661
1,74
0,83
0,024
0,724 0,021
=
=
0,024 0,001
0,021 0,0009
2
0,724
0,1129 0,2661
Fc =
0,021
4,59
0,1129 0,2661
=
110,22
1
F es:
1
0,1129
/2
0,2661
110,22
0,1129
/2 = 137,32
3784,29
0,2661
0,021
0,0009
El valor de tabla de una distribucin F con dos grados de libertad en el numerador y dos
grados de libertad en el denominador es 19, con lo cual se rechaza la hiptesis nula.
c. Determine 2 , pero en un modelo sin constante. Cmo cambia con respecto al obtenido en
a.? El estimador MCO de 2 es un modelo sin constante (Y = 2 X + u) es1 :
2 =
P4
i=1
P
4
Xi Yi
i=1
Xi2
Como el modelo no incluye constante, este estimador NO queda expresado en desvos con
respecto a la media. Utilizando la informacin disponible:
Y
4
10
12
14
X
0
20
36
40
12
Promedio
Suma
Y X
0
200
432
560
X2
0
400
1296
1600
1192
3296
Por lo tanto,
2 = 0,36165049
Como podemos apreciar el valor estimado para 2 , es mayor que el en caso donde se incluye
la constante, esto porque al ser positiva la constante y omitirla se genera un sesgo hacia
arriba del parmetro de pendiente. Esto se puede apreciar grficamente en la siguiente
figura, que dibuja las recta de regresin estimadas de un modelo con y sin constante:
1 Este
4
X
(Yi 2 Xi )2
i=1
CP O :
X
SE(2 )
=
2 (Yi 2 Xi )(Xi ) = 0
2
i=1
4
X
(Xi Yi + 2 Xi2 ) = 0
i=1
2 =
P4
i=1
P
4
X i Yi
i=1
Xi2
Modelo con
constante
Modelo sin
constante
Econometra I
Profesores:
Emerson Melo
Rodrigo Montero
Javiera Vsquez
Primavera 2005
Control 3
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes,
no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho
a reclamo. Contestar slo en el espacio disponible
Pregunta 1:(30 puntos) El mtodo de mnimos cuadrados descansa fuertemente en el supuesto
de Normalidad del trmino de error. Luego el estimador M.C.O, = (X 0 X)1 X 0 Y se obtiene
solo bajo errores normales.
Falso. El supuesto de Normalidad lo necesitamos para conocer la distribucin de los estimadores
y de esta forma poder derivar los test t y F. Por otra parte la formula = (X 0 X)1 X 0 Y resulta
simplemente de plantear el problema de optimizacin de mnimos cuadrados, el cual no depende
del supuesto de Normalidad de los errores.
Pregunta 2: (70 puntos) Sea el siguiente modelo de regresin lineal mltiple:
Yi = 0 + 1 X1i + 2 X2i + 3 X3i + ui
Los errores tienen el siguiente comportamiento u N (0, 2 I). Usted dispone de la siguiente
informacin sobre los parmetros estimados de este modelo.
0,02
2,5
= 0,45 0,35
)
= 1,2
V(
0,5 0,21 0,01
0,85
0,2 0,25 0,09 0,5
0,02
Donde el tamao muestral es de N=150
a) (30 puntos)Plantee matricialmente el estadstico asociado a la hipotess1 :
H0
: 0 = 1
1 + 2 = 2
3 = 1,5
Sabemos que dado que tenemos ms de una restriccin lineal, el estadstico que corresponde
es una F con la forma:
0 ]1 (R r) F(q,nk)
(R r)0 [RVd
ar()R
1 Slo
1 0
R= 0 1
0 0
0
1
0 y r= 2
1
1, 5
0
1
0
Luego a partir de los datos del enunciado se puede construir el test F, ya que planteamos
las matrices que estn involucradas en el conjunto de restricciones lineales.
b) (30 puntos) Ahora testee la siguiente hiptesis.(Ind: Asuma un valor de tabla de 1.96 que
corresponde a un 95 % de confianza. )
H0
1 + 2 = 0,5
1, 2 + 0, 85 0, 5
= 1, 76
0, 35+, 01 + 2 0, 21
2 Recordar
Econometra I
Verano 2005-2006
Profesor
Jaime Ruiz-Tagle V.
Ayudante
Roberto Jaramillo M.
Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo.
= u2 (X 0 X)1 .
La varianza de
= E[( E[])
( E[])
0]
V ar()
= E[( ) ( )0 ].
Dado que
= (X 0 X)1 X 0 y
= (X 0 X)1 X 0 (X + u)
= + (X 0 X)1 X 0 u,
se obtiene
=
V ar()
=
=
=
=
u2 =
u
0 u
.
nk
u2
u0 u
=
=
n
Pn
ui
i=1 (
u)2
Pn
=
i=1
u2i
es necesario estimar
parmetros
k)
en vez de
n.
y = X + u),
es insesgado porque
=
E[]
de las variables explicativas y de que el error se asume con media cero), y tiene
varianza mnima (es eciente porque no hay otro estimador lineal insesgado con
menor varianza).
Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Control 3
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) Es imposible que en el siguiente modelo Y = 0 + 1 X1 + 2 X2 + u,
los parmetros 1 y 2 sean individualmente no significativos, pero que el test F de significancia
global del modelo nos diga que este es significativo. Comente.
Falso. Hay dos posible argumentos.
Respuesta 1:
Es posible que los test de significancia individual de b1 y b2 nos digan que estos no son significativos individualmente. Sin embargo, esto no quiere decir que en conjunto sean es-tadsticamente
no significativos. Lo anterior podra darse por la covarianza existente entre los coeficientes estimados. En efecto, es posible que el rea roja sea significativa, y la covarianza existente entre
ambos coeficientes sea tal que en conjunto logren explicar la variabilidad de la variable dependiente. (Ver grfico)
Y
amarillo
azul
verde
rojo
caf
naranjo
Respuesta 2:
El test t asociado a la significancia de un parametro est en funcin de la varianze de cada
parmetro.:
1
bi
tcalculado = r
\
V ar bi
En general rechazamos la hipotesis nula de no significancia (H0 :i = 0 ), si la V ar bi es
muy alta. Esto hace que el test t calculado sea bajo y por lo tanto caigamos en la zona de no
rechazo.
En cambio el test F de la significancia conjunta de los parmetros (H0 :i = 0, i ) es una
funcin la matriz de varianza y covarianza de todos los parmetros estimados:
"
F calculado
0 \
b
Rb r
= R r
RV ar b R0
En este caso b y V ar b es el vector de parametros y la matriz de var y cov de dichos
parametros estimados. Por lo tanto, el test F toma en cuenta las covarianzas entre los parametros.
En particular, en un modelo con dos variables explicativas y constante el test F tendra la
forma de:
F calculado
0 1
0 0
b1
0 b
0
1 2
0
b
3
b1
b1 , b2
b1 , b3
V
Cov
Cov
0 1 0
V b2
Cov b2 , b3
Cov b2 , b1
0 0 1
Cov b3 , b1
Cov b3 , b2
V b3
0
b1
0
0 1 0 b
0 0 1 2 0
b3
!0
!
V b2
Cov b2 , b3
b2
b2
b3
b3
Cov b3 , b2
V b3
b22 V b2 2b2 b3 Cov b2 , b3 + b32 V b3
2
V b2 V b3 Cov b2 , b3
0
1
1
0
0
1
Por lo tanto, si la covarianza entre los parametros es tal que contrarresta el efecto de las
varianzas altas de los parametros podemos tener un test F suficientemente alto para rechazar la
H0 de no significancia conjunta (H0 :i = 0, i ), y por ende el modelo explica la varianza total
2
Suponiendo que la demanda por naranjas viene dada por la siguiente ecuacin:
y = + x + u
estime los parmetros de esta ecuacin. Calcule un intervalo de confianza al 90 % para la cantidad de naranjas que se venden en la semana 7, si el precio es de $25 por unidad en esta semana.
P 2
0,87 0,02
Nota:
ui = 1,77 y (X 0 X)1
0,02 0,0006
Respuesta: El estimador MCO de se obtiene de la siguiente forma:
P
(Xi X)(Yi Y )
=
P
(Xi X)2
Suma
Promedio
Y
6
4
5
4
3
2
24
4
X
10
20
30
40
50
60
210
35
(Y Y )
2
0
1
0
-1
-2
-
(X X)
-25
-15
-5
5
15
25
-
(Y Y )(X X)
-50
0
-5
0
-15
-50
-120
-20
(X X)2
625
225
25
25
225
625
1750
291.7
120
= 0,068571429
1750
= 6,4
Y X
Ahora si se espera que en la semana 7 el precio de las naranjas sea $25 por unidad, la demanda
esperada (prediccin puntual) es:
y0 = 6,4 0,068571429 25 = 4,685714286
3
2 =
=
= 0,4425
nk
4
0,87 0,02
1
0
0
1 00
1 25
x (X X) x
=
= 0,245
0,02 0,0006
25
Vd
ar(b
e0 )
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 3
Comente (6 puntos)
La significancia global del modelo depende de la significancia individual de las
variables independientes incluidas.
Respuesta. Falso. Es posible que, aun cuando los coeficientes estimados no sean
individualmente significativos, s lo sean en conjunto. Lo anterior podra darse en
el caso que la covarianza de los regresores sea capaz de explicar la variabilidad
de la variable dependiente. Como existe un alto grado de correlacin entre las
variables independientes del modelo (es decir, un alto grado de multicolinealidad),
entonces, al menos una de estas variables tiene una influencia significativa sobre
la variable dependiente, pero no se puede establecer cual. Por otro lado, al existir
un alto grado de multicolinedlidad, es muy probable que los coeficientes, a nivel
individual, no sean estadsticamente significativos. Recuerde que:
=
var()
2 (X 0 X)1
Si existe un alto grado de colinealidad entre las variables independientes del modelo, el determinante de (X 0 X) tiende a cero, por lo que se obtienen varianzas
gigantes.
(X 0 X)1
26, 7 4, 5
8
= 4, 5
1
1, 5
8 1, 5 2, 5
e2i
nk
P
=
Por otro lado, se sabe que:
P 2
e
R = 1 P i2 = 0, 95
yi
2
Es decir:
X
e2i = 1, 4
Por lo tanto:
2 =
1, 4
= 0, 7
2
Finalmente:
26, 7 4, 5
8
18, 69 3, 15 5, 6
var() = 0, 7 4, 5
1
1, 5 = 3, 15
0, 7 1, 05
8 1, 5 2, 5
5, 6 1, 05 1, 75
2
Los intervalos de confianza vienen dados por (4 puntos por cada uno):
p
p
P (4 1, 96 18, 69 < 0 < 4 + 1, 96 18, 69) = 0, 95
P (4, 47 < 0 < 12, 47) = 0, 95
p
p
P (2, 5 1, 96 0, 7 < 1 < 2, 5 + 1, 96 0, 7) = 0, 95
P (0, 86 < 1 < 4, 13) = 0, 95
p
p
P (1, 5 1, 96 1, 75 < 2 < 1, 5 + 1, 96 1, 75) = 0, 95
P (4, 09 < 2 < 1, 09) = 0, 95
Es decir, slo 1 es estadsticamente significativo (2 puntos).
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 3
Ei = 209
Mi = 791
Ei Mi = 19686
n
E
M
i
i
0
1 0
P 2
P
= (X X) X Y = P
Ei
Ei
Ei Mi
Por lo tanto:
1
791
20, 75335
9
209
=
=
209 5135
19686
4, 678374
= 1, 1063597
Luego, el test t se calcula como sigue:
t =
4, 678374
=
= 4, 2286193
1, 1063597
V ar(eo ) = s2 (1 + xo (X 0 X)1 xo )
Luego:
"
o
V ar(e ) = 344, 63293 (1 + 1 26
1 #
9
209
1
= 215, 565586
209 5135
26
Luego:
P (100, 88437 2, 3(14, 6821519) 100, 88437 + 2, 3(14, 6821519)) = 1
P (67, 115421 134, 65332) = 1
Control #3
Econometra I
Profesores: Tomas Rau y Javiera Vasquez
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda
23 de abril, 2008
Tiempo Total: 30 Minutos.
1.
2.
Ha : 31 23 6= 8
Escriba explicitamente el estadstico a usar, su distribuci
on bajo la hipotesis nula, y cuando rechaza o
no rechaza la hip
otesis nula.
R. Aqui hay dos alternativas: hacer un simple test-t o un test F mediante R = r (caso 3). La primera
es trivial,
31 23 + 8
t= q
tnk
9V ar(1 ) + 4V ar(3 ) 12Cov(1 , 3 )
1
(1)
2 (X X)1 =
0
0
y
0
4
0
3
0
0
9
0
0
3
0
9
Realice el test descrito en a) con un nivel de significancia del 5 % y diga si rechaza o no la hipotesis
5%
nula. Recuerde que t2,5 %,996 = 1,96 y que F1,996
= 3,84
R. El test t es simplemente
t= q
31 23 + 8
12
=2
36 + 36 36
con lo cual tenemos que se rechaza la hipotesis nula puesto que t2,5 %,996 = 1,96
La otra manera requiere un poco mas de algebra. Dado que q = 1 podemos reemplazarlo y calculemos
la expresion en corchetes a la menos 1, es decir la varianza de R
2 R(X X)1 R
luego,
36
0 3
0 6
3
0
0 2
0
0
0 9
0
4
0
3
0
3
0
2
0
0
9
0
0
0
3
3
0 0
9
2
[(R r) [
2 R(X X)1 R ]1 (R r)]/q = (12)(36)1 12/1 = (12)2 /36 = 4
5%
Luego el estadstico es mayor a F1,996
= 3,84 y se rechaza la hipotesis nula.
CONTROLES 4
Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 4
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) En un modelo de regresin lineal simple donde tanto la variable
dependiente como explicativa estn en logaritmos, el parmetro estimado representa una elasticidad. Comente.
Verdadero, cuando tenemos un modelo de regresin simple: ln(yi ) = + ln(xi ) + ui , donde
ambas variables (dependiente y explicativa) estan el logaritmos, el parmetro que representa
el impacto marginal de ln(x) sobre ln(y) representa la elacticidad de y a x.
ln(y)
Veamos esto con ms detalle, = ln(x)
, recordando que la dervivada de una variable en logaln(y)
rimo es ln(x)
= x1 x, tenemos que = ln(x)
= y
x
y
por definicin corresponde la elasticidad de y a x.
x
x
, lo que es implica =
%y
%x ,
lo que
Pregunta 2: (70 puntos) Existe presuncin que los egresados de Administracin de la carrera de Ingeniera Comercial tienen un mayor salario que aquellos egresados de Economa.
(a) Plantee un modelo que permita testear esta hiptesis. Explique explcitamente como lo
testeara.
R: Suponiendo que disponemos datos de los alumnos egresados de Ingeniera Comercial, podramos estimar el siguiente modelo:
Wi = 0 + 1 D1i + ui
donde Wi es el logaritmo natural del salario y D1i es una variable dummy que toma el valor 1
si la persona i egreso de administracin y 0 si egreso de economa (tambin se puede definir D2i
que tome el valor 1 si la persona i egreso de economa y 0 si egreso de administracin e incluir
esta en el modelo, o incluir ambas dummies en el modelo y omitir la constante).
De esta forma:
E[Wi /Administracion]
E[Wi /Economia]
0 + 1
0
en
E[Wi /Economia
U. de Chile] =
en U. de
Chile] =
E[Wi /Administracion
en
U. Catolica] =
E[Wi /Economia
en
U. Catolica] =
0 + 1 + 2 + 3
0 + 2
0 + 1
0
H0 :
1
2
3
R
= 0
= 0
= 0
= r
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Control 4
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz
en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el
espacio disponible
Pregunta 1: (30 puntos) Bajo el supuesto de normalidad del trmino de error, el estimador Mximo Verosmil (MV) y el de Mnimos Cuadrados Ordinarios (MCO) son exactamente
iguales. Comente.
Efectivamente bajo el supuesto de normalidad del trmino de error, el estimador Mximo Ve coincide con el estimador
rosmil de los parmetros asociados a las variables explicativas ()
MCO. Pero el estimador de la varianza del error ( 2 ) difiere, el estimador Mximo Verosmil de
este parmetro es un estimador sesgado, igual a la suma de los errores estimados al cuadrado
dividido por el tamao de muestra. De esta forma, el comente es FALSO.
Pregunta 2: (70 puntos) Suponga que Ud. quiere estimar la siguiente funcin de produccin
Cobb-Douglas:
Y = AL K eu
para lo cual dispone datos de producto (Y), capital (K) y trabajo (L) de 10 pases latinoamericanos.
a) Plantee una ecuacin de regresin estimable por MCO.
R:
Como la funcin de produccin Cobb-Douglas es una funcin no lineal es variables, para
que sea estimable por MCO se debe linealizar, lo que se hace aplicando logaritmo a esta
funcin, quedando el siguiente modelo logartmico:
ln(Y ) = ln(A) + |{z}
ln(L) + ln(K) + u
|{z}
| {z }
0
ln(Y )
ln(L)
%Y
%L = Y,L corresponde a la elasticidad del producto
ln(Y )
%Y
= %K
= Y,K corresponde a la elasticidad
2 = ln(K)
al factor trabajo, y
con respecto al factor Capital.
(1)
con respecto
del producto
b) Especifique un modelo que le permita testear que para cualquier nivel de Capital(K) y
Trabajo (L), pases grandes tienen en promedio un producto mayor que pases pequeos.
Adems plantee explcitamente un test de hiptesis para ver la significancia estadstica
de esta diferencia.
R:
Para testear esta hiptesis primero debemos definir la siguiente variable dummy:
(
1 Pas grande
D1 =
0 Pas pequeo
Un modelo que nos permita testear que para cualquier nivel de capital y trabajo los pases
grandes producen en promedio ms que los pequeos, requiere introducir esta variable
dummy (D1 ) en el modelo de la ecuacin (1):
ln(Y ) = 0 + 1 ln(L) + 2 ln(K) + 3 D1 + u
(2)
De esta forma:
E(ln(Y)|pas grande, K, L)=0 + 3 + 1 ln(L) + 2 ln(K).
E(ln(Y)|pas pequeo, K, L)=0 + 1 ln(L) + 2 ln(K).
El parmetro 3 es quien mide esta diferencia en el promedio del producto par cualquier nivel fijo de K y L, por lo tanto, para testear si esta diferencia es estadsticamente
significativa, se debe testear la hiptesis de que 3 es estadsticamente significativo, ms
especficamente se debe realizar el siguiente test de hiptesis:
H0 :
H1 :
3 = 0
3 6= 0
t= q
V (3 )
tnk
(3)
4 = 0
4 6= 0
t= q
V (4 )
tnk
Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 4
Pregunta 1: (30 puntos) Uno de los supuestos utilizados para derivar el estimador MCO
asuma que las variables independientes eran determinsticas. Si levantamos este supuesto el
estimador MCO sigue siendo insesgado pero ya no es el mejor estimador lineal e insesgado.
Comente.
Falso, cuando tenemos regresores estocsticos tenemos que la media y varianza condicional
1 yt
e 0
0
yt > 0; 0 > 0
T
Y
T
Y
1 yt
f (yt ; 0 ) =
e 0
0
t=1
t=1
T
1 PT
1
e 0 t=1 yt
0
T ln(0 )
T
1 X
yt
0 t=1
Encuentre las condiciones de primer orden asociadas a la estimacin por maxima verosimilitud de 0 (20 puntos).
1
T
T
1 X
yt
+
2 t=1
T
1 X
yt
2
= 0
=
t=1
PT
t=1
yt
Econometra I
Verano 2005-2006
Profesor
Jaime Ruiz-Tagle V.
Ayudante
Roberto Jaramillo M.
Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo.
Pregunta 1 (30 puntos)
Una variable aleatoria
(
f (x) =
donde
> 0
exp
para
para
x>0
x0
Px
es
, donde
es el
x.
n
Y
1
i=1
exp
xi
n
1
1 X
xi ,
=
exp
1X
xi .
xi
= x.
n
Los 3 tests usados en inferencia bajo Mxima Verosimilitud son: el test LR (Likelihood
Ratio - Razn de Verosimilitud), el test de Wald y el test LM (Lagrange Multiplier Multiplicador de Lagrange).
Los estadsticos de cada uno de los tests son los siguientes:
LR = 2 ln L(,
) ln L(,
)
(R r)0 [R(X 0 X)1 R0 ](R r)
2
a
LM = n R2
2q
W =
2q
a
2q
Econometra I
Profesoras: Javiera Vsquez.
Otoo 2006
Control 4
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) En un modelo que busca explicar que en promedio los hombres
ganan ms que las mujeres, para cualquier nivel de escolaridad, da lo mismo incluir una dummy en la regresin que estimar dos modelos separados, uno para los hombres y otro para las
mujeres. Comente.
Efectivamente en trminos de especificacin, es lo mismo plantear un modelo que capture la
diferencia por gnero mediante una variable dummy, que estimar separadamente un modelo de
ecuacin de mincer, uno para los hombres y otro para las mujeres. Sin embargo, en trminos de
eficiencia no es lo mismo. Al separar los modelos el tamao muestral utilizado es ms pequeo
(en cada uno de ellos) que al estimar un solo modelo, por lo que la primera metodologa es
menos eficiente.
Pregunta 2: (70 puntos) Plantee un modelo que le permita testear que la demanda por helados
en verano es diferente a la demanda promedio en invierno, y que la reaccin ante un cambio en
el precio difiere en estas dos estaciones. Sea explcito en como testeara esto.
Para esta pregunta vamos a dar dos alternativas de respuesta, una 100 % buena y una regular (pero aceptable):
Respuesta 1: Definamos las siguientes Dummies:
(
(
1 verano
1
d1i =
d2i =
0
0
invierno
2 = 3
H0 :
4 = 5
(1)
Si se cumplen las hiptesis nulas se comprueba que no existe diferencia estadstica en la demanda por helados entre invierno y verano.
Respuesta 2: Definamos la siguiente dummy:
(
1 verano
d1i =
0 invierno
(2)
=
=
+ 1 Pi + 2 + 3 Pi
+ 1 Pi
2 = 0
3 = 0
Si se cumplen las hiptesis nulas se comprueba que no existe diferencia estadstica en la demanda por helados entre invierno y verano.
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 4
Comente (6 puntos)
El supuesto de independencia (de las observaciones) es crucial para implementar
el estimador de mxima verosimilitud (MV).
1
2 2
1
u2
i
2 2
Respuesta. Asumiendo que las realizaciones del trmino de error son independientes, la densidad conjunta se escribe de la siguiente manera:
f (u1 , u2 , ..., un ; 2 ) = f (u1 ) f (u2 ) f (un ) = ni=1 f (ui )
Dado el supuesto de normalidad, entonces:
"
#
u2
0
i
1
1
u u2
2
2
n
n
2
2
f (u1 , u2 , ..., un ; ) = i=1
e
= i=1
e
2 2
2 2
La densidad multivariada para Y condicional en X viene dada por la siguiente
expresin:
u
f (Y |X) = f (u)
Y
donde |u/Y | es el valor absoluto del determinante formado por la matriz de
derivadas parciales (nxn) de los elementos de u con respecto a los elementos de
Y . En este caso, esta matriz es la matriz identidad. De esta forma, la funcin de
verosimilitud para Y viene dada por:
(Y X)0 (Y X)
1
e
f (Y1 , Y2 , ..., Yn ; X, , ) =
(2 2 )n/2
2
Luego, para obtener los estimadores de mxima verosimilitud se aplica logaritmo a la expresin anterior y se deriva respecto a y 2 :
n
(Y X)0 (Y X)
n
2
max ln(2) ln( )
2
2
2 2
Luego:
1
ln(L)
=0
= 2 X 0 (Y X )
ln(L)
n
1
0 (Y X )
= 2 + 4 (Y X )
2
Resolviendo:
M V = (X 0 X)1 X 0 Y
y:
2
M
V
0 (Y X )
(Y X )
=
n
2
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 4
1
adj(A)
|A|
Respuesta. Se sabe que el omitir una variable relevante tiene dos efectos: (i)
estimacin sesgada de los verdaderos parmetros poblacionales, (ii) estimacin
sesgada de las varianzas de los estimadores de mnimos cuadrados ordinarios. Por
lo tanto, al estimar el modelo omitiendo la calidad promedio de los materiales se
obtendrn estimaciones sesgadas, y esto es lo que se muestra a continuacin. Si
se estima el modelo:
Gi = 0 + 1 Ai + ui
entonces:
M CO =
P 1 P
N
Ai
Gi
0
P
P
P
=
Ai
A2i
Ai G i
1
Por lo tanto:
M CO =
1
1
1
76 10
80
0
10 10
80
=
=
154
10 76
154
660 10 10
1
Finalmente:
M CO
0
6, 878
= =
1, 121
1
P
P
G
0
N
A
C
i
i
i
P
P
P
P
Ai G i
A
C
M CO = 1 = P Ai P A2i
i
i
P
P 2
2
Ci
Ai Ci
Ci
Ci Gi
Por lo tanto:
M CO
1
80
0
10 10 15
= 1 = 10 76 84 154
200
2
15 84 102
1
adj(A)
|A|
10
C12 = (1)
15
10
C13 = (1)1+3
15
10
C21 = (1)2+1
84
10
C22 = (1)2+2
15
10
C23 = (1)2+3
15
10
C31 = (1)3+1
76
10
C32 = (1)3+2
10
3+3 10
C33 = (1)
10
1+2
696
240
300
84
= 240
102
76
= 300
84
15
= 240
102
15
= 795
102
10
= 690
84
15
= 300
84
15
= 690
84
10
= 660
76
240 300
795 690
690 660
Por lo tanto:
M CO
696
240 300
80
6, 716
0
1
240
795 690 154 = 0, 746
= 1 =
4860
300 690 660
200
0, 358
2
Pauta Control N4
Econometra I
Profesores: Toms Rau y Javiera Vsquez
Ayudantes: Roberto Gillmore, Eugenio Rojas, y Jorge Seplveda
23 de Mayo de 2008
1. Si Ud. posee la siguiente funcin de produccin Cobb-Douglas:
Yi = ALi K i e ui
donde:
Yi: produccin de la empresa i
Li: cantidad de trabajadores en la empresa i
Ki: capital fijo de la empresa i.
a) Por qu razn el modelo anterior no es estimable por MCO? (5 ptos)
La funcin Cobb-Douglas no es estimable tal cual se plantea, ya que la variable
dependiente (Y) depende en forma no lineal de los parmetros del modelo.
b) Menciones dos alternativas para que este modelo pueda ser estimado (10 ptos)
1- Se puede estimar por Mxima Verosimilud
2- Se puede linealizar el modelo aplicando logaritmo natural y estimar por MCO:
ln Yi = ln( A) + ln Li + ln K i + u i
123
E[ln Y | ln L, ln K , D ] = + ln L + ln K + D
De esta forma el producto promedio (en logaritmo) de las empresas del sector servicios
es:
E[ln Y | ln L, ln K , D] = + ln L + ln K +
Y de los otros sectores econmicos:
E[ln Y | ln L, ln K , D] = + ln L + ln K
Luego para testear si existe una diferencia significativa, se debe realizar un test t sobre
la hiptesis nula de que es igual a cero. Si se rechaza la hiptesis nula la diferencia en
el producto promedio de este sector con respecto a los restantes es estadsticamente
significativa.
d) A partir del modelo anterior, Qu variable agregara para testear que la
productividad marginal del trabajo es mayor en el sector servicios que en otros
sectores econmicos? (15 ptos)
Para testear esta hiptesis se debera agregar al modelo anterior, una variable interactiva
del lnL con la Dummy antes definida:
ln Yi = + ln Li + ln K i + Di + ln Li Di + u i
As el valor esperado condicional del producto (en logaritmos) en este caso es:
E[ln Y | ln L, ln K , D] = + ln L + ln K + D + ln L D
Entonces la elasticidad del producto con respecto al trabajo:
E[ln Y | ln L, ln K , D]
= + D
ln L
ln wi = + 1 Ei + 2 D2i Ei + 3 D3i Ei + ui
Donde:
Wi: salario de la persona i.
Ei: aos de escolaridad de la persona i.
D2i: variable dummy que toma valor 1 si la persona i tiene entre 8 y 11 aos de
escolaridad (incluido los entremos).
D3i: variable dummy que toma valor 1 si la persona i 12 aos de escolaridad o ms.
a) Qu representan los coeficientes 1, 2 y 3? (15 ptos)
Derivando el valor esperado del logaritmo del salario con respecto a los aos de
escolaridad, se obtiene el retorno a la educacin:
E[ln wi | E , D2 , D3 ]
= 1 + 2 D2 i + 3 D3i
E
Para la gente que tiene menos de ocho aos de escolaridad, el retorno a la educacin es:
E[ln wi | E , D2 , D3 ]
= 1
E
Para las personas que tienen 8 aos y ms de escolaridad pero menos de 12 aos de
escolaridad, el retorno a la educacin es:
E[ln wi | E , D2 , D3 ]
= 1 + 2
E
Y finalmente, para las personas que tienen 12 aos de escolaridad o ms, el retorno a la
ecuacin que resulta del modelo es:
E[ln wi | E , D2 , D3 ]
= 1 + 3
E
De esta forma, 1 representa el retorno a la educacin de las personas con menos de 8
aos de educacin (bsica incompleta), el coeficiente 2 representa el aumento en
retorno a la educacin de las personas que tienen entre 8 y 11 aos de educacin
(incluido los extremos) comparado con la gente con menos de 8 aos de escolaridad, y
el coeficiente 3 representa el aumento en retorno a la educacin de las personas que
CONTROLES 5
Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Pauta Control 5
Pregunta 1: (30 puntos) La omisin de una variable relevante siempre subestima el verdadero
valor del y su varianza. Comente.
Falso, la omisin de una variable relevante siempre produce sesgo en los parmetros a menos
que la correlacin entre la variable omitida y las explicativas incluidas sea cero, sin embargo, la
direccin del sesgo no es siempre negativa, el signo del sesgo depende de dos cosas: la correlacin
entre la variable omitida y las variables explicativas incluidas y el valor del parmetro que tendra asociado la variable omitida (valor poblacional). Para un modelo sencillo con una variable
1 ,x2 )
explicativa (x1 ) y una variable omitida (x2 ) se mostr en clases que el sesgo es: cov(x
V (x1 ) 2 .
Por otra parte, siempre al omitir una variable relevante, la varianza de los parmetros estimada
a partir del modelo incorrecto es menor que la del modelo verdadero que incluye la variable
omitida.
Pregunta 2: (70 puntos)
Suponga que un amigo de usted esta interesado en estimar el retorno a la educacin. Para
esto ha estimado los siguientes dos modelos.
Modelo 1:
Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Expe2i + 6 Dzonai + 7 Dpatroni + ui
Modelo 2:
Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Expe2i + 6 Dzonai + ui
En donde Wi corresponde al logaritmo natural del salario del individuo i , Dsexoi es una variable dicotmica que toma el valor de 1 si el individuo i es hombre, Esci corresponde a laos
aos de educacin del individuo i, Expei y Expe2i corresponden a los aos de experiencia y
experiencia al cuadrado del individuo i respectivamente, Dzonai es una variable dicotmica que
toma el valor de 1 si el individuo vive en una zona urbana y 0 sino, y Dpatroni es una variable
dicotmica que toma el valor de 1 si el individuo es trabajador por cuenta propia.
En base a los resultados de los modelos calcule los criterios de informacin de Akaike y Schwarz
y aconseje a su amigo sobre cual modelo debe considerar.
Modelo 1:
Dependent Variable: LNW
Method: Least Squares
Date: 10/27/04 Time: 00:15
Included observations: 40191
LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6)
*DZONA+C(7)*DPATRON
Coefficient
Std. Error
t-Statistic
Prob.
9.931645
0.389195
0.117759
0.018930
-0.000160
0.188917
0.359617
0.022411
0.010563
0.001023
0.000957
1.38E-05
0.007530
0.007515
443.1514
36.84418
115.1189
19.79067
-11.59811
25.08913
47.85069
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
C(7)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.368769
0.368674
0.674479
18280.58
-41197.25
11.91058
0.848871
?
?
1.705727
Modelo 2:
Dependent Variable: LNW
Method: Least Squares
Date: 10/27/04 Time: 00:24
Included observations: 40191
LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6)
*DZONA
C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Modelo I
Modelo II
Coefficient
Std. Error
t-Statistic
Prob.
9.938190
0.389363
0.120470
0.021630
-0.000151
0.176372
0.023040
0.010860
0.001050
0.000982
1.42E-05
0.007737
431.3386
35.85326
114.7276
22.03435
-10.65890
22.79717
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.332801
0.332718
0.693420
19322.21
-42310.86
AIC
BIC
n
40191
40191
k
7
6
11.91058
0.848871
?
?
1.739436
2lnL k
+
n
n
2lnL ln(n) k
+
n
n
lnL
-41197.25
-42310.86
AIC
2.05025
2.10564
BIC
2.0519
2.10707
De acuerdo a ambos criterios se recomienda escoger el primer modelo, ya que este minimiza
ambos criterios de informacin.
2
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Control 5
Pregunta 1: (30 puntos) El estimador de White me permite solucionar el problema de ineficiencia en el estimador MCO cuando los errores son Heterocedsticos. Comente.
Falso, el estimador de White slo me permite estimar en forma consistente la matriz de varianzas y covarianzas de los parmetros en presencia de Heterocedasticidad estimador por MCO. El
estimador MCO siempre ser ineficiente, el estimador eficiente en este contexto es el de Mnimos
Cuadrados Generalizados.
Por lo tanto, White me permite estimar consistentemente la matriz de varianzas ty covarianzas
del estimador MCO (que es ineficiente) para realizar la inferencia en forma correcta, utilizando
esta matriz.
Pregunta 2: (70 puntos) Suponga el siguiente modelo de regresin lineal:
Y = X + u
n1
n1
nkk1
n1
nk1 k1 1
nk2 k2 1
n1
donde k1 + k2 = k
0
0
1
X1 Y
X1 X1 X10 X2
=
X20 Y
X20 X1 X20 X2
2
o alternativamente:
(X10 X1 )1 + (X10 X2 )2 = X10 Y
(X20 X1 )1 + (X20 X2 )2 = X20 Y
(1)
(2)
De (2) obtengo:
(X20 X2 )2 = X20 (Y X1 1 )
2 = (X20 X2 )1 X20 (Y X1 1 )
(3)
(4)
M2
(5)
1 =
E(1 ) =
1 +
(X10 M2 X1 )1 X10 M2 u
=
=
=
=
=
E[(1 1 )(1 1 )0 ]
E[(X10 M2 X1 )1 X10 M2 uu0 M2 X1 (X10 M2 X1 )1 ]
(X10 M2 X1 )1 X10 M2 E[uu0 ]M2 X1 (X10 M2 X1 )1
(X10 M2 X1 )1 X10 M2 2 IM2 X1 (X10 M2 X1 )1
2 (X10 M2 X1 )1 X10 M2 X1 (X10 M2 X1 )1
V (1 )
= 2 (X10 M2 X1 )1
Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 5
Pregunta 1: (30 puntos) La omisin de variables relevantes produce subestimacin en los parmetros estimados por Mnimos Cuadrados Ordinarios. Comente.
Falso, es correcto que el estimador MCO ser sesgado en presencia de variables relevantes
omitidas, tenemos que E[1 ] = 1 + (X10 X1 )1 X10 X2 2 lo que en un modelo sencillo de dos
1 ,X2 )
variables (una incluida y la otra omitida) se reduce a E[1 ] = 1 + Cov(X
2 . Pero el signo
V (X1 )
del sesgo depende de dos cosas: del signo de 2 y de la covarianza entre X1 y X2 . Existen tres
casos posibles:
1. 2 positivo y Cov(X1 , X2 ) positiva, lo cual genera un sesgo hacia arriba o sobreestimacin.
2. 2 positivo y Cov(X1 , X2 ) negativa, lo cual genera un sesgo hacia abajo o subestimacin.
3. 2 negativo y Cov(X1 , X2 ) positiva, lo cual genera un sesgo hacia abajo o subestimacin.
Pregunta 2: (70 puntos) Demuestre que los criterios de informacin de Akaike (AIC) y Schwarz
(BIC):
AIC
BIC
lnL
k
+2
n
n
lnL
k
2
+ ln(n)
n
n
2
AIC
ln(
2 ) + 2
BIC
ln(
2 ) + ln(n)
k
n
1
2 2
1
2 2
(yi Xi )2
2 2
u2
i
e 22
n P
(yi Xi )2
n
1
L(, 2 ; Y, X) =
e i=1 22
2 2
n Pn 2
i=1 ui
1
=
e 22
2 2
Finalmente el logaritmo de la verosimilitud es:
lnL(, 2 ; Y, X)
n
n
ln(2) ln( 2 )
2
2
Pn
2
i=1 ui
2 2
la que se puede evaluar en los estimadores (,
2 ):
n
n
lnL(, ; Y, X) = ln(2) ln(
2 )
2
2
Pn
Recordemos que
2 =
Pn
i=1
u
2i
2i
i=1 u
2
2
n
n
n
2
ln(2) ln(
2 )
2
2
2
2
n
n
n
2
lnL = ln(2) ln(
)
2
2
2
n
2
lnL = ln(2) + ln(
)+1
2
lnL =
n
ln(
2 )
2
Reemplazando esta ltima expresin en las formulas originales de los criterios de informacin
de Akaike y Schwarz, se demuestra lo planteado.
Econometra I
Profesores: Emerson Melo
Rodrigo Montero
Jaime Ruiz-Tagle / Javiera Vsquez
Primavera 2005
Control 5 - Pauta de Correccin
Rut:
.......................................
Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.
muestre que el estimador mximo verosmil pasa por los puntos medios de los datos sobre yi y xi . Esto es, muestre que se cumple y = 0M V + 1M V x1 , donde 0M V y 1M V son
los estimadores de mxima verosimilitud de 0 y 1 respectivamente.
Para ello, recuerde que la funcin normal para una variable centrada en su media (es
decir, con media igual a cero) se escribe como:
1
x2
f (x) = exp 2 .
2
2
Solucin
normal es:
n
Y
u2
1
exp i2 .
2
2
i=1
1
u2
exp i2
2
2
i=1
n
X
n
u2i
= n ln() ln(2) +
2 .
2
2
ln(L) =
ln
i=1
.
2
2 2
i=1
n
X
i=1
(yi 0M V 1M V x1i )
2 2
n
X
!
= 0
(yi 0M V 1M V x1i ) = 0
i=1
n
X
yi = n 0M V + 1M V
Pni=1
i=1 yi
n
= 0M V +
x1i
i=1
Pn
MV
i=1 x1i
y = 0M V + 1M V x1 .
n
X
Explique en qu consiste cada uno de los 3 test de hiptesis usados en inferencia bajo Mxima Verosimilitud. Haga una comparacin crtica de los test, estableciendo sus
ventajas y desventajas.
LR = 2 ln L(,
) ln L(,
)
W
LM
2
a 2
2
= nR
q
2q
a
2q
El test de Wald involucra slo la estimacin del modelo no restringido, y analiza las
implicancias de las restricciones. La construccin del estadstico W involucra manejo
matricial, hacindolo ms demandante.
El test LM analiza la pendiente de la funcin de verosimilitud y nalmente slo requiere la estimacin del modelo restringido. La construccin del estadstico requiere
una regresin auxiliar.
Usualmente, el modelo original y el tipo de restricciones determinarn cul test es ms
sencillo de aplicar. En algunos casos el modelo no restringido puede ser tan complejo
que el test LM se hace ms conveniente. En otros casos, las restricciones pueden generar
un mayor costo de estimacin del modelo restringido, haciendo que el test de Wald sea
ms conveniente.
Econometra I
Verano 2005-2006
Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no
tiene derecho a reclamo.
Pregunta 1 (30 puntos)
(b) (15 puntos) Explique intuitivamente por qu se busca minimizar (segn esta denicin)
los criterios de informacin.
lo tanto, dado que para calcular el valor del ndice se usa el valor del logaritmo de la
funcin de verosimilitud, sabemos que ambos ndices, Akaike y Schwartz, son positivos.
Un valor de ln L ms cercano a cero indicar un mejor ajuste, de modo que el ndice
ser minimizado para obtener el modelo ptimo.
Pregunta 2 (30 puntos)
(a) (10 puntos) Si se omite una variable relevante en la estimacin de un modelo se produce un sesgo. Cul la estimacin que est sesgada? De qu depende el signo del sesgo?
Al omitir una variable relevante del modelo se producir un sesgo en la estimacin de los
parmetros de todas las variables del modelo. El signo del sesgo depende de la relacin
existente entre la variable omitida y el resto de las variables y del signo del parmetro
de la variable omitida en el modelo verdadero. Adems, se producir un sesgo en la estimacin la varianza de los estimadores de los parmetros. En particular, se subestimar
la varianza de los estimadores. Finalmente se sobreestimar la varianza de los errores.
(c) (10 puntos) Explique en qu consiste y para qu sirve el mtodo de estimacin de Mnimos Cuadrados Generalizados Factibles (MCGF). [Nota: No es necesaria una demostracin
matricial, pero el uso de expresiones algebraicas puede contribuir a una explicacin ms
clara].
V ar(|X)
= (X 0 X)1 (X 0 u2 X)(X 0 X)1
1
= n(X 0 X)1 ( u2 X 0 X)(X 0 X)1
n
X
= 1
u
2i xi x0i .
n
i=1
0 X)1 .
V ar(|X)
= n(X 0 X)1 (X
Universidad de Chile
Facultad de Economia y Negocios
CONTROL 5
Econometra I
Oto
no 2006
x21 0 0
0 x22 0
..
..
. 0
.
0
0 0 x2n
1
x21
x22
..
.
0
0
0
1
, =
.
1
x2n
h
i
0 1
(X X) = 1 1
1
x21
0
..
.
0
x22
..
.
0
0
0
0
1
0
..
.
0 1
1
x2n
T
X
1
=
2
i=1 xi
X Y =
1
x21
i
1 1
0
..
.
0
...
0
1
x22
y1
T
0
X
yi
.
. =
2
0 y
i=1 xi
n
1
x2n
PT
M CG = (X X) X Y =
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 5
Yi = 1 D1i + 2 D2i + ui
donde Yi es el salario del trabajador, D1i es una variable dummy que toma
el valor uno si la persona no utiliza un computador en su lugar de trabajo,
y cero si no, D2i es una variable dummy que toma el valor uno si la persona
utiliza un computador en su lugar de trabajo, y cero si no, y finalmente, ui
es un trmino de error bien comportado.
2. Encuentre los estimadores MCO del modelo anterior. (6 puntos)
Respuesta. En trminos matriciales, el modelo puede escribirse de la siguiente forma:
Y = X + u
donde:
d11
d21
d12 d22
X= .
.. = (D1 D2 )
.
.
.
d1n d1n
y:
1
=
2
Luego:
= (X 0 X)1 X 0 Y =
D10 D1
D10 D2
D20 D1
D20 D2
D10 Y
D20 Y
(1)
Finalmente:
1 P
d1i Yi
Y1
280,000
1
N1 0
= =
P
=
d2i Yi
Y2
300,000
2
0 N2
(2)
=
var()
2
N1
N2
2
14
2
6
4. Especifique nuevamente el modelo pero ahora incluya slo una variable dummy, y deje como categora base a aquellos que no utilizan un computador
en su lugar de trabajo. Cmo se relacionan los coeficientes de este modelo
con aquellos definidos en la parte (1)? (2 puntos)
Respuesta. El modelo a estimar sera el siguiente:
Yi = 0 + 1 D2i + ei
Por lo tanto, se cumple lo siguiente:
0 = 1
1 = 2 1
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 5
50
300
300
2
M
CO
= =
=
2/3
300
2100
2000
1
Para la muestra II:
M CO =
1
0
50 300
300
2
=
=
300 2100
2200
4/3
1
u u = Y Y X Y = 2100 2 2/3
=
2000
3
Luego:
I 2 =
500/3
= 3, 472
48
u u = Y Y X Y = 2800 2 4/3
1400
300
=
2200
3
Luego:
1400/3
= 9, 722
48
3. Aplique el test de Goldfeld y Quandt para evaluar la presencia de heteroscedasticidad en los residuos de ambas muestras. Utilice un valor crtico
para la distribucin F igual a 1,61. (Ayuda: recuerde que el numerador de
este test corresponde a la muestra que tiene asociada una mayor varianza
en los residuos) (30 puntos)
Respuesta. La hiptesis nula de este test es la presencia de errores homoscedsticos. El test es el siguiente:
II 2 =
II 2
uII 0 uII /NII
=
uI 0 uI /NI
I 2
que se distribuye F con NII y NI grados de libertad en el numerador y
denominador, respectivamente, ya que el numerador del test corresponde
a la varianza estimada de los residuos de la muestra que tiene asociada la
mayor varianza. Por lo tanto:
9, 722
= 2, 8
GQ =
3, 472
valor que es mayor al F crtico de tabla (1,61), por lo que se rechaza la
hiptesis nula de errores homoscedsticos.
GQ =
Departamento de Economa
Universidad de Chile
STA300
Econometra I
Profesores: Tom
as Rau y Javiera V
asquez.
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sep
ulveda.
o 2008, Pauta Control 5
Oton
1. Suponga el siguiente modelo con una variables explicativa x1 mas una constante:
y = + x1 + u
De esta forma la matriz X es de la siguiente forma:
X=
1
1
1
..
.
x11
x12
x13
..
.
x1n
Donde X = [i x1 ]
Donde
M = I i(i0 i)1 i0
Es facil ver que i0 i = n y que
ii0 =
1
1
..
.
1
1
..
.
..
.
1
1
1
1 nn
Lo anterior implica:
1
n
1
n
1
n
1
n
..
.
..
.
1
n
1
n
i(i0 i)1 i0 = .
..
1
n
1
n
1
n
1
n
nn
Departamento de Economa
Universidad de Chile
2. La omisi
on de variables relevantes siempre sobreestima el verdadero valor del parametro y su
varianza. Comente.
Respuesta
Falso, la omisi
on de variables relevantes no genera problemas de eficiencia, al contrario, la varianza es
menor, pero s genera problemas de sesgo, el cual depende de dos cosas:
i) La covarianza entre la variable omitida y la includa.
ii) Signo del parametro poblacional de la variable omitida.
Vemos que se estara sobreestimando si ambos son positivos o negativos y subestimando si es que
existe diferencia en el signo de estos elementos.
CONTROLES 6
Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 6
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas
a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta
con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos)Si existe Heterocedasticidad en los errores, el estimador
Mnimos Cuadrados Ordinarios ser sesgado, sin embargo, cuando existe autocorrelacin en los errores no se produce sesgo en los parmetros estimados. (Comente).
Falso, ambos problemas Heterocedasticidad y Autocorrelacin no generan problemas en la propiedad de insesgamiento de los parmetros estimados por MCO,
ya que el supuesto de que E(u) = 0 no se ha quebrado. Ambos problemas generan
problemas de eficiencia en la estimacin por MCO.
Pregunta 2: (70 puntos)
Dado el modelo de regresin yi = + i , donde E(i ) = 0, V (i ) = 2 x2i .
(a) Encuentre el estimador MELI de .
El estimador eficiente de es el estimador MCG
el patrn de Heterocedasticidad.
0
x21 0
0 x2 0
2
= .. . .
..
..
.
.
.
.
0 0 x2n
(1)
1
x21
0
1
x22
..
...
.
0
0
..
.
0
0
0
..
.
1
x2n
(2)
Adems como nuestro modelo incluye como variable explicativa slo la constante,
nuestra matriz X es:
1
1
X = ..
(3)
.
1
De esta forma:
X X=
1 1
X Y =
1
x21
1 1
0
1
x22
..
...
.
0
0
..
.
0
1
x21
0
..
.
0
0
1
x22
..
...
.
0
0
0
..
.
1
x2n
0
0
..
.
1
x2n
PT
0
M CG = (X X) (X Y ) =
T
X
1
=
t=1 x2t
y1
y2
..
.
yT
yt
t=1 x2t
PT 1
t=1 x2t
V (
M CG ) =
2 (X 0 1 X)1 = PT
1
t=1 x2t
1
1
..
.
(4)
T
X
yt
=
t=1 x2t
(5)
Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 6
Pregunta 1: (30 puntos) El estimador consistente de Newey and West es el ms eficiente dentro de los estimadores lineales cuando existe autocorrelacin.
Falso, cuando tenemos problemas de autocorrelacin el estimador MCO deja de ser eficiente, su varianza es igual a 2 (X 0 X)1 X 0 X(X 0 X)1 > 2 (X 0 X)1 . El estimador de Newey and
West nos permite estimar consistentemente esta varianza, la cual sigue siendo ineficiente.
Pregunta 2: (70 puntos) Considere el Modelo: yt = xt +ut , donde E(ut ) = 0, V (ut ) = k(xt )2
y Cov(ut , us ) = 0 t 6= s. Adems dispone de 5 observaciones de la variable dependiente y de
la variable explicativa:
yt
2
3
10
1
3
xt
1
2
4
1
1
xt
yt
yt
yt
=p
=
2
2
t
xt k
k xt
xt
xt
1
=p
=
2
2
t
k
k xt
(10 puntos)
El mtodo eficiente de MCG consiste en estimar por MCO el modelo: yt = xt + ut , doniid
de ut (0, 2 ):
PT
M CG
t=1
PT
yt xt
2
t=1 (xt )
PT
yt
t=1 xt k
PT
t=1
PT
1
2 k
yt
t=1 xt
T
2 k
PT
M CG
yt
t=1 xt
=
=
2
1
3
2
10
4
1
1
3
1
5
2 + 1,5 + 2,5 + 1 + 3
10
=
=2
5
5
(40 puntos)
La varianza del estimador MCG es:
V (M CG ) = 2 (X 0 1 X)1
0
V (M CG ) = (X X )1
Por lo tanto:
V (M CG ) =
PT
PT
2
t=1 (xt )
t=1
T
2 k
2
k
2k
=
T
10
V (M CG ) =
(20 puntos)
Econometra
Facultad de Ciencias Econmicas y Administrativas
Universidad de Chile
Control 6
.......................................
(1)
donde Si representa los aos de escolaridad del individuo i, SiP representan los
aos de escolaridad (promedio) de los padres del individuo i, y i es un trmino
de error bien comportado. En otras palabras, se est modelando el impacto que
tiene la escolaridad de los padres sobre los niveles de escolaridad de sus hijos. Sin
embargo, este investigador ha olvidado incluir la habilidad de los hijos como un
determinante clave de su escolaridad. En realidad, la verdadera relacin existente
entre la escolaridad de los hijos y la de sus padres debera ser estimada a travs
de la siguiente ecuacin:
Si = + SiP + Hi + i
(2)
PN P
s si
= PNi=1 iP
2
i=1 (si )
donde la variable en minsculas denota que se encuentra en desviacin respecto de su media. Por otro lado, la ecuacin (2) en desvos respecto de la
media viene dada por:
si = sPi + hi + i
Reemplazando si en la frmula de la estimacin de MCO, se tiene lo siguiente:
=
finalmente:
PN
i=1
sPi (sPi + hi + i )
PN P 2
i=1 (si )
PN
PN
P
i=1 si i
+
P
N
P 2
P 2
i=1 (si )
i=1 (si )
Aplicando esperanza a la expresin anterior:
P
i=1 si hi
= + PN
=+
E()
Cov(SiP , Hi )
V ar(SiP )
Cov(SiP , Hi )
V ar(SiP )
Habilidad (H)
12
11
12
16
14
17
10
21
20
10
=
= 0, 9808
= PNi=1 iP =
P
2
42, 77
V ar(Si )
i=1 (si )
5. Si ahora incluyera la variable habilidad en la estimacin, cmo esperara
usted que fuera el coeficiente estimado para ? Justifique (5 puntos)
Respuesta. De acuerdo a lo sealado en (3) lo ms probable es que el
estimador est sesgado hacia arriba, por lo que se esperara que la nueva
3
Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Control 6
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) La existencia de una tendencia creciente en la variable dependiente
que no es considerada en modelo implica una sobrestimacin del verdadero valor del parmetro.
Comente.
La mayora de las variables econmicas tienen una tendencia, generalmente creciente. Si el
conjunto de variables explicativas no explican adecuadamente este comportamiento, entonces el
trmino de error incorporar dicha tendencia, lo que conduce a la existencia de autocorrelacin
positiva. Con rachas de residuos por sobre la media y luego bajo la media.
X Modelo
verdadero
XX
X
Modelo
X
XX
X
estimado
X
X
X
X
XX
X
X
X
X
X
X
X X
12 13
E[uu0 ] = 2 = 21 2 23
31 32 2
1
De esta forma, necesitamos computar la varianza homocedstica del error, y dos covarianzas:
1 , que es la covarianza entre dos trminos de error distanciados u periodo y 2 que es la covarianza entre dos errores distanciados dos periodos.
El trmino de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2:
ut = 1 ut1 + 2 ut2 + t
1 = 0,1,
2 = 0,5
+
=
+
1
1
1 21 22
1 21 22
1 (0,1)2 (0,5)2
1 (0,1)2 (0,5)2
2
0,1
1 +
(1)
0,64
0,64
=
=
(2)
0,02
0,64
0,1
2
0,2 2 +
0,64
0,64
2
0,64
2
0,62
(3)
0,2
2
0,62
(4)
=
=
0,62
Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error:
0,2
0,52
2
2
1
0,2 0,52
0,62
0,62
0,62
2
0,2
0,2
2
2 =
0,2
1
0,2
E[uu0 ] =
0,62
0,62
0,62
0,62
2
0,52 0,2
1
0,52
0,2
2
2
0,62
0,62
0,62
(5)
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 6
= + Pt=2
= PT 2
T
2
t=2 yt1
t=2 yt1
Aplicando esperanza:
=+E
E()
"P
T
yt1 ut
Pt=2
T
2
t=2 yt1
El insesgamiento se cumplir en la medida que el segundo trmino del lado derecho sea cero. Es posible demostrar que el sesgo es igual a -(1 + 3)/T . Por lo
tanto, el sesgo desaparece a medida que crece T , es decir, el estimador de MCO
es consistente.
Existen sospechas de que la varianza del trmino de error para las primeras 22
observaciones (12 ) no es la misma que para las restantes 32 observaciones (22 ).
De hecho, para las primeras 22 observaciones (aquellas con los Xi ms bajos), los
datos producen los siguientes resultados (expresados en desviaciones respecto a
P
P 2
P 2
la media):
xy = 100,
x = 10 y
y = 1040. Para el siguiente grupo de
P
P 2
P 2
observaciones (32), los resultados son:
xy = 216,
x = 16 y
y = 3156.
En base a esta informacin responda lo siguiente:
1. Realice un test de Goldfeld-Quandt al 5 % para determinar si las varianzas
son las mismas para ambos grupos de observaciones. (Ayuda: (1) Para implementar el test no debe omitir observaciones. Trabaje directamente con
ambos grupos de datos; (2) Asuma que el F crtico es de 2,04.) (8 puntos)
Respuesta. El modelo, en desvos respecto a la media es el siguiente:
yi = xi + ui
Por lo tanto, la suma de cuadrados de la regresin (ESS) es igual a 2 x2i .
De esta manera, para el primer grupo de observaciones se tiene lo siguiente:
P 2
xy
2 2
ESS1 = xi = P 2 x2i = 1000
x
Por lo tanto, la suma de los errores al cuadrado (RSS1 ) es:
RSS1 =
y 2 ESS1 = 40
y 2 ESS2 = 240
12 =
40
u01 u1
=
=2
n1 k
20
22 =
u02 u2
240
=
=8
n2 k
30
Por lo tanto:
1 2
12 =
4 2
Una opcin entonces es corregir los datos del primer modelo, de manera
de hacer homogneas las varianzas. Para ello, se debe premultiplicar por la
matriz P . Se sabe que:
P 0 P = 1
2
2 0 0
0 2 0 0
.. .. . .
.. ..
. . .
. .
0
0 0 2
4 0
2 0 0
.. . .
.. = ..
. . .
.
0 2
0
4 0
.. . .
..
. .
.
0 4
Luego:
Y = + X + u
donde Y = 2Y , y as respectivamente para las otras variables. Por lo tanto,
P
para el primer grupo de observaciones, ahora se tiene que
xy = 400 y
P 2
x = 40. El estimador MCF de ser:
400 + 216
=
= 11
40 + 16
3. Cmo se estimara la varianza del estimador de mnimos cuadrados ordinarios, V ar(M CO ), si la varianza del trmino de error difiere entre los dos
perodos? (6 puntos)
M CO viene dada por la
Respuesta. La estimacin de la varianza de beta
siguiente expresin:
= (X 0 X)1 X 0 W X(X 0 X)1
var(beta)
donde la matriz W es una diagonal con 22 dos (2s), seguidos de 32 ochos
(8s). Por lo tanto:
=
var(beta)
1
1
(2 10 + 8 16)
= 0, 22
(10 + 16)
(10 + 16)
Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 7
Nombre:
..........................................................................................
Rut:
.......................................
Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes,
no puede usar calculadora, no puedo tener nada ms que lpiz en su escritorio, si contesta con
lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) Si existe Heterocedasticidad en los errores, el estimador Mnimos
Cuadrados Ordinarios ser insesgado, sin embargo, cuando existe autocorrelacin en los errores
se produce sesgo en los parmetros estimados. (Comente).
Falso, ambos problemas Heterocedasticidad y Autocorrelacin no generan problemas en la propiedad de insesgamiento de los parmetros estimados por MCO, ya que el supuesto de que
E(u) = 0 no se ha quebrado. Ambos problemas generan problemas de eficiencia en la estimacin por MCO.
Pregunta 2: (70 puntos)
Suponga que en el siguiente modelo de regresin: yt = xt + ut con t=1,2,3 (slo 3 observaciones en la muestra), ut sigue un proceso autorregresivo de segundo orden AR(2):
ut = 0,1ut1 + 0,5ut2 + t
Encuentre la matriz de varianzas y covarianzas del error (u).
Disponemos de 3 observaciones, por lo tanto la matriz de varianzas y covarianzas del error
sera de la siguiente forma:
2
12 13
E[uu0 ] = 2 = 21 2 23
31 32 2
De esta forma, necesitamos computar la varianza homocedstica del error, y dos covarianzas:
1 , que es la covarianza entre dos trminos de error distanciados u periodo y 2 que es la covarianza entre dos errores distanciados dos periodos.
El trmino de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2:
ut = 1 ut1 + 2 ut2 + t
1 = 0,1,
2 = 0,5
+
=
+
1
1
1 21 22
1 21 22
1 (0,1)2 (0,5)2
1 (0,1)2 (0,5)2
2
0,1
1 +
(1)
0,64
0,64
=
=
(2)
0,02
0,64
0,1
2
0,2 2 +
0,64
0,64
2
0,64
2
0,62
(3)
0,2
2
0,62
(4)
=
=
0,62
Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error:
0,2
2 0,52
2
1
0,2 0,52
0,62
0,62
0,62
2
0,2
0,2
2
2 =
0,2
1
0,2
E[uu0 ] =
0,62
0,62
0,62
0,62
2
0,52
0,2
1
0,52
0,2
2
2
0,62
0,62
0,62
(5)
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Control Recuperativo
Pregunta 1: (30 puntos) Si la variable dependiente se encuentra medida con error, el estimador MCO subestima el valor poblacional de los parmetros. Sin embargo, si la(s) variable(s)
explicativa(s) esta(n) medida(s) con error, el estimador MCO sobreestima el valor poblacional
de los parmetros. Comente.
Falso, si slo la variable dependiente esta medida con error, los supuestos para que MCO sea
insesgado no se ven afectados. Sin embargo, si la variable explicativa esta medida con error,
se rompe el supuesto cov(ut , xt ) = 0, el estimador MCO es sesgado hacia el origen, siempre
subestima el verdadero valor del parmetro.
Pregunta 2: (70 puntos) Dado el siguiente modelo:
yt = 0 + 1 xt + ut
ut = ut1 + t
iid
1
22
4
2
26
6
3
32
10
4
34
12
5
40
14
6
46
16
7
46
20
8
50
22
yt
22
26
32
34
40
46
46
50
xt
4
6
10
12
14
16
20
22
yt
xt
x y
x2
15
19
18
23
26
23
27
151
4
7
7
8
9
12
12
59
60
133
126
184
234
276
324
1337
16
49
49
64
81
144
144
547
P8
7 59
t=2 xt
P
=
8
2
59 547
t=2 xt
t=2 xt
P8
0
y
151
X Y = P8 t=2 t =
1337
t=2 yt xt
P8
X X =
M CG
M CG
7
59
10,67241379
1,293103448
59
547
151
1337
0 (1 )
(1 )
10,67241379
= 21,34482759
0,5
SOLEMNES
Solemne Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Nombre:
...........................................................................................
Rut:
.......................................
Ud. Dispone de 120 minutos para resolver la Solemne, no puede hacer consultas a
los ayudantes, slo lpiz y calculadora sobre su escritorio, si contesta con lpiz mina no
tiene derecho a reclamo. Contestar slo en el espacio disponible.
Pn
i
i=1 u
= 0.
Repuesta:
Falso, esto slo se cumple cuando el modelo incluye constante.Recordemos la CPO
de
X 0 X = X 0 Y , donde
de este vector de dimensin
Kx1 es:
P MCO:
P el primer
P elemento
P
(1 + 2 x2 + ... + k xk ) = y (y 1 2 x2 ... k xk ) = 0 u
= 0. Si el
trmino constante no se incluye, esta primera CPO no existe. Recuerde que la constante
Comente 2: Suponga que la variable dependiente, pero no la independiente, esta expresada en desvos con respecto a la media. Qu implicancias tiene esto sobre el posible
sesgo de la estimacin por MCO?
Repuesta:
No hay implicacias en el insesgamiento de en un modelo del tipo y = + x + u. Pero
al estar y en devios respecto a su media, el modelo puede ser expresado de la siguiente
manera: y = + x + u, donde la constante que estimemos no ser la misma que
en un modelo donde y no est en desvios con respecto a su media, est nueva constante
ser tal que ajuste la nueva escala de y (en desvios con respecto a la media) de manera
que y = y. Por lo tanto la constante ser sesgada.
Falso, son un ejercicio muy til. Por lo dems, no se requiere el conocimiento de los
verdaderos parmetros, ya que en este tipo de ejercicios uno es el "Dios", por lo tanto,
uno determina cmo se generan las y, yo s exactamente cual es su estructura y yo genero la muestra de variables dependientes. Luego esto me permite ver el comportamiento
de los parmetros estimados, cuando, por ejemplo, se invalida algn supuesto de MCO,
ya que conozco (yo lo impuse) los verdaderos parmetros.
Comente 4: Si estimo un modelo de regresin donde las ingresos son la variable dependiente y la escolaridad la variable explicativa, debera obtener el mismo valor para el
parmetro si es que estimo un modelo de regresin donde la escolaridad es la variable
dependiente y los ingresos la variable explicativa, ya que el anlisis de regresin mide
simplemente la relacin estadstica entre las variables.
Repuesta:
Falso, en un anlisis de correlacin da lo mismo la causalidad, en tal caso ambas variables son tratadas en forma simtrica. Sin embargo, en el anlisis de regresin se estudia
el valor de Y (dependiente) condicional al valor de X (explicativa). Para una estimacin
no hay razones para pensar que un ao adicional de educacin
del tipo y = + x,
tiene el mismo impacto sobre el ingreso promedio, que el que tiene un peso adicional de
ingreso sobre el promedio de educacin. mide el impacto de un aumento unitario de
x sobre el promedio de y.
Repuesta:
El comente es verdadero ya que el R2 no tiene correccin por los grados de libertad.
Una regresin con N variables explicativas ajustan perfectamente a la muestra de N
observaciones. A medida que el nmero de observaciones aumenta el ajuste se deteriora
ya que el perfecto ajuste de las N primeras observaciones tienen una influencia cada vez
menor en el ajuste de toda la muestra. Por ejemplo, dado el modelo: y = + x + u con
dos observaciones el ajuste es perfecto (una recta que une los dos puntos), si aumento
a tres el nmero de observaciones el ajuste (medido por el R2 ) va disminuyendo.
Comente 6: Si los errores del modelo de regresin lineal no tienen distribucin normal,
a pesar de que los estimadores MCO ya no son MELI, siguen siendo insesgados.
Repuesta:
El comente es falso ya que el resultado de que los estimadores por MCO son MELI no
requiere que los errores se distribuyan normal. En efecto tal propiedad requiere que los
errores cumplan la siguiente condicin: E(ui ) = 0 i, V ar(ui ) = 2 I i y Cov(ui uj ) = 0
i 6= j, es decir, que los errores ui iid sean independientes e idnticamente distribuidos.
Repuesta:
La no negatividad del R2 , tal como la expresin ST = SE + SR, son vlidas cuando existe trmino constante en el modelo. Cuando no se incluye constante el R2 puede
tomar cualquier valor, siempre menor o igual a uno, pero incluyendo todos los reales
negativos.
E(ui ) = 0,
E(u2i ) = u2
E(ui uj ) = 0 i 6= j
x = i donde i =
.
.
1
1
.
Pn
= (X 0 X)1 X 0 Y X 0 X = 1 . . . 1
. = i=1 1 = n (escalar)
.
1
y1
.
P
Pn
= yi = y
=
.
y
(escalar),
X 0Y = 1 . . . 1
i
i=1
n
.
yn
P
P
P
P
y
1
i
=E
E(yi ) = 1
E(1 +ui ) = 1
1 = n1 = 1 (insesgado)
E()
=
n
= E( E())
2
V ar()
= ECM ()
=
E
1
1
n
n
2
P 2
P 2
P
ui
ui
( ui )
n1
= E n + n 1 = E
=E
como ui son iid
n
n2
P 2 P
2
E( ui ) = E(ui ) ya que E(ui uj ) = 0
=
V ar()
(8 puntos)
nE(u2i )
n2
2
u
n
= ECM ()
P
P
yi
yi
=E
= n+1
E()
n+1 =
1
n1
es sesgado 1 1 = n+1
1 = n+1
P
(ii) =
nY
n+1
n n
n+1
=E
V ar()
yi
n+1
1
n+1
E(yi ) =
n
n+1 1
n
n+1 1
P
E( ui )2
h
i2
2
P 2
1 P
1 P
1
= E n+1
(yi 1 ) = E n+1
ui = (n+1)
ui )
2 E(
P
2
2
= E(ui ) = nu (puesto que E(ui uj ) = 0 i 6= j)
n
2
(n+1)2 u
P 2
ui
1
= E n+1
=
+ n+1
2
P
1
n
1
2
2
21 ui + 12 ) = (n+1)
2 +
2 (nu + 1 ) =
(n + 1)2 u
n+1
|
{z
} | {z }
=E
ECM ()
yi
n+1
=E
yi n1 1
n+1
varianza
P
1
E( ui
(n+1)2
sesgo2
(8 puntos)
(iii) Si interesa el insesgamiento como nico criterio elegira MCO. Sin embargo, si se
n
ya que V ar()
=
elige el estimador ms eficiente debera elegir ,
2 <
(n+1)2 u
2
u
Si elegimos por error cuadrtico medio, tengo que para n < 2 u2 2
= V ar().
n
1 2u
eu2 =
u
0 u
nk
Respuesta Pregunta 2:
Primero, el vector de residuos estimados puede escribirse en funcin de los residuos
poblacionales de la siguiente forma:
u
= Mu
Donde M = In X(X 0 X)X 0 , matriz de dimensin nxn idempotente y que satisface
MX = 0
E(
u0 u
) = E(u0 M 0 M u) = E(u0 M u), por las caractersticas de la matriz M.
Como u0 M u es un escalar E(u0 M u) = E[T r(u0 M u)]
Recordemos que la traza es un operador lineal y antes de introducir la esperanza podemos, por propiedades de la traza, cambiar el orden de las matrices.
E(u0 M u) = E[T r(u0 M u) = E[tr(M uu0 )] = T r[E(M uu0 )] = T r[M E(uu0 )] = T r[M u2 In ] =
u2 T r(M ) = u2 [T r(In ) T r[X(X 0 X)X 0 ])] = u2 (n k)
Por lo tanto como E(
u0 u
) = u2 (n k) para que la suma de los errores al cuadrado
sea un estimador insesgado de u2 debemos dividir por (n k).
u2 =
u
0 u
nk
E(
u2 ) =
(20 puntos)
E(
u0 u
)
nk
2
(nk)u
nk
= u2
e0 = E(Y0 ) E(Y
0 ) = E(Y0 ) X0 = X0 X0 = X0 ( )
=
Si se cumplen todos los supuestos bajo los cuales es MELI E()
E(
e0 ) = 0.
V ar(
e0 ) = E[(
e0 E(
e0 ))(
e0 E(
e0 ))0 ] = E(
e0 e00 )
0X 0 )
= E(X0 ( )(
)
0
= X0 E( )( )0 X00
0)
= X0 V ar(X
0
V ar(
e0 ) = u2 X0 (X 0 X)1 X00
(20 puntos)
33 0 0
132
X 0 X = 0 40 20 X 0 Y = 24
0 20 60
92
n
X
yi2 = 678
i=1
n
X
(yi Y )2 = 150
i=1
P
P
n
x
x
2
3
P
P
P
(i) Como X 0 X = P x2 P x22
3
Px2 x
2
x3
x2 x3
x3
y
P
X 0 Y = P yx2
yx3
(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectos
calculamos las medias de las variables:
P
2 = X2 = 0 X
3 = X3 = 0 Y = y = 132 = 4
X
n
n
33
P n
2 ) = P X2 ; P(X3 X
3 ) = P X3
(X
X
2
P
2 )(Y Y ) = P(Y Y )X2 = P Y X2 Y P X2 = P Y X2
(X2 X
Anlogamente
P
3 )(Y Y ) = P Y X3
(X3 X
40 20
24
0
0
XX=
y XY =
20 60
92
60 20
0,03 0,01
1
(X 0 X)1 = 2400400
=
20 40
0,01 0,02
= (X 0 X)1 X 0 Y =
0,03 0,01
0,01 0,02
24
92
0,2
1,6
2 +3 1
V ar()
=
eu2 (X 0 X)1 = nk
t333=30
0 (Y X )
= Y 0 Y 20 X 0 Y + 0 X 0 X
u
= Y X (Y X )
132
P
Como Y 0 Y = y 2 = 678 0 X 0 Y = 4 0,2 1,6 24 = 670,4
92
33
0
0
4
0,03 0,01
0,0076 0,0025
V ar( ) = 0,25
=
0,01 0,02
0,0025 0,0051
t=
0,2+1,61
0,0076+0,005120,0025
0,4
0,0076
0) =
V ar(e
u2 +
u
1 4 2
1
33
0
0
0
0
1
0,03 0,01 4
0,01 0,02
2
q
0 ) = 0,66
= 0,25 + 0,25 0,75 = 0,44 V ar(e
P r(6,65 < Yf < 9,35) = 0,95
(12 puntos)
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Solemne
Comente 1: (10 puntos) En un modelo de regresin lineal simple (Yi = 1 + 2 Xi + ui ), si
la variable independiente no vara, el estimador MCO 2 ser igual al valor poblacional del
parmetro (2 ).
El estimador de 2 es un modelo de regresin simple es: =
(Xi X)(Yi Y )
P
,
(Xi X)2
si X (variable
Pregunta 1: (15 puntos) Encuentre la expresin para la suma total al cuadrado cuando el
modelo de regresin no incluye un trmino constante.
Respuesta Pregunta 1:
Recordemos que la variable y puede ser expresada en funcin de su valor estimado y del error
estimado:
y = y + u
(1)
(2)
0
0
0
y y = y y + u
y + y u
+
u0 u
|{z} |{z}
(3)
(4)
0
N
X
Yi2 =
i=1
N
X
Yi2 +
i=1
N
X
u
2i
(5)
i=1
La suma total de los cuadrados (ST), la suma total explicada (SE) y la suma total de los
residuos (SR), se definen de la siguiente forma:
ST
N
X
(Yi Y ) =
i=1
SE
N
X
N
X
Yi2
NY
i=1
(Yi Y )2 =
i=1
SR
N
X
N
X
N
X
Yi2 = ST + N Y
(6)
i=1
2
Yi N Y
i=1
N
X
Yi2 = SE + N Y
(7)
i=1
u
2i
(8)
i=1
2
ST + N Y = SE + N Y + SR
2
2
ST = SE + SR + N Y Y
Esta expresin difiere de la vista en clases por el ltimo trmino, pero si el modelo incluyese
constante se garantiza que el promedio observado de la variable dependiente es igual al promedio
estimado para esta variable, con lo cual el ltimo trmino es igual a cero, y se tiene la expresin
tpica de descomposicin de varianza.
u
0 u
Y 0M Y
(9)
u
0 u
/(n k)
Y 0 M Y /(n 1)
(10)
R2 = 1
2 = 1
R
Y 0M Y
0 u
/(n k)
2) = u
(1 R
0
Y M Y /(n 1)
(1 R2 ) =
(11)
(12)
u
0 u
/(n 1)
u
0 u
=
= (1 R2 )
0
0
Y M Y /(n 1)
Y MY
2
R
(n1)
(nk)
2) =
(1 R
> 1:
(n 1)
u
0 u
/(n k)
u
0 u
= 0
0
Y M Y /(n 1) |Y {z
M Y} (n k)
| {z }
(1R2 )
2 ) = (1 R2 ) (> 1)
(1 R
2 ) > (1 R2 )
(1 R
2 < R2
R
>1
Pregunta 3: (40 puntos) Considere el siguiente modelo de regresin lineal con 3 variables:
yi = 1 + 2 x2,i + 3 x3,i + ui
se dispone de la siguiente informacin:
33 0
0
132
0
0
X X = 0 40 20 X Y = 24
0 20 60
92
n
X
yi2
= 678
i=1
n
X
(yi Y )2 = 150
i=1
Pn
(i) Como X 0 X = P x2
x3
P
P x22
P x2
x2 x3
P
P x3
3
Px2 x
x23
P
y
P
X 0 Y = P yx2
yx3
(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectos calculamos las medias de las variables:
P
P
P
X2
X3
y
132
X2 =
= 0 X3 =
=0 Y =
=
=4
n
n
n
33
X
X
X
X
(X2 X 2 ) =
X2 ;
(X3 X 3 ) =
X3
X
X
X
X
X
(Y Y )X2 =
Y X2 Y
X2 =
Y X2
(X2 X 2 )(Y Y ) =
Anlogamente
3 )(Y Y ) =
(X3 X
Y X3
40 20
24
X 0X =
y X 0Y =
20 60
92
1
60 20
0,03 0,01
(X 0 X)1 =
=
20 40
0,01 0,02
2400 400
= (X 0 X)1 X 0 Y =
0,03
0,01
0,01
0,02
24
92
0,2
1,6
2 = 0,2
3 = 1,6
u
2
nk
0 (Y X )
= Y 0 Y 20 X 0 Y + 0 X 0 X
u
= Y X (Y X )
Como
Y 0Y =
0 X 0 Y =
y 2 = 678
0,2 1,6
132
24 = 670,4
92
y adems
0 X 0 X =
0,2
1,6
33
0
0
0
40
20
0
4
20 0,2 = 670,4
60
1,6
u
0 u
= 678 2 670,4 + 670,4 = 7,6
u2 =
33 0
= 0,25 0 40
V^
ar()
0 20
7,6
0,25
30
1
0
0,0076767677
0
20 =
0
0,0076
60
0
0,00253333
Test de significancia de 1 :
tc =
4
= 45,653155 t30
0,0076767677
5
0
0,00253333
0,0050666667
0,2
= 2,2941573 t30
tc =
0,0076
Si lo comparamos con el valor de tabla de la distribucin t (-2.042), el estadstico calculado
es menor al de tabla (o mayor en valor absoluto), de esta forma se rechaza la hiptesis
nula de que 2 es igual a cero, y el parmetro resulta ser estadsticamente significativo.
Test de significancia de 3 :
tc =
1,6
= 22,478059 t30
0,0050666667
(iv) H0 : 2 + 3 = 1
2 + 3 1
t= q
t=
t30
0,2 + 1,6 1
0,4
=
0,0076 + 0,0051 2 0,0025
0,0076
(10 puntos)
Econometra I
Profesora: Andrs Otero
Javiera Vsquez.
Otoo 2005
Pauta Solemne
2
2
6=
M V =
M CO =
nk
n
1
Pregunta 5: (5 puntos) En un modelo de regresin lineal que busca explicar el salario promedio
utilizando como variable explicativa la educacin, se obtiene la siguiente estimacin muestral:
\
Salario=40000+15000*Educacin.
Interprete.
Respuesta: Este modelo estima un impacto marginal de la educacin sobre el salario de 15000,
es decir, un ao adicional de educacin gener un icremento de 15000 en el salario promedio.
Adems, se estima que una persona sin educacin obtiene un salario promedio de 40000.
Pregunta 6: (5 puntos) En un modelo de regresin lineal: Yi = 0 + 1 X1 + 2 X2 + u, se
determina el siguiente intervalo de confianza para 2 , P r[1,3956 < 2 < 2,8974] = 95 %, que
puede concluir sobre la significancia del parmetro 2 y sobre la hiptesis nula de que 2 es
igual a 3.5.
Respuesta: La significancia de un parmetro o el testeo de una hiptesis en particular se
puede realizar utilizando un intervalo de confianza. Testeando la hiptesis nula de significancia
H0 : 2 = 0, podemos ver que 0 cae en la zona de no rechazo, con lo cual se puede concluir que
el parmetro es significativo. Para H0 : 2 = 3,5, podemos ver que 3.5 cae fuera de la zona de
confianza determinada por el intervalo de confianza, por lo tanto se rechaza que 2 = 3,5.
Parte II: Ejercicios Cortos (30 puntos) (Contestar slo en el espacio disponible)
De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 1: Suponga que para estimar el modelo Yt = + Xt + ut se dispone de las siguientes observaciones:
t=
Xt
1
1
2
2
3
3
4
4
5
5
6
6
(1)
(2)
Si los errores cumplen con los supuestos tradicionales de tener media 0, varianza 2 y ser independientes entre ellos, se puede demostrar al tomar valor esperado a la expresin (2) que e es
insesgado. (5 puntos).
Ahora la varianza de e se obtiene de la siguiente forma:
e =
V []
e 2 = E[e ]2
E[e E()]
(3)
e =
V []
e =
V []
e =
V []
e =
V []
e =
V []
2
[u6 + u5 u2 u1 ]
8
2
E[u6 ] + E[u5 ]2 + E[u2 ]2 + E[u1 ]2
64
2 + 2 + 2 + 2
64
4 2
64
2
16
dado supuesto
de independencia
(5 puntos)
de este modelo es conocida e igual a:
Por otra parte, la varianza del estimador MCO ()
2
= 2 (X 0 X)1 = P
V []
6
X)2
i=1 (Xi
P6
P6
P6
2
Tenemos que X = 21
= 3,5, adems i=1 (Xi X)2 = i=1 Xi2 6 X , donde i=1 Xi2 = 91.
P6 6
De esta forma, i=1 (Xi X)2 =91 6 12,25 = 17,5
Por lo tanto:
2
=
V []
17,5
e
El estimador MCO tiene menor varianza que el estimado .
(5 puntos)
Ejercicio 2: Demuestre
que en un modelo de regresin simple: Y = 1 + 2 Xi + ui , la raz
20 X20 M0 X2 2
Y 0 M0 Y
En un modelo de regresin simple como el que se plantea, donde solo hay una variable explicativa
ms el trmino constante, el R2 se puede reescribir de la siguiente forma:
Pn
(Xi X)2
2
R2 = 2Pni=1
2
i=1 (Yi Y )
Aplicando raz cuadrada a la expresin anterior:
qP
n
2
i=1 (Xi X)
R2 = 2 qP
n
2
i=1 (Yi Y )
(4)
(5)
Pn
R2
X)
Pn
R2
n
i=1 (Xi
X)2
i=1 (Yi
Y )2
qP
n
Y )(Xi X)
qP
= xy
n
2
2
(X
X)
(Y
Y
)
i
i
i=1
i=1
= qP
n
i=1 (Yi
qP
(15 puntos)
4
(6)
De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 3: Con la informacin disponible de Homecenter entre los aos 1994 y 2004 sobre Nmero de Tiendas (N ) y tamao de la tienda (T AM ), se quiere estimar el valor promedio
del ingreso total en millones de dlares (IN GT ). Se estima el siguiente modelo de regresin
lineal:
IN GT = 0 + 1 N + 2 T AM + u
A continuacin se presenta la estimacin realizada en Eviews:
Dependent Variable: INGT
Method: Least Squares
Date: 04/15/05 Time: 15:59
Sample: 1994 2004
Included observations: 11
INGT=C(1)+C(2)*N+C(3)*TAM
C(1)
C(2)
C(3)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Coefficient
Std. Error
t-Statistic
Prob.
8085.608
51.42006
-125.7441
3035.113
3.656119
39.65131
2.664022
0.0286
-3.171246
0.0132
276.5529
611852.2
-75.70325
4196.545
3933.725
14.30968
14.41820
0.812131
donde:
- S.D dependent var (sy ) es la desviacin estndar de la variable dependiente, la que se construye
de la siguiente forma:
s
PN
2
i=1 (yi y)
sy =
N 1
qP 2
u
- S.E. of regression es el error estndar de la regresin ( = N ki ).
- Sum squared resid corresponde a la suma de los errores al cuadrado.
Con esta informacin se le pide a Ud. que interprete el modelo, testee la significancia individual de cada uno de los parmetros y testee la significancia global del modelo.
Respuesta:
No se
Rechaza
Se
Rechaza
(2,5%))
Se
Rechaza
(2,5%)
t)=2.306
t=-2.306
tc=-3.17
tc=2.66
Para ver la significancia del nmero de tiendas debemos calcular el test t asociado a esta
hiptesis nula.
1 0
51,42
tc = q
=
= 14,06
3,66
V (1 )
Con lo cual se rechaza H0 de que 1 = 0, ya que tc > tt = 2,306. Por lo tanto, el parmetro es
significativo. Para ver la significancia global del modelo se puede utilizar la siguiente definicin
del estadstico de Fischer:
Fq,nk =
R2 =
s
Sy =
R2
k1
(1R2 )
nk
Fk1,nk
ESS
RSS
u
b0 u
b0
R2 = 1
=1 P
T SS
T SS
(Yi Y )2
P
X
(Yi Y )2
= 3933,725
(Yi Y )2 = 154741923,76
n1
s
Sy =
X
u0 u0
= 276,5529
u
2 = 611852,052
nk
6
R2 = 1
611852,05
= 0,996
154741923,76
Fc =
0,996
2
10,996
8
' 996
t
F2,8
= 5,32
Por lo tanto, se rechaza la hiptesis de que todas las pendientes del modelo son iguales a cero.
El modelo es globalmente significativo.
Ejercicio 4: Sea la matriz X 0 X asociado al siguiente modelo de regresin lineal:
Y = 0 + 1 X1 + 2 X2 + u
5
X 0 X = 20
20
20
90
71
20
71
96
42
X 0 Y = 186
150
Se le pide que exprese ambas matrices en desvos con respecto a la media y obtenga el estimador
mnimos cuadrados ordinarios de 0 , 1 y 2 .
Respuesta:
X
X
2
(Xi X i )2 =
(Xi )2 nX
X
(Xi X i )(Xj X j ) =
X 0 Xdes =
P
(X1 X 1 )2
(Xi Xj ) nX i X j
P
(XP
1 X 1 )(X2 X 2 )
(X2 X 2 )2
20
5
= 4; X 2 =
x2 x3 = 71 5 4 4 = 9
20
5
= 4;
10 9
9 16
X Xdes =
X Ydes
Adems,
(Y
Y
X
)(X
)
i
i
1
1
= P
(Yi Y i )(X2 X 2 )
P
P
(Yi Y i )(Xi X i ) =
Yi Xi nY i X i
X
yx1 = 18;
18
18
X 0 Ydes =
b =
1
b =
79
10
9
16 9
9 10
9
16
yx2 = 18
18
18
18
1,5949
=
18
0,2278
5 3
3 6
0
1
(X X) =
2 2
0 4
y adems
u2 = 0,5 y
P90
i=1 (Yi
dadas por:
2
0
2 4
4
3
3
4
3
2
X 0Y =
1
2
Y )2 = 80
(i) (6 puntos) Interprete el modelo, Que signos esperara Ud. de para los parmetros de este
modelo?
Se espera que el nivel de ingresos de esta tienda, dependa negativamente del nmero
de competidores, positivamente del gato en publicidad y positivamente del nmero de
vendedores. De esta forma, podramos esperar un signo negativo para 1 y positivo para
2 y 3 .
(ii) (8 puntos) Encuentre el estimador MCO de los parmetros de este modelo.
El estimador MCO del vector de parmetros = (X 0 X)1 X 0 Y , utilizando la informacin
disponible:
0
1
2 =
3
11
7
12
3
5
3
2
0
3
6
2
4
2
2
4
3
0
3
2
4
3 1
4
2
tc = q
V ar(i )
asociado a la hipotesis
nula H0 : i = 0
5 3 2
0
2,5 1,5 1
3 6 2 4
3
1
2
0
1
=
=
V ar[]
(X X) = 0,5
2 2 4
3
2
0 4 3
4
covarianzas
0
2
1,5
2
Para todas las hiptesis nulas se utiliza el mismo valor de tabla de la distribucin tstudent: tt = t86,95 % 1,99.
Test de significancia de 0 :
11
tc =
= 6,96
2,5
Se rechaza la hiptesis nula de que 0 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 1 :
7
tc = = 4,04
3
Se rechaza la hiptesis nula de que 1 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 2 :
12
tc = = 8,46
2
Se rechaza la hiptesis nula de que 2 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 3 :
3
tc = = 2,12
2
Se rechaza la hiptesis nula de que 3 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
R2
=
=
u
0 u
0
Y M0 Y
Pn
u
2
1 Pn i=1 i 2
i=1 (Yi Y )
Pn
Pn
u
2i
De la informacin que se entrega sabemos que
2 = i=1
= 0,5, por lo tanto i=1 u
2i =
86
2
86 0,5 = 43. Adems se nos entrega la informacin de que (Yi Y ) = 80. Reemplazando:
R2 = 1
43
= 0,4625
80
R2 /(k 1)
(1 R2 )/(n k)
0,4625/3
0,154
=
= 24.6
0,5375/86
0,00625
q
q
i
P r 7 1,99 3 < 1 < 7 + 1,99 3 = 95 %
P r [10,45 < 1 < 3,55] = 95 %
11
Intervalo de Confianza de 2 :
h
i
P r 12 1,99 2 < 2 < 12 + 1,99 2 = 95 %
P r [9,19 < 2 < 14,81] = 95 %
Intervalo de Confianza de 3 :
h
i
P r 3 1,99 2 < 3 < 3 + 1,99 2 = 95 %
P r [0,19 < 3 < 5,81] = 95 %
Por otra parte, el intervalo de confianza para 2 se obtiene de la siguiente forma:
#
"
2
(n
k)e
(n k)e
2
< 2 <
= 95 %
Pr
20,95,86
20,05,86
El valor de tabla de 20,95,86 65 (para la correccin se utiliz 43.8) y el de 20,05,86 107
(para la correccin se utiliz 18.5). POr lo tanto,
86 0,5
86 0,5
2
Pr
< <
= 95 %
43,8
18,5
12
Econometra I
Profesores:
Emerson Melo
Rodrigo Montero
Javiera Vsquez
Primavera 2005
Pauta Solemne
u
u
Respuesta:
Lo primero que debemos darnos cuenta para demostrar lo que se pide, es que :
u
= Y X = Y (X 0 X)1 X 0 Y = [Inn (X 0 X)1 X 0 ]Y
S definimos M = [Inn (X 0 X)1 X 0 ] , que como es bien sabemos es una matriz smetrica e
idempotente. Luego
u
= M Y = M (X + U ) = M U
De esta forma, podemos escribir
u
0 u
= U 0M U
Tomando esperanza en la expresin anterior, asumiendo X fijo
E(
u0 u
) = E(U 0 M U )
Usando el operador traza escribimos:
E(T r(U 0 M U )) = E(T r(M U 0 U ))
y por propiedad del operador traza y de la esperanaza, se tiene
T r(M E(U U 0 )) = T r(M 2 Inn ) = 2 T r(M )
donde
u
0 u
nk
Ejercicio 2: (15 puntos) El profesor O. Thero es un acadmico muy dedicado a sus labores, y
ama la docencia; es por ello que durante el semestre recin pasado dict en cuatro universidades
distintas el curso "Introduccin a la Microeconoma". Una de las grandes interrogantes para
este docente se refiere a cules seran los determinantes del xito de sus estudiantes. Es por ello
que una vez concluido los cursos decidi ir en busca de la respuesta, y construy una base de
datos que contiene la informacin para cada uno de sus 300 estudiantes. El modelo que l ha
estimado es el siguiente:
Ni = + Hi + Yi + Si + ui
Donde Ni representa la nota final obtenida por el alumno i, Hi corresponde a las horas promedio
que el alumno dedicaba cada semana al estudio de dicha asignatura (de acuerdo a la informacin
que recopil en una breve encuesta hecha al final del curso), Yi es el ingreso per cpita de la
familia y Si representa los aos de escolaridad (promedio simple1 ) de los padres. Los resultados
de la estimacin se presentan en la siguiente tabla:
Constante
Horas
Ingreso
Escolaridad de padres
N
F-Test (p-value)
R2
R2 ajustado
Coeficiente
2.48
0.187
9.9e(-07)
-0.002
Error Estndar
0.074
0.005
1.32e(-07)
0.007
300
0
0.78
0.77
p-value
0
0
0
0.691
2, 48
= 33, 51 > 1, 96 signif icativo
0, 074
t =
0, 187
= 37, 4 > 1, 96 signif icativo
0, 005
t =
t =
9, 9
= 7, 5 > 1, 96 signif icativo
1, 32
0, 002
= | 0, 28| < 1, 96 no es signif icativo
0, 007
ii) Qu significa que el p-value del coeficiente asociado a la escolaridad de los padres sea de
0,691? (2 puntos)
1S
i
Si +Sim
,
2
Respuesta: El p-value representa la probabilidad de que el valor crtico sea mayor que
el t calculado, es decir, describe el nivel de signficancia asociado a un estadstico t particular. Por lo tanto, un p-value de 0,05 representa significancia estadstica del coeficiente
estimado con un nivel de confianza del 95 %. Como en este caso el p-value es ostensiblemente mayor que dicho valor, entonces, se puede concluir que el coeficiente asociado a la
escolaridad de los padres, no es estadsticamente significativo al 5 % (ni tampoco al 10 %).
iii) Qu significa que el p-value del test F sea de 0? (2 puntos)
Respuesta: El test F permite determinar la signifcancia estadstica conjunta del modelo
(testea que todas los coeficientes asociados a las pendientes son igual a cero). Si el p-value
de dicho test es cero (0), entonces, se rechaza la hiptesis nula con un 99 % de confianza,
es decir, el modelo es signifcativo en su conjunto.
iv) Cul es la nota esperada para un alumno que dedicaba 10 horas a la semana al estudio de
la asignatura, cuyo ingreso familiar per cpita es de $43.000 y que la escolaridad promedio
de los padres es de 17 aos? (2 puntos)
Respuesta:
i = 2, 48 + 0, 187 (10) + 9, 9e(7) (43,000) 0, 002 (17) = 4, 3
N
v) Por qu podra preferir usted fijarse en el R2 ajustado ms que en el R2 ? (2 puntos)
Respuesta: El R2 presenta muchas deficiencias, dentro de las cuales cabe mencionar
que es monotnonico en la incorporacin de regresores adicionales. Por el contrario el R2
ajustado penaliza la incorporacin de regresores por la prdida de grados de libertad en
que se incurre. Por lo tanto, eventualmente, mientras que el R2 siempre aumenta con la
incorporacin de una variable independiente adicional, el R2 ajustado podra disminuir.
vi) Qu crticas podra usted hacerle a este modelo (mencione dos)? (4 puntos)
Respuesta: (1) Es posible que las respuestas de los alumnos estn sesgadas a la hora
de responder acerca de cuntas horas dedic en promedio a la semana a estudiar la asignatura. (2) Un determinante significativo de las notas de las personas viene dado por su
habilidad, la cual no es observable en este caso, y por ende, no se incorpora en el modelo.
(3) La estimacin MCO no restringe a que la prediccin de la nota se encuentre en el
rango uno siete. Por lo tanto, podra darse el caso que para alguna persona en particular,
el modelo arroje una nota estimada que no pertenezca al rango admisible.
vii) Si el modelo fuera estimado nuevamente pero utilizando como variable dependiente el
logaritmo de la nota final del curso (N = ln(N )), qu representaran los coeficientes
estimados? (2 puntos)
Respuesta: En este caso, los coeficientes estimados representaran semielasticidades.
Ejercicio 3: (15 puntos) Para estimar el modelo yi = xi +ui se propone el siguiente estimador:
Pn
xi yi
= 2 i=1
Pn
2
+
i=1 xi
2
i) Pruebe que dicho estimador subestima el verdadero valor del parmetro. (8 puntos)
ii) Pruebe que (7 puntos):
E[ ]2 =
2
2
2
Pn
i=1
x2i
Respuesta:
i)
=
=
=
=
E[]
Pn
i=1 xi yi
Pn
2
2
i=1 xi
2 +
Pn
i=1 xi (xi + ui )
Pn
2
2
i=1 xi
2 +
Pn
Pn
xi ui
i=1 x2i
+ 2 i=1
Pn
Pn
2
2
2
i=1 xi
i=1 xi
2 +
2 +
Pn
i=1 x2i
Pn
2
2
i=1 xi
2 +
Pn
i=1 x2i
Pn
2
2
i=1 xi
2 +
E[]
2
2
Pn
+ i=1 x2i
> 0 E[]
> , subestima ya que en valor esperado es menos
Si <0 E[]
negativo que .
< 0 E[]
< , subestima ya que en valor esperado es menos
Si >0 E[]
positivo que .
ii) Primero obtengamos :
Pn
i=1 x2i
+
Pn
2
2
i=1 xi
2 +
+
Pn
+ i=1 x2i
2
2
Pn
xi ui
Pn
2
i=1 xi
i=1
2
2
+
Pn
xi ui
Pn
2
i=1 xi
i=1
2
2
2 2
Pn
Pn
2
2
E ( i=1 xi ui ) 2 i=1 xi ui +
E[ ]2 =
h
i2
Pn
2
2
i=1 xi
2 +
Pn
4
2 i=1 x2i + 2
2
E[ ] = h
i2
Pn
2
2
+
x
2
i=1 i
2
n
2
x2i + 2
i=1
E[ ]2 =
h
i2
Pn
2
2
+
x
2
i=1 i
E[ ]2
2
2
2
Pn
i=1
x2i
5 3
3
6
(X 0 X)1 =
2 2
0 4
y adems
u2 = 0,5 y
P90
i=1 (Yi
dadas por:
2
0
2 4
4
3
3
4
3
2
X 0Y =
1
2
Y )2 = 80
= =
2 2 4
3 1
2
0 4 3
4
2
3
11
7
=
12
3
(ii) (6 puntos) Testee la significancia estadstica de 1 , 2 y 3 .
Para ver la significancia individual de cada uno de los parmetros del modelo se utiliza el
siguiente estadstico t:
i
tc = q
V ar(i )
asociado a la hipotesis
nula H0 : i = 0
5 3 2
0
2,5 1,5 1
3
6
2
4
3
1
=
=
V ar[]
2 (X 0 X)1 = 0,5
2 2 4
3
2
0 4 3
4
covarianzas
0
2
1,5
2
Para todas las hiptesis nulas se utiliza el mismo valor de tabla de la distribucin tstudent: tt = t86,95 % 1,99.
8
Test de significancia de 1 :
7
tc = = 4,04
3
Se rechaza la hiptesis nula de que 1 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 2 :
12
tc = = 8,46
2
Se rechaza la hiptesis nula de que 2 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 3 :
3
tc = = 2,12
2
Se rechaza la hiptesis nula de que 3 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
R2
=
=
u
0 u
0
Y M0 Y
Pn
u
2
1 Pn i=1 i 2
i=1 (Yi Y )
Pn
Pn
u
2i
De la informacin que se entrega sabemos que
2 = i=1
= 0,5, por lo tanto i=1 u
2i =
86
2
86 0,5 = 43. Adems se nos entrega la informacin de que (Yi Y ) = 80. Reemplazando:
R2 = 1
43
= 0,4625
80
(v) (3puntos) Testee la hiptesis de que todos los coeficientes a excepcin de la constante son
cero.
Bajo esta hiptesis nula el estadstico F calculado se puede escribir de la siguiente forma:
Fc =
R2 /(k 1)
(1 R2 )/(n k)
0,154
0,4625/3
=
= 24.6
0,5375/86
0,00625
q
q
i
P r 12 1,99 2 < 2 < 12 + 1,99 2 = 95 %
P r [9,19 < 2 < 14,81] = 95 %
Por otra parte, el intervalo de confianza para 2 se obtiene de la siguiente forma:
#
"
(n k)e
2
(n k)e
2
2
< <
Pr
= 95 %
20,95,86
20,05,86
El valor de tabla de 20,95,86 65 (para la correccin se utiliz 43.8) y el de 20,05,86 107
(para la correccin se utiliz 18.5). Por lo tanto,
86 0,5
86 0,5
Pr
< 2 <
= 95 %
43,8
18,5
10
Econometra I
Verano 2005-2006
Profesor
Jaime Ruiz-Tagle V.
Ayudante
Roberto Jaramillo M.
Instrucciones
Ud. Dispone de 90 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo.
Yi = 0 + 1 Xi + ui ,
donde
Yi
(1)
variable explicativa
Xi
Usted sugiere que es ms intuitivo usar kilogramos y metros para las medidas, en
cuyo caso el modelo a estimar sera
Yi = 0 + 1 Xi + vi ,
donde
Yi
(2)
Xi
es la altura medida
(b) (10 puntos) A partir de la estimacin por MCO en (1) y (2), derive una expresin
para la relacin existente entre los los estimadores
y entre
1 .
donde
yi
xi
P
xi yi
1 = P 2
xi
i
Yi = 0 + 1 X
Dado que
yi =
yi
;
1,000
xi =
xi
, el modelo alternativo implica estimadores MCO
100
P
xy
1 = P i 2i =
xi
1
1,000100
1
100100
xi yi
x2i
1
1
10
.
Yi = 0 + 1 X
i
De donde se obtiene
0 = Yi 1 X
i
1
= Yi
1 X
i
10
1
1
1
=
1 Xi
Yi
1,000
10 100
i
1 h
i
Yi 1 X
=
1,000
1
0 .
0 =
1,000
(c) (5 puntos) Cul modelo explica mejor el peso de una persona? Explique intituivamente.
Dado que los modelos son equivalentes y que los parmetros son tienen una
relacin proporcional, ambos modelos explican de igual forma el peso de una persona. La nica diferencia es la unidad de medida, pero el la capacidad del modelo
para esplicar es la misma porque se esta ocupando exactamente la misma informacin.
(d) (10 puntos) Derive una expresin para la relacin entre el coeciente de bondad
del ajuste R2 del modelo en (1) y para el coeciente R2 en el modelo (2).
Sabemos que
R2 =
ESS
T SS
=1
RSS
, donde
T SS
RSS =
u2i
T SS =
P
(Yi Y )2 .
1
1,0002
T SS =
T SS .
Por lo tanto,
Finalmente,
RSS =
2
ui .
P 2
(Yi Y ) =
1,0002
P
(Yi Y )2 =
Pero
Yi
ui = Yi Yi =
(
0 + 1 Xi )
1,000
1
1
1
Yi
0 + 1 Xi
=
1,000
1,000
10
100
1
Yi
0 + 1 Xi
=
1,000 1,000
Yi
Yi
=
1,000 1,000
ui
=
.
1,000
P 2
1
ui .
RSS = 1,000
2
RSS
T SS
R2 = 1
=1
1
RSS
1,0002
1
T SS
1,0002
=1
RSS
T SS
= R2 .
Yi = 1 + 2 X2i + 3 X3i + ui ,
(3)
(a) (5 puntos) Explique cmo testeara la hiptesis que los parmetros de las variables explicativas son iguales entre s. Plantee el problema matricialmente.
Se busca testear la hiptesis en forma matricial
H0 :
donde
R = r
qkk1
q1
dado que
H0 : 2 = 3 H0 : 2 3 = 0,
la forma matricial es
H0 :
z }| {
R
r
1
z
}|
{
z }| {
0 1 1 2 = 0 .
3
3
corresponde al nmero
H0 : 2 = 5
3 = 0
O equivalentente en forma matricial
H0 :
2
3
5
0
H0 :
z }| {
r
z
}|
z }| {
{
1
0 1 0
5
2 =
.
0 0 1
0
3
= R ,
E[R]
= 2 (X 0 X)1 .
V ar()
Por lo tanto,
=
E[]
y de esta
y la varianza ser:
V ar()
= R (X X)1 R0
= 2 R(X 0 X)1 R0 .
(d) (10 puntos) Derive una expresin algebraica para el estadgrafo F explicitando
cada uno de sus pasos.
4
Dado que los errores se distribuyen u N (0, 2 I) por los supuestos del modelo, el
estimador de MCO se distribuye se distribuye N (, 2 (X 0 X)1 ), y nalmente
R N (R, 2 R(X 0 X)1 R0 ). Estandarizando la distribucin, se tiene que
R R
p
N (0, 1),
2 R(X 0 X)1 R0
R r
p
N (0, 1).
2 R(X 0 X)1 R0
Por otro lado, se puede demostrar que u2u 2nk . Por lo tanto utilizando la
propiedad de que una distribucin F es una divisin de dos chi-cuadrado dividas
por sus respectivos grados de libertad, se puede obtener
0
(Rr)
q
u
0 u
2 (nk)
Fq,nk ,
lo que se simplica a
0 [R(X 0 X)1 R0 ]1 (Rr)
(Rr)
q
u
0 u
nk
Fq,nk .
u
u
Dado que nk
corresponde al estimador insesgado de la varianza de los errores
2
(R r)0 R[
2 (X 0 X)1 R0 ]1 (R r)
Fq,nk .
q
de libertad correspondientes.]
Dado que el nmero de restricciones es q = 2 y que n k = 17, los valores cticos
correspondientes en las tablas de la distribucin F son: F2,17 ( = 10 %) = 2,64,
F2,17 ( = 5 %) = 3,59, F2,17 ( = 1 %) = 6,11. Por lo tanto, la hiptesis nula se
rechaza al 90 % de signicancia y no se puede rechazar al 95 % o ms de conanza, porque slo al 90 % el estadgrafo calculado es mayor al valor crtico de tabla.
Los valores crticos de tabla cercanos a 3.13 con un 95 % de conanza son F2,60 ( =
5 %) = 3,15 y F2,120 ( = 5 %) = 3,07. Por lo tanto, con una muestra de tamao
n >= 123 se garantiza que el test se hubiera aceptado porque el estadgrafo calculado habra sido mayor al valor crtico de tabla.
(a) (10 puntos) Explique por qu en la prediccin puntual existen dos fuentes de error.
En la prediccin puntual se pretende predecir un valor en particular de la variable
dependiente con el modelo estimado. Entonces, el error de prediccin puntual se
puede escribir como
ei = Yi Yi = Xi + ui Xi
+ ui ,
= Xi ( )
corresponde al error de estimacin de los parmetros y ui cordonde ( )
responde al error aleatorio. Al querer predecir un valor en particular tendremos
2 fuentes de error; una proveniente de la estimacin de los parmetros (es una
estimacin que siempre contiene algn grado de error) y otra proveniente de la
naturaleza estocstica del modelo, donde aunque el modelo sea perfecto siempre
habr un componente aleatorio que genere error.
(b) (10 puntos) Utilizando la matriz de desvos M 0, derive la expresin matricial para
el coeciente R2. Recuerde que para ello debe hacer una descomposicin de la
varianza total de la variable a explicar entre la parte explicada de la varianza y
la parte residual.
Primero expresamos el modelo general (asumiento que se usa una constante) en
desvos con respecto a la media, para lo cual premultiplicamos por la matriz M 0
M 0Y
=i
, es decir, la constante:
M 0 X + M 0 u
M 0 X + M 0 u
M 0 X1 1 + M 0 X2 2 + M 0 u
M 0 i1 + M 0 X2 2 + M 0 u
|{z}
=
=
=
=
=0
0
= M X2 2 + M 0 u
= M 0 X2 2 + u.
M 0Y
T SS = Y 0 M 0 Y = Y 0 (M 0 X2 2 + u)
T SS = (X + u)0 (M 0 X2 2 + u)
u0 u
X 0 u + u0 M 0 X2 2 + |{z}
= 0 X 0 M 0 X2 2 + 0 |{z}
| {z }
{z
}
|
=0
ESS
=0
RSS
T SS = ESS + RSS,
ESS RSS
+
T SS
T SS
ESS
RSS
R2 =
=1
.
T SS
T SS
1=
Sabemos que el estimador de MCO es insesgado (bajo los supuestos del modelo) y es igual a
= (X 0 X)1 X 0 Y
= (X 0 X)1 X 0 (X + u)
= + (X 0 X)1 X 0 u).
= E[( E[])(
E[])
0] =
V ar()
=
=
=
=
V ar()
Esto es porque se asume que los errores son homocedsticos y que no existe autocorrelacin.
d2
d1
5
d2
10
12
15
20
d1
24
30
40
60
120
inf
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf
39.86
8.53
5.54
4.54
4.06
3.78
3.59
3.46
3.36
3.29
3.23
3.18
3.14
3.10
3.07
3.05
3.03
3.01
2.99
2.97
2.96
2.95
2.94
2.93
2.92
2.91
2.90
2.89
2.89
2.88
2.84
2.79
2.75
2.71
49.5
9.00
5.46
4.32
3.78
3.46
3.26
3.11
3.01
2.92
2.86
2.81
2.76
2.73
2.70
2.67
2.64
2.62
2.61
2.59
2.57
2.56
2.55
2.54
2.53
2.52
2.51
2.50
2.50
2.49
2.44
2.39
2.35
2.30
53.59
9.16
5.39
4.19
3.62
3.29
3.07
2.92
2.81
2.73
2.66
2.61
2.56
2.52
2.49
2.46
2.44
2.42
2.40
2.38
2.36
2.35
2.34
2.33
2.32
2.31
2.30
2.29
2.28
2.28
2.23
2.18
2.13
2.08
55.83
9.24
5.34
4.11
3.52
3.18
2.96
2.81
2.69
2.61
2.54
2.48
2.43
2.39
2.36
2.33
2.31
2.29
2.27
2.25
2.23
2.22
2.21
2.19
2.18
2.17
2.17
2.16
2.15
2.14
2.09
2.04
1.99
1.94
57.24
9.29
5.31
4.05
3.45
3.11
2.88
2.73
2.61
2.52
2.45
2.39
2.35
2.31
2.27
2.24
2.22
2.20
2.18
2.16
2.14
2.13
2.11
2.10
2.09
2.08
2.07
2.06
2.06
2.05
2.00
1.95
1.90
1.85
58.2
9.33
5.28
4.01
3.40
3.05
2.83
2.67
2.55
2.46
2.39
2.33
2.28
2.24
2.21
2.18
2.15
2.13
2.11
2.09
2.08
2.06
2.05
2.04
2.02
2.01
2.00
2.00
1.99
1.98
1.93
1.87
1.82
1.77
58.91
9.35
5.27
3.98
3.37
3.01
2.78
2.62
2.51
2.41
2.34
2.28
2.23
2.19
2.16
2.13
2.10
2.08
2.06
2.04
2.02
2.01
1.99
1.98
1.97
1.96
1.95
1.94
1.93
1.93
1.87
1.82
1.77
1.72
59.44
9.37
5.25
3.95
3.34
2.98
2.75
2.59
2.47
2.38
2.3
2.24
2.20
2.15
2.12
2.09
2.06
2.04
2.02
2.00
1.98
1.97
1.95
1.94
1.93
1.92
1.91
1.90
1.89
1.88
1.83
1.77
1.72
1.67
59.86
9.38
5.24
3.94
3.32
2.96
2.72
2.56
2.44
2.35
2.27
2.21
2.16
2.12
2.09
2.06
2.03
2.00
1.98
1.96
1.95
1.93
1.92
1.91
1.89
1.88
1.87
1.87
1.86
1.85
1.79
1.74
1.68
1.63
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf
60.19
9.39
5.23
3.92
3.30
2.94
2.70
2.54
2.42
2.32
2.25
2.19
2.40
2.10
2.06
2.03
2.00
1.98
1.96
1.94
1.92
1.90
1.89
1.88
1.87
1.86
1.85
1.84
1.83
1.82
1.76
1.71
1.65
1.60
60.71
9.41
5.22
3.90
3.27
2.90
2.67
2.50
2.38
2.28
2.21
2.15
2.10
2.05
2.02
1.99
1.96
1.93
1.91
1.89
1.87
1.86
1.84
1.83
1.82
1.81
1.80
1.79
1.78
1.77
1.71
1.66
1.60
1.55
61.22
9.42
5.20
3.87
3.24
2.87
2.63
2.46
2.34
2.24
2.17
2.10
2.05
2.01
1.97
1.94
1.91
1.89
1.86
1.84
1.83
1.81
1.80
1.78
1.77
1.76
1.75
1.74
1.73
1.72
1.66
1.60
1.55
1.49
61.74
9.44
5.18
3.84
3.21
2.84
2.59
2.42
2.30
2.20
2.12
2.06
2.01
1.96
1.92
1.89
1.86
1.84
1.81
1.79
1.78
1.76
1.74
1.73
1.72
1.71
1.70
1.69
1.68
1.67
1.61
1.54
1.48
1.42
62
9.45
5.18
3.83
3.19
2.82
2.58
2.40
2.28
2.18
2.10
2.04
1.98
1.94
1.90
1.87
1.84
1.81
1.79
1.77
1.75
1.73
1.72
1.70
1.69
1.80
1.67
1.66
1.65
1.64
1.57
1.51
1.45
1.38
62.26
9.46
5.17
3.82
3.17
2.80
2.56
2.38
2.25
2.16
2.08
2.01
1.96
1.91
1.87
1.84
1.81
1.78
1.76
1.74
1.72
1.70
1.69
1.67
1.66
1.65
1.64
1.63
1.62
1.61
1.54
1.48
1.41
1.34
62.53
9.47
5.16
3.80
3.16
2.78
2.54
2.36
2.23
2.13
2.05
1.99
1.93
1.89
1.85
1.81
1.78
1.75
1.73
1.71
1.69
1.67
1.66
1.64
1.63
1.61
1.60
1.59
1.58
1.57
1.51
1.44
1.37
1.30
62.79
9.47
5.15
3.79
3.14
2.76
2.51
2.34
2.21
2.11
2.03
1.96
1.90
1.86
1.82
1.78
1.75
1.72
1.70
1.68
1.66
1.64
1.62
1.61
1.59
1.58
1.57
1.56
1.55
1.54
1.47
1.40
1.32
1.24
63.06
9.48
5.14
3.78
3.12
2.74
2.49
2.32
2.18
2.08
2.00
1.93
1.88
1.83
1.79
1.75
1.72
1.69
1.67
1.64
1.62
1.60
1.59
1.57
1.56
1.54
1.53
1.52
1.51
1.50
1.42
1.35
1.26
1.17
63.33
9.49
5.13
3.76
3.10
2.72
2.47
2.29
2.16
2.06
1.97
1.90
1.85
1.80
1.76
1.72
1.69
1.66
1.63
1.61
1.59
1.57
1.55
1.53
1.52
1.50
1.49
1.48
1.47
1.46
1.38
1.29
1.19
1.00
919
920
d2
d1
5
d2
10
12
15
20
d1
24
30
40
60
120
inf
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf
161.4
18.51
10.13
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18
4.17
4.08
4.00
3.92
3.84
199.5
19.00
9.55
6.94
5.79
5.14
4.74
4.46
4.26
4.10
3.98
3.89
3.81
3.74
3.68
3.63
3.59
3.55
3.52
3.49
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33
3.32
3.23
3.15
3.07
3.00
215.7
19.16
9.28
6.59
5.41
4.76
4.35
4.07
3.86
3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13
3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.92
2.84
2.76
2.68
2.60
224.6
19.25
9.12
6.39
5.19
4.53
4.12
3.84
3.63
3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90
2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.61
2.53
2.45
2.37
230.2
19.3
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33
3.20
3.11
3.03
2.96
2.90
2.85
2.81
2.77
2.74
2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55
2.53
2.45
2.37
2.29
2.21
234.0
19.33
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.45
2.43
2.42
2.34
2.25
2.17
2.10
236.8
19.35
8.89
6.09
4.88
4.21
3.79
3.50
3.29
3.14
3.01
2.91
2.83
2.76
2.71
2.66
2.61
2.58
2.54
2.51
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35
2.33
2.25
2.17
2.09
2.01
238.9
19.37
8.85
6.04
4.82
4.15
3.73
3.44
3.23
3.07
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48
2.45
2.42
2.40
2.37
2.36
2.34
2.32
2.31
2.29
2.28
2.27
2.18
2.10
2.02
1.94
240.5
19.38
8.81
6.00
4.77
4.10
3.68
3.39
3.18
3.02
2.90
2.80
2.71
2.65
2.59
2.54
2.49
2.46
2.42
2.39
2.37
2.34
2.32
2.30
2.28
2.27
2.25
2.24
2.22
2.21
2.12
2.04
1.96
1.88
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf
241.9
19.4
8.79
5.96
4.74
4.06
3.64
3.35
3.14
2.98
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38
2.35
2.32
2.30
2.27
2.25
2.24
2.22
2.20
2.19
2.18
2.16
2.08
1.99
1.91
1.83
243.9
19.41
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.25
2.23
2.20
2.18
2.16
2.15
2.13
2.12
2.10
2.09
2.00
1.92
1.83
1.75
245.9
19.43
8.70
5.86
4.62
3.94
3.51
3.22
3.01
2.85
2.72
2.62
2.53
2.46
2.40
2.35
2.31
2.27
2.23
2.20
2.18
2.15
2.13
2.11
2.09
2.07
2.06
2.04
2.03
2.01
1.92
1.84
1.75
1.67
248.0
19.45
8.66
5.80
4.56
3.87
3.44
3.15
2.94
2.77
2.65
2.54
2.46
2.39
2.33
2.28
2.23
2.19
2.16
2.12
2.10
2.07
2.05
2.03
2.01
1.99
1.97
1.96
1.94
1.93
1.84
1.75
1.66
1.57
249.1
19.45
8.64
5.77
4.53
3.84
3.41
3.12
2.90
2.74
2.61
2.51
2.42
2.35
2.29
2.24
2.19
2.15
2.11
2.08
2.05
2.03
2.01
1.98
1.96
1.95
1.93
1.91
1.90
1.89
1.79
1.70
1.10
1.52
250.1
19.46
8.62
5.75
4.50
3.81
3.38
3.08
2.86
2.70
2.57
2.47
2.38
2.31
2.25
2.19
2.15
2.11
2.07
2.04
2.01
1.98
1.96
1.94
1.92
1.90
1.88
1.87
1.85
1.84
1.74
1.65
1.55
1.46
251.1
19.47
8.59
5.72
4.46
3.77
3.34
3.04
2.83
2.66
2.53
2.43
2.34
2.27
2.20
2.15
2.10
2.06
2.03
1.99
1.96
1.94
1.91
1.89
1.87
1.85
1.84
1.82
1.81
1.79
1.69
1.59
1.50
1.39
252.2
19.48
8.57
5.69
4.43
3.74
3.30
3.01
2.79
2.62
2.49
2.38
2.30
2.22
2.16
2.11
2.06
2.02
1.98
1.95
1.92
1.89
1.86
1.84
1.82
1.80
1.79
1.77
1.75
1.74
1.64
1.53
1.43
1.32
253.3
19.49
8.55
5.66
4.40
3.70
3.27
2.97
2.75
2.58
2.45
2.34
2.25
2.18
2.11
2.06
2.01
1.97
1.93
1.90
1.87
1.84
1.81
1.79
1.77
1.75
1.73
1.71
1.70
1.68
1.58
1.47
1.35
1.22
254.3
19.5
8.53
5.63
4.36
3.67
3.23
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64
1.62
1.51
1.39
1.25
1.00
921
922
d2
d1
5
d2
10
12
15
20
d1
24
30
40
60
120
inf
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf
4052
98.50
34.12
21.20
16.26
13.75
12.25
11.26
10.56
10.04
9.65
9.33
9.07
8.86
8.68
8.53
8.40
8.29
8.18
8.10
8.02
7.95
7.88
7.82
7.77
7.72
7.68
7.64
7.60
7.56
7.31
7.08
6.85
6.63
4999.5
99.00
30.82
18.00
13.27
10.92
9.55
8.65
8.02
7.56
7.21
6.93
6.70
6.51
6.36
6.23
6.11
6.01
5.93
5.85
5.78
5.72
5.66
5.61
5.57
5.53
5.49
5.45
5.42
5.39
5.18
4.98
4.79
4.61
5403
99.17
29.46
16.69
12.06
9.78
8.45
7.59
6.99
6.55
6.22
5.95
5.74
5.56
5.42
5.29
5.18
5.09
5.01
4.94
4.87
4.82
4.76
4.72
4.68
4.64
4.60
4.57
4.54
4.51
4.31
4.13
3.95
3.78
5625
99.25
28.71
15.98
11.39
9.15
7.85
7.01
6.42
5.99
5.67
5.41
5.21
5.04
4.89
4.77
4.67
4.58
4.50
4.43
4.37
4.31
4.26
4.22
4.18
4.14
4.11
4.07
4.04
4.02
3.83
3.65
3.48
3.32
5764
99.30
28.24
15.52
10.97
8.75
7.46
6.63
6.06
5.64
5.32
5.06
4.86
4.69
4.56
4.44
4.34
4.25
4.17
4.10
4.04
3.99
3.94
3.90
3.85
3.82
3.78
3.75
3.73
3.70
3.51
3.34
3.17
3.02
5859
99.33
27.91
15.21
10.67
8.47
7.19
6.37
5.80
5.39
5.07
4.82
4.62
4.46
4.32
4.20
4.10
4.01
3.94
3.87
3.81
3.76
3.71
3.67
3.63
3.59
3.56
3.53
3.50
3.47
3.29
3.12
2.96
2.80
5928
99.36
27.67
14.98
10.46
8.26
6.99
6.18
5.61
5.2
4.89
4.64
4.44
4.28
4.14
4.03
3.93
3.84
3.77
3.70
3.64
3.59
3.54
3.50
3.46
3.42
3.39
3.36
3.33
3.30
3.12
2.95
2.79
2.64
5982
99.37
27.49
14.80
10.29
8.10
6.84
6.03
5.47
5.06
4.74
4.50
4.30
4.14
4.00
3.89
3.79
3.71
3.63
3.56
3.51
3.45
3.41
3.36
3.32
3.29
3.26
3.23
3.20
3.17
2.99
2.82
2.66
2.51
6022
99.39
27.35
14.66
10.16
7.98
6.72
5.91
5.35
4.94
4.63
4.39
4.14
4.03
3.89
3.78
3.68
3.60
3.52
3.46
3.40
3.35
3.30
3.26
3.22
3.18
3.15
3.12
3.09
3.07
2.89
2.72
2.56
2.41
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf
6056
99.40
27.23
14.55
10.05
7.87
6.62
5.81
5.26
4.85
4.54
4.30
4.10
3.94
3.80
3.69
3.59
3.51
3.43
3.37
3.31
3.26
3.21
3.17
3.13
3.09
3.06
3.03
3.00
2.98
2.80
2.63
2.47
2.32
6106
99.42
27.05
14.37
9.89
7.72
6.47
5.67
5.11
4.71
4.40
4.16
3.96
3.80
3.67
3.55
3.46
3.37
3.30
3.23
3.17
3.12
3.07
3.03
2.99
2.96
2.93
2.90
2.87
2.84
2.66
2.50
2.34
2.18
6157
99.43
26.87
14.20
9.72
7.56
6.31
5.52
4.96
4.56
4.25
4.01
3.82
3.66
3.52
3.41
3.31
3.23
3.15
3.09
3.03
2.98
2.93
2.89
2.85
2.81
2.78
2.75
2.73
2.70
2.52
2.35
2.19
2.04
6209
99.45
26.69
14.02
9.55
7.40
6.16
5.36
4.81
4.41
4.10
3.86
3.66
3.51
3.37
3.26
3.16
3.08
3.00
2.94
2.88
2.83
2.78
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.37
2.20
2.03
1.88
6235
99.46
26.60
13.93
9.47
7.31
6.07
5.28
4.73
4.33
4.02
3.78
3.59
3.43
3.29
3.18
3.08
3.00
2.92
2.86
2.80
2.75
2.70
2.66
2.62
2.58
2.55
2.52
2.49
2.47
2.29
2.12
1.95
1.79
6261
99.47
26.50
13.84
9.38
7.23
5.99
5.20
4.65
4.25
3.94
3.70
3.51
3.35
3.21
3.10
3.00
2.92
2.84
2.78
2.72
2.67
2.62
2.58
2.54
2.50
2.47
2.44
2.41
2.39
2.20
2.03
1.86
1.70
6287
99.47
26.41
13.75
9.29
7.14
5.91
5.12
4.57
4.17
3.86
3.62
3.43
3.27
3.13
3.02
2.92
2.84
2.76
2.69
2.64
2.58
2.54
2.49
2.45
2.42
2.38
2.35
2.33
2.30
2.11
1.94
1.76
1.59
6313
99.48
26.32
13.65
9.20
7.06
5.82
5.03
4.48
4.08
3.78
3.54
3.34
3.18
3.05
2.93
2.83
2.75
2.67
2.61
2.55
2.50
2.45
2.40
2.36
2.33
2.29
2.26
2.23
2.21
2.02
1.84
1.66
1.47
6339
99.49
26.22
13.56
9.11
6.97
5.74
4.95
4.40
4.00
3.69
3.45
3.25
3.09
2.96
2.84
2.75
2.66
2.58
2.52
2.46
2.40
2.35
2.31
2.27
2.23
2.20
2.17
2.14
2.11
1.92
1.73
1.53
1.32
6366
99.50
26.13
13.46
9.02
6.88
5.65
4.86
4.31
3.91
3.60
3.36
3.17
3.00
2.87
2.75
2.65
2.57
2.49
2.42
2.36
2.31
2.26
2.21
2.17
2.13
2.10
2.06
2.03
2.01
1.80
1.60
1.38
1.00
923
924
Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Pauta Solemne
Comentes: (30 puntos)
1. En un modelo de regresin lineal simple 0 = 3, 0 y 1 = 2, 0,
a) la media de Y es 3,0 + 2,0 = 5,0.
b) se espera que Y aumente en 2,0 si X aumenta en 1 unidad.
c) los supuestos de mnimos cuadrados se cumplen.
d ) el valor de 0 no importa.
R: La media de Y se describe como 0 + 1 x, luego depender del valor de X cual sea la
media de Y . Respecto a que se cumplan los supuestos de MCO, es necesario tener mas
informacin, y la afirmacin de que el valor de 0 carece de cualquier fundamento. Por
ultimo la afirmacin verdadera es el hecho de que dado que 1 = 2, 0, es la pendiente en
este modelo, representa el cambio marginal de una unidad adicional de X, por lo tanto
se espera que Y aumente en dos unidades por cada unidad adicional de X.
2. En el modelo de regresin lineal Y = X + u, el estimador MCO alcanza la cota inferior
de Cramer-Rao.
R: Falso. Bajo el supuesto de normalidad del trmino de error, se tiene que el estimador
MCO y MV de son equivalentes, pero no as el estimador de la varianza del error 2 .
Entonces bajo el supuesto de normalidad tenemos que el estimador MCO de alcanza la
cota inferior de Cramer-Rao, pero no as el estimador de 2 .
3. En un modelo de regresin simple Y = + X + u, si la correlacin entre Y y X es
positiva, el parmetro estimado de tambin ser positivo.
R: Verdadero. En un modelo de regresin lineal simple es posible escribir el parmetro
de la siguiente forma:
p
V ar(Y )
Cov(Y, X)
=
= x,y p
V ar(X)
V ar(X)
por tanto como el ratio entre las races de las varianzas de X e Y es siempre positivo, el
signo del parmetro esta directamente determinado por el signo de la correlacin.
4. Cuando hay un problema de variable omitida,
a) el supuesto que E(ui |Xi ) = 0 es violado.
b) el supuesto que (Xi , Yi ) son iid es violado.
c) el supuesto que (Xi , ui ) tiene cuarto momento finito es violado.
d ) hay perfecta multicolinealidad.
1
R: El problema de variable omitida (se dice solo variable omitida y no variable omitida
relevante porque si dicha variable no fuera relevante no sera omitida) implica que el
error de la regresin del modelo incorrecto esta capturando la informacin acerca de
la variable omitida, por tanto si la variable omitida es correlacionada con alguna de las
variables incluidas luego E(ui |Xi ) 6= 0. El resto de las afirmaciones no son implicancias
derivadas del problema de variable omitida.
5. Si no hay suficientes variables explicativas en la regresin entonces los parmetros estimados estarn sesgados.
R: El hecho de que el numero de regresores afecte el sesgo de un parmetro estimado
es falso, sin embargo si se excluyen variables relevantes, y ocurre que ellas estn correlacionadas con las incluidas, esto producir un sesgo, pero una cantidad reducida de
variables explicativas, a priori, no tiene implicarais en el sesgo de un estimador.
6. Es equivalente realizar un Test F de significancia global del modelo y realizar varios test
de significancia individual de todos los parmetros.
R: Falso, aunque realicemos todos los test de significancia individual para las pendientes del modelo este resultado no va a ser equivalente al test de significancia global, ya
que este ltimo considera la correlacin entre las variables explicativas. Puede existir un
caso extremo que las variables tengan una correlacin muy alta y esta varianza conjunta
explique el comportamiento de la variable independiente, aunque cada una por separado
no es capaz de explicar el comportamiento de Y .
1
u2
1
2
n 1 2X1 X2 X
1
e11
X
e = ..
X
.
e
X1n
e21
" P
X
e2
.. , X
0
e = P X1i
eX
.
e2i X
e1i
X
e2n
X
P e e #
X X
P 1ie 2 2i
X2i
covarianzas de
"
P e e #
P e2
u2
X
X2i
X
2 e 0 e 1
P e e
P e1i2 2i
u (X X) = P
P e e 2
P e2
2
e
X
X
X
P e e
Cov(X1i , X2i )
X1i X2i
=p
= qP
V (X1i )V (X2i )
e2 P X
e2
X
1i
2i
P e e 2
( X
1i X2i )
=P
P e2
2
e
X1i X
2i
3
P e2
P e2
u2 X
u2 X
2i
2i
V (1 ) = P
P e2 P e2 = P e2 P e2
e 2 2
e2 P X
X
X
X
(1
2X1 ,X2 )
X
X
1i
2i
1i
2i
1i
2i
X1 ,X2
Luego simplificando la expresin, y reemplazando la varianza poblacional de X1
1
2
u2
1
=
2u
V (1 ) = P
2
e 2 (1 2
n 1 X1 ,X2 X1
X
1i
X1 ,X2 )
2. (15 puntos) Demuestre que la varianza del error de una prediccin individual, en un
modelo de regresin lineal simple, se puede expresar de la siguiente forma:
1
(X0 X)2
P
V AR(Y0 Y0 ) = 2 1 + +
n
xi
R: Si se desea predecir el valor individual de Y correspondiente a X = X0 , es decir, se quiere
obtener:
Y0 = 1 + 2 X0 + u0
Se predice de la siguiente forma:
Y0 = 1 + 2 X0
El error de prediccin Y0 Y0 es:
Y0 Y0
1 + 2 X0 + u0 (1 + 2 X0 )
= (1 1 ) + (2 2 )X0 + u0
=
(1)
(2)
Por consiguiente,
E[Y0 Y0 ] =
=
porque 1 y 2 son insesgados, X0 es un nmero fijo y E(u0 ) es cero pos los supuestos tpicos.
Elevando (2) al cuadrado y tomando valor esperado se obtiene:
V [Y0 Y0 ] =
(3)
P 2
X
P i2 2
n xi
2
P 2
x
i 2
X P 2
xi
P i2 2 + P 2 X02 + 2X0 X P 2 + 2
V [Y0 Y0 ] =
n xi
xi
xi
2
(X0 X)
1
P 2
V [Y0 Y0 ] = 2 1 + +
n
xi
(4)
(5)
(6)
(Xi X)(Yi Y )
106,4
= 0,494
=
P
2
215,4
(Xi X)
= 21,9 0,494 186,2 = 3,504
Y X
20
20
qP
u
2
Para calcular el error estndar, u =
nk , necesitamos la suma de los errores al cuadrado.
Esta se puede obtener de la siguiente ecuacin:
X
u
2
=
Para obtener
i )2
(Yi
X
i Y i + 2
i)
(Yi2 +
2 + 2 Xi2 2
Yi 2X
X
X
X
X
X
Xi2 2
Yi 2
Xi Yi + 2
Xi
Yi2 + n
2 + 2
u
2 hay que obtener los valores que falta, que son
Xi Yi ,
X
i Y ) = =
Y
(Xi X)(Y
Xi Yi nX
X
X
i Y ) + nX
Y
Xi Yi =
(Xi X)(Y
= 106,4 + 20 9,31 1,095
X
Xi Yi = 310,289
X
2
(Xi X)
X
Xi2
X
Xi2
=
=
X
X
Xi2 y
Yi2 :
(8)
2
Xi2 nX
2 + nX
2
(Xi X)
215,4 + 20 9,312
1948,922
6
(7)
(9)
(Yi Y )2
X
Yi2
=
=
=
X
X
Yi2 nY 2
(Yi Y )2 + nY 2
86,9 + 20 1,0952
u
2 = 34,343
qP
u
2
nk
es:
rP
u2
u
u
2
nk
r
34,343
=
20 2
= 1,908
= 1,381
=
Y0
Y0
Y 0
=
=
=
+ X0
3,504 + 0,494 10
1,436
e2
e2
e
(X X0 )2
Pi
u2 1 +
2
n (Xi X)
2500,9
= 1,908(1 +
)
20 4308
= 3,017
= 1,737
=
(10)
El t de tabla para un test de dos colas con un 95 % de confianza es tt = 2,101, por lo que el
intervalo de confianza queda:
Y0 tt,/2 e Y 0
1,436 2,101 1,737 Y 0
2,213 Y 0
Y0 + tt,1/2 e
1,436 + 2,101 1,737
5,085
Las desviaciones estndares de los parmetros estimados se encuentra entre parntesis abajo de los estimadores.
Un coeficiente individual es estadsticamente significativo al nivel 5 % (*), nivel 1 % (**) usando
un test de dos colas.
Usando los resultados de la Tabla 5.2 adjunta conteste las siguientes preguntas:
1. En la regresin de la columna (3), el valor estimado de 1 es -1,00. Qu significa un valor
de -1,00 en esta regresin?
R: Mientras mas alumnos sean por profesor, existe una incidencia negativa sobre el puntaje estimado, adems este efecto es estadsticamente distinto de cero al 1 % de significancia.
En otras palabras, si el ratio alumnos/profesores aumenta en una unidad, se espera que
el promedio caiga en un punto, segn nuestra especificacin.
2. Usando los resultados de la columna (3), construya un intervalo de confianza para 1 del
99 %.
R: Un intervalo de confianza de 1 de significancia, con varianza desconocida y T-k
grados de libertad, se define como:
P r[1 t1 2 ,T k (1 ) < 1 < 1 + t1 2 ,T k (1 ) ] = 1
(1)
Remplazando valores1
1 2, 575(0, 27) < 1 < 1 + 2, 575(0, 27)
(2)
(3)
Despejando para R2 :
T 1
2
2
R = 1 (1 R )
T k
T k 2
R =1+
(R 1)
T 1
(4)
R2 = 1 +
420 4
(0, 773 1)
420 1
= R2 = 0, 7746
(5)
(6)
(7)
el tamao muestral es lo suficientemente grande, se puede usar una normal estandar para encontrar
los valores tipificados (T > 100).
10
/(T k)
2 = 1 +
(1)
R
Y 0 M Y /(T 1)
Adems posteriormente las variables que fueron omitidas en (1) e incluidas en (3) resultaron ser significativas al 1 %, por lo tanto, es probable que se este eliminado un potencial
sesgo de variable relevante omitida.
5. Sea 4 el coeficiente de la variable porcentaje de ingresos pblicos".
a) Es 4 estadsticamente significativo en la regresin de la columna (4)? Construya un
intervalo de confianza para 4 del 95 % usando la regresin de la columna (4).
R: Por enunciado sabemos que es significativo al 1 %. Recordemos la definicin de
un intervalo de confianza al 1 :
P r[4 t1 2 ,T k (4 ) < 4 < 4 + t1 2 ,T k (4 ) ] = 1
(1)
Remplazando valores:
0, 79 1, 96(0, 068) < 4 < 0, 79 + 1, 96(0, 068)
(2)
(3)
(4)
(5)
cov(X1 , X2 )
2
(6)
E(1 ) = i +
V (X1 )
Siendo X2 la variable relevante omitida, el signo del sesgo del parmetro depender
de la cov(X1 , X2 ) y del beta de la variable omitida.
11
(3)
cov(X1 , X2 )
2
(1)
E(1 ) = i +
V (X1 )
Siendo X2 la variable relevante omitida, el signo del sesgo del parmetro depender de
la cov(X1 , X2 ) y del beta de la variable omitida. En (1), 1 esta siendo sub estimado
comparado con (2). La correlacin es positiva ya que 2 < 0 en el modelo (2), por lo cual
cov(X1 , X2 ) > 0.
9. Supongamos que el tamao muestral aumenta al doble, entonces n = 840. Como esperas
que cambien los errores estndares de los estimadores MCO? Explique.
12
R: Si T aumenta el doble, contamos con una mayor parte de la poblacin, por lo cual
estaremos mas cerca de estimar los verdaderos parmetros poblacionales, adems nuestras
estimaciones son ms precisas, ya que aumenta la variabilidad de las variables independientes, con esto la varianza de los betas ser menor. Como la estimacin es ahora mas
precisas, los errores de MCO son menores.
13
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Solemne
1.
3. Si una variable es econmicamente significativa, entonces, no debiera ocurrir que estadsticamente no lo fuera.
Respuesta. Falso. En trminos econmicos, la signficancia de la variable
viene determinada por el modelo terico subyacente. Sin embargo, a nivel
estadstico la significancia estar determinada en parte por la naturaleza y
caractersticas de los datos. En particular, la variable podra ser estadsticamente no significativa debido a una alta colinealidad en los datos (covarianza). Esto ocurre pues mientras mayor sea sta, mayor ser tambin la
varianza del estimador, y por lo tanto, ms probabilidades hay que el cero
est contenido en el intervalo de confianza asociado.
4. El anlisis economtrico permite descartar teoras, y de esa manera, progresar en el entendimiento de la economa.
Respuesta. En parte esto es correcto. En la medida que el anlisis economtrico sea el apropiado, y que los datos no estn muy contaminados, entonces,
es posible validar teoras a partir de ste. Sin embargo, las conclusiones de
todo anlisis economtrico deben ponderarse adecuadamente en funcin de
las limitaciones que ste ofrece. Ahora bien, si existe abundante evidencia
emprica que apoya cierta afirmacin terica, entonces, habra fundamento
para poder establecer que el modelo explica relativamente bien la realidad.
5. La singularidad de la matriz (X 0 X) no afecta la precisin de las estimaciones.
Respuesta. La precisin de las estimaciones vienen dadas por su varianza,
es decir:
= 2 (X 0 X)1
var()
(1)
En la medida que la matriz (X 0 X)1 sea singular, esto es, no invertible,
entonces, su inversa no existe, pues su determinante tiende a cero. Por lo
tanto, se tendrn varianzas gigantes, y en el lmite, es decir, cuando la
matriz es singular, stas no se podrn calcular. Por lo tanto, el comente es
falso.
6. Siempre es mejor utilizar un slo modelo para predecir, en lugar de escoger
una combinacin de distintos modelos.
Respuesta. Falso. En la medida que se reconoce que ningn modelo es
perfecto, y que por lo tanto, los defectos de uno pueden ser las virtudes
de otro, entonces, al tomar ms de un modelo para realizar proyecciones, y
hacer una ponderacin de stas, ser posible obtener mejores estimaciones.
Esto ocurrira pues los errores de unos con otros tenderan a cancelarse,
obtenindose as una mejor prediccin.
2.
)=
n
xi
Respuesta. Se sabe que:
= + X
+
= ( )X
+
= Y X
X
Por lo tanto:
+
= ( )X
E(
)2 = E[( )X
]2 = X
2 ) 2XE[(
)
]
Por otro lado, se sabe que:
2
E( )2 = P 2
x
y:
E(
2 ) =
Adems:
E[( )
] = E
E[( )
] =
1
P
x2
2
n
P X
x 1
P 2
x
n
E[(x1 1 + x2 2 + + xn n )(1 + 2 + + n )]
P
2 x
E[( )
] = P 2 = 0
n x
Finalmente:
2
E(
) =
2
1
X
+P 2
n
x
2. Demuestre que
2 = nki es un estimador insesgado de 2 .
Respuesta. Considere lo siguiente:
= Y X = Y X(X 0 X)1 X 0 Y = M Y
con:
M = I X(X 0 X)1 X 0
donde M es una matriz simtrica e idempotente. Note adems lo siguiente:
= M Y = M (X + ) = M .
Un estimador natural de 2 sera la suma de los errores estimados al cuadrado, es decir:
X
=
0
Aplicando esperanza:
E(
0
) = E(0 M 0 M ) = E(0 M )
Dado que la traza de un escalar es un escalar, se tiene:
E(0 M ) = E[tr(0 M )] = E[tr(0 M )] = 2 tr(M )
Reemplazando M :
E(0 M ) = 2 tr(I) 2 tr[X(X 0 X)1 X 0 ] = 2 tr(I) 2 tr[(X 0 X)1 (X 0 X)]
Por lo tanto:
E(0 M ) = 2 (n k)
Es decir, la suma de los cuadrados de los errores estimados es un estimador
sesgado de 2 . Por lo tanto, y dado el resultado anterior:
P 2
i
2
=
nk
corresponde a un estimador insesgado de 2 .
3.
(2)
Se tiene lo siguiente:
1
100 6
3
0, 005051
0
=
=
6 36
15
0, 415825
1
2. Se piensa que una forma mejor de estimar la demanda sera incluyendo
adems del ingreso medio disponible, los precios de pescado (Pt ) como nueva
variable explicativa. Sabiendo que:
X
X
X
X
Pt = 4
Yt Pt = 30
Pt2 = 100
Pt Dt = 5
calcule los nuevos coeficientes estimados.
Respuesta. El nuevo a modelo a estimar viene dado por:
Dt = 0 + 1 Yt + 2 Pt + t
Aplicando MCO se tiene lo siguiente:
1
0
100 6
4
3
0, 004041
1 = 6 36 30 15 = 0, 499282
4 30 100
5
0, 09995
2
5
(3)
(4)
n1
nk
= 0, 617
(6)
(7)
2 por:
y el R
2 = 1 (1 R2 )
R
n1
nk
= 0, 691
(8)
2 , es decir, el segundo
El modelo preferido ser aquel que tenga el mayor R
2
modelo. No sera correcto fijarse en el R , pues ste es monotnico frente a la
2 toma en cuenta la
incorporacin de regresores adicionales, mientras que el R
prdida en grados de libertad en que se incurre.
4.
Considere la siguiente estimacin que ha sido generada a partir de la informacin proporcionada por la Encuesta de Caracterizacin Nacional (CASEN) para
el ao 2003:
Variable
Coeficiente
Desviacin Estndar
Aos de escolaridad
Experiencia laboral
Experiencia laboral al cuadrado
Constante
0,1202
0,0212
-0,0000938
5,0379
0,0007037
0,0006365
0,0000127
0,0112151
0, 1202
1
=
= 170, 81
1
0, 0007037
t2 =
2
0, 0212
=
= 33, 3
2
0, 0006365
7
t3 =
3
0, 0000938
=
= 7, 38
3
0, 0000127
0
0, 0112151
Dado que el t es mayor que dos, entonces, la constante es significativa. Este
resultado tiene sentido desde un punto de vista econmico, pues reflejara de
alguna forma el salario mnimo que paga el mercado, es decir, independiente
del capital humano de la persona sta recibira al menos dicha cantidad.
4. Cul es el salario (mensual) estimado para una persona con 14 aos de
escolaridad, y cuatro aos de experiencia laboral? (Asuma que la jornada
laboral es de 45 horas a la semana, y que el mes tiene 4,2 semanas)
Respuesta. La prediccin es la siguiente:
Yi = 0 + 1 X1i + 2 X2i + 3 X3i
Reemplazando:
Yi = 5, 0379 + 0, 1202(14) + 0, 0212(4) 0, 0000938(16) = 6, 8039992
Aplicando e() se llega a que el salario por hora estimado es de $901. Como la persona trabaja 45 horas a la semana, y el mes tiene 4,2 semanas,
entonces, el salario mensual estimado para esta persona es de $170.289.
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Solemne
1.
A su vez, sin perder generalidad, se sabe que para el caso del modelo de dos
variables (Yi = + Xi + ui ), la varianza del estimador MCO viene dada
por:
2
= P
var()
x2i
donde:
u2i
N k
donde k corresponde al nmero de parmetros a estimar. De esta manera,
es posible apreciar cmo el tamao muestral (N ) afecta el valor del test
y por ende, mayor
t. Mientras mayor sea N menor es la varianza de ,
es el valor del test t. En consecuencia, es ms probable que el coeficiente
estimado resulte ser estadsticamente significativo.
P
2.
Matemticos
b1 =
2 2
1
var(Y
Y
)
=
n
1
(Xn X1 )2
(Xn X1 )2
2
(Xn X1 )2
(Xi X)
o bien que:
2
2 (Xn X1 )2
(Xi X)
y v = (Xn X).
Por
Se definen las siguientes variables, u = (X1 X)
lo tanto:
2
2 = 2(u2 +
(Xi X)
n1
X
2 + v 2 ) 2(u2 + v 2 )
(Xi X)
i=2
i
1
2
3
4
5
6
7
8
9
10
11
12
p i qi
(Pi P )(Qi Q)
P
P
=
= 1450
=
p2i
(Pi P )2
Por otro lado, el intercepto se estima como:
P = 1530
=Q
b) Calcule la suma de los cuadrados totales (TSS), la suma de los cuadrados de la regresin (ESS), la suma de los errores al cuadrado (RSS) y
el coeficiente R2 .
Respuesta. La suma de los cuadrados totales viene dada por:
X
X
2=
2 = 22760, 25
T SS =
(Qi Q)
Q2i nQ
La suma de los cuadrados de la regresin viene dada por:
X
2 = 15768, 75
ESS = 2
(Qi Q)
ESS
15768, 75
=
= 0, 69
T SS
22760, 25
2 =
RSS
6991, 5
e2i
=
=
= 699, 15
n2
n2
10
=
= 305, 31
b = pP
0, 0075
(Pi P )2
Por otro lado:
b
1450
= 4, 74
=
b
305, 31
por lo tanto, se rechaza la hiptesuis nula, y el coeficiente es estadsticamente significativo.
tb =
3.
La movilidad social es un tema que preocupa a las autoridades de muchos pases. Economas que presentan una elevada movilidad social son aquellas en donde
existe una elevada probabilidad de avanzar a lo largo de la distribucin de ingresos, mediante un acceso razonable a las oportunidades que ofrece el mercado.
Una de las principales herramientas para lograr movilidad social es la educacin,
6
Rut:____________________________
ii. Consider the following multiple regression models (a) to (d) below. DFemme = 1 if
the individual is a female, and is zero otherwise; DMale is a binary variable which
takes on the value one if the individual is male, and is zero otherwise; DMarried is a
binary variable which is unity for married individuals and is zero otherwise, and
DSingle is (1-DMarried). Regressing weekly earnings (Earn) on a set of explanatory
variables, you will experience perfect multicollinearity in the following cases unless:
a. Earn
i = 0 + 1 DFemme + 2 Dmale + 3 X 3i .
b. Earn
i = 0 + 1 DMarried + 2 DSingle + 3 X 3i .
= + DFemme + X .
c. Earn
i
3i
d. Earn
i = 1 DFemme + 2 Dmale + 3 DMarried + 4 DSingle + 5 X 3i .
Answer: c
iii. When there are omitted variables in the regression, which are determinants of the
dependent variable, then
a. you cannot measure the effect of the omitted variable, but the estimator of
your included variable(s) is (are) unaffected.
b. this has no effect on the estimator of your included variable because the
other variable is not included.
Rut:____________________________
c. this will always bias the OLS estimator of the included variable.
d. the OLS estimator is biased if the omitted variable is correlated with the
included variable.
Answer: d
iv. The assumption that X has full column rank implies that
a.
b.
c.
d.
Answer: c
v. One implication of the extended least squares assumptions in the multiple regression
model is that
a.
b.
c.
d.
Answer: d
vi. The following linear hypothesis can be tested using the F-test with the exception of
a. 2 = 1 and 3 = 4 / 5 .
e. 2 = 0 .
f. 1 + 2 = 1 and 3 = 2 4 .
g. 0 = 1 and 1 = 0.
Answer: a
a. (X -1X)-1(X -1Y).
b. (XX)-1XY.
Rut:____________________________
c. AY.
d. (XX)-1XU.
Answer: a
ix.
a.
b.
c.
d.
Answer: b
x. In the case when the errors are homoskedastic and normally distributed, conditional
on X, then
a. is distributed N( , | X ),where | X = u2 I(k+1).
b. is distributed N(, ), where =
n ( )
/n = Q X1 V QX1 /n.
2)
2.1. Give several economic examples of how to test various joint linear hypotheses
using matrix notation. Include specifications of R = r where you test for (i) all
coefficients other than the constant being zero, (ii) a subset of coefficients being
zero, and (iii) equality of coefficients. Talk about the possible distributions involved
in finding critical values for your hypotheses.
Answer: Answers will vary by student. Many restrictions involve the equality of coefficients across
different types of entities in cross-sections (stability). Using earnings functions,
students may suggest testing for the presence of regional effects, as in the textbook
example at the end of Chapter 5 (exercises). The textbook tested jointly for the presence
of interaction effects in the student achievement example at the end of Chapter 6.
Students may want to test for the equality of returns to education and on-the-job training.
The panel chapter allowed for the presence of fixed effects, the presence of which can be
tested for. Testing for constant returns to scale in production functions is also frequently
mentioned.
Rut:____________________________
2.2. Consider the multiple regression model from Chapter 5, where k = 2 and the
assumptions of the multiple regression model hold.
(a)
Show what the X matrix and the vector would look like in this case.
1 X 11
1 X 12
Answer: X =
M M
1 X 1n
(b)
X 21
0
X 22
, and = 1
2
X 2 n
Having collected data for 104 countries of the world from the Penn World Tables,
you want to estimate the effect of the population growth rate (X1i) and the saving
rate (X2i) (average investment share of GDP from 1980 to 1990) on GDP per worker
(relative to the U.S.) in 1990. What are your expected signs for the regression
coefficient? What is the order of the (XX) here?
Answer: You would expect the population growth rate to have a negative
coefficient, and the saving rate to have a positive coefficient. The order of
XX is 3 3.
(c)
You are asked to find the OLS estimator for the intercept and slope in this model
Rut:____________________________
using the formula = (XX)-1XY. Since you are more comfortable in inverting a
22 matrix (the inverse of a 22 matrix is,
1
a b
1 d b
)
ad bc c a
c d
you decide to write the multiple regression model in deviations from mean form.
Show what the X matrix, the (XX) matrix, and the XY matrix would look like now.
(Hint: use small letters to indicate deviations from mean, i.e., zi = Zi Z and note
that
+
X +
X + u$ i
Yi =
0
1 1i
2 2i
+
X +
X .
Y =
0
x +
x + u$ i .)
yi =
1 1i
2 2i
x11
x
Answer: X = 12
M
x1n
(d)
x21
x22
, XX =
M
x2 n
n 2
x1i
i =1
n
x1i x2i
i =1
x
x
1i 2 i
yi x1i
i =1
, XY = i =1
.
n
n
2
x2 i
yi x2 i
i =1
i =1
n
Show that the slope for the population growth rate is given by
n
1 =
i =1
i =1
i =1
x x
i =1
n 2
x1i
i =1
Answer: n
x1i x2i
i =1
2
1i
i =1
2
2i
i =1
( x1i x2 i ) 2
i =1
n 2
x1i x2 i
x2 i
1
i =1
=
i =1
n
n
n
n
n
2
2
2
2
x
x
(
x
x
)
x
1i 1i
1i 2i
2i
x1i x2 i
i =1
i =1
i =1
i =1
i =1
n
x1i x2 i
i =1
.
n
x12i
i =1
Rut:____________________________
yi x1i
i =1
results in the two least squares estimators
Post multiplying this expression with n
yi x2 i
i =1
n
n
n
n
2
yi x1i x2 i yi x2 i x1i x2i
i =1
i =1
i =1 n i =1 n
n
2
2
2
i =1
.
1 = n i =1 ni =1
, and hence gives the formula for
1
n
n
2
2
y
x
x
y
x
x
x
i 2 i 1i
i 1i 1i 2 i
i =1
i =1
i =1
i =1
n
n
n
2
2
2
(
)
x
x
x
x
1i 2i
1i 2i
i =1
i =1
i =1
Rut:____________________________
(e)
The various sums needed to calculate the OLS estimates are given below:
n
i =1
i =1
i =1
yx
i 1i
i =1
i =1
i =1
Find the numerical values for the effect of population growth and the saving rate on
per capita income and interpret these.
1
0.0122 0.6422 (0.0520) 2
=
Answer: =
12.953
1.393 .
A reduction of the population growth rate by one percent increases the per capita income relative to the United States by roughly
0.13. An increase in the saving rate by ten percent increases per capita income relative to the United States by roughly 0.14.
(f)
Indicate how you would find the intercept in the above case. Is this coefficient of
interest in the interpretation of the determinants of per capita income? If not, then
why estimate it?
Answer: The first order condition for the OLS estimator in the case of k = 2 is
n
Y =n
i =1
i =1
i =1
X
X . The intercept is only of interest if there are
0 = Y
1 1
2 2
observations close to the origin, which is not the case here. If it is set to
zero, then the regression is forced through the origin, instead being
allowed to choose a level.
2.3. Define the GLS estimator and discuss its properties when is known. Why is this
estimator sometimes called infeasible GLS? What happens when is unknown?
What would the matrix look like for the case of independent sampling with
heteroskedastic errors, where var( ui | X i ) = ch( X i ) = 2 X 12i ? Since the inverse of
the error variance-covariance matrix is needed to compute the GLS estimator, find
1 . The textbook shows that the original model Y = X + U will be transformed
into Y% = X% + U% , where Y% = FY, X% = FX, and U% = FU, and FF = -1. Find F
in the above case, and describe what effect the transformation has on the original
data.
Rut:____________________________
Answer: GLS = (X -1X)-1(X -1Y). The key point for the GLS estimator with
known is that is used to create a transformed regression model such
that the resulting error term satisfies the Gauss-Markov conditions. In that
case, GLS is BLUE. However, since is typically unknown, the
estimator cannot be calculated, and is therefore sometimes referred to as
infeasible GLS. If is unknown, then a feasible GLS estimator can be
calculated if is a known function of a number of parameters which can
be estimated. Once the parameters have been estimated, they can then be
used to calculate , which is the estimator of . The feasible GLS
estimator is then
0 X 122
E(UU|X) = (X) = 2
M
M
0
0
1
0 L
X2
11
1
L
1 0
1
X 122
(X) = 2
M
M O
0
0 L
L
L
O
L
0
0
M
1
X 12n
0
,
M
X 12n
, F=
1
X
11
1
X 12
0
.
M
1
X 1n
Prueba Solemne
Econometra I
Profesor: Tomas Rau Binder
Ayudante: Victor Nahuelpan
27 de diciembre
Tiempo Total: 120 Minutos.
1.
1. Defina funci
on de regresi
on poblacional. R. La funci
on de regresion poblacional es el lugar geometrico de las medias condicionales E(Yi |Xi ) = f (Xi )
que puede ser una funci
on cualquiera. Un caso particular es la recta de
regresion poblacional Y = X + u.
2. Demuestre que E(u|X) = 0 E(u) = 0. R. Por Ley de las Esperanzas
Iteradas (Iterated Law of Expectations) sabemos que E(E(u|X)) = E(u).
Luego, reemplazando E(u|X) = 0, tenemos que E(u) = 0.
3. Muestre que = (X X)1 X Y es insesgado. R. Reemplazando la recta
de regresion poblacional tenemos que = + (X X)1 X u. Tomando
valor esperado y usando el supuesto 2 (X no estoc
asticas) y supuesto 3
= .
(E(u|X) = 0) tenemos que E()
4. Muestre que el rango de Mnn = In X(X X)1 X es igual a n k
donde X es de orden n k. Recuerde que el rango de una matriz simetrica e idempotente es igual a su traza. R. Usando las propiedades: tr(AB)=tr(A)-tr(B) y tr(AB)=tr(BA). Tenemos que:
r(M ) = tr(M )
=
=
2.
Preguntas de Desarrollo
E(
u)
xi E(ui u)
Pi 2 i = 2 +
P 2
E(2 ) = 2 +
x
i
x
i
P
x
)
i
P
= 2
E(2 ) = 2 +
x2i
= Y 2 X
= 1 + 2 X + u 2 X
tomando valor esperado
E(1 )
= 1 + 2 X + E(u) E(2 )X
= 1 +
2
1
2
1
1
Y =
1 X= 1
1
0
3
1
2
0
3/2
1
1/2
0
y=
0 x = 1/2
3/2
1
P
P 2
ademas:
xi yi = 3/2 + 3/2 = 3,
xi = (3/2)2 + (1/2)2 + (1/2)2 +
2
(3/2) = 20/4 = 5. Luego
2 = 3/5 = 0,6
1 = Y 2 X = 1 (3/5) (3/2) = 1 9/10 = 0,1
Para estimar 2 necesitamos los residuos
0,01
2 0,09
u
= 0,09
0,01
u
2i = 0,2 y
2 = 0,2/2 = 0,1 dado que n k = 2.
b) Testee la hip
otesis nula H0 : 2 = 0 (a dos colas). Es 2 significativo
al 5 %?Y al 10 %? Ver Cuadro 1 para los valores crticos. (10 puntos)
P
R. Sabemos que la varianza de 2 =
2 / x2i = 0,1/5 = 0,02. Por
lo tanto el error est
andar de 2 es 2/10 = 0,141. El test t es:
t=
2
6/10
= 4,24
=
2/10
SE(2 )
RSS/(n k)
0,2/2
=1
= 0,85
T SS/(n 1)
2/3
Ra2 = 1
X
l
= n/ + (1/2 )
yi /xi
2
1
4
2
Y =
1 X = 1
3
3
X
2l
= n/2 + (2/3 )
E(yi /xi )
2
usando que las xs son fijas y que E(yi |xi ) = xi , tenemos que
I() = n/2 + (2/3 )
X xi
xi
=
Luego, reemplazamos el valor de R = 2, r = 3 y evaluando I()
2
90 %
3.078
1.886
1.638
1.533
1.476
1.44
1.415
95 %
6.314
2.92
2.353
2.132
2.015
1.943
1.895
97.50 %
12.71
4.303
3.182
2.776
2.571
2.447
2.365
99 %
31.82
6.965
4.541
3.747
3.365
3.143
2.998
99.50 %
63.66
9.925
5.841
4.604
4.032
3.707
3.499
1.
Comentes (5 puntos, m
aximo 5 renglones)
1. La funci
on de regresion poblacional es el lugar geometrico de las esperanzas
condicionales para distintos valores de X.
R. Verdadero. La funci
on de regresion poblacional es el lugar geometrico
de la esperanza condicional de y en X, luego es una funci
on de X. En
particular E(Y |X = x), para distintos valores de X = x. Si bien no se
explicita en el texto si la esperanza es sobre y, se puede asumir dado que
hablamos de una funci
on de regresion.
2. Si tenemos dos estimadores de un par
ametro: uno sesgado y otro insesgado,
elegiremos siempre el insesgado.
R. Falso. Preferiremos aquel que tenga un menor error cuadratico medio.
3. Si tenemos dos columnas de la matriz X linealmente dependientes el estimador MCO de es igual a cero.
R. Falso. El estimador MCO de no existe puesto que X X no tiene
inversa si dos columnas de X son linealmente dependientes.
4. Cuando tenemos hip
otesis lineales del tipo R = r, si q = 1 podemos usar
un simple test t.
R. Verdadero. Cuando q = 1, podemos escribir un test t teniendo cuida
do en incorporar las covarianzas en el c
alculo del error est
andar de R.
Ademas, para un est
adistico que sigue una F con (1,n-k) grados de libertad, su raz cuadrada sigue una t-student con n k grados de libertad.
1
2.
Preguntas de Desarrollo
b) Demuestre que el estimador MCO de 1 , ..., k es equivalente a estimar por MCO el modelo de UNA variable, es decir y = i xi + u para
cada i = 1, .., k. (20 puntos)
R El estimador MCO de 1 , ..., k est
a dado por la formula usual:
= (X X)1 X Y
Pn
Dado que m=1 xjm = 0, tenemos que todos los elementos fuera de
la diagonal de X X son ceros (recuerde que la multiplicacion es fila
por columna). As,
y ademas
X X =
n P 0 0
0
x22,i 0
.. .. . .
..
.
. .
.
0
0 0
P
P yi
x2,i yi
X Y = .
.
.
P
xk,i yi
0
0
..
.
P
x2k,i
P
yi
P n
x2,i yi
P 2
x2,i
..
.
P
x yi
P k,i
x2k,i
X
(yj i xi,j )2
j
obtenemos
P
j xi,j yj
i = P 2
j xi,j
P
P 2
incluso para i = 1 puesto que j x1,j = j 12 = n, luego
i =
yi
Cuadro 1: Datos
x1 x2 x3 y
1
1 -2
1
1 -1
1 -2
1 -1 -1
1
1
1
2
0
1
0
0
0
1
1
X X = 1 1
2
1
y
1 1 1
1 1 0
1 2 0
1 2
1
1
5
0
1 1
=
1
2
0
0
0
1
1
1
1
1
1
1
X Y = 1 1
2
1
1 1 1
1 1 0
1 2 0
y finalmente
1
2
1
0
0
0 0
4 0
0 10
= 2
1/5
0
0
0
0
0 1/4
0 2 = 0,5
=
0
0 1/10
5
0,5
1 + 3
2
HA :
1 + 3
2
4
0
6=
4
0
(10 puntos)
R. Escribamos la matriz R
1
0
1 + 3 4
2
1 0
0 1
y R r,
R r =
9/2
1/2
=
=
1/5
0
0 1/4
0
0
1
1/5
0 1/10
0
0 1/4
0
1
3/10
0
0 1/4
1
0
0 1
1 0
0
1 0
0 0 1
1/10
1 0
0
1
0
luego
[R(X X)1 R ]1 =
y as,
(R r) [R(X X)1 R ]1 (R r)
=
=
=
10/3 0
0 4
10/3 0
0 4
9/2
90/6 2
1/2
9/2 1/2
810/12 + 1 = 68,5
y finalmente,
68,5/2
(R r) [R(X X)1 R ]1 (R r)/q
=
= 27,4
u u/(n k)
2,5/2
5%
el valor crtico de una F(2,2)
= 19, luego se rechaza la hipotesis nula.
9/2
1/2
n
n
ln(2) ln( 2 )
2
2
(yi 1 2 xi )2
2 2
(yi 1 2 xi )
2
P
(yi 1 2 xi )xi
=
2
n
1 X
= 2+ 4
(yi 1 2 xi )2
2
2
=
y 2 x
P
P
yi xi y xi
P
nx2 x2i
P
(yi 1 2 xi )2
n
= 0
= 0,5
i=1
n
n
= ln(2) ln
2
2
l(r,1 , r,2 ,
r2 )
u
2nr,i
n
u
2r,i
n
n
2
n
2
LR = n ln
n
X
i=1
u2r,i
ln
n
X
u
2nr,i
i=1
!#
Cuadro 2: Datos
x1 x2
y
1
1
1
1 -1 -2
1 -1
1
1
1
0
1
0
0
EXMENES
Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Examen Final
Nombre:
...........................................................................................
Rut:
.......................................
Ud. Dispone de 120 minutos para resolver el examen, no puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo.
1.
Comentes
( 35 puntos)Debe responder 5 de los siguientes 8 comentes. Debe justificar sus respuestas
Comente 1: ( 7 puntos) La omisin de una variable relevante siempre siempre sesga la estimacin MCO de . Comente.
Falso, el sesgo que se produce en el parmetro depende de la covarianza entre la variables
explicativas y la omitida, y el valor poblacional de la variable omitida.
= 1 +
En un modelo de regresin simple: E()
cov(x1 ,x2 )
var(x1 ) omitida
Dw '= 2(1 ) podemos apreciar que cuando = 1 significa que Dw '= 4. De esta
forma si se rechaza Ho : = 0, porque Dw = 4, es en favor de la hiptesis alternativa de
autocorrelacin negativa.
Falso, inequivocamente hay autocorrelacin negativa.
Comente 4: ( 7 puntos) Un sntoma de la existencia de multicolinealidad es la presencia de
un R2 ajustado alto . Comente.
El sntoma corresponde no simplemente a la observacin de un R2 alto, sino que adems acompaado por estadsticos t que nos hacen concluir que los parmetros no son significativos (t
bajos). Esto porque en presencia de multicolinealidades, las varianzas de los estimadores son
altas, pues (x0 x) es cercano a cero. Lo que resulta en estadsticos t pequeos.
Comente 5: ( 7 puntos) La estimacin por Mxima Verosimilitud es MELI. Comente.
Falso, el estimador MELI es el de MCO. El estimador MV es asintonticamente ms eficiente ya que alcanza la cota de Cramer-Rao, aun cuando en muestras finitas puede ser sesgado.
Bajo el supuesto de normalidad,el estimador MV y MCO de coinciden. Sin embargo, difieren
en la estimacin de sus varianzas, ya que la varianza de MV es sesgada. De esta forma, MV es
el mejor estimador pero en muestras grandes (Cramer-Rao).
Comente 6: ( 7 puntos) Si los errores del modelo de regresin lineal no tienen distribucin
normal, a pesar de que los estimadores OLS ya no son MELI siguen siendo insesgados. Comente.
La propiedad de Meli no requiere de un supuesto especfico de la distribucin de los errores,
simplemente requiere que stas sean iid. Bajo independencia e idntica distribucin (cualquiera
sea), MCO ser MELI.
Comente 7: ( 7 puntos) La inclusin de variables independientes rezagadas no trae consecuencias de sesgo ni de eficiencia en las estimaciones MCO . Comente.
Verdadero, cuando se incluyen rezagos de la variable dependiente MCO pierde la propiedad
de insesgamiento, pero sigue siendo consistente. Sin embrago, si asumimos fijo los regresores
(variables independientes), sus rezagos tambin los sern y por lo tanto, no se produce ningn
problema con las propiedades de MCO. El nico peligro es que se puede generar un problema
de multicolinealidad.
Comente 8: ( 7 puntos) La utilizacin de la matriz de White permite corregir el problema de
heterocedasticidad sin saber a priori la especificacin de esta. Comente.
Falso, la estimacin de White no corrige la heterocedasticidad, sino que permite obtener
un estimador consistente de la matriz de varianzas y covarianzas con heterocedasticidad, y de
esta forma, poder realizar la inferencia. Efectivamente, esto se puede hacer sin conocer el patrn
de heterocedasticidad.
Pero no se corrige la heterocedasticidad.
2.
Demostraciones
( 40 puntos) Debe responder 2 de las siguientes 4 demostraciones.
Pregunta 1: ( 20 puntos)
Demuestre que el R2 ajustado es menor que el R2 .
Respuesta:
u
0 u
0
Y MY
(1)
u
0 u
/(n k)
0
Y M Y /(n 1)
(2)
R2 = 1
2 = 1
R
Reemplazando (1) en (2):
2
2 = 1 (1 R2 ) (n 1) = (n k) (1 R )(n 1)
R
(n k)
(n k)
2 = (n k) (1 R2 )(n 1) = (1 k) + R2 (n 1)
(n k)R
2 = (1 k) + R2 (n 1)
R
(n k)
(n k)
2 = 0 + R2 = R2 , por ende son iguales.
Para K = 1, R
2 = () + R2 (< 1) R
2 < R2
Para K > 1, R
Pregunta 2: ( 20 puntos)
Considerando el siguiente modelo de regresin lineal con error de medicin en la variable explicativa
Yi = Xi + ui
ui N (0, 2 )
En donde Xi = Xi + ei
Demuestre que el estimador por variables instrumentales se puede escribir como
V I
0 X
)1 X
0 y
(X
(3)
Respuesta:
Modelo verdadero: Yi = Xi + ui , se observa: Xi = Xi + ei
Como Xi est medida con error, se puede utilizar el instrumento Z. Para obtener el estimador de variables instrumentales hago un estimador en dos etapas:
Primera etapa: regresin entre Xi y Zi , para obtener Xi :
Xi = Zi + vi
= (Z 0 Z)1 Z 0 X
X = Z(Z 0 Z)1 Z 0 X
0
0
V I = (X Z(Z 0 Z)1 Z 0 X )1 X Z(Z 0 Z)1 Z 0 Y
Pregunta 3: ( 20 puntos)
Considerando el siguiente modelo de regresin lineal
Yi = Xi + ui
ui N (0, 2 )
N
X
u
2
i=1
0 Y + 0 X 0 X ]
mn[Y 0 Y 2X
= 0 2X 0 Y + 2X 0 X = 0 M CO = (X 0 X)1 X 0 Y
(Y X)0 (Y X)
1
2 2
e
n
(2 2 ) 2
n
2
(Y X)0 (Y X)
2 2
l
1
= 2 2(Y X)(X 0 ) = 0 M V = (X 0 X)1 X 0 Y
2
Maximizar l con respecto a es lo mismo que minimizar (Y X)0 (Y X). Para ambos casos
se resuelve igual problema, por lo que el estimador resultante es anlogo en ambas estimaciones.
Pregunta 4: ( 20 puntos)
Demuestre que la inclusin de variables irrelevantes disminuye la eficiencia de las estimaciones
MCO.
Respuestas:
Modelo correcto: Y = X1 1 + u
Modelo incorrecto: Y = X1 1 + X2 2 + u
Recordando la regresin particionada: el estimador de 1 del modelo incorrecto es:
1 = (X10 M2 X1 )1 X10 M2 Y
Donde M2 = I X2 (X20 X2 )1 X20
1 = (X10 M2 X1 )1 X10 M2 (X1 1 + u) = 1 + (X10 M2 X1 )1 X10 M2 u
E(1 ) = 1 + (X10 M2 X1 )1 X10 M2 E(u)
Como E(u) = 0 E(1 ) = 1
Respecto a la varianza:
V (1 ) = E[(1 E(1 ))(1 E(1 ))0 ]
= E[(X10 M2 X1 )1 X10 M2 uu0 M2 X1 (X10 M2 X1 )1 ]
Como M2 es idempotente y simtrica.
V (1 ) = 2 (X10 M2 X1 )1 X10 M2 X1 (X10 M2 X1 )1
= 2 (X10 M2 X1 )1
La varianza verdadera (estimando el el modelo correcto) sera:
V (1 ) = 2 (X 0 X)1
1
1
[V (1 )]1 [V (1 )]1 = 2 (X10 X1 ) 2 (X10 M2 X1 )
1
= 2 X10 [I M2 ]X1
1
= 2 X10 X2 (X20 X2 )1 X20 X1
3.
Pregunta Obligatoria
( 45 puntos)
Suponga que un amigo de usted esta interesado en estimar el retorno a la educacin utilizando una encuesta de corte transversal, pero no esta muy seguro de los resultados obtenidos.
El modelo que su amigo estim es el siguiente.
Dependent Variable: W
Method: Least Squares
Included observations: 4021 after adjustments
W=C(1)+C(2)*DSEXO+C(3)*ESC+ C(4)*EXPE
C(1)
C(2)
C(3)
C(4)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Coefficient
Std. Error
t-Statistic
Prob.
10.16332
0.347502
0.123967
0.012138
0.061402
0.034635
0.003168
0.000964
165.5208
10.03325
0.0000
0.0000
12.58711
0.0000
0.302890
0.302369
0.701184
1974.992
-4276.154
11.89096
0.839496
2.128900
2.135167
lnWi
%Wi
=
ESCi
ESCi
ao de educacin.
Como t =
0,123967
0,003168
Expe1
0
0
0
Expe
0
2
0
0
.
0
0
0
0
0
0
0
0
0
. .
0
. .
0
0 .
0
. 0
.
0 .
.
. . Expen
C(1)
Coefficient
Std. Error
t-Statistic
0.0085142
0.020
0.4208
Prob.
0.673
Respuesta:
La autocorrelacin al igual que la heterocedasticidad, no tiene impactos sobre el insesgamiento, pero si sobre la eficiencia de estimador de MCO.
Un posible test es el Durbin-Watson (hay otros, ver apuntes)
Si se desconoce el patrn de autocorrelacin y no es posible estimarlo eficientemente, se
puede utilizar la estimacin consistente de la matriz de varianzas y covarianzas utilizando
el mtodo de Newey and West, para realizar la inferencia.
Si ocupamos DW tenemos que : DW = 2(1 ) = 2(1 0,0085142) = 1,98
Con lo que se rechaza la hiptesis nula de autocorrelacin.
El modelo arroja estos resultados, pues es un modelo de corte transversal donde es muy
extrao encontrar autocorrelacin entre individuos, recordar que la autocorrelacin es un
problema comn de series de tiempo.
7. (5 puntos) Como se mencion en el enunciado la variable experiencia se construy como
Expei = Edad Esci 6. Qu consecuencias puede acarrear esta especificacin de la
variable experiencia?. Explique detalladamente.
Respuesta:
Como la variable experiencia es construida a partir de otra variable explicativa (ESC),
esto genera un gran grado de asociacin entre dos variables explicativas del modelo o
multicolinealidad.
10
Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Examen
Comente 1: (10 puntos) Ud. posee informacin de la estimacin de los siguientes modelos:
Modelo
(1) yi = 0 + 1 x1,i + 2 x2,i + ui
(2) yi = 0 + 1 x1,i + 3 x3,i + ui
R2
0.96
0.85
Akaike
2.15
2.10
Schwarz
3.19
2.98
ey (y)x
x!
y 0,
e
(yi )xi
li (|yi , xi ) = ln
xi !
= ln yi + xi (ln + ln yi ) ln(xi !)
(1)
n
X
yi + ln
i=1
n
X
xi +
i=1
n
X
xi ln yi
i=1
n
X
ln(xi !)
i=1
L
n X
=
yi +
i=1
n
X
i=1
Pn
yi +
i=1
xi
n
X
xi
= 0
= 0
i=1
Pn
n + i=1 xi
Pn
i=1 yi
1+x
y
(2)
i = 1, ..., n
donde xi esta medida con error, de forma tal que slo accedemos a la variable xi = xi + i ,
iid
i=1 zi xi
Ahora sumando y restando i a la expresin entre parntesis y operando:
Pn
i + ui + i i )
i=1 zi (x
P
V I =
n
i=1 zi xi
x
i
z }| {
z }| {
z
((
x
+
i ) + ui i )
i
i=1 i
Pn
i=1 zi xi
Pn
V I
V I
V I
V I
Pn
z (xi + i )
i=1
Pni
zi xi
Pi=1
n
z i i
+ Pni=1
z
i xi
Pi=1
n
zi i /n
+ Pni=1
z
i=1 i xi /n
Pn
plim i=1 zi i /n
Pn
plim i=1 zi xi /n
plim +
z }| {
E(zi i )
+
E(zi xi )
| {z }
=0
plimV I
6=0
plimV I
Para que z sea un instrumento vlido debe cumplir con que E(zi i ) = 0 y E(zi xi ) 6= 0, con lo
cual se demuestra que el estimador de variable instrumentales es consistente.
1.021150
0.271875
0.712607
0.987964
0.987001
1.975875
97.60204
-57.21199
Std.
Error
t-Statistic
Prob.
1.074276
0.138389
0.143427
0.950547
1.964572
4.968432
0.3509
0.0607
0.0000
32.68142
17.33004
4.300857
4.443593
1.572226
r
DW
n
h= 1
N (0, 1)
2
1 n
2
Utilizando la informacin de la tabla anterior:
DW
1.572226
n
28
2
(0,143427)2
De esta forma,
s
1,572226
28
h= 1
= 1,738115749
2
1 28 (0,143427)2
El valor de tabla de la distribucin normal estndar a un 95 % de confianza es 1.960 y a un
90 % de confianza es 1.645, entonces a un 5 % de significancia no se puede rechazar la nula de
no autocorrelacin en los errores, sin embargo a un 10 % de significancia se rechaza la hiptesis
nula. Tambin podemos calcular el p-value:
(1,738115749) = 0,9582 p = 2[1 (1,738115749)] = 0,0836
Pregunta 4: (20 puntos) Suponga que Ud. tiene que estimar el siguiente modelo:
yi = 1 x1,i + 2 x2,i + ui
0,5
10 8
0,7
0,56
=
=
X 0X =
V ()
0,4
8 10
0,56
0,7
V (y) = 25,2
Pn
x2
10 8
i=1 x1i x2i
P
X 0 X = Pn i=1 1i
=
n
2
8 10
i=1 x2i x1i
i=1 x2i
De esta forma,
"
0
B = S(X X)S
=
=
0
1
10
1
10
1
8
10
8
10
10 8
8 10
"
1
10
0
1
10
1
8
10
|B I|
0
1
8
1
10
10
2
8
(1 )2
10
8
10
= 0
= 0
= 0
(1 ) =
(1 1 ) =
(1 2 ) =
8
10
8
2
1 =
10
10
8
18
2 =
10
10
De esta forma podemos construir el coeficiente de Belsley (recordar que un nmero mayor a 25
sugiere la presencia de multicolinealidad):
s
r
18
18
10
=
= 9=3
=
2
2
10
No existe evidencia de presencia de multicolinealidad entre las variables explicativas de este
modelo.
donde E(i ) = 0
V (i ) = 2 x2i
2
x1
0
0
0 x22 0
= .
(3)
..
..
..
..
.
.
.
0
De esta forma 1 es:
1
x21
..
.
0
1
x22
0
..
.
0
x2n
..
0
0
..
.
(4)
1
x2n
Adems como nuestro modelo incluye como variable explicativa slo la constante, nuestra matriz
X es:
1
1
X= .
(5)
..
1
De esta forma:
X 0 1 X =
1 1
X 0 1 Y =
1 1
1
x21
0
..
.
0
1
x21
..
.
0
1
x22
..
..
.
0
1
x22
0
..
.
0
..
0
0
..
.
1
x2n
0
0
..
.
M CG = (X
X)
(X
Y)=
yt
t=1 x2t
PT 1
t=1 x2t
V (
M CG ) =
2 (X 0 1 X)1 = PT
1
t=1 x2t
y1
y2
..
.
yT
1
x2n
PT
1
1
..
.
T
X
1
=
t=1 x2t
(6)
T
X
yt
=
t=1 x2t
(7)
Econometra I
Profesores: Andrs Otero
Javiera Vsquez.
Otoo 2005
Pauta Examen
M CO = [xx + ]1
rt = 0 + 1 i + 2 e + Xt + t
Donde X es un conjunto de k 3 variables explicativas tales como tipo de cambio nominal,
oferta monetaria, tasa de inters externa y otros. Y es un error bien comportado.
1
110
100
90
80
Coefficient
Std. Error
t-Statistic
Prob.
29.51925
0.713659
1.942347
0.024105
15.19773
29.60658
0.0000
0.0000
70
C(1)
C(2)
60
50
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
40
1960 1965 1970
0.958449
0.957356
2.675533
272.0220
-95.09761
85.64500
12.95632
4.854881
4.939325
0.122904
75.13900
32.26962
Probability
Probability
0.000000
0.000000
-2
C(1)
C(2)
C(3)
Coefficient
Std. Error
t-Statistic
Prob.
0.571953
1.305693
-0.903238
13.59850
0.276476
0.420341
0.042060
4.722620
-2.148822
0.9667
0.0000
0.0383
-4
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
-6
1960 1965 1970 1975 1980 1985 1990
SALARIO Residuals
1995
C(4)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.914245
0.873615
0.873615
0.910629
31.51134
-51.18093
Std. Error
0.056337
85.64500
12.95632
4.787279
4.913945
0.204600
0.963059
0.961063
2.556609
241.8413
-92.74559
t-Statistic
16.22811
Coefficient
Std. Error
t-Statistic
Prob.
4.109836
0.528938
0.656965
0.077395
6.255797
6.834267
0.0000
0.0000
Prob.
0.0000
0.120615
2.561492
2.675945
2.718600
1.472987
C(5)
C(6)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
0.557983
0.546037
0.858069
27.24242
-48.34227
8.500412
1.273537
2.581655
2.666966
1.620598
Qu puede concluir sobre el modelo estimado?. Sea bastante detallado y utilice las herramientas aprendidas en clases.
Respuesta:
1. Se puede ver grficamente que tanto el salario por hora como la produccin por hora
tienen un comportamiento tendencial, estos ya es un indicio de que podemos estar en
presencia de autocorrelacin. (1 punto)
2. La estimacin del modelo: salario = 0 + 1 P rod tiene parmetros estadsticamente significativos, con un R2 alto, nos muestra que por cada unidad adicional de produccin esto
se refleja en un aumento de salario de 0.71 (1 punto), pero podemos ver que tenemos un
problema de autocorrelacin, ya que el estadstico Durbin-Watson toma un valor de 0.12
con lo cual cae en la zona de rechazo de la nula de autocorrelacin en favor de la hiptesis
alternativa de autocorrelacin positiva (3 puntos). Esto se confirma con el resultado del
test de Breusch-Godfrey, ya que tiene un p-value de 0 %, lo que nos indica rechazo de la
hiptesis nula de no autocorrelacin con 0 % de error tipo I (2 puntos); y con la inspeccin
grfica de los residuos del modelo, los que claramente tienen el comportamiento esperado
bajo autocorrelacin positiva (rachas de valores por sobre la media seguidas de rachas de
valores por debajo de la media) (2 puntos).
3. Como se menciono en un comienzo la autocorrelacin puede ser provocada por la tendencia
de las variables, sin embargo, la estimacin que incluye una tendencia como variable
explicativa muestra que a pesar de que esta es estadsticamente significativa y que los
criterios de informacin nos muestran que esta especificacin es mejor a la anterior, el
problema de autocorrelacin sigue presente (DW=0.2) (2 puntos).
4. Si la tendencia no es slo lo que causa la autocorrelacin, debe ser porque adems existe
un comportamiento dinmico omitido, el cual debera estar en el error. La estimacin de
un proceso autorregresivo de primer orden para los errores muestra que efectivamente el
error tiene un comportamiento dinmico, el coeficiente de correlacin serial es de 0,9 y
significativo (1 punto).
5. Al transformar las variables en diferencias: DSalariot = Salariot 0,9 Salariot1 y
DP rodt = P rodt 0,9 P rodt1 , y estimar el modelo con estas variables transformadas
(primer paso del mtodo de Cochrane-Orcutt), vemos que el problema de autocorrelacin
ha desaparecido (DW=1.62) (2 puntos).
Conclusin: el modelo estimado tiene un problema de autocorrelacin provocado tanto por la
existencia de una tendencia como de un comportamiento dinmico omitido (1 punto).
E(ut ) = 0
V ar(ut ) = 2 E(yt )2
Explique detalladamente cuales son las consecuencias sobre MCO cuando es aplicado a este
modelo Cmo estimara este modelo? Que estimador utilizara? De que depender la eficiencia de su estimacin?. Plantee una expresin para el estimador ptimo de y de u2 .
Respuesta:
Este modelo presenta heterocedasticidad por lo que las estimaciones por MCO son ineficientes.
El patrn que sigue la heterocedasticidad depende del valor esperado de la variable dependiente
yt , es decir, E(yt ) = Xt . Dado que es desconocido no podemos aplicar el estimador MCG. Sin
embargo, podemos aplicar MCGF y el estimador Mximo Verosimilutud (MV). La aplicacin
del primero requiere una estimacin en dos etapas, ya que es necesario obtener para aplicar el
mtodo. De esta forma se puede estimar el modelo por MCO ignorando la heterocedasticidad
y luego usar esta estimacin para normalizar las variables y aplicar MCGF. Este mtodo ser
menos eficiente que MV debido a que este ltimo estimar en conjunto todos los parmetros
involucrados. (5 puntos)
Para encontrar las expresiones de y
2 lo podan hacer por MV o MCG.
Estimador Mximo Verosmil:
La funcin de densidad (equivalente a la verosimilitud) para cada yt N (xt , 2 (xt )2 ) es:
1
f (yt ) = p
2 2 (xt )2
(y x )2
2t2 (x t)2
t
T
T
X
X
T
T
(yt xt )2
ln(2) ln 2 T ln()
ln(xt )
2
2
2 2 (xt )2
t=1
t=1
(1)
Maximizando (1) con respecto a y 2 obtenemos las condiciones de primer orden, las cuales
nos entregan el estimador MV de ambos parmetros:
l
l
2
T
T
2
t
T
1 X (yt xt )
1 X (yt xt )x
+
+
=0
x2t
x2t
2 3 t=1
2 2 t=1
T
2
T
1 X (yt xt )
=
+
=0
2
xt
2
4 2 t=1
22
De (3) tengo:
1
2
4 2
T
X
2
(yt xt )
t=1
x2t
5
T
22
(2)
(3)
2
(yt xt )
2
(xt )
(4)
T
T
2
t
1 X (yt xt )
1 X (yt xt )x
T
+
+
x2t
2 t=1
x2t 2
2 2 t=1
|
{z
}
T
2
= 0
T
T
T
1 X yt
+ +
= 0
2 2 t=1 xt
T =
T
X
yt
x
t=1 t
yt
t=1 xt
(10 puntos)
Estimador MCF:
La variables yt , xt y ut transformadas son (para lo cual previamente se debe estimar ):
yt
xt
ut
yt
yt
yt
=q
=
t
xt
2 x2t
xt
xt
1
=q
=
t
2 x2t
ut
ut
ut
=q
=
t
x
2
t
2 xt
iid
PT
=
t=1
PT
yt xt
2
t=1 (xt )
yt
1
t
t=1 x
PT 1 2
t=1
P
T
yt
1
t=1 xt
2
T
2
PT
=
PT
M CF
yt
t=1 xt
T
6
M
CF
ut )2
t=1 (
PT
2
M
CF
t=1
2
(yt xt )
(xt )2
(10 puntos)
Ejercicio 3: (15 puntos) El semestre pasado mostr empricamente que a los alumnos con
mejor rendimiento en los controles les iba mejor en el examen.
En esta oportunidad se obtuvo la siguiente regresin estimada:
Modelo 1:
Dependent Variable: EXAMEN
Method: Least Squares
Date: 07/06/05 Time: 16:46
Sample: 1 110
Included observations: 110
EXAMEN=C(1)+C(2)*CONTROLES
C(1)
C(2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Coefficient
Std. Error
t-Statistic
Prob.
1.180496
0.664234
0.625536
0.135391
1.887175
4.906056
0.0618
0.0000
0.182248
0.174676
1.023741
113.1888
-157.6550
4.211818
1.126880
2.902818
2.951918
2.024406
(5)
c) Ahora plantee un modelo que le permita testear si existen diferencias en la productividad del
estudio entre hombres y mujeres (midiendo productividad en horas de estudio). Explique
y grafique.
N.Examen = 0 +1 N.Controles+2 DummyGenero+3 Xi +4 DummyGeneroHE +
(6)
Donde HE corresponde a las horas estudiadas para rendir el examen.
Nota
+DG
0+2
0
Horas Estudiadas
Ejercicio 4: (5 puntos) Sobre la tarea realizada para el curso, responda las siguientes preguntas:
a) Seale el modelo estimado y la procedencia de los datos utilizados.
b) Principales problemas de su estimacin y como los detecto.
c) Principales conclusiones.
Respuesta:Individual
De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 5: Considere el siguiente modelo:
yt = 1 +
xt
+ ut
xt + 2
=
2
ut N (0, 2 )
con
2 = 16 y
y2 = 18
AIC
ln(
2 ) + 2
BIC
ln(
2 ) + ln(n)
k
n
De esta forma, del modelo sin restringir se tiene los siguientes valores de los criterios de informacin:
AIC
BIC
2
= 3,773
4
2
= ln(16) + ln(4) = 3,466
4
= ln(16) + 2
= 1 + 1 + ut
= 3 + ut
Como es un modelo que slo incluye una constante el estimador MCO de 3 es:
PT
yt
3 = t=1 = Y
T
El estimador de la varianza del error de este modelo es entonces:
PT
t
t=1 u
2 =
T k
PT
t=1 (yt 3 xt )
=
T k
PT
t=1 (yt Y 1)
=
T k
2
2
=
y
10
1
= 3,390
4
1
= ln(18) + ln(4) = 3,237
4
= ln(18) + 2
11
0<x<
f(xt)
f(xt)=1/
xt
Como se puede apreciar esta funcin no tiene un mximo en el rango [0, ] de xt , la solucin
al problema de maximizar la probabilidad de ocurrencia de la muestra ser una solucin esquina.
Como alpha determina el rango donde se mueve xt , el valor que me maximiza la probabilidad de ocurrencia de xt es:
M V = max{xt }
Veamos esto con ms detalle, supongamos que tenemos la siguinete muestra de x = {1, 5, 3, 4, 2, 1,5, 9},
los cuales tienen una distribucin uniforme, que pasa si tomo
= min{xt }, en este caso yo
estoy estimado que xt se puede mover entre 0 y 1, de acuerdo a esto la probabilidad de que
mi muestra venga de una distribucin uniforme con este es bastante baja, ya que claramente
observo valores mayores a 1 (Figura 1). Si eligiera
= 2 significa que xt se puede mover entre
0 y 2, este valor de tampoco maximiza la probabilidad de ocurrencia de la muestra, ya que
observo varios valores de xt mayores a dos (Figura 2). La nica forma de maximizar la probabilidad de ocurrencia de la muestra, es escoger
igual al mximo valor observado de xt , as
de acuerdo a esta densidad xt se puede mover entre 0 y el mximo, y no existe ningn valor
observado de xt que quede fuera de este rango.
12
f(xt)
f(xt)
No se
deberia
observar
No se
deberia
observar
0 1 2 3 4 5 6 7 8 9
0 1 2 3 4 5 6 7 8 9
xt
f(xt)
Es posible
observar todas
las
observaciones
0 1 2 3 4 5 6 7 8 9
13
xt
xt
Econometra
Facultad de Ciencias Econmicas y Administrativas
Universidad de Chile
Pauta Examen Final
1.
Y = X1 + X2 2 + U
donde X1 y X2 son matrices de n k1 y n k2 respectivamente, mientras que 1
y 2 son de dimensin k1 1 y k2 1, Y es de dimensin n 1, y el trmino de
error U cumple los supuestos del modelo de regresin lineal clsico.
1. Plantee el problema de mnimos cuadrados asociado al modelo.(5 puntos)
Sol: El problema de mnimos cuadrados viene dado por
mn(Y X1 1 X2 2 )0 (Y X1 1 X2 2 )
1 ,2
1 = (X10 M2 X1 )1 X10 M2 Y
2 = (X20 M1 X2 )1 X20 M1 Y
donde Mi = [I Xi (Xi0 Xi )1 Xi0 ] i = 1, 2 (15 puntos)
Sol:En clases vimos que las ecuaciones normales de este problema corresponden a
X10 X1 1 + X10 X2 2 = X10 Y
X20 X1 1 + X20 X2 2 = X20 Y
Si despejamos 1 en la primera ecuacin y lo reemplazamos en la segunda
tenemos que resulta una ecuacin en trminos de 2 , que se escribe como:
X20 X1 [(X10 X1 )1 X10 (X10 X1 )1 X10 X2 2 ] + X20 X2 2 = X20 Y
Si se resuelve para 2 encontramos la expresin que se pide
3. Demuestre que E(i ) = i con i = 1, 2 (5 puntos)
Sol: Consideremos el caso para 1 , donde lo podemos reescribir como
1 = 1 + (X10 M2 X1 )1 X10 M2 X2 2 + (X10 M2 X1 )1 X10 M2 U
Pero podemos ver que M2 X2 = 0, ademas si tomamos esperanza y dado los
supuestos del enunciado, se concluye que E(i ) = 0, i=1,2
2
4. Demuestre que
V(i ) = u2 (X10 M2 X1 )1 (5 puntos)
Sol: Es facl ver que a partir de la parte c) se puede escribir
1 1 = (X10 M2 X1 )1 X10 M2 U
Luego, para (1 1 )(1 1 )0 , tenemos
(1 1 )(1 1 )0 = (X10 M2 X1 )1 X10 M2 U U 0 M2 X1 (X10 M2 X1 )1
Tomando E() en la expresin anterior, concluimos
5. Suponga ahora que los errores se distribuyen normalmente con media cero
y varianza constante, es decir, U N (0, 2 I). Si usted estima el modelo anterior por Mxima Verosimilitud que forma deben tener 1 y 2 .
Porque? (5 puntos)
Sol:Bajo supuestos de Normalidad, independencia y que adems los errores
se distribuyen identicamente, se tiene que los estimadores de MV coinciden
con los de OLS. Este es un resultado que probamos en clases, donde se
mostr que los estimadores de MCO y de MV coinciden bajo las condiciones
sealadas anteriormente.
6. Suponga ahora que los errores se distribuyen normalmente con media cero,
pero
V(ui ) = i2
Cov(ui , uj ) = 0 i 6= j
Cambian sus conclusiones respecto a la parte e?. (5 puntos)
2.
Por lo tanto:
(M CG )(M CG )0 = (X 0 1 X)1 X 0 1 U U 0 1 X 0 (X 0 1 X)1
Aplicando esperanza:
E[(M CG )(M CG )0 ] = (X 0 1 X)1 X 0 1 E(U U 0 )1 X 0 (X 0 1 X)1
E[(M CG )(M CG )0 ] = (X 0 1 X)1 X 0 1 2 1 X 0 (X 0 1 X)1
Finalmente:
V ar(M CG ) = 2 (X 0 1 X)1
Considere ahora el siguiente modelo de slo dos variables:
Yi = + Xi + Ui
Suponga adems que la heteroscedasticidad toma la siguiente forma:
i2 = 2 Xi2
4. Encuentre E(U U 0 ). (5 puntos)
Respuesta. Como el trmino de error es heteroscedstico y libre de autocorrelacin la matriz de varianza y covarianza de ste toma la siguiente
forma:
2
1
X12
0
.
.. 0
22 0
=
.
...
0
0 ..
0 n2
0
X2 0
1
0 X22 0
0
2
E(U U ) = .
..
.
..
0
0 0
0
0
E(U U 0 ) =
..
.
2 X22
0
...
..
.
= 2
2
Xn
0
..
.
0
2 Xn2
X2
1
Entonces:
0
..
.
X22
..
0
.
...
0
0 Xn2
1/X12
Por lo tanto:
0
..
.
1/X22
0
0
..
.
0
..
.
0
1/Xn2
1/X12
0
P P =
0
..
.
1/X22
0
0
..
.
0
..
.
0
1/Xn2
1/X1
0
..
0
1/X2 0
.
P =
..
..
.
.
0
0
0 1/Xn
4 1
6 3
12 15
P5
x y
= P5i=1
2
i=1 (x )
donde la variable en minsculas denota que se encuentra en desviacin respecto de su media. Finalmente:
1, 22
y:
Y X = 1, 65
3.
3.1.
Considere el modelo:
yi = 0 + 1 xi + ui
(1)
donde ui N (0, u2 ). Se sabe que la variable xi est medida con error, de modo
que slo se observa
xi = xi + vi
8
Respuesta:
y i = 0 + 1 x i + ui
= 0 + 1 (xi vi ) + ui
= 0 + 1 x i 1 v i + ui
= 0 + 1 xi + (ui 1 vi )
| {z }
i
yi = 0 + 1 xi + i .
(b) (5 puntos) Muestre que en el modelo en (a) el error est correlacionado con
la variable observable xi . Explique las implicancias de este problema.
Respuesta:
Cov(i , xi ) = Cov(ui 1 vi ,
x i + vi )
los parmetros .
Respuesta: Una forma de correccin es la utilizacin de variables instrumentales. La idea es utilizar un instrumento en vez de la variable medida
con error. Para ello, se requiere que el instrumento no est correlacionado
con el trmino de error y que el instrumento s est correlacionado con la
variable explicativa para la cual acta como instrumento (la variable medida
con error).
(d) (7 puntos) En el modelo en la equacin (1) considere ahora que slo la variable
dependiene yi est medida con error i N (0, 2 ), el que es independiente
de xi y de ui . Cules son las implicancias de este problema de medicin?
Explique y justifique algebraicamente.
Respuesta: Si slo la variable dependiente est medida con error, se tiene que
slo se observa:
yi = yi + i .
De este modo, el modelo observable es
yi = 0 + 1 xi + ui
yi + i = 0 + 1 xi + ui
yi = 0 + 1 xi + ui i
yi = 0 + 1 xi + (ui i )
| {z }
i
yi = 0 + 1 xi + i .
10
xi )
= Cov(ui , xi ) + Cov(i , xi )
Cov(i , xi ) = 0.
Por lo tanto, no habr problema de sesgo en la estimacin de los parmetros.
3.2.
ybi )2
n0
i (yi
RM SE =
i
|yi ybi |
n0
yt = 0 + 1 x1t + ut
(2)
yt = 0 + 1 x1t + 2 x2t + ut ,
12
emabargo, si el objetivo fundamental es predecir slo en el subperodo ta hasta T , el modelo (1) es ms adecuado porque para ese subperodo presenta un
error medio ms bajo.
13
Universidad de Chile
Facultad de Economia y Negocios
PAUTA EXAMEN
Econometra I
Otoo 2006
iid
i (0, 2 )
V (zi ) + V (i )
V (zi ) + 2
yi + i donde i (0, 2 )
yi i
=
=
donde i cumple con los supuesto tradicionales bajo los cuales MCO es insesgado.
Ahora si xi esta medida con error, de forma tal que observamos xi , tal que:
xi
xi
=
=
xi + i donde i (0, 2 )
xi i
=
=
0 + 1 (xi i ) + ui
0 + 1 xi + (ui 1 i )
{z
}
|
i
= Cov(ui 1 i , xi + i )
= Cov(ui , xi ) 1 Cov(i , xi ) + Cov(ui , i ) Cov(i , i )
= 0 1 0 + 0 1 2
= 1 2
| {z }
6=0
+ (X 0 X)1 X 0 u
+ (X 0 X)1 X 0 E[u]
E())
0]
E[( E())(
E[(X 0 X)1 X 0 uu0 X(X 0 X)1 ]
2 (X 0 X)1 X 0 X(X 0 X)1
donde i (0, 2 )
z
i xi
2
i xi
1 = 1 + P 2 + P 2
x
x
P i
P i
z
x
E[
2
i i
i ]xi
E[1 ] = 1 + P 2 + P 2
x
xi
P i
z
x
2
i i
E[1 ] = 1 + P 2
xi
| {z }
6=0
e) Tanto el error de media en una variable dependiente, como si hay una variable omitida
relevante pueden corregirse usando la metodologa de variables instrumentales. Es
ms, este ltimo estimador es insesgado.
RESPUESTA:
Mitad falso mitad verdadero. El error de medida en la variable dependiente no produce sesgo. Por lo tanto no hay para que usar variables instrumentales (IV).
Demostracin en b).
En el caso de variable omitida relevante si hay sesgo y se puede corregir usando IV.
Demostracin: Supongamos el siguiente modelo de regresin simple:
yi = xi + ui
Donde existe una variable hiomitida,
la cual est correlacionada con xi . Es decir
= + E
zh
z
P i i +E P i i
zi xi
zi xi
2 = 3
ii
i0 D
n nu
X 0X =
=
D0 i D0 D
nu nu
0
" PY #
iY
P i
X 0Y =
=
Yi
D0 Y
D=1
donde n es el tamao muestral, nu es la cantidad de individuos con educacin universitaria en la muestra, adems definamos nm como
Pla cantidad de individuos con educacin
media, de forma tal que n = nu +nm . Adems
Yi es la suma de la variable dependiente
D=1
slo para los individuos con la dummy igual a uno, es decir, los con educacin universitaria.
Ahora calculemos la inversa de la matriz (X 0 X):
0
(X X)
1
=
n nu nu nu
nu
nu
nu
n
1
nm
n1m
n1m
n
nu nm )
(X 0 X)1 X 0 Y =
D=1
nm
P
Yi
Yi
D=0
nm
nm
P
Yi
D=1
nm
Yi
D=0
nm
Yi
D=1
nm
Yi
D=0
nm
Yi
D=0
nm
Ym
YuYm
Yi
Yi
D=1
Yi
nm
nm
Yi
D=1
nu nm
Yi
D=1
n
nu
Yi
nm
P
nu nm
D=0
Yi
D=1
Yi
nm
P
Yi
Yi
D=1
Yi
nu nm
D=0
D=0
nm
D=0
nm
nm
P
Yi
Yi +
D=1
" PY #
P i
Yi =
Yi
D=0
n1m
n
nu nm
D=0
1
nm
n1m
nm
nu
D=1
nu
4. (13 puntos) Sea hijos el nmero de hijos de una mujer y educ los aos de escolaridad de
ella. Un modelo simple que regresiona fertilidad y educacin es:
hijos = 0 + 1 educ + u
en el que u es el error observado.
a) Qu factores contiene u? Es probable que se correlacione con educacin? Que
efectos tendra esto sobre la estimacin de 1 ? Demuestre matemticamente su respuesta.
RESPUESTA:
u contiene todos los factores que tambin determinan la eleccin del nmero de
hijos que tiene una mujer y un trmino de error aleatorio.
6
Si alguno de los factores que contiene u est correlacionado con educ entonces
estimar por MCO entregar estimadores de 1 sesgados. Por ejemplo, el nivel
de ingresos de una mujer tambin afecta en su decisin de si tener hijos o no,
y est altamente correlacionada con educacin. Tambin el estado civil de la
mujer, a mayor educacin de la mujer mayor es la probabilidad de disolucin
matrimonial.
Demostracin.
Sea F es el set de variables omitidas correlacionadas con educacin (E (educ.F ) 6= 0).
1 0
= X0 X
Xy
0
1 0
1 0
E () = X0 X
X (X + u) = + X0 X
X (F + )
0 1 0
0 1 0
= + X X
X F + X X
X
1
= + (X 0 X) X 0 F
{z
}
|
6=0
(0,010)
(0,00021)
(0,003)
n=722, R2 =0,169
Interprete el coeficiente del trmino de interaccin. (Ayuda: elegir dos valores especficos de educpm y comparar efecto de educ)
RESPUESTA:
Un ao adicional de educacin implica 0, 047 + 0, 00078 educpm % ms de salarios.
Es decir una persona cuyos padres tienen 18 aos de educacin tiene un retorno a la
educacin total de 0, 047 + 0, 00078 18.
Una persona cuyos padres tiene en promedio 17 aos de educacin tienen un retorno
a la educacin de 0, 047 + 0, 00078 17.
La diferencia es de 0, 00078.
Es decir, un ao adicional en la educacin de los padres reporta 0,00078 ms de
log(sal), esto es 0, 078 % ms de salario.
c) Cuando educpm se agrega como una variable adicional en la ecuacin, obtenemos:
log(sal) =
4, 94 + 0, 97 educ + 0, 033educpm
(0,38)
(0,027)
(0,017)
(0,004)
+0, 010antig + u
(0,003)
n=722, R2 =0,174
El salario depende ahora de manera positiva de la educacin de los padres? Pruebe
la hiptesis nula de que el salario no depende de la instruccin de los padres.
RESPUESTA:
Si, ahora el salario depende en forma positiva e independiente de la educacin de los
padres.
log(sal)
= 0, 033 + 0, 0016 educ
educpm
Probando la hiptesis nula de que el salario no depende de la instruccin de los
padres.
Primero, en esta estimacin ambas variables relacionadas con la educacion de los
padres son no significativas en forma independiente. Los valores de los test t respectivos son:
t = 0, 033/0, 017 = 1, 94
t = 0, 0016/0, 0012 = 1, 33
Ambos son menores a 1,96 que es el valor del test t al 95 % de confianza con muchas
observaciones. Sin embargo, antes cuando estaba solamente la variable interactiva
esta era significativa al 95 %, 0,00078/0,00021=3,71.
Por lo tanto, la educacin de los padres en forma independiente no es significativa,
pero en forma interactiva si lo es. El efecto de la educacin de los padres es a travs
de que afectan la educacin de los hijos. Pero no tienen un efecto directo en que
los hijos tengan mayores salarios. Esta ltima hiptesis sera verdad si, por ejemplo,
padres ms educados tienen ms networks (pitutos) para que sus hijos tengan mejores
trabajos y por lo tanto mejores salarios.
8
(b
u0 u
b u
b0 u
b) /k2
F(k2 ,nk)
0
u
bu
b/ (n k)
donde u
b denotan los residuos MCO restringidos (donde k2 representa el nmero de
regresores del modelo restringido o sin las dos variables asociadas a la educacin de
los padres), mientras que u
b representan los residuos del modelo MCO original.
Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Examen
1.
La empresa Gini est evaluando implementar una nueva estructura de remuneraciones, para lo cual es fundamental entender primero cmo se determinan en la
actualidad los salarios de sus trabajadores. Es por ello que han decidido contratarlo
a usted, flamante ex-alumno del curso de econometra 1 para que les ayude en el
anlisis economtrico de su problema. Con el objetivo de abordar adecuadamente el
problema planteado, usted propone estimar la siguiente ecuacin:
wi = 0 + 1 Si + 2 Xi + i
donde wi representa el logaritmo del salario que percibe el trabajador i, Si corresponde a los aos de escolaridad del trabajador, Xi son los aos que lleva el trabajador en la empresa Gini (antiguedad), y finalmente, i corresponde a un trmino
de error con media cero y varianza 2 .
1. Analice si en este modelo se est omitiendo alguna variable relevante. Adems,
establezca cules seran las consecuencias sobre la estimacin de los parmetros
(por MCO) de dicha omisin. (8 puntos)
Respuesta. El modelo planteado omite claramente algunas variables que son
relevantes, como por ejemplo, la habilidad, la antiguedad al cuadrado (para
ver perfil creciente o decreciente de la experiencia), y variables que reflejen
caractersticas cualitativas como gnero.
Por lo tanto, la estimacin por MCO ser sesgada; la direccin de este sesgo
depender de la correlacin de la posible variable omitida con las variables
explicativas y con la variable dependiente del modelo.
2. Explique al menos dos procedimientos que usted utilizara para detectar la
presencia de heteroscedasticidad en los residuos. En caso de haberla, cules
1
2.
donde var(ui ) = i 2 , y 1 =1; 2 =2; 3 =3; 4 =4. Por otro lado, se tiene lo
siguiente: Yi =(3,6,9,12), y Xi =(1,2,4,5). Estime los parmetros 0 y 0 por el
mtodo de mnimos cuadrados ordinarios.
Respuesta.
bM CG = (X 0 1 X)1 X 0 1 Y
1 1
1 2
X =
1 4
1 5
3
6
Y =
9
12
= V ar() = E(0 )
1 0 0 0
0 2 0 0
= 2
0 0 3 0
0 0 0 4
1 0 0 0
0 2 0 0
= 2
0 0 3 0
0 0 0 4
1 0 0 0
1
1
0 2 01 0
1 =
2
0 0 3 0
0 0 0 14
Por lo tanto, sustituyendo con lo anterior, se pueden obtener los de mnimos
cuadrados generalizados:
1, 066
b
M CG =
2, 133
2. (25 puntos) Las ventas de gasolina en una determinada zona geogrfica se
modelaron a travs de la siguiente especificacin:
= 70 0, 01P + 0, 2Y 1, 5S1 + 3, 6S2 + 4, 7S3
Q
donde Q representan las ventas, P es el precio, Y corresponde al ingreso
disponible, y Si son variables dummies trimestrales (i=1,2,3,4). Los valores
esperados para Y y P para el prximo ao vienen dados por:
Trimestre
P
Y
1
110
100
2
116
102
3
122
104
4
114
103
a) Calcule las ventas esperadas para para cada trimestre del prximo ao.
(7 puntos)
Respuesta. Las ventas esperadas para cada trimestre del prximo ao
vienen dadas por:
1 = 70 0, 01P1 + 0, 2Y1 1, 5 = 87, 4
Q
2 = 70 0, 01P2 + 0, 2Y2 + 3, 6 = 92, 84
Q
3 = 70 0, 01P3 + 0, 2Y3 + 4, 7 = 94, 28
Q
4 = 70 0, 01P4 + 0, 2Y4 = 89, 46
Q
b) Otro investigador propone utilizar los mismos datos para estimar una
ecuacin igual que la anterior, pero desea utilizar las variables dummies
S2 , S3 y S4 . Encuentre los coeficientes asociados a esta especificacin. (9
puntos)
Respuesta. Este investigador propone el siguiente modelo:
Q = 1 + 2 S2 + 3 S3 + 4 S4 + P + Y
Adems, se sabe que la siguiente identidad se cumple para estos datos:
S4 = 1 S1 S 2 S3
Luego, reemplazando en la ecuacin anterior:
Q = 1 + 2 S2 + 3 S3 + 4 (1 S1 S2 S3 ) + P + Y
Reagrupando trminos:
Q = (1 + 4 ) 4 S1 + (2 4 )S2 + (3 4 )S3 + P + Y
que corresponde a la regresin original. Por lo tanto, haciendo uso de la
estimacin original, se tiene que:
1 + 4 = 70
4 = 1, 5
2 4 = 3, 6
3 4 = 4, 7
= 0, 01
= 0, 2
As, los coeficientes estimados por este investigador sern: 1 = 68,5; 2
= 5,1; 3 = 6,2; 4 = 1,5; = -0,01 y = 0,2.
3.
LOGSALARY
8.0
7.5
7.0
6.5
0
LOGPROFIT
10
12
Prob.
0.0000
0.0000
7.269.493
Adjusted R-squared
0.360037
0.408740
S.E. of regression
0.326982
0.622791
1.005.023
Schwarz criterion
0.676215
Log likelihood
-2.789.396
F-statistic
5.444.617
Durbin-Watson stat
2.233.248
Prob(F-statistic)
0.000000
1. Note que se han dejado fuera cuatro observaciones para llevar a cabo la estimacin, por qu? (8 puntos)
Respuesta. Se dejaron fuera pues las utilidades de esas cuatro empresas eran
negativas (prdidas), por lo tanto, la funcin logaritmo se indefine.
2. Son estadsticamente significativos los coeficientes estimados? Tiene el signo esperado? (8 puntos)
Respuesta. Son estadsticamente significativos, lo cual se desprende del pvaue (menor a 0,05), o bien, del cuociente entre el valor estimado del coeficiente y la desviacin estndar del mismo (cuyo valor es mayor que 1,97).
3. Segn los resultados del test de Ramsey RESET, habra un problema de especificacin del modelo? (8 puntos)
0.350930
0.341979
Coefficient
Std. Error
t-Statistic
Prob.
-5.981.640
1.315.475
-0.454713
0.6504
LOGPROFIT
-0.582640
0.794813
-0.733053
0.4654
FITTED^2
0.312867
0.333725
0.937499
0.3509
Probability
Probability
0.556754
0.548410
Coefficient
Std. Error
t-Statistic
Prob.
-0.032151
0.140858
-0.228249
0.8200
LOGPROFIT
0.048798
0.046586
1.047.494
0.2976
LOGPROFIT^2
-0.004059
0.003746
-1.083.502
0.2814
R-squared
0.012515
Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puede
rechazar la hiptesis nula de que los residuos del modelo son homoscedsticos.
5. Segn los resultados del test de Breusch-Godfrey sobre correlacin serial, ex7
0.471043
0.458798
t-Statistic
Prob.
-0.005453
0.129438
-0.042130
0.9665
LOGPROFIT
0.001021
0.022068
0.046281
0.9632
RESOLS(-1)
-0.119031
0.104460
-1.139.490
0.2575
RESOLS(-2)
0.035061
0.105207
0.333255
0.7397
R-squared
0.016232
Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puede
rechazar la hiptesis nula de que los residuos no estn autocorrelacionados.
ECONOMETRIA I
PROFESORA: JAVIERA VASQUEZ
Pauta Examen
que MCO cumple con las caractersticas deseable cuando el modelo lineal, supuesto
que no se cumple en los modelos de probabilidad, no incluir la no linealidad es
equivalente a omitir una variable relevante generando sesgo en la estimacin.
I.4 Si en la estimacin de un modelo de regresin de la forma Yt=Xt+ut el
estadstico de Durban-Watson nos indica presencia de autocorrelacin, bastar con
incluir la variable dependiente rezada un periodo como regresor para solucionar
definitivamente el problema. Comente.
Respuesta:
Falso, la autocorrelacin puede ser provocada por dos cosas: si la variable
dependiente tiene una tendencia y esta no esta siendo capturada por las variables
explicativas y por un patrn dinmico omitido. En el primer caso incluir la variable Yt1 como regresor no soluciona el problema, en el segundo caso puede que al incluir un
rezago de la variable dependiente se solucione el problema de autocorrelacin si es
que esta es de orden 1, pero si la autocorrelacin es de un orden superior habr que
incluir ms rezagos de la variable dependiente como regresor.
I.5 Indique cuales son los problemas en la estimacin MCO que generan problema de
slo problemas de sesgo e inconsistencia, y cuales generan slo problemas de
eficiencia.
Respuesta:
Problemas de sesgo/inconsistecia:
Problemas de eficiencia:
Considere el
explicativas:
Yi = 0 + 1 X 1 + 2 X 2 + 3 X 3 + ui
Pero Ud. esta interesado en estimar
(=1+2).
(i)
(ii)
Respuesta:
(i)
E[] =
E[ 1 + 2 ] = 1 + 2
Para lo cual hay que demostrar que los estimadores de 1 y 2 son insesgados.
El modelo anterior se puede escribir como Y=X+u, donde es un vector que
contiene los cuatro parmetros del modelo, y X una matriz que contiene las tres
variables explicativas del modelo ms una columna de unos que representa la
constante. El estimador MCO del modelo es:
= ( X ' X ) 1 X 'Y
Reemplazando Y por la especificacin poblacional del modelo, se tiene:
= ( X ' X ) 1 X ' ( X + u )
= ( X ' X ) 1 X ' X + ( X ' X ) 1 X ' u
= + ( X ' X ) 1 X ' u
Tomando valor esperado a la expresin anterior, y bajo los supuestos clsicos del
modelo MCO, que el error es bien comportado, se obtiene que el estimador es
insesgado.
E[ ] = + ( X ' X ) 1 X ' {
E[u ]
0
E[ ] =
3
Por lo tanto,
E[ 1 ] = 1
E[ 2 ] = 2
E[ 1 + 2 ] = 1 + 2
E[] =
(ii)
V () = E[ E ()]2
Como acabamos de demostrar que el estimador es insesgado:
V () = E[ ]2
Ahora reemplazando en funcin de los coeficientes s:
V () = E[ 1 + 2 ( 1 + 2 )]2
Reorganizando trminos, elevando al cuadrado y aplicando valor esperado:
V () = E[ 1 + 2 ( 1 + 2 )]2
V () = E[( 1 1 ) + ( 2 2 )]2
V () = E[( 1 1 ) 2 + 2( 1 1 ) ( 2 2 ) + ( 2 2 ) 2 ]
V () = E[( 1 1 ) 2 ] + 2 E[( 1 1 ) ( 2 2 )] + E ( 2 2 ) 2 ]
V () = V ( 1 ) + 2 cov(1 , 2 ) + V ( 2 )
III. Ejercicio matemtico (20 puntos)
Pr(Y = 1) = p
f (Y ) = Pr(Y = 2) = q
Pr(Y = 3) = 1 p q
(i)
Respuesta:
Sea n1 el nmero de observaciones donde Y=1, n2 el nmero de observaciones
donde Y=2, y por lo tanto n-n1-n2 el nmero de observaciones donde Y=3. Entonces
la distribucin de probabilidad conjunta de las n observaciones se puede escribir de
la siguiente forma:
n
Respuesta:
Aplicando logaritmo natural a la expresin encontrada en la parte (i) obtenemos la
log-likelihood a optimizar con respecto a p y q:
l n1 n n1 n2
=
p p (1 p q )
l n2 n n1 n2
=
p q (1 p q )
Haciendo ambas ecuaciones iguales a cero (condiciones de primer orden) y
resolviendo se obtienen los estimadores MV de p y q:
n1 n n1 n2
=0
p (1 p q )
n2 n n1 n2
( 2)
=0
q (1 p q )
(1)
De (1):
n1 (1 p q) p(n n1 n2 ) = 0
n1 n1 p n1q np + n1 p + n2 p = 0
n1 n1q np + n2 p = 0 (3)
Adicionalmente restando (2) de (1):
n1 n2
=0
p q
n
q = 2 p ( 4)
n1
Reemplazando (4) en (3):
n1 n1
n2
p np + n2 p = 0
n1
n1 np = 0
p MV =
n1
n
q MV =
n2
n
Pi = 0 + 1Ti + X i + ui
Donde 1 mide el efecto causal del profesor 1 sobre el promedio de los alumnos (P),
adems se deben incluir otras variables explicativas que permita limpiar por
cualquier cosa que haya afectado la aleatoriedad completa del experimento. La
comparacin de la estimacin del efecto causal sin otros regresores y con otros
regresores ayuda a ver si existieron estas amenazas en el diseo experimental.
Potenciales amenazas a la validez interna de los resultados:
-
Que los alumnos no sean asignados 100% en forma aleatoria sino por
rendimiento
7
Number of obs
F( 7,
420)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
428
11.78
0.0000
.66669
-----------------------------------------------------------------------------lwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.0998844
.0150975
.0702084
.1295604
exper |
.0407097
.0133723
.0144249
.0669946
expersq | -.0007473
.0004018
-1.86
0.064
-.0015371
.0000424
nwifeinc |
.0056942
.0033195
1.72
0.087
-.0008307
.0122192
age | -.0035204
.0054145
-0.65
0.516
-.0141633
.0071225
kidslt6 | -.0558725
.0886034
-0.63
0.529
-.2300339
.1182889
kidsge6 | -.0176484
.027891
-0.63
0.527
-.0724718
.0371749
_cons | -.3579972
.3182963
-1.12
0.261
-.9836494
.2676551
------------------------------------------------------------------------------
SSM 36.6476796
=
= 0.16409842
SST
223.327441
SSR /(n k )
0.44447562/420
R 2 = 1
= 1
= 0.15016672
SST /(n 1)
0.52301508/427
0.0998844
t educ =
= 6.6159563
0.0150975
0.0407097
t expr =
= 3.0443304
0.0133723
R2 =
(ii)
Con respecto a la bondad de ajuste del modelo, tanto el R-cuadrado como el Rcuadrado ajustado indican que las variables explicativas del modelo explican slo
un 15% del comportamiento de la variable dependiente, lo que es relativamente
bajo pero no despreciable.
(iii)
Number of obs
Censored obs
Uncensored obs
=
=
=
753
325
428
Wald chi2(7)
Prob > chi2
=
=
75.37
0.0000
-----------------------------------------------------------------------------|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lwage
|
educ |
.1066795
.0208209
5.12
0.000
.0658713
.1474876
exper |
.0406657
.0132436
3.07
0.002
.0147088
.0666226
expersq | -.0007457
.0003979
-1.87
0.061
-.0015255
.0000341
nwifeinc |
.0047293
.0038863
1.22
0.224
-.0028877
.0123463
age | -.0049886
.0062221
-0.80
0.423
-.0171837
.0072064
kidslt6 | -.0974594
.1250796
-0.78
0.436
-.3426109
.1476921
kidsge6 | -.0191121
.0278513
-0.69
0.493
-.0736996
.0354754
_cons |
-.40472
.3311825
-1.22
0.222
-1.053826
.2443857
-------------+---------------------------------------------------------------select
|
educ |
.1568112
.0240434
6.52
0.000
.109687
.2039355
nwifeinc | -.0209167
.0045791
-4.57
0.000
-.0298915
-.0119418
age |
-.034533
.007576
-4.56
0.000
-.0493817
-.0196843
kidslt6 | -.8921331
.1144159
-7.80
0.000
-1.116384
-.6678821
kidsge6 | -.0385341
.0404704
-0.95
0.341
-.1178545
.0407864
_cons |
.4155959
.4726033
0.88
0.379
-.5106895
1.341881
-------------+---------------------------------------------------------------/athrho |
.121872
.2608112
0.47
0.640
-.3893085
.6330525
/lnsigma | -.4109284
.0383022
-10.73
0.000
-.4859993
-.3358574
-------------+---------------------------------------------------------------rho |
.1212722
.2569754
-.3707639
.5601505
sigma |
.6630344
.0253957
.6150822
.714725
lambda |
.0804076
.1717962
-.2563066
.4171219
-----------------------------------------------------------------------------LR test of indep. eqns. (rho = 0):
chi2(1) =
0.17
Prob > chi2 = 0.6777
------------------------------------------------------------------------------
E[Yi | X i , Z i , S = 1] = X i + ( Z i )
Donde S es la variable indicador de seleccin, cuya probabilidad de que sea igual
a uno es estimada utilizando las variables Z, y son los coeficientes de esta
estimacin. La variable () es el IMR que corrige el problema de truncamiento
pero no basado en un umbral fijo, sino con las variables que determinan la
probabilidad de seleccin. El no incorporar la variable lambda o inverso de mill
equivale a omitir una variable relevante por lo que los parmetros sern
sesgados en la medida que exista una correlacin importante entre la variable
omitida y las variables incluidas en la estimacin y en la medida que la variable
omitida sea realmente relevante (o sea significativa).
En la tabla anterior veamos que la educacin, ingreso familiar, edad y nmero de
hijos menores de 6 aos son importantes para explicar la probabilidad de que la
mujer trabaje o no.
(vi)
11
1.
a) La presencia de error de medida produce que el estimador MCO sea sesgago e inconsistente.
R. Incierto: si el error de medida es en la variable dependiente, este solo producira errores est
andar
mas elevados, pero el estimador MCO seguira siendo insesgado y consistente. Por otra parte, si el
error de medida es en las variables independientes, efectivamente, el estimador MCO sera sesgado e
inconsistente.
b) La multicolinealidad implica que necesariamente aumente la probabilidad de cometer error de tipo II.
R. Verdadero. Si existe multicolinealidad (no exacta, si la multicolinealidad es exacta el estimador
MCO no existe) los errores est
andar seran muy elevados, con lo cual, los estadsticos seran peque
nos
(por ejemplo el estadstico t o F) y tenderemos a no rechazar la hipotesis nula, aun cuando esta sea
falsa. Por definicion, el error tipo II es el que se comete cuando uno no rechaza la hipotesis nula cuando
ella es falsa, luego estaremos mas expuestos a este tipo de error.
c) Dado que el estimador de MCG es MELI, siempre deberamos usar este metodo en lugar de MCO.
R. Incierto. Si bien es cierto que el estimador MCG es MELI ante perturbaciones no esfericas, no es
menos cierto que el estimador MCO tambien es MELI si se cumplen los supuestos del Teorema de
Gauss-Markov. En el caso de perturbaciones no esfericas, la matriz es generalmente desconocida,
luego es posible estimar usando MCF en lugar de MCG. En consencuencia, el comente solo es verdedaro
en el caso que es conocida y es diferente a la matriz de identidad. En todos los dem
as casos es falso.
d) La estimaci
on por el metodo de variables instrumentales es muy u
til para los casos en que el residuo
est
a correlacionado con las variables independientes.
R. Vedadero. El metodo sirve para esos casos, puesto que se viola el supuesto de que las variables
independientes y el residuo no esten correlacionadas. Un ejemplo que vimos en clases es cuando hay error
de medida en las variables dependientes. Esto bajo el supuesto de que tenemos buenos instrumentos,
que esten correlacionados con la variables independientes y no correlacionados con el residuo.
1
e) El metodo de Cochrane-Orcutt sirve para obtener un estimador eficiente cuando estamos en presencia
de autocorrelaci
on.
R. Incierto. Es verdadero si la Autocorrelaci
on es de primer orden, es decir, el proceso del error sigue
un proceso AR(1). Es falso o incierto si la autocorrelaci
on es de mayor orden.
f) El criterio de informaci
on bayesiano (BIC) es mayor al criterio de Akaike (AIC) cuando n > 3.
R. Verdadero. De acuerdo a las f
ormulas que vimos en clases, la u
nica diferencia entre el criterio BIC
y AIC es la manera en que penalizan la saturacion del modelo (la perdida de grados de libertad).
Mientras el criterio AIC suma k/n el criterio BIC suma ln(n) k/n. Luego, si n > 3, tenemos que
BIC AIC = ln(n) 1 > 0.
2.
Evalue la matriz X X. Que puede decir acerca de la relacion entre x1 y x2 ? Como cambia su respuesta
en a)? (5 puntos)
4 0
X X = 0 6
0 0
0
0
8
Esto implica que las variables son ortogonales entre ellas, luego el producto punto entre x1 y x2 es cero
y tambien lo es su covarianza. La respuesta en a) cambia puesto que omitir x2 no produce problemas
en la estimaci
on de 1
d) Obtenga el estimador MCO de 0 , 1 y 2 (10 puntos)
R. La estimaci
on MCO entrega los siguientes valores:
0
0
= 1 = 7/6
2
1/4
e) Calcule los errores est
andar y el R2 , Que puede decir acerca de la calidad de los datos? (10 puntos)
R. Los errores est
andar son los siguientes:
SE(0 )
0,577
= SE(1 ) = 0,471
SE()
0,408
SE(2 )
3.
Problemas de An
alisis
a) Especifique la funci
on lineal de consumo Keynesiana. Muestre que el supuesto de que la PMEC decrece
con el ingreso implica que el itercepto es positivo. (5 puntos)
R. La funci
on de consumo Keynesiana se puede escribir como una relacion lineal entre el consumo y
el ingreso disponible.
Ct = 0 + 1 Yt
Se puede ver que
P M EC =
Ct
0
=
+ 1
Yt
Yt
Luego para que P M EC sea decreciente a medida que aumenta Yt , 0 tiene que ser positivo. Si este es
igual a 0, la PMEC es constante. Si este fuera negativo, la P M EC sera creciente.
b) Usando datos per c
apita anuales, la estimaci
on de la funci
on de consumo para Estados Unidos fue la
siguiente para el perodo 1929-1938:
Ct
It
Gt
+
+
Yt
Yt
Yt
plim1
donde SY2 = plim n1
tenemos que,
Pn
i=1
1
1+
2
SY
plim0
= C 1 Y
= C + v 1 Y 1 w
= 0 + 1 Y 1 Y 1 w + v
= 0 + (1 1 )Y 1 w + v
= 0 + (1 plim1 )Y
2
= 0 + 1 2 w 2 Y
w + SY
a) Para investigar acerca este resultado Ud. junta datos de estudiantes universitarios y sus padres y estima
la siguiente relaci
on:
Ae
donde Ae es la altura del estudiante medida en centimetros y Ap es la altura del padre del estudiante.
Los valores entre parentesis son los errores est
andar corregidos por heterocedasticidad. Haga un grafico
con esta lnea de regresion junto con una lnea de 45 grados y explique por que el resultado encontrado
arriba sugiere regresi
on a la media. (10 puntos)
R. Graficando la recta tenemos que
El resultado sugiere regresion a la media puesto que los hijos de padres bajos seran mas altos que sus
padres y los hijos de padres altos seran mas bajos que sus padres. Si esto sucede de generaci
on en
generaci
on, tenemos que la altura de las personas converger
a a un valor medio.
b) Investigando la literatura medica Ud. encuentra que la altura depende, en una proporcion importantsima, de un gen llamado phog y de factores ambientales. Suponga la altura del hijo(a) est
a determinada
por el padre y que padre e hijo(a) tienen exactamente el mismo gen el cual no cambia en el tiempo y
que la altura es medida con error de la siguiente manera:
Xi,h = f (Xi ) + vi,h , y Xi,p = f (Xi ) + ui,p
donde Xi,h es la medida de la altura del hijo h que tiene un gen Xi y los factores ambientales est
an
dades por vi,h para el hijo y ui,p para el padre. La estatura medida del padre est
a dada por Xi,p .
Considere que los factores ambientales son independientes el uno del otro y ademas son independientes
del gen. Combinando las dos ecuaciones, encuentre una funci
on de regresion poblacional y discuta su
relacion con la falacia de Galton. (10 puntos)
6
90 %
3.078
1.886
1.638
1.533
1.476
1.44
1.415
95 %
6.314
2.92
2.353
2.132
2.015
1.943
1.895
97.50 %
12.71
4.303
3.182
2.776
2.571
2.447
2.365
99 %
31.82
6.965
4.541
3.747
3.365
3.143
2.998
99.50 %
63.66
9.925
5.841
4.604
4.032
3.707
3.499
AYUDANTAS
Ayudanta de Econometra
17 de Junio 2004
Heterocedasticidad y Autocorrelacin
Profesores: Javiera Vasquez y Andres Otero
1. Considere el siguiente modelo:
Yi = +
1
Y = 3
5
0
1 0
= 0.5 0
0.2
2
R 2 = 0 .5
R 2 = 0 .6
e t = b0 + b1 xt + b2 et 1 + b3 et 2 + vt
e t = b0 + b1et 1 + wt
R 2 = 0 .9
R 2 = 0 .4
Y = 2.75
1
0
1
2
X = 2 dnde el modelo a estimar es yi = xi + u i
5
1
con i = 1,2, K 5 .
3.1) Si u i ~ N (0, i 2 )
3.2) Si con la informacin del apartado 3.1) Usted obtuvo los siguientes
resultados MCO = 0.5 , MCG = 1.22 , Var( MCG ) = 0.3 y
j
1 L + 1 e e [x ' x
2
j =1
3.2.1) Evale si
t = j +1
t t j
t j
+ xt j ' xt = 0.5
4. Considere el modelo:
yt = + t
t = u t - u t -1
u ~ N(0,5)
4
Si y = 5 , obtenga el estimador de
3
5. Considere el siguiente MRL donde se cumplen todos los supuestos de MCO.
Yi = X i + u i
4
1
3
2
donde Y =
y X =
6
3
1
0
Sin embargo, se presume que puede existir heterocedasticidad.
a) Cul es el usual estimador de la varianza de en una estimacin de MCO?
b) Cul es la matriz de varianza y covarianzas de White?
c) Realice un test de White para probar la existencia de heterocedasticidad.
Prob.
C
RDOW JONES
0.1167
0.0000
150
0.0028 0.015
0.7679 0.0012
ei2 xi ' xi =
( X ' X ) 1 =
5.6914
0.0004
i =1
0.8718 0.0007
j 150
et et j xt x't j + xt j x't =
0.0003
L + 1 t = j +1
j =1
150
150
et et 1
1
150
2
t 1
= 0.25
2
t
148
= 0.052
Resolucion Problema 5 y 6
Ayudanta Econometra 17 de Junio
Profesores Javiera Vasquez y Andres Otero
Preparado por Javier Fernandez
Problema 5:
A) El estimador de la varianza de es
2 (X 0 X)1 , para lo cual necesitamos
y luego con este, los e (para estimar
obtener el ,
2 ), por lo tanto:
28
= (X 0 X)1 X 0 Y =
= 2,
14
Con lo que
Y =
2
4
6
0
,e
=
2
1
0
1
4+1+0+1
e0 e
2
=
= 2,
,
=
nk
41
2
1
Vd
ar(mco ) =
=
14
7
Y Y =
2,5
0,5
1,5
0,5
,Z Z =
2,5
0,5
5,5
3,5
13
, =
49
13
49
i2
49
= 0,3832
Y =
4
3
6
1
6
, X =
1
2
3
0
3
46
, =
= 2, e =
23
2
1
0
1
0
e =
1
0
1
0
y Z =
1
2
2
1 3 1
1
0
0
1
3 1
0,018
0,345
y R2 =
0 Z 0 M0 Z
= 0,67
Y 0 M0 Y
Problema 6:
A) La autocorrelacion de orden 1 puede ser testeada con el test de Durbin
Watson,1 que es de la forma 2(1), en este caso disponemos de una estimacion
de ,2 que es:
P150
i=1 et et1
2
i=1 et1
P150
(1)
0,0028 0,015
5,6914
#"
1
150
"
0,7679 0,0012
0,0004
"
0,8718 0,0007
0,0003
"
0
1
## "
0,0028 0,015
5,6914
(4)
y [RM CO q] es de la forma:
"
1 0
0 1
#"
0,003845
0,941777
(5)
Departamento de Economa
Universidad de Chile
Econometra I
o 2005
Oton
Ayudanta No 8
Profesores: Andres Otero y Javiera Vasquez
Ayudantes: Rodrigo Bravo y Roberto Jaramillo
Comentes
Comente las siguientes afirmaciones. Utilice matematicas y graficos si lo cree pertinente.
1. Siempre podemos utilizar para testear hipotesis los test t y F.
Respuesta: Falso, ya que es necesario que se cumpla que el error este normalmente distribuido.
Esto es porque cualquier funci
on lineal de variables normalmente distribuidas estar
a tambien normalmente distribuida, lo que es equivalente a decir que si u est
a normalmente distribuida, los
tambien lo estar
an.
2. Una funci
on de distribuci
on normal se caracteriza porque su simetra es cero, y su kurtosis es
indefinida.
Respuesta: Falso. Es correcto que la funci
on de distribuci
on normal tiene simetra igual a cero,
pero su coeficiente de kurtosis (es decir, el ancho de las colas de la distribuci
on) es igual a 3.
3. Si los errores del modelo de regresi
on lineal no tienen distribucion normal, a pesar de que los
estimadores MCO ya no son MELI, siguen siendo insesgados.
Respuesta: El comente es falso ya que el resultado de que los estimadores por MCO son MELI
no requiere que los errores se distribuyan normal. En efecto tal propiedad requiere que los errores
cumplan la siguiente condici
on: E(ui ) = 0 i, V ar(ui ) = i2 I y Cov(ui , uj ) = 0 6= j, es decir,
que los errores ui iid sean independientes e identicamente distribuidos.
4. Es mejor predecir un valor puntual de y 0 que el valor esperado E(y 0 /x0 ), ya que uno hace lo
primero con mayor precisi
on.
Respuesta: Falso. La varianza del error de predicci
on al predecir un valor puntual de y 0 es mayor
0
0
que al predecir E(y /x ), por lo tanto lo primero es menos preciso.
Ejercicios
1. Encontrar la varianza del error de prediccion e = E(y 0 ) X 0 (al predecir el valor de E(y 0 )), y
compararla con la varianza que se obtiene al predecir un valor puntual de y 0
Respuesta:
= x0 (X 0 X)1 X 0 u
e = E(y 0 ) Y 0 = x0 x0 = x0 ( )
e2 = E[
e e0 ] = E[x0 (X 0 X)1 X 0 uu0 X(X 0 X)1 x00 ]
e2 = x0 (X 0 X)1 X 0 (u2 )X(X 0 X)1 x00 ]
e2 = u2 [x0 (X 0 X)1 X 0 X(X 0 X)1 x00 ]
1
Departamento de Economa
Universidad de Chile
+ u0 . Por
Al calcular un valor puntual de y 0 , el error de predicci
on es e0 = y 0 y0 = x0 ( )
lo tanto, calculando su varianza:
+ u0 )(x0 ( )
+ u0 )0 ]
e2 = E[
e e0 ] = E[(x0 ( )
0 x00 + x0 ( )u
00 + (x0 ( ))
0 u0 + u0 u00 ]
e2 = E[x0 ( )(
)
1, 0
0, 2
0, 2
0, 1
2
0, 01
0
= 0, 02
0, 01
Ahora hay que calcular el valor del estadstico t, para ver si el valor es estadsticamente significativo. Pero para calcular el estadstico t, a
un nos falta conocer la varianza de la predicci
on de y.
Recordar que estamos calculando la varianza del error de predicci
on cuando se quiere conocer un
valor puntual (para cada pas). Calculando para Uganda se obtiene:
Departamento de Economa
Universidad de Chile
e2 = u2 0 [1 + x0 (X 0 X)1 x00 ]
e2 = 0,09[1 + 2
e2
0
1
0,2
0,2
2
]
0,1
0
2
0,4
]
0
= 0,09[1 + 2
e2 = 0,45
Calculando el intervalo de confianza:
yt+1 y0
< t1/2,nk ] = 1
P r[t/2,nk < p
V ar(e2 )
Los grados de libertad son 10-2=8. Adem
as asumimos un grado de significancia de 0.05. Por lo
tanto el estadstico t es igual a 2.306 (dos colas).
Esto implica que:
P r[2,306 <
yt+1 0,02
0, 01
2
= 0, 02
0, 01
Para calcular el estadstico t, es necesario calcular nuevamente la varianza del error de predicci
on,
ya que los datos de la matriz x0 cambiaron.
e2 = u2 0 [1 + x0 (X 0 X)1 x00 ]
e2
= 0,09[1 + 0
e2
2
= 0,09[1 + 0,4
1
0,2
0,2
0
]
0,1
2
0
0,2
]
2
e2 = 0,09[1 + 0,4]
e2 = 0,126
Ya que se tiene la varianza del error de predicci
on, ahora podemos calcular el intervalo de confianza
de la predicci
on del crecimeinto de Suiza.
Calculando el intervalo de confianza:
3
Departamento de Economa
Universidad de Chile
yt+1 y0
P r[t/2,nk < p
< t1/2,nk ] = 1
V ar(e2 )
Los grados de libertad son 10-2=8. Adem
as asumimos un grado de significancia de 0.05. Por lo
tanto el estadstico t es igual a 2.306 (dos colas).
Esto implica que:
P r[2,306 <
yt+1 0,02
P
P x = 17,22
xy = 37,1022
x2 = 10,92
2
R = 0,7462
y = 85
Es significativo el coeficiente del consumo de gas natural en la explicacion del consumo de energa?
Respuesta: Primero es necesario calcular el valor del
P
P P
n xy x y
P 2
P
=
n x ( x)2
35 37,1022 17,22 85
=
35 10,92 (17,22)2
165,123
=
85,6716
= 1,9274
Ahora calculando la varianza del coeficiente:
2
= P u
V ar()
(xi x
)2
Sin embargo a
un nos falta conocer el valor de u2 . Este valor lo podemos obtener del R2
R2 = 1
SR
ST
SR = ST (1 R2 )
4
Departamento de Economa
Universidad de Chile
SR = u
0 u
= 12,15(1 0,7462) = 3,08367
u2 =
u2 =
u
0 u
nk
3,08367
= 0,09345
33
Econometra I
FACEA, Universidad de Chile
Demostracin
1
2
12 0
0 22
Econometra I
FACEA, Universidad de Chile
Demostracin
1 0
0
0 22 0 = 0
2
1
0
=0
0
2
(12 )(22 ) = 0
12 22 12 22 + 2 = 0
12 22 (12 + 22 ) + 2 = 0
p
(12 + 22 ) (12 + 22 )2 412 22
=
2 p
2
2
( + 2 ) (12 22 )2
= 1
2
(12 + 22 ) (12 22 )
=
2
1 = 12
2 = 22
De esta forma la matriz es:
12 0
0 22
Ahora calculemos los vectores propios, recuerde que cada valor propio tiene asociado un vector propio. Comencemos con el vector propio de 1 . Este debe cumplir
las siguientes ecuaciones:
2
1 1
0
c1
(1)
=0
0
22 1
c2
c0 c = 1 c21 + c22 = 1
(2)
2
c1
0
1 2
=0
(3)
c2
0
22 2
c0 c = 1 c21 + c22 = 1
2
(4)
Econometra I
FACEA, Universidad de Chile
Demostracin
1 0
C=
0 1
Luego la matriz P es:
P = C
1/2
1 0
0 1
1
1
0
1
2
1
1
1
2
Departamento de Economa
Universidad de Chile
Econometra I
o 2005
Oton
n
Multicolinealidad y Error de Medicio
Profesores: Andres Otero y Javiera Vasquez
Ayudantes: Jose Manuel Castellon y Roberto Jaramillo
1.
Comentes
Comente las siguientes afirmaciones. Utilice matematicas y graficos si lo cree pertinente.
1. El error de medici
on no genera ning
un problema cuando este se encuentra en la variable independiente. Sin embargo, si este se encuetra en la variable dependiente, el estimador MCO deja de ser
MELI.
Respuesta: Falso. El error de medici
on cuando se encuentra en la variable dependiente no genera
problemas que provoquen que el estimador MCO deje de ser MELI, ya que no se ha roto el supuesto
de que cov(x, u) = 0. Sin embargo, cuando el error de medici
on se encuentra en la variable
independiente, el estimador MCO deja de ser MELI.
2. La multicolinealidad es un problema grave, que siempre hay que eliminar.
Respuesta: No necesariamente. La multicolinealidad es problema que afecta muchos elementos en
la estimaci
on de los modelos. Sin embargo, esta es propia del modelo que se est
a analizando, por
lo que si esta se trata de eliminar, se corre el riesgo de estar cambiando el modelo en s.
3. Cuando los datos que estamos analizando tienen multicolinealidad, el estimador MCO no puede
calcular el valor de los par
ametros, porque la varianza de los coeficientes estimados es casi cero.
Respuesta: No siempre. Cuando la multicolinealidad es exacta, no se pueden calcular los par
ametros
por MCO, ya que det((X 0 X)1 ) no est
a definido. Sin embargo, cuando no es exacta, s se pueden
calcular los par
ametros por MCO, pero estos tienen una serie de problemas.
4. Una de las formas m
as f
aciles de identificar la multicolinealidad es cuando vemos que el modelo que
estamos estimando tiene un R2 bajo, pero todos los coeficientes son estadsticamente significativos.
Respuesta: Falso, porque es al reves. Una de las form
as m
as f
aciles de detectar la multicolinealidad,
es cuando se tiene un R2 , pero los p
ar
ametros no son estadsticamente significativos.
2.
Ejercicios
(1)
Departamento de Economa
Universidad de Chile
Yi = Yi + i
(2)
E(X i )
=
=
=
=
E(X (ui i ))
E(Xui + Xi )
E(Xui ) + E(Xi )
0
= Yi + i
= Xi + i
E(Xi i )
=
=
=
=
=
6=
E(X (ui i ))
E(Xi (ui X i ))
E(Xi ui X 2 Xi )
E(Xi ui ) E(X 2 ) E(Xi )
E(Xi2 )
0
Yi = 1 + 2 Xi + 3 Zi + ui
(3)
Sera igual que se tenga que Xi + Zi = 8 que 2 + 3 = 8 para obtener los parametros estimados?
2
Departamento de Economa
Universidad de Chile
Respuesta:
Para ver los efectos de estas equivalencias, las reemplazaremos para observar los resultados que
tienen sobre la estimaci
on MCO. Reemplazando Zi = 8 Xi en (3) resulta:
Yi
= 1 + 2 Xi + 3 (8 Xi ) + ui
= 1 + 2 Xi + 83 3 Xi + ui
= 1 + 83 + Xi (2 3 ) + ui
Utilizando 4 = 1 + 83 y 2 3 = 5 queda:
Yi = 4 + 5 Xi + ui
(4)
Yi
= 1 + 2 Xi + (8 2 )Zi + ui
t= q
V ar(1 )
3
0,5
=
= 0,59
0,7
Departamento de Economa
Universidad de Chile
Para 2 :
2
t= q
V ar(2 )
0,4
=
= 0,48
0,7
Px
S=
..
.
0
2
1
...
..
..
.
.
...
P1 x
2
n
P1x
nn
S=
!
(5)
1
10
Adem
as la matriz (X 0 X)1 es igual a :
(X 0 X)1 =
P 2
P x1
x2 x1
P
10
2
Px1 x
=
x22
8
8
10
(6)
B = S(X X)
S=
1
4/5
4/5
1
(7)
Ahora hay que calcular el o los valores propios de B, lo que se hace a continuaci
on:
|B I| = 0
1
4/5
1 0
|
| = 0
4/5
1
0 1
1 4/5
|
| = 0
4/5 1
(8)
Departamento de Economa
Universidad de Chile
De (8) obtenemos los valores propios 1 = 1/5 y 2 = 9/5 y reemplazando estos valores en
el ndice de Belsley queda:
r
=
M AX
=
M IN
9/5
=3
1/5
Departamento de Economa
Universidad de Chile
Econometra I
Primavera 2005
Ayudanta Extra - 05-08-05
Profesores: J. V
asquez-F. Tagle, R. Montero, E. Melo
Ayudante: Roberto Jaramillo 1
1.
Ejercicios
1. Derive los estimadores MCO a partir de un modelo con una variable explicativa.
a) Que variaciones puede obtener de este modelo? Nota: Encuentre los estimadores cuando el
modelo tiene s
olo constante, s
olo pendiente, y ambas.
Respuesta:
Para todos los modelos que se definan, lo que se busca es minimizar las suma de los errores
al cuadrado.
1) Utilizando este criterio en un modelo con pendiente y constante:
yi
ui
n
X
u2i
= 0 + 1 xi + ui
= yi 0 1 xi
n
X
=
(yi 0 1 xi )2
i=1
i=1
M IN0 ,1
n
X
u2i
(1)
=0
(2)
=0
(3)
i=1
Pn
2
i=1 ui
0
Pn
i=1
u2i
u2i
(yi 0 1 xi )
(yi 0 1 xi )
i=1
0
2
n
X
i=1
n
X
i=1
n
X
yi n0 1
i=1
n
X
xi
i=1
0 = y 1 x
1 rojarami@facea.uchile.cl
Departamento de Economa
Universidad de Chile
u2i
(yi 0 1 xi )xi
(yi 0 1 xi )xi
i=1
1
2
n
X
i=1
n
X
i=1
n
X
xi yi 0
n
X
i=1
n
X
xi 1
i=1
x2i
i=1
Reemplazando el estimador de 0 en la u
ltima expresi
on resulta:
n
X
n
X
xi yi (
i=1
Pn
i=1 yi
i=1
n
X
i=1
Pn
xi yi
xi yi (
y 1 x
)
i=1
xi
n
i=1
yi
x2i
Pn
( i=1 xi )2
+ 1
1
x2i
n
i=1
Pn
i=1
xi
n
1 =
i=1
n
X
xi 1
xi 1
i=1
n
X
xi yi
yi
ui
n
X
u2i
n
X
i=1
i=1
n
X
n
X
u2i
i=1
Pn
2
i=1 ui
M IN0
0
(yi 0 )
i=1
n
X
yi n0
i=1
0 = y
2
xi
n
X
i=1
i=1
n
n
X
X
n
x2i (
xi )2
i=1
i=1
= 0 + ui
= yi 0
n
X
=
(yi 0 )2
i=1
i=1
n
X
i=1
n
X
n
X
x2i
n
Pn
n
X
yi
Departamento de Economa
Universidad de Chile
3) Y con un modelo s
olo con la pendiente:
yi
ui
n
X
u2i
= 1 xi + ui
= yi 1 xi
n
X
=
(yi 1 xi )2
i=1
i=1
Minimizando:
M IN1
n
X
u2i
i=1
n
X
Pn
i=1
u2i
1 xi
(yi 1 xi )xi
i=1
n
X
xi yi 1
i=1
n
X
x2i
i=1
n
X
xi yi
1 =
i=1
n
X
x2i
i=1
b) Explique que diferencias puede inferir entre estos modelos, con respecto a sus propiedades.
Respuesta:
En el caso de un modelo sin constante, resulta:
n
X
i=1
(yi 1 xi )xi
| {z }
ui
n
X
ui xi
i=1
Sin embargo no garantiza que la suma de los errores sea igual a cero.
Viendo el caso de un modelo s
olo con constante:
n
X
i=1
(yi 0 )
| {z }
ui
n
X
ui
i=1
En este caso no garantiza que el error no este correlacionado con los datos, en caso de que
estos se esten omitiendo.
Estas dos condiciones se encuentran al mismo tiempo cuando se utiliza un modelo con constante y pendiente.
3
Departamento de Economa
Universidad de Chile
NF
2.2
6.2
3.6
4.2
4.6
yi
= 0 + 1 xi + ui
(4)
Respuesta: Utilizaremos los estimadores cuando el modelo tiene pendiente y constante encontrados en el ejercicio 1:
0
= y 1 x
n
n
n
X
X
X
n
xi yi
xi
yi
i=1
i=1
i=1
n
X
x2i (
xi )2
i=1
i=1
n
X
Los elementos para encontrar los estimadores, que se sacan de la tabla son:
n
n
X
X
xi = 19,5
x2i = 89,69
i=1
n
X
i=1
i=1
xi yi = 90,82
n
X
yi = 20,8
i=1
0,71
0
0
0
= y 1 x
Ahora reemplazando en 0 :
1,391
(5)
(6)
Departamento de Economa
Universidad de Chile
yi
yi
= 0 + ui
= 1 xi + ui
(7)
(8)
0 =
. Reemplazando
n
x2
P
P
i=1
= y
= 20,8/5
4,16
Pn
xi yi
Pi=1
n
2
i=1 xi
0
0
90,82/89,69
1,01
Los par
ametros no son iguales por lo explicado en la parte b) del ejercicio 1, ya que los modelos
no pueden asegurar las propiedades que se nombran en ese apartado.
3. La Subsecretara de electricidad y combustibles esta interesada en conocer la relacion que existe
entre consumo de energa electrica (y) y el consumo de gas natural (x). Con este fin, encarga
a la Subdirecci
on General de Estudios la especificacion de un modelo econometrico entre estas
variables y su estimaci
on a partir de las series de datos disponibles en la subsecretara. Suponga
que usted trabaja como tecnico en la citada subdireccion y es el encargado de realizar el informe
solicitado. Para ello dispone de la siguiente informacion elaborada por su ayudante a partir de los
datos originales:
n
X
n = 35
n
X
i=1
xi = 17,22
i=1
(yi y) = 12,15
n
X
n
X
x2i = 10,92
i=1
xi yi = 37,1022
i=1
n
X
i=1
yi = 85
Departamento de Economa
Universidad de Chile
yi
= 0 + 1 xi + ui
(9)
= y 1 x
n
n
n
X
X
X
n
xi yi
xi
yi
i=1
i=1
i=1
n
X
x2i (
xi )2
i=1
i=1
n
X
Reemplazando en el estimador de 1 :
35 37,1022 17,22 85
35 10,92 17,22 2
= 1,93
0
0
0
= y 1 x
Ahora reemplazando en 0 :
3,38
Podemos decir que como la pendiente de la recta de regresion es negativa, al aumentar el consumo
de energa electrica, disminuye el consumo de gas natural; y viceversa.
2.
Comentes
Comente las siguientes afirmaciones.
1. La estimaci
on por MCO adem
as de garantizar que la recta de regresion pasa por las medias
muestrales de las variables, tambien garantiza que no estan relacionados el error y el valor predicho
de la variable dependiente.
2. Si la varianza de un estimador es igual a su Error Cuadratico Medio (ECM), podemos decir que
el estimador es insesgado.
3. En el modelo de regresi
on lineal de una variable explicativa, si al variable independiente no vara,
entonces el estimador de 2 ser
a igual al verdadero valor poblacional de 2 .
4. A un investigador no le conviene utilizar un parametro sesgado.
5. Cuando la varianza de las variables explicativas es alta, el estimador por MCO de la pendiente del
modelo es menos preciso.
6
Departamento de Economa
3.
Universidad de Chile
Propuestos
1. Encuentre al menos dos formas diferentes de expresar el calculo de los parametros por MCO,
cuando el modelo tiene s
olo una variable explicativa. Ayuda: puede encontrar dos formas distintas
encontrando las expresiones en desviaciones con respecto a la media, y otra forma es desarrollando
esta u
ltima expresi
on.
2. Para el ejercicio 1, analice las propiedades de los estimadores encontrados (insesgamiento, eficiencia, menor ECM, consistencia)
3. Suponga que encontr
o una base de datos, pero ahora no sabe su procedencia. Lo u
nico que sabe
es que Y es la variable dependiente, y X es la variable explicativa.
X
-8
-1
0
4
2
Y
0
1
3
5
4
Departamento de Economa
Universidad de Chile
Econometra I
Primavera 2005
Ayudanta Extra - 02-09-05
Profesores: J. V
asquez-F. Tagle, R. Montero, E. Melo
Ayudante: Roberto Jaramillo
1.
Comentes
1. Un amigo suyo le comenta que en un modelo de regresion lineal, en el peor de los casos los residuos
explican un cero % la variabilidad del termino dependiente. Que opina usted?
Respuesta: Si los residuos explican en un cero % la variabilidad del modelo, significa que el total
est
a siendo explicado por las variables explicativas, lo que en teora muestra un modelo que bien
ajustado. Sin embargo, un R2 alto puede no ser el mejor de los casos, ya que se pueden presentar
problemas de inclusi
on de variables irrelevantes, multicolinealidad, pocos datos (R2 = 1 cuando
hay s
olo dos datos), o que el modelo no incluya la constante.
2. La ventaja que tiene el test F, es que con una sola hipotesis me permite hacer todos los test de
significancia de Student al mismo tiempo.
Respuesta: El test F permite testear al mismo tiempo un conjunto de hip
otesis. Al testear la
significancia estadstica de un par
ametro, estamos realizando un test individual para cada uno de
los par
ametros, lo que sera distinto al testear que todos no son estadsticamente significativos al
mismo tiempo (Conjuntos distintos). Por esto el comente sera falso.
3. En una prueba de hip
otesis cualquiera, la zona de rechazo nunca cambia al cambiar la hipotesis
nula.
Respuesta: Falso. Para ver si es que cambia la zona de rechazo de una hip
otesis, hay que ver si
cambia el estadstico de tabla. El comente sera falso, ya que en el caso de un estadstico F al
cambiar la cantidad de hip
otesis nulas, el estadstico F de tabla va cambiando.
4. La ventaja que tiene el test t de Student es que puedo utilizarlo sin importar la distribucion del
error, suponiendo que tenemos una muestra finita.
Respuesta: Para utilizar los Test t y F es necesario que el error este destribuido en forma normal.
Si esto no sucede, no podramos conocer la distribuci
on de estos estadsticos.
2.
Ejercicios
1. Encuentre la expresi
on para la suma total al cuadrado cuando el modelo de regresion no incluye
un termino constante.
y
yy
y0 y
y0 y
0
=
=
=
=
y + u
0
y y + y 0 u
0
(
y+u
) y + (
y+u
)0 u
0
0
0
y y + u
y + y u
+
u0 u
|{z} |{z}
0
n
X
i=1
yi2
n
X
i=1
yi 2 +
n
X
i=1
ui 2
(1)
Departamento de Economa
Universidad de Chile
ST
n
X
(yi y)2
i=1
ST
n
X
yi2 n
y2
i=1
n
X
yi2
= ST + n
y2
(2)
i=1
SE
n
X
(
yi y)2
i=1
SE
n
X
yi2 ny2
i=1
n
X
yi2
= SE + ny2
(3)
i=1
Reemplazando 2 y 3 en 1 queda:
ST + n
y
= SE + ny2 +
n
X
ui 2
i=1
| {z }
SR
ST
= SE + SR + n(y2 y2 )
R2
SR
ST
1 R2
(4)
SR n 1
R2 = 1
ST n k
(5)
Reemplazando 4 en 5 queda:
R2
1 R2
n1
nk
n1
(1 R2 )
nk
1 (1 R2 )
k = 1 R2 = R2
k > 1 1 R2 > 1 R2 R2 < R2
2
Departamento de Economa
Universidad de Chile
Nota C3
3.7
5.1
3.4
1.9
3.4
2.8
Nota Sol
3
4
4.7
2.6
5
5.2
8,32 4,13
4,13 5,72
1
5,72 4,13
=
30,53 4,13 8,32
4,84
=
1,24
0,75
=
0,36
=
= y x
1 1 x
2 2
= 2,51
c) Analice la significancia estadstica de todos los parametros. Para esto encuentre los valores
de los estadsticos, con su respectivo P-value.
Es necesario encontrar el valor de las varianzas de los estimadores:
Departamento de Economa
Universidad de Chile
V ar()
= u2 i (X 0 X)1
Pn
2i
i=1 u
=
nk
u2 i
u2 i
V ar()
V ar()
2,56
= 0,85
3
0,85
5,72 4,13
=
30,53 4,13 8,32
0,16 0,12
=
0,12 0,23
ti
t1
t2
0
q i
V ar(i )
0,75 0
= 1,875
0,16
0,36 0
= 0,75
0,23
P valuei
P value1
P value2
= 2(1 P r)
= 0,15
= 0,51
1 + 2 1
tH0
tH0
= 1,58
Departamento de Economa
Universidad de Chile
q
nk
= 2
= 3
1 0
R =
0 1
0,75
=
0,36
0,3
r =
0,4
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
Fq,nk
u
0 u
nk
Fq,nk
2,16/2
= 1,27
0,85
El F de tabla con un 95 % de confianza es 9.55, por lo que existe suficiente evidencia para no
rechazar la hip
otesis nula con un 95 % de confianza
f ) Encuentre que porcentaje de la variabilidad se explica por los datos. Tambien realice alg
un
ajuste a este coeficiente en caso de encontrarlo necesario.
Para encontrar ese porcentaje, hay que revisar el R2
R2
ST
ST
6,01
1
n
X
(yi y)2 =
i=1
SR =
n
X
SR
ST
n
X
yi2 n
y2
i=1
ui 2 = 2,56
i=1
R2
2,56
= 0,57
6,01
(X
X )2
2
nV ( X )
Podemos observar que mientras mayor es el tamao muestral menor es la varianza del
estimador MCO (ms preciso), y mientras mayor es la varianza de las variables
explicativas menor es la varianza del estimador (ms preciso).
Departamento de Economa
Universidad de Chile
Econometra I
o 2006
Oton
Ayudanta Extra 25/04/06
Profesores: Claudia Sanhueza, Javiera Vasquez.
Ayudante: Roberto Jaramillo Moya1
Nota: Esta pauta ha sido publicada a modo de referencia. No ha sido revisada, por lo que es un muy
buen ejercicio para el estudio buscar incongruencias.
1.
Ejercicios
Nota C3
3.7
5.1
3.4
1.9
3.4
2.8
Nota Sol
3
4
4.7
2.6
5
5.2
Para esta muestra, que fue obtenida del curso Econometra I de alg
un semestre del pasado, responda las siguientes preguntas:
a) Encuentre los estimadores de los parametros y su correspondiente matriz de varianzas y
covarianzas.
RESPUESTA
Al trabajar con los datos en desviaci
on con respecto a la media:
X 0X
8,32
4,13
X 0 X 1
1
30,53
X 0Y
M CO
2,51
u
2i
2,56
n
X
5,72
4,13
4,84
1,24
4,13
5,72
4,13
8,32
0,75
0,36
i=1
Departamento de Economa
Universidad de Chile
V ar()
u2 i
u2 i
V ar()
u2 i (X 0 X)1
Pn
u
2i
nk
i=1
2,56
= 0,85
3
0,85
5,72
30,53 4,13
V ar()
0,12
0,23
0,16
0,12
4,13
8,32
SR =
n
X
R2
ST
ST
6,01
SR
ST
n
X
n
X
i=1
i=1
(yi y)2 =
yi2 n
y2
ui 2 = 2,56
i=1
R2
2,56
= 0,57
6,01
ti
t1
t2
i 0
V ar(i )
0,75 0
= 1,875
0,16
0,36 0
= 0,75
0,23
Departamento de Economa
Universidad de Chile
P valuei
2(1 P r)
P value1
0,15
P value2
0,51
R2 /(k 1)
F(k1,nk)
(1 R2 )/(n k)
0,57/(3 1)
= 1,99
(1 0,57)/(6 3)
El valor F crtico es de 9.55 para un 95 % , por lo que existe suficiente evidencia para afirmar que
los par
ametros no seran significativos en forma global con un 95 % de confianza.
tH 0
tH 0
1 + 2 1
nk
Fq,nk
Fq,nk
2
3
1
0
0
1
0,75
0,36
0,3
0,4
nk
2,16/2
= 1,27
0,85
Departamento de Economa
Universidad de Chile
El F de tabla con un 95 % de confianza es 9.55, por lo que existe suficiente evidencia para no rechazar
la hip
otesis nula con un 95 % de confianza
f ) Si un alumno se sac
o un 3.6 en el control 2 y un 4.3 en el control 3, haga una prediccion del
valor puntual de esta.
RESPUESTA
y
3,7
V ar(
e)
=
=
V ar(
e)
u2 (1 + x0 (X 0 X)1 x00 ))
1
3,6
0,85(1 +
30,53
3,64
4,3
5,72
4,13
4,13
8,32
El intervalo queda:
3,7 3,18
3,64 y 0
2,37 y 0
3,7 + 3,18
9,78
3,64
3,6
)
4,3
Departamento de Economa
Universidad de Chile
Econometra I
o 2006
Oton
Ayudanta 16-6-6
Profesoras: Javiera Vasquez y Claudia Sanhueza
Ayudantes: Juan Carlos Caro, Javier Fernandez, Nicolas Grau, Roberto Jaramillo 1 , Roque Montero
1.
Comentes
2.
Ejercicios
Departamento de Economa
Universidad de Chile
h = (1
DW
)
2
n
2 N (0, 1)
1 n
2
2
Con la informaci
on anterior: DW = 1,572226, n = 28 y
= (0,143427)
s
1,572226
28
(1
)
N (0, 1)
2
1 28(0,143427)2
1,738115749
El estadstico t, en un test de dos colas, es de 1.96, por lo que no podramos rechazar la hip
otesis nula de
no autocorrelaci
on.
yt
ut
=
=
0 + 1 xt + ut
ut1 + t
1
22
4
2
26
6
3
32
10
4
34
12
5
40
14
6
46
16
7
46
20
8
50
22
yt = yt 0,5yt1
xt = xt 0,5xt1
De esta forma, se tienen los siguientes datos transformados:
t
1
2
3
4
5
6
7
8
Suma
yt
22
26
32
34
40
46
46
50
xt
4
6
10
12
14
16
20
22
yt
xt
x y
x2
15
19
18
23
26
23
27
151
4
7
7
8
9
12
12
59
60
133
126
184
234
276
324
1337
16
49
49
64
81
144
144
547
Departamento de Economa
Universidad de Chile
yt = 0 (1 ) + 1 xt + t
As, el estimador MCG de los par
ametros es:
P8
7
t=2 xt
P
=
8
2
59
t=2 xt
t=2 xt
P8
151
y
P8 t=2 t =
1337
t=2 xt yt
X X
X Y
=
=
P8
M CG
M CG
=
10,67
1,29
7
59
59
547
1
151
1337
59
547
xt
1
2
4
1
1
yt
xt
yt
yt
yt
= p
=
t
xt k
k 2 x2t
xt
xt
1
= p
=
2
2
t
k
k xt
El metodo eficiente de MCG consiste en estimar por MCO el modelo: yt = xt +ut , donde ut viid (0, 2 ):
Departamento de Economa
Universidad de Chile
M CG
Pn
yt xt
Pi=1
n
2
i=1 xt
Pn
=
=
M CG
V (M CG )
=
=
=
V (M CG )
yt
k xt k
1
2
i=1 ( k )
Pn yt
t=1 xt
n
2/1 + 3/2 + 10/4 + 1/1 + 3/1
5
2
0
(X X )1
1
Pn
1
2
(
t=1 k )
2k
2k
=
n
10
Departamento de Economa
Universidad de Chile
Econometra I
Primavera 2006
Profesores: Jose Miguel Benavente, Rodrigo Montero.
Ayudantes: Javier Fern
andez, Andrea Gutierrez, Roberto Jaramillo, Roque Montero.
Ayudanta 05-09-06
1.
Ejercicios
Nota C3
3.7
5.1
3.4
1.9
3.4
2.8
Nota Sol
3
4
4.7
2.6
5
5.2
=
=
=
Nota Solemne
Nota Control 2
Nota Control 3
X 0X
8,32
4,13
X 0 X 1
1
30,53
M CO
2,51
u
2i
2,56
n
X
5,72
4,13
4,84
1,24
XY
0,75
0,36
i=1
4,13
5,72
4,13
8,32
Departamento de Economa
Universidad de Chile
2
c) Obtenga los coeficientes R2 y R
RESPUESTA
R2
=
=
=
SR
ST
P u2
P(y
y)2
Pi u2
1 P 2
y n
y2
1
2
R
0,55
n1
nk
61
1 (1 0,55)
63
0,25
1 (1 R2 )
=
=
=
d ) Analice la significancia estadstica de todos los parametros. Para esto encuentre los valores
de los estadsticos, con su respectivo P-value.
Es necesario encontrar el valor de las varianzas de los estimadores:
V ar()
u2 i
u2 i
V ar()
V ar()
= u2 i (X 0 X)1
Pn
2i
i=1 u
=
nk
2,56
= 0,85
3
0,85
5,72 4,13
=
30,53 4,13 8,32
0,16 0,12
=
0,12 0,23
ti
t1
t2
0
q i
V ar(i )
0,75 0
= 1,875
0,16
0,36 0
= 0,75
0,23
P valuei
P value1
P value2
2
= 2(1 P r)
= 0,15
= 0,51
Departamento de Economa
Universidad de Chile
1 + 2 1
tH0
tH0
= 1,58
q
nk
= 2
= 3
1 0
R =
0 1
0,75
=
0,36
0,3
r =
0,4
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
Fq,nk
u
0 u
nk
Fq,nk
2,16/2
= 1,27
0,85
El F de tabla con un 95 % de confianza es 9.55, por lo que existe suficiente evidencia para no
rechazar la hip
otesis nula con un 95 % de confianza
Departamento de Economa
Universidad de Chile
Econometra I
Primavera 2006
Ayudanta Extra - 17-10-06
Profesores: Jose Miguel Benavente, Rodrigo Montero
Ayudantes: Javier Fern
andez, Andrea Gutierrez, Roberto Jaramillo, Roque Montero
1.
Comentes
1. El planteamiento de un modelo ANOVA tiene la ventaja de que genera un error tipo 1 menor que
hacer varios test t al mismo tiempo.
RESPUESTA
Falso, ya que la cantidad de test son distintos. Para ver la diferencia entre tres grupos, con ANOVA se
plantean dos test de sinificancia, y con una comparaci
on de medias 3, lo que genera que cada test en forma
indiviual sea distinto. Como al hacer un test de significancia individual en ANOVA incluye m
as efectos
al mismo tiempo (comparaci
on con m
as medias), entonces la probabilidad de que el test se rechace es m
as
alta, con lo que el comente sera falso.
2.
Ejercicios
Yi = 1 + 2 Di + ui
(1)
X!X
X!X
(X ! X)1
(X ! X)1
(X ! X)1
i!
i D
D!
!
i! D
ii
!
!
Di DD
n nu
nu nu
1
nu
nu
nu
n
nu n n2u
1
nu
nu
nu
n
nu nm
1/nm
1/nm
1/nm n/(nu nm )
(2)
(3)
Departamento de Economa
Universidad de Chile
X!Y
X!Y
X!Y
i!
! Y
D
!
iY
D! Y
P
P yi
D=1 yi
(4)
(X ! X)1 X ! Y
P
1/nm
1/nm
P yi
1/nm n/(nu nm )
D=1 yi
" P Y P
#
Y
i
"
"
"
"
Yi
nm
D=0
nm
Yi
Yi
D=0 Yi
P nm
D=1 Yi
nm
Ym +
D=1
nm
Y
Pm
D=1
nm
Y
Pm
(6)
D=1
nm P
n
Yi
+ nuD=1
nm
P
D=0
nm
(5)
Yi nm
nu
Ym
P
Yi
Ym + D=1
nu
Ym
Yu Ym
Yi
D=1
Yi
nu nm
( nnu 1)
(7)
(8)
(9)
(10)
(11)
(12)
Grupo 1
Grupo 2
=
=
Yi = N + 1 Xi + u1,i
Yi = C + 1 Xi + u2,i
(13)
(14)
Yi = 0 + N hi + C di + 1 Xi + ui
(15)
X = i hi di
X = i hi 1 hi
Xi
Xi
(16)
(17)
Departamento de Economa
Universidad de Chile
Y en este caso la columna de unos se puede formar con la suma de la columna 2 y la columna 3, por
lo que tendramos una columna LD, y la matriz seria singular y no calculable bajo MCO (Trampa de las
Dummies).
3. De acuerdo a un estudio de un respetado profesor de esta facultad, en que se vean las diferencias de
sueldos entre egresados de las distintas menciones, se han encontrado las siguientes conclusiones:
a) Existe la idea de que los egresados de Economa de esta facultad, al salir recien de la carrera,
ganan m
as que los egresados de Administraci
on de la misma facultad. Como planteara el
modelo y lo testeara?
RESPUESTA
El modelo se puede plantear de la siguiente forma:
yi = 0 + 1 di + ui
(18)
t = 1 . Sin embargo, si lo que queremos testear es que un estudiante de Economa recien egresado
1
gana m
as que un estudiante de Administraci
on, entonces lo que hay que buscar es que el par
ametro
andose esto en un test de una cola, que se plantea igual que el
1 sea mayor que cero, transform
anterior, pero lo que cambia es la zona de rechazo, que ahora s
olo se encuentra a la izquierda de la
curva de la tabla t-student.
(19)
c) A pesar de no haber sido includo en el estudio, tambien existe la creencia de que los recien
egresados de la universidad que es competencia directa, pero no tan prestigiosa, obtienen
salarios distintos. Plantee el modelo.
RESPUESTA
Descartando la diferencia entre menciones, podemos plantear el modelo de la siguiente forma:
yi = 0 + 1 chi + 2 tcati + ui
(20)
Universidad de Chile
Repaso de conceptos
1. Omisin de variable relevante e inclusin de variable irrelevante
2. Heterocedasticidad
Comentes
1. La omisin de variables relevantes produce subestimacin en
los parmetros estimados por MCO.
Falso, es cierto que el estimador MCO siempre ser sesgado en
presencia de variables irrelevantes omitidas:
E ( 1 ) 1
Cov( X 1 , X 2 )
2
Var ( X 1 )
Sesgo
Universidad de Chile
Ejercicios
1. Como sabemos, la demanda por un bien depende de muchas
variables, entre ellas el ingreso y precio del bien. Un
economista est estimando la demanda por un producto X,
para lo cual ha propuesto el siguiente modelo:
Q b0 P b1Y b2 e
a) Linealice el modelo y obtenga las elasticidades precio e
ingreso.
Q b0 P b1 Y b2 e
ln Q ln b0 b1 ln P b2 ln Y
ln Q b1 ln P b2 ln Y
Donde = ln b0
Por definicin:
Universidad de Chile
Q,P
Q,P
Q
%Q
Q ln Q
b1
% P P
ln P
P
Q
Q ln Q
%Q
b2
%Y Y
ln Y
Y
Q b0 P b1 Y b2 Ps b3 e
ln Q ln b0 b1 ln P b2 ln Y b3 ln Ps
ln Q b1 ln P b2 ln Y b3 ln Ps
Entonces los parmetros estarn sesgados:
Intuitivamente:
E (b1 ) b1 b3
COV (ln P, ln Ps )
Var (ln P)
E (b2 ) b2 b3
COV (ln Y , ln Ps )
Var (ln Y )
cuando
E (b1 ) Q , P
E (b2 ) Q ,Y
Universidad de Chile
ut ~ N (0, )
La estructura de I es la siguiente:
a
I e
d
e
b
f
d
f
c
Universidad de Chile
Universidad de Chile
u1 ' u1 / n1 k
u21 / u22 204/150= 1,36 lo comparo con una F17,17=?
u 2 u 2 / n2 k
(disculpen, pero no encontr la tabla) por lo tanto no existe evidencia
suficiente para demostrar heterocedasticidad.
2
.
Universidad de Chile
Universidad de Chile