Está en la página 1de 377

Universidad de Chile

Facultad de Economa & Negocios

ECONOMETRIA 1

Recopilacin de Pruebas Anteriores


(Desde Primavera 2004, Hasta Otoo 2008)
-Jmaggior-

CONTROLES 1

Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 1

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible

Pregunta 1: (30 puntos) En un modelo de regresin lineal la pendiente que se obtiene a


partir de la muestra disponible es siempre igual a la pendiente verdadera (poblacional) que
relaciona las variables.

....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
....................................................................................................................
Pregunta 2: Ud. dispone de los siguientes datos, donde Y es la variable dependiente y X
la variable explicativa. Complete la siguiente tabla con la informacin requerida:

Y
X
2
1
-2
0
1
4
3
1
1 .......
2 .......

Y
.......
.......
.......
.......

u
.......
.......
.......
.......

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Control 1
Pregunta 1: (30 puntos) Mientras mayor es el tamao de la muestra que disponemos, ms se
aproxima un estimador a su valor poblacional. Comente.
Si bien cuando el tamao de muestra aumenta, esta cada vez se parece ms a la poblacin, un
estimador para que en el lmite sea igual al valor poblacional tiene que cumplir con la propiedad de consistencia. Recordar que un estimador es simplemente una frmula o mtodo que nos
dice como aproximar un parmetro poblacional a travs de una muestra, existen estimadores
consistentes y otros que no lo son, a pesar que la muestra sea infinito un estimador puede ser
distinto a su valor verdadero, en este caso es inconsistente.
Pregunta 2: Suponga que la variable aleatoria yi esta compuesta por la suma de un componente fijo y uno aleatorio:
yi = xi + ui
|{z}
|{z}
f ijo

para

i = 1, ..., N

aleatorio

donde xi es una variable determinstica (fija), es un parmetro que mide la influencia de x


sobre y y ui es una variable aleatoria que se distribuye Normal N (0, 2 ).
Determine las propiedades del siguiente estimador de :
y
=
x

donde y =

N
1 X
yi
N i=1

x=

N
1 X
xi
N i=1

R:
y
= =
x

1
N
1
N

PN

i=1 yi
PN
i=1 xi

PN
i=1
= PN
i=1

yi
xi

Reemplazando yi = xi + ui (expresin poblacional) en (1):


PN
PN
PN
i=1 xi
i=1 ui
i=1 (xi + ui )
=

+
=
PN
PN
PN
x
x
i=1 i
i=1 i
i=1 xi
PN
ui
= + Pi=1
N
i=1 xi
PN
i=1 ui
= PN
i=1 xi
Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3):
PN
i=1 E[ui ]

E[] = + P
N
i=1 xi
=
1

(1)

(2)
(3)
(4)

Utilizando la propiedad de operador lineal de la Esperanza, y el supuesto que ui tiene esperanza


igual a cero, el estimador propuesto es insesgado. (20 PUNTOS)
Ahora calculemos su varianza:
=
V ()

]2
E[ E[]
|{z}

=
=
=
=
=
V ()

E[ ]2
"P
N
i=1
PN
i=1

(
(

PN

xi

i=1

PN

ui

xi )2

2
i=1 xi )

utilizando
#2

(4)
1

"

#2

N
X

E
= PN
ui
( i=1 xi )2
i=1
"N
#
X
2
E
ui + N (N 1)ui uj
i=1

N
X
i=1

E[u2i ] +N (N 1) E[ui uj ]
| {z }
| {z }
0

n
PN
( i=1 xi )2

(30 PUNTOS)
El Error cuadrtico medio (ECM) se este estimador es igual a la varianza, ya que es un estimador insesgado:
=
ECM ()

+ [sesgo]2
V ()
| {z }

=
ECM ()

n 2
PN
( i=1 xi )2

(10 PUNTOS)
Por ltimo, el estimador es consistente ya que es insesgado es muestras pequeas (10 PUNTOS). Adems se puede demostrar que:
2
= Pn
lm V ()
N
n
( i=1 xi )2

1
n2 2
2
= lm
PN
P
2
N
2
n n(
n n
x
)
i=1 xi
i=1 i
lm

n (x)2
1
2
lm
=0
2 n
(x) | {z n}
lm

m.s

p
o

y por lo tanto, es consistente.


2

=
plim()

Econometra I
Profesores: Andrs Otero
Javiera Vsquez.
Otoo 2005
Control 1
Pregunta 1: (30 puntos) El nico problema de no incluir un trmino constante
en el Modelo de Regresin Lineal, es que no se garantiza que la recta de regresin
pase por las medias o equivalentemente que la suma de los errores estimados sea
igual a cero. Comente.
Falso, si bien el no incluir un trmino constante en el modelo de regresin lineal tiene el problema de no garantizar que la recta de regresin pase por las
medias ni que la suma de los errores estimados sea igual a cero, este no es el
nico problema. El no incluir el trmino constante genera sesgo en la estimacin
de la pendiente al obligar a que la recta pase por el origen, tal como se muestra
en el siguiente grfico:

. .sin.constante
con constante
.
.. . . . . .
. .. . . .
.. . . . . .
.
.
.
Sesgo en la estimacin de la pendiente,
provocado por la estimacin de un
modelo de regresin lineal sin constante

Pregunta 2: (70 puntos) Ud. dispone de los siguientes datos, donde Y es la


variable dependiente y X la variable explicativa. Complete la siguiente tabla con
la informacin requerida:

Suma
Promedio
1
2

Y
12
2
5
1

X
2
1
3
0

5
1.7
2.2

1.5

Y Y
7
-3
0
4

2 =

X X
0.5
-0.5
1.5
-1.5

(Y Y )(X X)
3.5
1.5
0
6
11

(X X)2
0.25
0.25
2.25
2.25
5

Y
6.1
3.9
8.3
1.7
5

Pn

i=1 (Y Y )(X
Pn
2
i=1 (X X)

X)

11
= 2,2
5

1 = Y 2 X = 5 2,2 1,5 = 1,7

5.9
-1.9
-3.3
-0.7
0

Econometra I
Profesores:

Emerson Melo
Rodrigo Montero
Javiera Vsquez

Primavera 2005
Pauta Control 1
Rut:

.......................................

Ud. Dispone de 40 minutos para resolver este control, no puede hacer consultas a los ayudantes,
no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho
a reclamo. Contestar slo en el espacio disponible
Pregunta 1: Usted es gerente de costos de una prestigiosa empresa multinacional, y el gerente general, al cual todos llaman muy cariosamente Pato, lo llama a su oficina, y le plantea
el siguiente problema: ...existe la necesidad de justificar frente al directorio el esquema de remuneraciones que se aplica en la empresa. Como usted es alguien preparado, que ha estudiado
en la Universidad de Chile, necesito que me muestre cual es el premio que la empresa entrega a
sus trabajadores por cada ao de estudio que tienen (aos de escolaridad). La siguiente tabla
presenta la informacin de que usted dispone:

Aos de escolaridad (S)


0
3
5
7
10
12
17
17
17

Salario (W )
150000
170000
185000
190000
215000
250000
550000
650000
800000

Nmero de trabajadores
10
5
4
8
9
10
5
4
5

Usted decide hacer un informe al respecto, y para ello debe dar respuesta a las siguientes
interrogantes. NOTA: trabaje todos los clculos con DOS decimales.
1. Plantee el modelo a estimar, definiendo claramente cada una de las variables involucradas.
(3 puntos)
Respuesta: Se debe estimar el siguiente modelo:
Wi = + Si + i
donde Wi corresponde al salario del trabajador i, Si corresponde a los aos de escolaridad
del trabajador i, y i representa el trminos de error, bien comportado. Los parmetros
a estimar vienen dados por y . Por lo tanto, el modelo plantea a priori una relacin
lineal y directa entre los aos de escolaridad y el salario de la persona.
1

2. Escriba y grafique la funcin objetivo. Ayuda: para graficar la funcin objetivo asuma que
slo existe un parmetro que debe ser estimado. (4 puntos)
Respuesta: La funcin objetivo a minimizar es:
mn

N
X

,
i=1

2i = mn

N
X

,
i=1

i )2
(Wi
S

Graficamente:
Funcin
objetivo

Solucin

3. Cules son las estimaciones MCO de los parmetros poblacionales y ? (6 puntos)


Respuesta:

PN
si wi
59941583, 33

= Pi=1
=
= 28804, 45
N
2
2080, 98
i=1 si
S = 306583, 33 (28804, 45 8, 98) = 47823, 34

=W

donde si y wi representan los aos de escolaridad y el salario en desvos respecto de la


media.
4. Demuestre matemticamente y numricamente que la suma de los errores estimados es
igual a cero. (4 puntos)
Respuesta: La funcin objetivo a minimizar es:
mn

N
X

,
i=1

2i = mn

N
X

,
i=1

i )2
(Wi
S

Derivando con respecto a :

PN
N
i )2
X
i=1 (Wi
S
i) = 0
= 2
(Wi
S

i=1
Por lo tanto:

N
X

i) = 0
(Wi
S

i=1

N
X
i=1

i = 0

Numericamente:
60
X

i = (10 102176, 66) + (5 35763, 30)

i=1

+(4 6845, 60) + (8 59454, 50) + (9 120867, 86)


+(10 143476, 76) + (5 12500, 98) + (4 112500, 98)
+(5 262500, 98) = 0
5. Considere la siguiente transformacin de los salarios:
W = ln(W )
donde ln() corresponde al logaritmo natual. Estime nuevamente el modelo, pero utilizando como variable dependiente W en lugar de W . Qu representa el coeficiente estimado
para la pendiente? Demuestre. (Ayuda: recuerde el concepto de semi-elasticidad) (9 puntos)
Respuesta: El modelo a estimar sera el siguiente:
Wi = + Si + i
Los estimadores MCO son:
PN

174, 07
i=1 si wi
= P
=
= 0, 08
N
2
2080,
98
s
i=1 i
= W S = 12, 46 (0, 08 8, 98) = 11, 71
donde si y wi representan los aos de escolaridad y el logaritmo del salario en desvos
representa el porcentaje de incremento
respecto de la media. El coeficiente estimado ()
en el salario por un ao adicional de escolaridad. Matemticamente:
ln(Wi )
1
=
dWi =
Si
Wi
6. Recuerde que Pato quiere conocer el premio salarial que la empresa entrega a sus trabajadores por cada ao de escolaridad. Cul sera? Ayuda: utilice el resultado encontrado
en (5). (4 puntos).
Respuesta: Por cada ao adicional de escolaridad el trabajador recibe un premio de
8 % en su salario.

Econometra I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.


Ayudante : Roberto Jaramillo M.
Control 1 - Pauta de Correccin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.
Pregunta 1 (30 puntos)

Considere la especicacin estocstica de la Funcin de Regresin Poblacional


Yi = E[Yi |Xi ] + ui ,

donde la la Funcin de Regresin Poblacional considerando 2 variables y una relacin


lineal es:
E[Yi |Xi ] = 0 + 1 Xi .

(a) Explique cul es el supuesto detrs de la Funcin de Regresin Poblacional.

El supuesto esencial detrs de la Funcin de Regresin Poblacional es que se


asume que se puede representar correctamente, en valor esperado (en promedio),
a la variable dependiente a travs de una funcin lineal de las variables explicativas. Se llama funcin poblacional porque se asume que se dispone del total de los
datos de la economa.
(b) Explique algebraicamente por qu la media condicional de ui es igual a cero
(E[ui |Xi ] = 0).

Se tiene
Yi
E[Yi |Xi ]
E[Yi |Xi ]
E[ui |Xi ]

E[Yi |Xi ] + ui
E[E[Yi |Xi ]|Xi ] + ui
E[Yi |Xi ] + E[ui |Xi ]
0.

=
=
=
=

Dada la ley del valor esperado iterado (E[E[A|B]|B] = E[A|B]).


Pregunta 2 (30 puntos)

(a) Explique la diferencia entre causalidad econmica y correlacin estadstica.

La principal diferencia que existe entre causalidad econmica y correlacin estadstica es que la primera es una relacin de causa-efecto en un sentido econmico. En cambio, la correlacin estadstica es simplemente una observacin estadstica que indica un grado de relacin lineal. La correlacin estadstica no necesariamente implica que una variable correlacionada con otra se comporte de una
forma cuando la variable con la que tiene la correlacin cambie, no hay necesariamente una causalidad. En el ejemplo dado en clases, existe un grado de relacin
entre la calidad de un vino y el clima, pero no se puede decir que el clima est
provocado por la calidad del vino.

(b) Explique la diferencia entre la representacin estocstica de la Funcin de Regresin Muestral y representacin estocstica de la Funcin de Regresin Poblacional.

La diferencia est en la cantidad de datos disponibles para la regresin. En la


representacin estocstica de la Funcin de Regresin Poblacional, tal como lo
dice su nombre, se dispone de los datos que corresponden a la poblacin, que representan el total de datos. En cambio, la Funcin de Regresin Muestralal ser
Muestral est utilizando un subconjunto de la poblacin, lo que nos puede llevar
a conclusiones distintas por las ucuaciones entre las distintas muestras, tratando esta ltima de estimar a la Funcin de Regresin Poblacional con los datos
disponibles en la muestra. El trmino de error en la funcin poblacional corresponde al error generado por tratar de explicar la variable dependiente a travs de
una especicacin funcional en particular, mientras que en la funcin muestral el
trmino de error recoge adems el error de estimacin de los parmetros.

Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Pauta Control 1
Pregunta 1: (30 puntos) Si un estimador converge, entonces este estimador es consistente.
Comente.
Esto no es necesariamente cierto, ya que el estimador puede converger a un valor distinto del
valor poblacional del parmetro. Slo si el estimador converge al verdadero valor del parmetro
(poblacional) este estimador es consistente.
Pregunta 2: (70 puntos) Suponga que la variable aleatoria yi esta compuesta por la suma
de un componente fijo y uno aleatorio:
yi = xi + ui
|{z}
|{z}
f ijo

para i = 1, ..., N

aleatorio

donde xi es una variable determinstica (fija), es un parmetro que mide la influencia de x sobre y y ui es una variable aleatoria independiente e idnticamente distribuida Normal N (0, 2 ).
Determine si el siguiente estimador de es insesgado, calcule su varianza y determine si es
consistente:
y
=
x

donde y =

N
1 X
yi
N i=1

x=

N
1 X
xi
N i=1

R:
y
= =
x

1
N
1
N

PN

i=1 yi
PN
i=1 xi

PN
i=1
= PN
i=1

yi
xi

Reemplazando yi = xi + ui (expresin poblacional) en (1):


PN
PN
PN
i=1 xi
i=1 ui
i=1 (xi + ui )
=
=

+
PN
PN
PN
x
x
i=1 i
i=1 i
i=1 xi
PN
ui
= + Pi=1
N
i=1 xi
PN
i=1 ui
= PN
i=1 xi
Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3):
PN
i=1 E[ui ]

E[] = + P
N
i=1 xi
=
1

(1)

(2)
(3)
(4)

Utilizando la propiedad de operador lineal de la Esperanza, y el supuesto que ui tiene esperanza


igual a cero, el estimador propuesto es insesgado. (20 PUNTOS)
Ahora calculemos su varianza:
=
V ()

]2
E[ E[]
|{z}

=
=
=
=
=
V ()

E[ ]2
"P
N
i=1
PN
i=1

(
(

PN

xi

i=1

PN

ui

xi )2

i=1

xi )2

utilizando
#2

(4)
1

"

#2

N
X

= PN
E
ui
( i=1 xi )2
i=1
"N
#
X
2
E
ui + N (N 1)ui uj
i=1

N
X
i=1

E[u2i ] +N (N 1) E[ui uj ]
| {z }
| {z }
0

n
PN
( i=1 xi )2

(30 PUNTOS)
El Error cuadrtico medio (ECM) se este estimador es igual a la varianza, ya que es un estimador insesgado:
=
ECM ()

+ [sesgo]2
V ()
| {z }

=
ECM ()

n 2
PN
( i=1 xi )2

Para demostrar que es consistente, en el lmite el error cuadrtico medio (o varianza) debe ser
igual a cero, de esta forma el estimador converge en media cuadrtica a su verdadero valor, y
es estimador se dice consistente:
2
= Pn
lm V ()
N
n
( i=1 xi )2

n2 2
2
1
= lm
PN
P
2
N
2
n n(
n n
i=1 xi
i=1 xi )
lm

n (x)2
1
2
l
m
=0
2
(x) n
| {z n}
lm

m.s

p
o

y por lo tanto, es consistente.


(20 PUNTOS)
2

=
plim()

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 1

Semestre: Primavera 2006


Profesores: Jos Miguel Benavente, Rodrigo Montero
Tiempo de duracin: 20 minutos
No hay preguntas de ningn tipo para los ayudantes.
Comente (6 puntos)
En el contexto del modelo de regresin lineal de dos variables (Yi = + Xi + i )
el signo de estar determinado por el signo del coeficiente de correlacin entre
X e Y.
Respuesta. El coeficiente de correlacin entre X e Y se define como:
=

Cov(X, Y )
X Y

donde X y Y representan las desviaciones estndar de X e Y , respectivamente.


Por lo tanto:

P
= pP

xy
pP

y2
donde la letra en minsculas indica que la variable se encuentra en desvos respecto a la media. Por lo tanto:

x2

pP

y
= pP
x2
Es decir, el signo del estimador de va a depender del signo del coeficiente
de correlacin entre X e Y . Por lo tanto, el comente es verdadero.
Problema (14 puntos)
Considere el siguiente modelo:
Yi = + Xi + i
1

donde i es independiente e identicamente distribuido con media 0 y varianza 2 .


La variable X tiene las siguientes realizaciones: X1 = 1, X2 = 2, X3 = 3, X4 = 4,
X5 = 5 y X6 = 6.
Un econometrista estima la pendiente de esta relacin mediante la siguiente expresin:
1
= (Y6 + Y5 Y2 Y1 )
8
1. Muestre que este estimador es insesgado.
Respuesta. Reemplazando:
1
= (X6 + X5 X2 X1 + 6 + 5 2 1 )
8
Reemplazando por los valores de X:
1
1
= (8 + 6 + 5 2 1 ) = + (6 + 5 2 1 )
8
8
Aplicando esperanza se llega a:
=
E()
Por lo tanto, este estimador es insesgado.
2. Derive su varianza y determine la eficiencia relativa de este estimador respecto al estimador de mnimos cuadrados ordinarios.
Respuesta. Se sabe que:
1
= + (6 + 5 2 1 )
8
Aplicando varianza:
2
= 1 V ar(6 + 5 2 1 ) =
V ar()
64
16

Por otro lado:


2
2
V ar( M CO ) = P 2 = 2
x
35
Por lo tanto, la eficiencia relativa de este estimador viene dada por:

V ar()
35
=
>1
V ar( M CO )
32
ES decir, este estimador es menos eficiente que el estimador de mnimos
cuadrados ordinarios.

Econometra I
Semestre Primavera 2007
Control 1
Pauta Desarrollo
Profesores: Jose Miguel Benavente, Rodrigo Montero P.
Ayudantes: Rodrigo Bravo C., Felipe Ros B., Loreto Silva V.
Puntaje Total: 100 pts.
1. (50 Pts.) Considere el modelo de regresion lineal Y = X + con regresores determinsticos y
errores identica e independientemente distribuidos pero con primero momento igual a a, (i
iid(a, 2 ), i). Entonces si a es distinto de cero entonces V ar(M CO ) 6= 2 (X 0 X)1 y por ende el
estimador deja de ser eficiente.
Respuesta: Falso por los dos motivos siguientes:
Si E(u) = a, entonces V ar(M CO ) sigue siendo 2 (X 0 X)1 ya que el supuesto en el enunciado
no altera el hecho que var(u) = u2 I.
Si E(u) = a, el estimador M CO ya no es insesgado y por ende no podemos hablar de
eficiencia. Ya que es una propiedad que se aplica solo a los estimadores insesgados.
2. (50 Pts.) Demuestre que en un modelo de regresion lineal m
ultiple con k regresores, el estimador
insesgado de la varianza del error es:
Pn

ui 2
nk
i=1

Respuesta:
Primero, el vector de residuos estimados puede escribirse en funcion de los residuos poblacionales
de la siguiente forma:
u
= Mu
Donde M = In X(X 0 X)1 X 0 , matriz de dimension nx n idempotente y que satisface M X = 0.
Entonces: E(
u0 u
) = E(u0 M M u) = E(u0 M u), dada las caractersticas de la matriz M. Como u0 M u
es un escalar entonces E(u0 M u) = E[T r(u0 M u)].
Al cambiar el orden de las matrices queda:
E(u0 M u) = E[T r(u0 M u) = E[tr(M u0 u)] = T r[E(M u0 u)] = T r[M E(u0 u)] = T r[M u2 In ] =
u2 T r(M ) = u2 [T r(In) T r[X(X 0 X)1 X 0 ]] = u2 (n k)
Por lo tanto como E(u0 M u) = u2 (n k) para que la suma de los errores al cuadrado sea un
estimador insesgado de u2 debemos dividir por (n k).
Pn

Pn
ui 2
E( i=1 ui 2 )
(n k)u2
E(
) =
=
= u2
nk
nk
nk
i=1

1)

Comentes
a) Cuando hay variables omitidas en la regresin, que son determinantes de la variable
dependiente, entonces el estimador MCO de la variable incluida siempre estar
sesgado.
b) El teorema de Gauss-Markov prueba que, con errores homocedsticos, el estimador
OLS es insesgado.
c) Una de las condiciones importantes de Gauss-Markov es var(ui|X1,, Xn) = u2 , 0 <

u2 < for i = 1,, n,.


d) Cuando los errores son heterocedsticos OLS es insesgado y eficientes, a menos que
haya autocorrelacin.
e) Discuta intuitivamente la frmula para el F estadstico para testaer las restricciones
2 2

1 t1 + t2 2
t1 ,t 2 t1t
1 = 0 y 2 = 0 : F =
.

2
2

t1 ,t2

Answer: For the case when there is no correlation between the two explanatory variables, the
formula reduces to a simple average of the squared t-statistics, i.e., F =

1 2 2
( t1 + t2 ) .
2

The F2, distribution is the distribution of a random variable with a chi-squared


distribution with 2 degrees of freedom, divided by 2. Equivalently, the
F2, distribution is the distribution of the average of 2 squared standard normal
random variables. Because the t-statistics are uncorrelated by assumption, they are
independent standard normal random variables under the null hypothesis. If either

1 or 2

are nonzero (or both), then either t1 or t2 or both will be large. This
leads to a large F-statistic, and hence a rejection of the null hypothesis.

2)

Preguntas Largas

2.1)
Considere el modelo Yi = 1 X i + ui , donde ui = cX i2 ei y todos los X y e son i.i.d. y
distribuidos N(0,1).
a) Pruebe si son satisfechos cada uno de los supuestos extendidos del modelo de
regresin mltiple
b) Ser el estimador OLS de 1 eficiente?
c) Cmo estimara 1 por WLS?
Consider the model Yi =
distributed N(0,1).
(a)

1 X i + ui , where ui = cX i2 ei

and all of the Xs and es are i.i.d. and

Which of the Extended Least Squares Assumptions are satisfied here? Prove your assertions.

Answer: The extended least squares assumptions are:


1.
E(cXiei|Xi) = 0 (conditional mean zero) this holds here since the Xs and es
are i.i.d;
2.
(Xi, Yi), i = 1,, n are independent and identically distributed (i.i.d.) draws
from their joint distribution - this applies here;
3.
(Xi, ui) have nonzero finite fourth moments this follows from the normal
distribution, which has moments of all orders.
4.
5.

(b)

var(ui|Xi) = u (homoskedasticity) this fails since var(ui|Xi) = X i ; and


The conditional distribution of ui given Xi is normal (normal errors) this
holds since X i , ui is perfectly normal, so to speak.

Would an OLS estimator of

be efficient here?

Answer: Since the model is heteroskedastic, WLS offers efficiency gains.


(c)

How would you estimate 1 by WLS?


2

Answer: You would weight each observation by 1/ X i , i.e., regress Yi / X i on 1/ X i .

2.2)
Se tienen datos de 104 pases para determinar cuales son los determinantes de las
diferencias entre calidad de vida (medido por nivel de inreso percpita) en el mundo.
Recuerde de su curso de Maroeconoma que el modelo de crecimiento neoclsico sugiere
que el nivel de producto por trabajador (ingreso per cpita) estn determinados, entre otros,
por la tasa de ahorro y el crecimiento de la poblacin. Para testear este modelo se corre la
siguiente regresin:

= 0.339 12.894 n + 1.397 sK


RelPersInc
R2=0.621, SER = 0.177
donde RelPersInc es PIB por trabajador relativo a US, n es el crecimiento de la poblacin
promedio, 1980-1990, y sK es la tasa de inversin promedio como porcentaje del PIB de
1960 a1990 (recuerde inversin=ahorro).
a) Interprete los resultados. Son los signos esperados? Explique.
b) Recuerdas que tambin el capital humano important para determinar las
diferencias en estndar de vida de un pas. Por eso agregas datos adicional es
de aos de educacin promedio para 1985 (Educ) a la regersin. Los nuevos
resultados son:

= 0.046 5.869 n + 0.738 sK + 0.055 Educ


RelPersInc
2
R =0.775, SER = 0.1377
Cmo afecta los resultados anteriores?

c) Chequeando los resultados te das cuenta que ahora hay 86 observaciones, ya


que los datos de Educ no estn disponibles para todos los pases. Tienes que
modificar alguna de tus conclusiones en (b)?
d) Brazil tiene los siguientes valores: RelPersInc = 0.30, n = 0.021, sK = 0.169,
Educ = 3.5. T ecuacin sobre estima o sub estima el PIB percpita de
Brazil? Qu pasara si Brazil logra duplicar su nivel educacional?

You have collected data for 104 countries to address the difficult questions of the determinants for
differences in the standard of living among the countries of the world. You recall from your
macroeconomics lectures that the neoclassical growth model suggests that output per worker (per
capita income) levels are determined by, among others, the saving rate and population growth rate. To
test the predictions of this growth model, you run the following regression:

= 0.339 12.894 n + 1.397 sK , R2=0.621, SER = 0.177


RelPersInc
where RelPersInc is GDP per worker relative to the United States, n is the average population
growth rate, 1980-1990, and sK is the average investment share of GDP from 1960 to1990
(remember investment equals saving).
(a)

Interpret the results. Do the signs correspond to what you expected them to be? Explain.
Answer: The Solow growth model predicts higher productivity with higher saving rates and
lower population growth. The signs therefore correspond to prior expectations. A 10
percent point increase in the saving rate results in a roughly 14 percent increase in
per capita income relative to the United States. Lowering the population growth rate
by 1 percent results in a 13 percent higher per capita income relative to the United
States. It is best not to interpret the intercept. The regression explains
approximately 62 percent of the variation in per capita income among the 104
countries of the world.

(b)

You remember that human capital in addition to physical capital also plays a role in
determining the standard of living of a country. You therefore collect additional data on the
average educational attainment in years for 1985, and add this variable (Educ) to the above
regression. This results in the modified regression output:

= 0.046 5.869 n + 0.738 sK + 0.055 Educ, R2=0.775, SER = 0.1377


RelPersInc
How has the inclusion of Educ affected your previous results?
Answer: The coefficient on the population growth rate is roughly half of what it was
originally, while the coefficient on the saving rate has approximately doubled. The
regression R2 has increased significantly.
(c)

Upon checking the regression output, you realize that there are only 86 observations, since
data for Educ is not available for all 104 countries in your sample. Do you have to modify some
of your statements in (d)?

Answer: When comparing results, you should ensure that the sample is identical, since
comparisons are not valid otherwise.
(d)

Brazil has the following values in your sample: RelPersInc = 0.30, n = 0.021, sK = 0.169, Educ =
3.5. Does your equation overpredict or underpredict the relative GDP per worker? What
would happen to this result if Brazil managed to double the average educational attainment?
Answer: The predicted value for Brazil is 0.240. Hence the regression underpredicts Brazils
per capita income. Increasing Educ to 7.0 would result in a predicted per capita
income of 0.43, which is a substantial increase from both its current actual position
and the previously predicted value.

2.3) Una sub-muestra de la encuesta de CASEN 2003 tiene los siguientes datos de salarios
por hora individuales, edad y gnero. Leste en las noticias que por cada peso que gana un
hombre la mujer gana 0,7 pesos. Para testear est hiptesis, primero regresionas ingresos en
una variable binaria que toma el valor 1 si es mujer y 0 si es hombre, y una constante. Estos
son los resultados:

a) Desarrolle un test de diferencias de medias e indique si las diferencias entre los


salarios de hombres y mujeres son estadsticamente significativas. Justique su
eleccin de un test de una o dos colas. Es esta evidencia de discriminacin en contra
de la mujer? Por qu? Es probable que los errores se distribuyan normalmente en
este caso? Si no, presenta esto un problema para hacer el test?
b) Decides incluir como control la edad (en aos). Los resultados son los siguientes:

Testee la significancia de edad y gnero. Por qu crees que la edad juega un rol en la
determinacin de los salarios.

2.3)

A subsample from the Current Population Survey is taken, on weekly earnings of individuals,
their age, and their gender. You have read in the news that women make 70 cents to the $1
that men earn. To test this hypothesis, you first regress earnings on a constant and a binary
variable, which takes on a value of 1 for females and is 0 otherwise. The results were:

= 570.70 - 170.72 Female, R2=0.084, SER = 282.12.


Earn
(9.44) (13.52)
(a)

Perform a difference in means test and indicate whether or not the difference in the mean
salaries is significantly different. Justify your choice of a one-sided or two-sided alternative
test. Are these results evidence enough to argue that there is discrimination against females?
Why or why not? Is it likely that the errors are normally distributed in this case? If not, does
that present a problem to your test?
Answer: The t-statistic is -12.63, while the critical value is 1.64. The difference is therefore
statistically significant. A one-sided alternative was chosen since the claim is that
females make less than males. This represents little evidence of discrimination, since
attributes of males and females have not been included. Given that earnings
distributions are not normally distributed, the errors will also not be distributed

normally, and assuming that they are, results in problematic inference.

(b)

Test for the significance of the age and gender coefficients. Why do you think that age plays a
role in earnings determination?
Answer: The t-statistics are 9.36 for the age coefficient, and -13.00 for the gender coefficient.
Both of these values are greater than the (absolute) critical value from the standard
normal distribution (1.64). Hence you can reject the null hypothesis that these
coefficients are zero. Age proxies on the job training. A better proxy that has been
used frequently in the past is the Mincer experience variable (Age-Education-6).
Obviously this is a better proxy for some subsample of individuals than for others.

2.4)

Demuestre que aunque el estimar MCO en el modelo de regersin lienal simple,es


n

1 =

X Y nXY
i =1
n

i i

X
i =1

2
i

nX

. Si minimizamos la suma de los cuadrados de los residuos en el

modelo de regresin lineal mltiple Yi = 0 + 1 X 1i + 2 X 2 i + ui , los estimadores MCO no


n

son 1 =

X 1iYi nX 1Y
i =1
n

X
i =1

2
1i

nX

y 2 =

i =1
n

2
1

Y nX 2Y

2i i

i =1

, a menos que
2
2i

nX 2

X
i =1

2i

X 1i = 0 .

For the simple linear regression model of Chapter 4, Yi = 0 + 1 X i + ui , the OLS estimator for the
n

= Y X , and =
intercept was
0
1
1

X Y nXY
i =1
n

i i

X
i =1

. Intuitively, the OLS estimators for the


2
i

nX

=Y
X X
regression model Yi = 0 + 1 X 1i + 2 X 2 i + ui might be
0
1 1
2 2
n

=
,
1

X
i =1
n

X
i =1

Y nX 1Y

1i i
2
1i

nX

=
and
2

2
1

X
i =1
n

X
i =1

Y nX 2Y

2i i

. By minimizing the prediction mistakes of the


2
2i

nX 2

regression model with two explanatory variables, show that this cannot be the case.
Answer: To minimize the sum of squared prediction mistakes
n

(Y b
i =1

b1 X 1i b2 X 2 i )2

you need to take the following three derivatives with respect to b0 , b1 and b2 . This
results in

b0

i =1

i =1

(Yi b0 b1 X 1i b2 X 2i )2 = 2 (Yi b0 b1 X 1i b2 X 2i )

n
n
2
(
Y
b
b
X
b
X
)
2
(Yi b0 b1 X 1i b2 X 2 i ) X 1i

i 0 1 1i 2 2i

b1 i =1
i =1
n
n
(Yi b0 b1 X 1i b2 X 2 i ) 2 = 2 (Yi b0 b1 X 1i b2 X 2 i ) X 2 i

b2 i =1
i =1

The OLS estimators are those for which the derivatives are zero. Hence we get
n


X
X ) = 0;
=Y
X
X
2 (Yi
0
1 1i
2 2i
0
1 1
2 2
i =1
n

i =1

i =1

i =1

i =1

i =1

i =1

i =1

i =1


X
X ) X = 0; Y X =
2 (Yi
i 1i 0 nX 1 + 1 X12i + 2 X 2i X 1i
2i
1i
0
1 1i
2

X
X ) X = 0; Y X =
2 (Yi
i 2i 0 nX 2 + 2 X 22i + 1 X 2i X 1i
2i
2i
0
1 1i
2

=Y
X X .
It is clear that the first of these three expressions results in
0
1 1
2 2
However, the second (third) expression involves terms in X 2i ( X 1i ), hence the
n

=
formula cannot be simplified to
1

X 1iYi nX 1Y
i =1
n

X
i =1
n

unless special conditions hold (such as

X
i =1

2
1i

nX

2i

X 1i = 0 ).

2
1

=
(
2

X
i =1
n

X
i =1

Y nX 2Y

2i i

)
2
2i

nX 2

Control #1
Econometra I
Profesores: Tomas Rau y Javiera Vasquez
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda
26 de marzo, 2008
Tiempo Total: 30 Minutos.

1.

Comentes (10 puntos, 5 c/u)

1) La recta de regresion poblacional es igual a la funci


on de regresion poblacional. (beautiful mind)
R. Depende. En general es falso. En particular, si las variables aleatorias tienen una distribuci
on normal
bivariada, la esperanza condicional, i.e. la funci
on de regresion poblacional es una funci
on lineal de X
y por lo tanto es una recta de regresion poblacional. En ese caso es verdadero.
2) La representacion estoc
astica de la funci
on de regresion poblacional implica que E(u|X) = 0. Por otra
parte, la ley de las esperanzas iteradas implica que E(u) = 0. Esto es conveniente puesto que el error
poblacional es cero, en promedio.
R. Verdadero. La representacion est
ocastica de la funci
on de regresion poblacional implica que E(u|X) =
0 puesto que asume que Y = E(Y |X) + u. Al tomar esperanza condicional a los dos lados de la ecuacion tenemos que E(u|X) = 0. Tambien es cierto que la LEI implica que E(u) = 0 puesto que
E[E(u|X)] = E(u) y E[E(0|X)] = 0. Ademas de conveniente es una condicion que impone la representacion estoc
astica (si E(u|X) 6= 0 veremos mas adelante que MCO no sera insesgado ni consistente).

2.

Problema (20 puntos)

Suponga que Ud. dispone de datos agragegados del Simce para colegios de dos comunas de Santiago:
Puente Alto y Recoleta, las cuales seran indexadas por los ndices p y r respectivamente. Los puntajes
ltimo,
promedios fueron Y p = 270 y Y r = 260 con varianzas muestrales dadas por Sp2 = 100 y Sr2 = 72. Por u
los tama
nos muestrales logrados fueron de np = 10 y nr = 12. A pesar de la importante diferencia de 10
puntos, personeros de la comuna de Recoleta insisten que la media en esa comuna sera mas alta que en
Puente Alto. Para ayudar a esclarecer esa diferencia, realice un test de diferencia de medias de la siguiente
hipotesis nula: H0 : p < r ante la alternativa H1 : p r . Asuma que las muestras son aleatorias simples
y utilice un nivel de significancia de = 5 % y luego = 1 %. Que puede inferir de los resultados de las
pruebas de hip
otesis?
R. Simplemente,
10
YpYr
t= q
= 2,5
=
4
Sp2 /np + Sr2 /nr
1

ademas, t5 %,20 = 1,725 y t1 %,20 = 2,528. Por lo tanto, t > t5 %,20 lo cual implica que se rechaza la
hipotesis nula que la media de Recoleta es mayor que la de Puente Alto a un 5 % de significancia. Por otro
lado, t < t1 %,20 , con lo cual no se rechaza la hipotesis nula a un 1 % de significancia. Luego, dado que la
signicancia es la probabilidad de cometer error de tipo I, vemos que se rechaza facilmente para estandares
convencionales (5 %) pero si somos un poco mas exigentes (o aversos al riesgo de cometer dicho error) no
rechazamos la hip
otesis nula. Dado el tama
no muestral y las propiedades asint
oticas de los estimadores, es
sensato usar un nivel de significancia de 5 % y asumir que existe un 5 % de probabilidad de cometer error de
tipo I e igualmente rechazar la hip
otesis nula.
Cuadro 1: Valores Crticos para una distribuci
on t-Student
n-k
1
2
3
4
5
.
.
20
21
22
23

90 %
3.078
1.886
1.638
1.533
1.476

95 %
6.314
2.92
2.353
2.132
2.015

97.50 %
12.71
4.303
3.182
2.776
2.571

99 %
31.82
6.965
4.541
3.747
3.365

99.50 %
63.66
9.925
5.841
4.604
4.032

1.325
1.323
1.321
1.319

1.725
1.721
1.717
1.714

2.086
2.080
2.074
2.069

2.528
2.518
2.508
2.500

2.845
2.831
2.819
2.807

CONTROLES 2

..

. .

Profesores+

Econometria
1 - .
J.M. U.enavenle, A. Otero y J. Vsquez.
- PRIMAVkA 2 0 0 4
.
.,

.I_

.,

<

C ONTROL 2

c
Nor11brc:

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Rut:

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ._.. . . .

control, no puede hacer consultas a los ayudantes, no puedo tener nada m& que l&piz en su escritorio, si contesta con l&piz mina no tiene
derecho a reclamo. Contestar ~610 en el espacio disponible
Pregunta 1: (30 puntos) En el modelo de regresibn lineal de una variable explicativa si la
variable independiente -Y no rara, entonces el estimador ,/$ ser igual al verdadero valor pobla-

....................................................................................................................
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..*.....................................
Pregunta 2: (70 puntos) En un modelo de regresin lineal con k variables explicativas,
Y = X/~+U. Demuestre que el estimador mnimos cuadrados ordinarios cumple con la condicin
de minimizar la suma de errores al cuadrado.
.$M,

N\J j& c
(hYn)
)JJM.=

.
YY

CQQ

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Control 2

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz
en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el
espacio disponible
Pregunta 1: (30 puntos) En el contexto de un Modelo de Regresin Lineal (MRL), la recta de regresin pasa por los valores promedios de la variable dependiente. Comente.
Este se cumple siempre que el modelo de regresin incluya un trmino constante, es la constante
justamente quien cumple el rol de asegurar que el promedio muestral del valor estimado de Y
se iguale con el promedio muestral de los valores observados
P de Y . Si el modelo incluye trmino
constante por condicin de primer orden se cumple que
ui = 0, y que el valor estimado de
la constante (1 ) es 1 = Y 2 X, de lo que deduce inmediatamente que la recta de regresin
pasa por los valores promedio: Y = 1 + 2 X. Por lo tanto, esta afirmacin es verdadera slo
si estamos hablando de un modelo que incluye trmino constante.
Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresin Lineal Simple:
Yi = 1 + 2 Xi + ui

para

i = 1, ..., N

Adems posee la siguiente informacin muestral de X e Y:


Y
X

2
0

5
10

6
18

7
20

a. Obtenga el estimador Mnimos Cuadrados Ordinarios de 1 y 2 .


b. Determine 2 , pero en un modelo sin constante. Cmo cambia con respecto al obtenido en
a.?
c. Cales son las consecuencias de no incorporar el trmino constante en la especificacin?
R:
a. Los estimadores MCO de 1 y 2 son:
1
2

= Y 2 X
P4
i=1 (Xi X) (Yi Y )
=
P4
2
i=1 (Xi X)

Utilizando la informacin muestral entregada tenemos:


1

Promedio
Suma

Y
2
5
6
7
5

X
0
10
18
20
12

Y Y
-3
0
1
2

X X
-12
-2
6
8

(Y Y )(X X)
36
0
6
16

(X X)2
144
4
36
64

58

248

De esta forma,
2

58
= 0,233870968
248
5 0,233870968 12 = 2,193548387

Tambin se puede obtener los estimadores de 1 y 2 utilizando la forma matricial del estimador
MCO:
= (X 0 X)1 X 0 Y
utilizando la informacin disponible:

1
4 48
20
2,193548387

=
=
=
48 824
298
0,233870968
2
(40 puntos)
b. El estimador MCO de 2 es un modelo sin constante (Y = 2 X + u) es1 :
P4
i=1 Xi Yi

2 = P
4
2
i=1 Xi
Como el modelo no incluye constante, este estimador NO queda expresado en desvos con
respecto a la media. Utilizando la informacin disponible:

Promedio
Suma
1 Este

Y
2
5
6
7
5

X
0
10
18
20
12

Y X
0
50
108
140

X2
0
100
324
400

298

824

se obtiene de minimizar la suma de los errores al cuadrado con respecto a 2 :


mn

4
X
(Yi 2 Xi )2

i=1

CP O :

X
SE(2 )
=
2 (Yi 2 Xi )(Xi ) = 0

2
i=1

4
X
(Xi Yi + 2 Xi2 ) = 0
i=1

2 =

P4

i=1
P
4

X i Yi

i=1

Xi2

Por lo tanto,
2 = 0,361650485
Como podemos apreciar el valor estimado para 2 , es mayor que el en caso donde se incluye la
constante, esto porque al ser positiva la constante y omitirla se genera un sesgo hacia arriba del
parmetro de pendiente. Esto se puede apreciar grficamente en la siguiente figura, que dibuja
las recta de regresin estimadas de un modelo con y sin constante:

Modelo con
constante
Modelo sin
constante

Al ser la constante positiva (cuando la estimamos), si la obligamos a ser cero (estimacin si


constante), la pendiente de la recta de regresin aumenta para lograr minimizar la suma de los
errores al cuadrado.
(20 puntos)
c. Las consecuencias de estimar un modelo sin constante son:
Sesgo en el parmetro de pendiente (se omite una variable, la constante)
Pn
No se garantiza que i=1 u
i = 0
No se garantiza que la recta de regresin pase por los valores promedios de las variables
observadas, no se garantiza que el promedio estimado de la variable dependiente sea igual
al promedio observado de dicha variable.
(10 puntos)

Econometra I
Profesores: A. Otero y J. Vsquez.
Primavera 2004
Pauta Control 2
Pregunta 1: (30 puntos) En un modelo de regresin lineal simple: Yi = 1 +2 Xi +ui , mientras
menor es la varianza de los errores estimados y mientras mayor es la varianza muestral de la
variable explicativa, el estimador MCO de 2 es menos preciso. Comente.
Recordemos que la varianza del estimador MCO de 2 es:

2
=
2
i=1 (Xi X)

V ar(2 ) = Pn

n
n

2
=
2
n Vd
ar(X)
i=1 (Xi X)

Pn

donde Vd
ar(X) es el estimador muestral de la varianza de X. De esta forma, a medida que
aumenta la varianza de X y disminuye la varianza de u
, disminuye la varianza de 2 y el estimador es ms preciso. Con lo cual el comente es falso.
Pregunta 2: (70 puntos) Demuestre que en un modelo de regresin lineal mltiple con k
regresores, el estimador insesgado de la varianza del error es:
Pn
u
2

e2 = i=1 i
nk
Primero, el vector de residuos estimados puede escribirse en funcin de los residuos poblacionales de la siguiente forma:
u
= Mu
Donde M = In X(X 0 X)1 X 0 , matriz de dimensin nxn idempotente y que satisface M X = 0
E(
u0 u
) = E(u0 M 0 M u) = E(u0 M u), por las caractersticas de la matriz M.
Como u0 M u es un escalar E(u0 M u) = E[T r(u0 M u)]
Recordemos que la traza es un operador lineal y antes de introducir la esperanza podemos,
por propiedades de la traza, cambiar el orden de las matrices.
E(u0 M u) = E[T r(u0 M u) = E[tr(M uu0 )] = T r[E(M uu0 )] = T r[M E(uu0 )] = T r[M u2 In ] =
u2 T r(M ) = u2 [T r(In ) T r[X(X 0 X)1 X 0 ])] = u2 (n k)
Por lo tanto como E(
u0 u
) = u2 (n k) para que la suma de los errores al cuadrado sea un
estimador insesgado de u2 debemos dividir por (n k).

u2 =

u
0 u

nk

E(
u2 ) =

E(
u0 u
)
nk

2
(nk)u
nk

= u2

Econometra I
Profesores:

Emerson Melo
Rodrigo Montero
Javiera Vsquez

Primavera 2005
Pauta Control 2
Pregunta 1: (30 puntos) Si un estimador es insesgado, significa que no existe error de estimacin. Comente.
Falso, al tratar de aproximar un parmetro poblacional a partir de una muestra siempre
existe un error de estimacin, es inevitable debido a las fluctuaciones muestrales (Ver Figura).
Lo que sucede si es el estimador es insesgado es que este error de estimacin en promedio es
igual a cero y por lo tanto, en valor esperado el estimador es igual a su valor poblacional.

Figura 5: Rectas de Regresin muestral y poblacional

Pregunta 2: (70 puntos) Sea el siguiente modelo de regresin lineal mltiple:


Yi = 1 + 2 X2i + 3 X3i + ui
Ud. dispone de la siguiente informacin sobre este modelo:

10 10 5
30
X 0 X = 10 56 63 X 0 Y = 77
5 63 115
56
a) (30 puntos) Encuentre la matriz (XX) y (XY) del modelo en desvos con respecto a la media.
Las matrices (XX) y (XY) del modelo original tienen la siguiente forma generalizada:

P
P
n
X
X
Y
2i
3i
i
P
P 2
P
P
X2i X3i X 0 Y = P Yi X2i
X 0 X = P X2i P X2i
P
2
X3i
X2i X3i
X3i
Yi X3i

y las matrices (XX) y (XY) del modelo en desvos con respecto a la media tiene la
siguiente forma generalizada:

P
P
(XP
(X2i X2 )2
(X2i X2 )(Yi Y )
2i X2 )(X3i X3 )
0
P
X 0X = P
X
Y
=
(X2i X2 )(X3i X3 )
(X3i X3 )2
(X3i X3 )(Yi Y )
Debemos determinar los valores al interior de estas ltimas matrices a partir de la informacin entregada:
P
Yi
30
Y =
=
=3
10
Pn
X2i
10
X2 =
=
=1
10
Pn
X3i
5
X3 =
=
= 0,5
n
10
X
X
2
2
(X2i X2 )2 =
X2i
n X2 = 56 10 1 = 46
X
X
2
2
X3i
n X3 = 115 10 (0,5)2 = 112,5
(X3i X3 )2 =
X
X
(X2i X2 )(X3i X3 ) =
X2i X3i nX2 X3 = 63 10 1 (0,5) = 68
X
(X3i X3 )(X2i X2 ) = 68
X
X
(X2i X2 )(Yi Y ) =
X2i Yi nX2 Y = 77 10 1 3 = 47
X
X
(X3i X3 )(Yi Y ) =
X3i Yi nX3 Y = 56 10 (0,5) 3 = 71
Con estos valores podemos computar ambas matrices:

46
68
47
X 0X =
X 0Y =
68 112,5
71
b) (30 puntos) Encuentre los estimadores MCO de 2 y 3

2
3

46
68
68 112,5

2
3

47
71

1
112,5
68
5175 4624

1
459,5
=
70
551

0,834
=
0,127
=

68
46

c) (10 puntos) Recupere el estimador MCO de 1


1
1

= Y 2 X2 3 X3
= 3 0,834 1 0,127 (0,5) = 2,23

47
71

Econometra I

Verano 2005-2006

Profesor

Jaime Ruiz-Tagle V.

Ayudante

Roberto Jaramillo M.

Control 2 - Pauta de Correccin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.
Pregunta 1 (30 puntos)
(a) Explique verbalmente en qu consiste el mtodo de Mnimos Cuadrados Ordinarios.

El mtodo MCO busca escoger los coecientes de regresin de tal manera que
la funcin de regresin muestral sea lo ms cercana a la funcin de regresin
poblacional, lo que esquivale a decir que trata de que los errores sean lo menor
posible. Sin embargo, si tomamos slo la minimizacin de la suma de los errores,
puede darse que estos se compensen entre ellos, dando que este valor sea muy
bajo, pero que el modelo estimado no sea bueno. Para solucionar este problema,
se minimiza la suma de los errores al cuadrado, lo que entrega una mayor ponderacin a los errores ms grandes.

(b) Enumere y explique 4 de los 9 supuestos detrs del mtodo de Mnimos Cuadrados Ordinarios.

(4 puntos cada uno, la explicacin est en los apuntes).


1.
2.
3.
4.
5.
6.

El modelo de regresin es lineal


Los valores de X son jos
El valor medio del error ui es igual a cero
Homocedasticidad de ui
No existe autocorrelacin entre los errores
La convarianza entre ui y Xi es cero
1

7. El nmero de observaciones n debe ser mayor que el nmero de parmetros


por estimar
8. Variabilidad en los valores de X
9. El modelo de regresin est correctamente especicado
Pregunta 2 (30 puntos)
(a) Explique en qu consiste el sesgo en la estimacin de un parmetro.

El sesgo en un parmetro corresponde a la diferencia entre el valor esperado del


estimador del parmetro y el valor verdadero del parmetro. Por lo tanto, esta
. Si este es insesgado, entonces E[]
= .
medida se conoce como E[]

(b) Considere un modelo de 2 variables explicativas como


(1)

Yi = 0 + 1 Xi + ui .

Py x
Px

Muestre detalladamente que el estimador de Mnimos Cuadrados Ordinarios (MCO)


de

1 =

i i
2
i

aritmtica de

es insesgado. (Recuerde que

,
xi = Xi X

donde

es la media

Xi ).

Primero hay que obtener la especicacin de este modelo cuando se dene en


desvos con respecto a la media. Para esto, podemos obtener la media de (1)
Yi = 0 + 1 Xi + ui
X
X
X
Yi =
0 +
1 Xi +
ui
P
P
P
P
Yi
0
1 Xi
ui
=
+
+
n
n
n
n}
| {z

=0

Y = 0 + 1 X

(2)

Ahora restndole a (1) lo obtenido en (2)


+ ui
Yi Y = 1 (Xi X)
yi = 1 xi + ui

(3)

de donde se obtiene el estimador de MCO para 1 . Remplazamos en la frmula


el valor obtenido en (3):

P
yx
P i 2i
x
P i
xi (1 xi + ui )
P 2
=
x
P 2 iP
x i ui
x
= 1 P i2 + P 2
x
xi
Pi
xi ui
= 1 + P 2
xi

1 =

(4)

Ahora aplicando valor esperado a (4):


P


x
u
i
i
E[1 ] = E 1 + P 2
x
Pi

x i ui
= E[1 ] + E P 2
xi
=0

P z }| {
E(xi ui )
= 1 + P 2
xi
E[1 ] = 1

(5)

Lo que signica que 1 es insesgado.

Universidad de Chile
Facultad de Economia y Negocios
Econometra I
Otoo 2006
Pauta Control 2
Profesoras: Claudia Sanhueza y Javiera Vsquez.
Pregunta 1: (70 puntos) Un modelo de regresion multiple incluye dos regresores: yi = 0 + 1 x1i + 2 x2i + i .
En este modelo se cumplen todos los supuestos clasicos vistos en clases y
ademas se cumple que la E(x1i x2i ) = 12 .
Suponga que un investigador estima el modelo sin considerar u omitiendo
b , el estimador MCO de , un estimador insesgado?.
la variable x2i . Es
1
1
Demuestre su respuesta. Ayuda: El modelo que estima este investigador tiene
un error estocastico ui = 2 x2i + i .
(10 puntos) Usando la ayuda. El modelo que estima el investigador es entonces:
yi = 0 + 1 x1i + ui , donde ui = 2 x2i + i
b1 expresado en desvios c/r a la media es:
(10 puntos) Por lo tanto
Xn
(x1i x1 ) (yi y)
i=1
b =

Xn
1
(x1i x1 )2
i=1

(10 puntos) Para ver si este estimador insesgado tomemos esperanza:


Xn


(x1i x1 ) (yi y)
i=1
b

= E
E
Xn
1
(x1i x1 )2
Xn i=1

(x1i x1 ) [ 1 (x1i x1 ) + (ui u)]


i=1

= E
Xn
2
(x1i x1 )
i=1
Xn

Xn
2
1
(x1i x1 ) +
(x1i x1 ) (ui u)
i=1
i=1

= E
Xn
(x1i x1 )2
i=1

Xn
(x1i x1 ) (ui u)
i=1

= E 1 +
Xn
(x1i x1 )2
i=1

(20 puntos) Pero ui = 2 x2i + i , en desvios c/r a la media es ui u =


2 (x2i x2 ) + i , ya que = 0, entonces:

Xn

(x1i x1 ) (ui u)
i=1
b

E
= E 1 +
Xn
1
(x1i x1 )2
i=1

Xn
(x1i x1 ) [ 2 (x2i x2 ) + i ]
i=1

= E 1 +
Xn
(x1i x1 )2
i=1

Xn
Xn
(x1i x1 ) (x2i x2 )
(x1i x1 ) i
i=1

= E 1 + 2
+ Xi=1
Xn
n
(x1i x1 )2
(x1i x1 )2
i=1

i=1

(10 puntos) Asumiendo los supestos clasicos del modelo original se cumplen
y tenemos una muestra suficientemente grande:

b +
E
1
1
2
a

= 1 + 2

12
V ar (x1 )

12
+0
V ar (x1 )

b1 el estimador del modelo que omite la variable


(10 puntos) Por lo tanto
x2 cuando esta esta correlacionada con x1 , es sesgado. (Esto no tienen puntos:
b1 es insesgado).
Notar que si 12 = 0 entonces
2

Pregunta 2: (30 puntos) Un R2 y R alto no significa que no existe sesgo


de variables omitida. Comente.
2

(10 puntos) El R2 y R nos dice si las variables explicativas includias en


el modelo "explican" la variable dependiente, las variables explicativas, son entonces buenos predictores de la variable dependiente.
(20 puntos) Sin embargo, puedo estar incluyendo variables no relevantes
desde el punto de vista teorico, o estar no observando variables que esten correlacionadas con algunas de las variables explicativas, e igual tener un alto R2
2
y R . O sea, puedo estar estimando parametros sesgados y tener un alto R2 y
2
2
R . Un sesgo de variable omitida puede darse con cualquier nivel de R2 y R .

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 2

Semestre: Primavera 2006


Profesores: Jos Miguel Benavente, Rodrigo Montero
Tiempo de duracin: 20 minutos
No hay preguntas de ningn tipo para los ayudantes

Comente (6 puntos)
Mientras ms variables independientes se incluyan en el modelo, ms precisas
sern las estimaciones, pues se utilizar una mayor cantidad de informacin.
Respuesta. Falso. A medida que se incorporan ms regresores en la estimacin
se va perdiendo precisin en las estimacin. Esta situacin se aprecia claramente
en el diagrama de Ballentine Venn, que muestr cmo al incorporar regresores
adicionales acarrea una prdida de informacin para hacer la estimacin (rea
roja). Tericamente sera posible que no se produjera esta prdida si es que el
regresor adicional es completamente ortogonal a los ya incorporados. A modo de
ejemplo, considere el siguiente modelo:
Yi = 1 + 2 X2i + 3 X3i + i
La varianza para 2 viene dada por:
V ar(2 ) = P

2
2
x22 (1 r23
)

donde r23 corresponde al coeficiente de correlacin entre X2 y X3 (la variable en


minsculas indica que se encuentra en desviacin respecto a su media). Por lo
tanto, al aumentar la correlacin entre ambas variables, la varianza del estimador
crece.
1

Ejercicio (14 puntos)


Considere el siguiente modelo expresado en desvos respecto a la media:
yi = 2 x2i + 3 x3i + i
Se tiene adems, la siguiente informacin:
X
X
493 X 2
y2 =
x2 = 30
x23 = 3
3
X
X
X
x2 y = 30
x3 y = 20
x2 x3 = 0
1. Calcule los estimadores para 2 y 3 (8 puntos)
Respuesta. Como las variables X2 y X3 son ortogonales (

x2 x3 = 0),

entonces, cada estimador se obtiene igual que en el caso del modelo de


regresin lineal de dos variables:
P
x2 y
30
2 = P 2 =
=1
x2
30
P
x3 y
20
3 = P 2 =
x3
3
2. Calcule el R2 del modelo estimado (6 puntos)
Respuesta. Se sabe que:
yi = 2 x2i + 3 x3i +
i
Elevando al cuadrado y aplicando sumatoria:
X
X
yi2 =
(2 x2i + 3 x3i +
i )2
Dado que las variables independientes son ortogonales a los errores estimados, y adems, para este caso son ortogonales entre s, entonces:
P
P
P 2
22 x22i + 32 x23i

P 2
1=
+ P 2i
yi
yi
Es decir:

P 2
P
P

i
22 x22i + 32 x23i
490
P 2
R =1 P 2 =
=
yi
yi
493
2

Departamento de Economa

Universidad de Chile

Econometra I
Control 2
5 de septiembre, Primavera 2007
Miguel Benavente y Rodrigo Montero
Profesores: Jose
Ayudantes: Rodrigo Bravo,Felipe Ros, Loreto Silva

1. Respecto al coeficiente de determinacion R2 (33 puntos):


a. Defnalo (9 puntos).
Medida de bondad de ajuste que indica que parte de la variabilidad de las y (variable dependiente) es explicada por la variabilidad de las x (variables independientes)
R2

ESS
T SS

(1)

b. Que se necesita para que este se pueda interpretar? (8 puntos) Se necesita que el modelo a
estimar posea una constante, as, el coeficiente de determinaci
on se encontrar
a entre 0 y 1.
Si no incluye constante, se sale de aquel rango y pierde sentido la interpretaci
on
c. Explique las desventajas que presenta (8 puntos) La principal desventaja es que R2 siempre
aumentar
a o al menos se mantendr
a igual al aumentar el numero de regresores. Se puede
llegar, entonces, a altos R2 con regresores que practicamente no explican el modelo
d. Que otro indicador alternativo pudiera utilizarse, y por que sera mas conveniente? (8 puntos)
Un indicador alternativo, dado lo anterior, es el R2 ajustado, el cual castiga la inclusion de
una variable poco relevante para el modelo, considerando los grados de liberdad restantes por
sumar variables explicativas. Con esto, la medida de bondad del ajuste incluso puede disminuir
2. Comente en no m
as de 10 lneas la siguiente aseveracion: Para que el estimador b de mnimos cuadrados ordinarios sea MELI, se necesita que los errores tengan una distribucion N
(0, 2 )(33puntos)
Falso. Basandonos en la Clase 6, para que un estimador de minimos cuadrados ordinarios sea
MELI, este debe ser Insesgado, un modelo lineal, y el mejor en el sentido de que cualquier otro
estimador con estas caractersticas tendr
a una varianza mayor. Si bien es cierto que es importante
que la esperanza de los errores sea cero tanto para estimar MCO como para el insesgamiento, esta
no es una propiedad exclusiva de la distribuci
on normal. Lo mismo ocurre para la homocedasticidad.
Ambas cosas pueden ocurrir sin distribuirse normalmente. Incluso, estas dos caracteristicas son
supuestos del metodo MCO, donde, en ningun supuesto se indica normalidad en los errores.
3. Suponga el siguiente modelo (34 puntos):
N(0, 2 )

yi = 0 + 1 xi + i

2 = 1

x0 x =
=

1
2

0,5
1


2
6


Testee que cada par


ametro individualmente es cero. En que caso se aceptara o rechazara la
hipotesis nula?
1

Departamento de Economa

Universidad de Chile

Plantear hipotesis:
H0 : 0 = 0

0 6= 0

H0 : 1 = 0

1 6= 0

b debemos invertir la matriz XX y luego, multiplicarla por


Para encontrar la V ar(),
e2
=
e2 (X 0 X)1


1
6 2

e2 (X 0 X)1 = 1 (
)
2 1
64


3 1
b = 1
V ar()
1 21
b
V ar()

Por lo tanto, tenemos:


V ar(b0 ) = 3

V ar(b1 ) =

1
2

con lo cual podemos hacer los test t:


t0 =

0,5

tnk

t1 = 1 1 tnk
2

La hip
otesis nula se rechazar
a cuando ttabla < tcalculado

Pauta Control #2
Econometra I
Profesores: Tomas Rau y Javiera Vasquez
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda
9 de abril, 2008
Tiempo Total: 30 Minutos.

1.

Comentes (10 puntos, 5 c/u)

1) En el modelo de k variables, el estimador MCO existe si, y solo si, la matriz X tiene inversa. (5 puntos)
R. Falso. En el caso general n > k solo se requiere que (X X)1 exista y no que X tenga inversa
(recuerde que solo las matrices cuadradas pueden tener inversa y Xnk ), luego en general el comente
es falso. Ahora, si k = n la matriz X es cuadrada y se requiere que (X X)1 = X 1 (X )1 y por lo
tanto necesitamos que X tenga inversa. S
olo en este caso particular el comente sera verdadero.
2) El modelo de regresion en desviaciones con respecto a la media no es muy u
til puesto que no podemos
estimar el intercepto. (5 puntos)
R. Falso, siempre se puede recuperar el intercepto. Por ejemplo, si la RRP es Yi = 1 + 2 Xi + ui , la
RRP en desviaci
on con respecto a la media es yi = 2 xi + u y podemos estimar 2 . Pero el intercepto
siempre se puede recuerar de la siguiente manera: 1 = Y 2 X.

2.

Problema (20 puntos)

Sea el modelo de regresion de dos variables: yi = 1 + 2 xi + ui , donde yi es la variable dependiente, xi es


la variable independiente, 1 , 2 son los par
ametros a estimar y ui es el error poblacional con media cero
y varianza desconocida 2 (suponga que se cumplen todos los supuestos vistos en clases). Suponga que Ud.
tiene una muestra aleatoria simple de yi , xi de tama
no n.
i) Usando c
alculo, obtenga el estimador MCO de 2 . (10 puntos)
R. Como vimos en la clase 5, si escribimos el modelo en desviacion con respecto a la media el problema
es mas sencillo:
mn SE(2 ) =
2

(yi 2 xi )2

y las condiciones de primer orden est


an dadas por
X
SE(2 )
=
2(yi 2 xi )xi = 0
2
1

luego

P
yi xi
2 = P 2
xi

ii) Obtenga la varianza de 2 y, sin necesidad de demostrar matematicamente, explique que ocurre si
n = 2. (10 puntos)
R. La varianza se puede obtener f
acilmente de la expresion que encontramos en (i) (ver clase 5)
E(2 2 )2 = E
luego

2
P
xi ui
P 2
xi

2
var(2 ) = P 2
xi

2
Si n = 2 tenemos que
P no2 se puede hacer inferencia en este caso puesto que no existe estimador de
2
(recuerde que
= u
/(n 2)).

CONTROLES 3

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Control 3

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz
en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el
espacio disponible
Pregunta 1: (30 puntos) Es mejor predecir un valor puntual de y 0 que el valor esperado
E(y 0 /x0 ), ya que uno hace lo primero con mayor precisin. Comente.
Falso, al tratar de predecir un valor puntal de y (y 0 ), el error de prediccin esta compuesto
de dos trminos, uno asociado a las diferencias entre el estimador de los parmetros y el valor
+ u.
poblacional de ellos y otro correspondiente al error intrnseco de y, es decir: e = x0 ( )
Sin embargo, cuando se predice simplemente el valor promedio condicional de y, se elimina del
error de prediccin, el error asociado a la desviacin de una observacin particular de y de su
La
valor promedio condicional, es decir, el error de prediccin en este caso es: ee = x0 ( ).
2
0
1 00
varianza del error de prediccin en el primer caso es: [1 + x (XX) x ], y en el segundo
0
caso es simplemente: 2 x0 (XX)1 x0 . Por lo tanto, la prediccin en el primer caso es menos
precisa que en el segundo.
Pregunta 2: (70 puntos) Con la informacin disponible sobre producto bruto real(Y), dias
laborales (L) y capital (K) para el sector agricola de Taiwan (1958-1972), se estima un modelo
de regresin lineal con las variables en logaritmos, de la siguiente forma:
ln(y) = 0 + 1 ln(L) + 2 ln(k) + u
A continuacin se presenta la estimacin realizada en Eviews:
Dependent Variable: LY
Method: Least Squares
Date: 12/31/04 Time: 13:57
Sample: 1958 1972
Included observations: 15
LY=C(1)+C(2)*LL+C(3)*LK

C(1)
C(2)
C(3)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

Coefficient

Std. Error

t-Statistic

Prob.

-3.338455
1.498767
0.489858

2.449508
0.539803
0.102043

-1.362908
2.776509
4.800487

0.1979
0.0168
0.0004

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

0.074810
0.067158
19.28156

10.09653
0.207914
-2.170875
-2.029265
0.891083

donde:
- S.D dependent var (sy ) es la desviacin estndar de la variable dependiente, la que se construye
de la siguiente forma:
s
PN
2
i=1 (yi y)
sy =
N 1
qP 2
u
- S.E. of regression es el error estndar de la regresin ( = N ki ).
- Sum squared resid corresponde a la suma de los errores al cuadrado.
Adems se estima el siguiente modelo restringido:
ln(y) = 0 + ln(L) + ln(k) + u
Dependent Variable: LY
Method: Least Squares
Date: 12/31/04 Time: 13:58
Sample: 1958 1972
Included observations: 15
LY=C(1)+LL+LK

C(1)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

Coefficient

Std. Error

t-Statistic

-5.673589

0.036429

-155.7450

0.539520
0.539520
0.141088
0.278681
8.608959

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

Prob.
0.0000
10.09653
0.207914
-1.014528
-0.967325
0.250752

a) Testee la hiptesis de que todas las pendientes son igual a cero.


Recordemos que el Test-F de significancia global del modelo o que todas las pendientes son igual a cero, se puede escribir en funcin del R2 de la siguiente forma:
F =

R2 /(k 1)
Fk1,nk
(1 R2 )/(n k)

En el tabla de regresin no se presenta la informacin del R2 , por lo tanto se debe construir.


Como el modelo incluye constante:
R2 = 1

RSS
T SS

La suma de los errores al cuadrado (RSS) se puede obtener directamente de la tabla (Sum
squared resid), el valor es de 0.067158.
2

La suma total de cuadrados se puede obtener de la desviacin estndar de la variable


dependiente (S.D dependent var) reportada en la tabla:
s
PN
2
i=1 (yi y)
= 0,207914
sy =
N 1
s
PN
2
i=1 (yi y)
= 0,207914
15 1
N
X

(yi y)2

= (0,207914)2 14

(yi y)2

= 0,60519524

i=1
N
X
i=1

De esta forma, el R2 es:


R2 = 1

0,067158
= 0,889030
0,60519524

El estadstico F calculado para la hiptesis nula de que todas las pendientes son igual a
cero es:
F =

0,889030/2
= 48,06885
(1 0,889030)/12

Si lo comparamos con el valor F de tabla a un 95 % de confianza con 2 grados de libertad en


el numerador y 12 grados de libertad en el denominador, que es igual a 3.89, la conclusin
es que se rechaza la hiptesis nula de que las pendientes del modelo son iguales a cero.
b) Testee la Hiptesis de que las pendientes suman uno.
Se puede construir un test-t con la informacin de las desviacin estndar de los parmetros y la informacin de covarianza entre los parmetros:
=

tc

2 + 3 1

tc

V ar(2 ) + V ar(3 ) + 2Cov(2 , 3 )

t12

1,498767 + 0,489858 1

(0,539803)2 + (0,102043)2 + 2 (0,038427)


0,988625
= 2,08445441
0,47428478

Si lo comparamos con el valor de tabla de la distribucin t a un 95 % de confianza y con 12


grados de libertad, que es igual a 2.179, se concluye que no se puede rechazar la hiptesis
nula de que las pendientes sumen uno.
Tambin se puede calcular el cuadrado del estadstico t, el que corresponde al estadstico F , y se debe comparar con un valor de tabla a un 95 % de confianza con un grado de
libertad en el numerador y 12 grados de libertad en el denominador, el que es igual a 4.75.
Como el cuadrado del estadstico t calculado es 4.34495017, se concluye exactamente o
mismo, no se puede rechazar la nula de que las pendientes sumen uno.
3

c) Construya un intervalo de confianza para 1 y 2 .


La forma general del intervalo de confianza es:

q
q
P i t1/2,nk V ar(i ) i i + t1/2,nk V ar(i ) = 1
a un 95 % de confianza, t0,975,12 = 2,179.
De esta forma, el intervalo de confianza de 1 es:
P [1,498767 2,179 0,539803 1 1,498767 + 2,179 0,539803] = 0,95
P [0,32253626 1 2,67499774] = 0,95
Por otra parte, el intervalo de confianza de 2 es:
P [0,489858 2,179 0,102043 2 0,489858 + 2,179 0,102043] = 0,95
P [0,2675063 2 0,7122097] = 0,95

Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 3
Pregunta 1: (30 puntos) En una prueba de hiptesis cualquiera, la zona de rechazo nunca
cambia al cambiar la hiptesis nula. Comente.
Falso, cuando hacemos un test de hiptesis de la forma H0 : R = r para ver si rechazamos o
no la hiptesis nula debemos comparar el valor calculado del estadstico con el valor de tabla
de una distribucin F con q grados de libertad en el numerador y n k grados de libertad en
el denominador. Si bien el valor de tabla de la distribucin F no cambia con r (los valores que
testeamos bajo la hiptesis nula) si cambia con el nmero de hiptesis que estemos testeando (q).
Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresin Lineal Simple:
Yi = 1 + 2 Xi + ui

para i = 1, ..., N

Adems posee la siguiente informacin muestral de X e Y:


Y
X

4
0

10
20

12
36

14
40

a. Obtenga el estimador Mnimos Cuadrados Ordinarios de 1 y 2 .

1
4
96
40
4,3871

=
=
=
96 3296
1192
0,233870968
2
b. Testee la hiptesis nula conjunta de que 1 = 4,5 y 2 = 0,5.
Para testear H0 : 1 = 4,5, 1 = 0,5, utilizamos el siguiente estadstico F:
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
F(q,nk)
u
0 u
/(n k)
lo que se puede reescibir de la siguiente forma:
0 ]1 (R r)]/q F(q,nk)
[(R r)0 [RVd
ar()R
donde:

=
Vd
ar()
e2 (X 0 X)1

4,3871 4,5
0,1129
R r =
=
y
0,233870968 0,5
0,2661

1,74
0,83
0,024
0,724 0,021
=
=
0,024 0,001
0,021 0,0009
2

De esta forma, el valor calculado del estadstico

0,724
0,1129 0,2661
Fc =
0,021

4,59
0,1129 0,2661
=
110,22
1

F es:
1

0,1129
/2
0,2661

110,22
0,1129
/2 = 137,32
3784,29
0,2661
0,021
0,0009

El valor de tabla de una distribucin F con dos grados de libertad en el numerador y dos
grados de libertad en el denominador es 19, con lo cual se rechaza la hiptesis nula.
c. Determine 2 , pero en un modelo sin constante. Cmo cambia con respecto al obtenido en
a.? El estimador MCO de 2 es un modelo sin constante (Y = 2 X + u) es1 :
2 =

P4
i=1
P
4

Xi Yi

i=1

Xi2

Como el modelo no incluye constante, este estimador NO queda expresado en desvos con
respecto a la media. Utilizando la informacin disponible:
Y
4
10
12
14

X
0
20
36
40
12

Promedio
Suma

Y X
0
200
432
560

X2
0
400
1296
1600

1192

3296

Por lo tanto,
2 = 0,36165049
Como podemos apreciar el valor estimado para 2 , es mayor que el en caso donde se incluye
la constante, esto porque al ser positiva la constante y omitirla se genera un sesgo hacia
arriba del parmetro de pendiente. Esto se puede apreciar grficamente en la siguiente
figura, que dibuja las recta de regresin estimadas de un modelo con y sin constante:
1 Este

se obtiene de minimizar la suma de los errores al cuadrado con respecto a 2 :


mn

4
X
(Yi 2 Xi )2

i=1

CP O :

X
SE(2 )
=
2 (Yi 2 Xi )(Xi ) = 0

2
i=1

4
X
(Xi Yi + 2 Xi2 ) = 0
i=1

2 =

P4

i=1
P
4

X i Yi

i=1

Xi2

Modelo con
constante
Modelo sin
constante

Al ser la constante positiva (cuando la estimamos), si la obligamos a ser cero (estimacin


si constante), la pendiente de la recta de regresin aumenta para lograr minimizar la suma
de los errores al cuadrado.

Econometra I
Profesores:

Emerson Melo
Rodrigo Montero
Javiera Vsquez

Primavera 2005
Control 3
Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes,
no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho
a reclamo. Contestar slo en el espacio disponible
Pregunta 1:(30 puntos) El mtodo de mnimos cuadrados descansa fuertemente en el supuesto
de Normalidad del trmino de error. Luego el estimador M.C.O, = (X 0 X)1 X 0 Y se obtiene
solo bajo errores normales.
Falso. El supuesto de Normalidad lo necesitamos para conocer la distribucin de los estimadores
y de esta forma poder derivar los test t y F. Por otra parte la formula = (X 0 X)1 X 0 Y resulta
simplemente de plantear el problema de optimizacin de mnimos cuadrados, el cual no depende
del supuesto de Normalidad de los errores.
Pregunta 2: (70 puntos) Sea el siguiente modelo de regresin lineal mltiple:
Yi = 0 + 1 X1i + 2 X2i + 3 X3i + ui
Los errores tienen el siguiente comportamiento u N (0, 2 I). Usted dispone de la siguiente
informacin sobre los parmetros estimados de este modelo.

0,02
2,5

= 0,45 0,35
)
= 1,2
V(
0,5 0,21 0,01

0,85
0,2 0,25 0,09 0,5
0,02
Donde el tamao muestral es de N=150
a) (30 puntos)Plantee matricialmente el estadstico asociado a la hipotess1 :
H0

: 0 = 1
1 + 2 = 2
3 = 1,5

Sabemos que dado que tenemos ms de una restriccin lineal, el estadstico que corresponde
es una F con la forma:
0 ]1 (R r) F(q,nk)
(R r)0 [RVd
ar()R
1 Slo

deje el estadistico expresado, no es necesario realizar el calculo.

Luego las matrices involucradas son:

1 0
R= 0 1
0 0

0
1
0 y r= 2
1
1, 5

0
1
0

Luego a partir de los datos del enunciado se puede construir el test F, ya que planteamos
las matrices que estn involucradas en el conjunto de restricciones lineales.
b) (30 puntos) Ahora testee la siguiente hiptesis.(Ind: Asuma un valor de tabla de 1.96 que
corresponde a un 95 % de confianza. )
H0

1 + 2 = 0,5

Con los datos del problema puede rechazar la hiptesis nula?


Como aqu solo tenemos una restriccin lineal, es posible usar un test t.2 A partir de lo
anterior tenemos:
1 + 2 0, 5
1 + 2 0, 5
tc = q
=q
V (1 + 2 )
V (1 ) + V (2 ) + 2Cov(1 , 2 )
Reemplazando los datos del enunciado, se obtiene:
tc =

1, 2 + 0, 85 0, 5
= 1, 76
0, 35+, 01 + 2 0, 21

Usando la indicacin del enunciado, no es posible rechazar la hipotesis nula.


c) (10 puntos) Seale las diferencias que existen en los procedimientos de las partes a) y b). La
diferencia es que con el test F podemos plantear mas de una hiptesis lineal ( en la parte
a) planteamos 3 restricciones), mientras que con el test t podemos trabajar solamente
con una restriccin lineal. Ademas en ambos casos tenemos distribuciones estadsticas
distintas.

2 Recordar

que en ese caso el test F corresponde a un test al cuadrado.

Econometra I

Verano 2005-2006

Profesor

Jaime Ruiz-Tagle V.

Ayudante

Roberto Jaramillo M.

Control 3 - Pauta de Correccin

Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo.

Pregunta 1 (30 puntos)


(a) En un modelo de regresin con k variables, el estimador de Mnimos Cuadrados
= (X 0 X)1 X 0 y . Muestre que la varianza de es:
Ordinarios (MCO) es

= u2 (X 0 X)1 .

La varianza de

est dada por:

= E[( E[])
( E[])
0]
V ar()
= E[( ) ( )0 ].
Dado que

= (X 0 X)1 X 0 y
= (X 0 X)1 X 0 (X + u)
= + (X 0 X)1 X 0 u,
se obtiene

=
V ar()
=
=
=
=

E[((X 0 X)1 X 0 u) ((X 0 X)1 X 0 u)0 ]


E[(X 0 X)1 X 0 uu0 X(X 0 X)1 ]
(X 0 X)1 X 0 E[uu0 ]X(X 0 X)1
(X 0 X)1 X 0 2 In X(X 0 X)1
2 (X 0 X)1 .

Notar que esto se cumple porque

no est correlacionado con los errores y porque

los errores no presentan autocorrelacin y son homcedsticos.

(b) Explique por qu el estimador insesgado de la varianza de los errores es

u2 =

u
0 u

.
nk

El estimador natural de las varianza de los errores es

u2

u0 u
=
=
n

Pn

ui
i=1 (

u)2

Sin embargo, para obtener los valores de

Pn
=

i=1

u2i

es necesario estimar

parmetros

1 , . . . , k ), de modo que la precisin de la estimacin es menor al ser los grados


(
de libertad menores (n

k)

en vez de

n.

De este modo, al corregir por lo grados

de libertad, se obtiene el estimador insesgado de la varianza.

Pregunta 2 (30 puntos)


(a) Explique qu signica que un estimador sea MELI.

Un estimador es MELI si es que es el Mejor Estimador Lineal Insesgado.

(b) Explique por qu el estimador de MCO es MELI.

El estimador de MCO es MELI porque es un estimador Lineal (el modelo es

y = X + u),

es insesgado porque

=
E[]

(dado el supuesto de independencia

de las variables explicativas y de que el error se asume con media cero), y tiene
varianza mnima (es eciente porque no hay otro estimador lineal insesgado con
menor varianza).

(c) Explique el Teorema de Gauss-Markov.

El Teorema de Gauss-Markov postula que el estimador de MCO es MELI.

Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Control 3

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) Es imposible que en el siguiente modelo Y = 0 + 1 X1 + 2 X2 + u,
los parmetros 1 y 2 sean individualmente no significativos, pero que el test F de significancia
global del modelo nos diga que este es significativo. Comente.
Falso. Hay dos posible argumentos.
Respuesta 1:
Es posible que los test de significancia individual de b1 y b2 nos digan que estos no son significativos individualmente. Sin embargo, esto no quiere decir que en conjunto sean es-tadsticamente
no significativos. Lo anterior podra darse por la covarianza existente entre los coeficientes estimados. En efecto, es posible que el rea roja sea significativa, y la covarianza existente entre
ambos coeficientes sea tal que en conjunto logren explicar la variabilidad de la variable dependiente. (Ver grfico)

Y
amarillo

azul

verde
rojo

caf

naranjo

Respuesta 2:
El test t asociado a la significancia de un parametro est en funcin de la varianze de cada
parmetro.:
1

bi

tcalculado = r


\
V ar bi


En general rechazamos la hipotesis nula de no significancia (H0 :i = 0 ), si la V ar bi es
muy alta. Esto hace que el test t calculado sea bajo y por lo tanto caigamos en la zona de no
rechazo.
En cambio el test F de la significancia conjunta de los parmetros (H0 :i = 0, i ) es una
funcin la matriz de varianza y covarianza de todos los parmetros estimados:
"

F calculado

0 \
b
Rb r
= R r
RV ar b R0


En este caso b y V ar b es el vector de parametros y la matriz de var y cov de dichos
parametros estimados. Por lo tanto, el test F toma en cuenta las covarianzas entre los parametros.
En particular, en un modelo con dos variables explicativas y constante el test F tendra la
forma de:

F calculado

0 1
0 0

b1
0 b
0

1 2
0
b
3

b1
b1 , b2
b1 , b3
V

Cov

Cov

0 1 0
V b2
Cov b2 , b3

Cov b2 , b1
0 0 1


Cov b3 , b1
Cov b3 , b2
V b3

0
b1
0
0 1 0 b
0 0 1 2 0
b3

!0
!
V b2
Cov b2 , b3
b2
b2

b3
b3
Cov b3 , b2
V b3


b22 V b2 2b2 b3 Cov b2 , b3 + b32 V b3

2
V b2 V b3 Cov b2 , b3
0

1
1
0

0
1

Por lo tanto, si la covarianza entre los parametros es tal que contrarresta el efecto de las
varianzas altas de los parametros podemos tener un test F suficientemente alto para rechazar la
H0 de no significancia conjunta (H0 :i = 0, i ), y por ende el modelo explica la varianza total
2

de la variable dependiente. A pesar de que no podamos rechazar las H0 de no significancia de


cada uno de los parametros del modelo (H0 :i = 0 ).
Pregunta 2: (70 puntos) Una pequea tienda de comestibles observa que el precio de las
naranjas vara mucho durante el ao. Fuera de temporada el precio llega a los $60 por unidad,
y dentro de la temporada los precios varan entre $10, $20 y $30 por unidad. A continuacin se
presentan los datos para seis semanas con las cantidades de naranjas vendidas (y) y el precio
(x):
Naranjas Vendidas
y (cientos)
6
4
5
4
3
2

Precio por naranja


x (pesos)
10
20
30
40
50
60

Suponiendo que la demanda por naranjas viene dada por la siguiente ecuacin:
y = + x + u
estime los parmetros de esta ecuacin. Calcule un intervalo de confianza al 90 % para la cantidad de naranjas que se venden en la semana 7, si el precio es de $25 por unidad en esta semana.

P 2
0,87 0,02
Nota:
ui = 1,77 y (X 0 X)1
0,02 0,0006
Respuesta: El estimador MCO de se obtiene de la siguiente forma:
P
(Xi X)(Yi Y )

=
P
(Xi X)2

Suma
Promedio

Y
6
4
5
4
3
2
24
4

X
10
20
30
40
50
60
210
35

(Y Y )
2
0
1
0
-1
-2
-

(X X)
-25
-15
-5
5
15
25
-

(Y Y )(X X)
-50
0
-5
0
-15
-50
-120
-20

(X X)2
625
225
25
25
225
625
1750
291.7

120
= 0,068571429
1750
= 6,4
Y X

Ahora si se espera que en la semana 7 el precio de las naranjas sea $25 por unidad, la demanda
esperada (prediccin puntual) es:
y0 = 6,4 0,068571429 25 = 4,685714286
3

El intervalo de confianza de la prediccin es:


p
p
P r[b
y 0 t0,95,4 V ar(b
e0 ) y 0 yb0 + t0,95,4 V ar(b
e0 )] = 90 %
donde t0,95,4 = 2,132

Ahora debemos calcular la varianza del error de prediccin:


Vd
ar(b
e0 ) =
2 (1 + x0 (X 0 X)1 x00 )
P 2
ui
1,77

2 =
=
= 0,4425
nk
4

0,87 0,02
1
0
0
1 00
1 25
x (X X) x
=
= 0,245
0,02 0,0006
25
Vd
ar(b
e0 )

0,4425(1 + 0,245) = 0,5509125

Entonces el intervalo de confianza de la prediccin es:


p
p
P r[4,685714286 2,132 0,5509125 y 0 4,685714286 + 2,132 0,5509125] = 90 %
P r[3,10326969 y 0 6,268158882] = 90 %

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 3

Semestre: Primavera 2006


Profesores: Jos Miguel Benavente, Rodrigo Montero
Tiempo de duracin: 20 minutos
No hay preguntas de ningn tipo para los ayudantes

Comente (6 puntos)
La significancia global del modelo depende de la significancia individual de las
variables independientes incluidas.
Respuesta. Falso. Es posible que, aun cuando los coeficientes estimados no sean
individualmente significativos, s lo sean en conjunto. Lo anterior podra darse en
el caso que la covarianza de los regresores sea capaz de explicar la variabilidad
de la variable dependiente. Como existe un alto grado de correlacin entre las
variables independientes del modelo (es decir, un alto grado de multicolinealidad),
entonces, al menos una de estas variables tiene una influencia significativa sobre
la variable dependiente, pero no se puede establecer cual. Por otro lado, al existir
un alto grado de multicolinedlidad, es muy probable que los coeficientes, a nivel
individual, no sean estadsticamente significativos. Recuerde que:
=
var()
2 (X 0 X)1
Si existe un alto grado de colinealidad entre las variables independientes del modelo, el determinante de (X 0 X) tiende a cero, por lo que se obtienen varianzas
gigantes.

Ejercicio (14 puntos)


Con la informacin proporcionada por una muestra de 5 datos, se ha estimado el
siguiente modelo (mnimos cuadrados ordinarios):
Yi = 4 + 2, 5X1i 1, 5X2i
El R2 del modelo es de 0,95 y
informacin:

yi2 = 28. Se cuenta adems con la siguiente

(X 0 X)1

26, 7 4, 5
8

= 4, 5
1
1, 5

8 1, 5 2, 5

Construya un intervalo de confianza para 0 , 1 y 2 al 95 % (asuma un t


crtico igual a 1,96). Son los coeficientes estadsticamente significativos?
Respuesta. Se sabe que:
=
var()
2 (X 0 X)1
Adems (es importante corregir por la prdida en grados de libertad, ya que
la muestra es pequea):
2

e2i
nk
P

=
Por otro lado, se sabe que:

P 2
e
R = 1 P i2 = 0, 95
yi
2

Es decir:
X

e2i = 1, 4

Por lo tanto:

2 =

1, 4
= 0, 7
2

Finalmente:

26, 7 4, 5
8
18, 69 3, 15 5, 6

var() = 0, 7 4, 5
1
1, 5 = 3, 15
0, 7 1, 05

8 1, 5 2, 5
5, 6 1, 05 1, 75
2

Los intervalos de confianza vienen dados por (4 puntos por cada uno):
p
p
P (4 1, 96 18, 69 < 0 < 4 + 1, 96 18, 69) = 0, 95
P (4, 47 < 0 < 12, 47) = 0, 95

p
p
P (2, 5 1, 96 0, 7 < 1 < 2, 5 + 1, 96 0, 7) = 0, 95
P (0, 86 < 1 < 4, 13) = 0, 95

p
p
P (1, 5 1, 96 1, 75 < 2 < 1, 5 + 1, 96 1, 75) = 0, 95
P (4, 09 < 2 < 1, 09) = 0, 95
Es decir, slo 1 es estadsticamente significativo (2 puntos).

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 3

Semestre: Primavera 2007


Profesores: Jos Miguel Benavente, Rodrigo Montero
Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros
Tiempo de duracin: 40 minutos
No hay preguntas de ningn tipo para los ayudantes
Est permitido utilizar calculadora

Una compaa telefnica est desarrollando un nuevo plan de contrato, para


lo cual necesita ver cmo se relaciona la cantidad de minutos hablados durante
un mes con la edad de la persona. En particular, ellos disponen de la siguiente
informacin:
i
1
2
3
4
5
6
7
8
9
Por lo tanto:
X
Ei2 = 5135

Edad (E) Minutos (M )


14
65
16
54
18
55
22
70
26
77
27
90
27
110
29
120
30
150

Ei = 209

Mi = 791

Ei Mi = 19686

Luego, el modelo a estimar es el siguiente:


Mi = + Ei + ui
Donde u cumple con los supuestos convencionales que se hacen sobre el trmino
de error. (NOTA: en caso de ser necesario trabaje con tres decimales)
IMPORTANTE: esta pauta de correccin ha sido confeccionada considerando TODOS los decimales en los clculos respectivos.
1

1. Obtenga los estimadores MCO de y . (10 puntos)


Respuesta. Se sabe que:


 
P 1  P

n
E
M
i
i
0
1 0
P 2
P
= (X X) X Y = P
Ei
Ei
Ei Mi

Por lo tanto:
1 
 

  

791
20, 75335
9
209
=
=
209 5135
19686
4, 678374

2. Estime la varianza de u ( 2 ). (10 puntos)


Respuesta. Se sabe que:
P 2
ei
2412, 43054
2
2
s =
=
=
= 344, 63293
nk
7
3. Influye la edad de las personas en la cantidad de minutos que hablan por
celular? (Ayuda: Utilice 2,3 para el valor crtico de la distribucin t). (10
puntos)
Respuesta. Se debe analizar la significancia estadstica del coeficiente es Para ello se necesita estimar, en primer lugar, la varianza del
timado ().
estimador MCO:

1
9
209
2
0
1
= s (X X) = 344, 63293
V ar()
209 5135
En este caso, solo interesa el elemento 2x2 de la matriz, por lo tanto:
= 1, 2240317
V ar()
As:

= 1, 1063597
Luego, el test t se calcula como sigue:
t =

4, 678374

=
= 4, 2286193

1, 1063597

Este valor es mayor al t crtico sugerido (2,3), por lo tanto, se rechaza la


hiptesis nula, y el coeficiente estimado es estadsticamente significativo.

4. Realice una prediccin condicional de minutos a hablar para una persona


que tiene 26 aos de edad, y luego construya un intervalo de confianza al
95 % para dicha prediccin (Ayuda: Utilice 2,3 para el valor crtico de la
distribucin t). (10 puntos)
Respuesta. La prediccin es:
= 20, 75335 + 4, 678374(26) = 100, 88437
M
Por otro lado, se sabe que:
p
p
+ t V ar(eo )) = 1
t V ar(eo ) M
P (M
Adems:

V ar(eo ) = s2 (1 + xo (X 0 X)1 xo )
Luego:
"
o


V ar(e ) = 344, 63293 (1 + 1 26

1  #
9
209
1
= 215, 565586
209 5135
26

Luego:
P (100, 88437 2, 3(14, 6821519) 100, 88437 + 2, 3(14, 6821519)) = 1
P (67, 115421 134, 65332) = 1

Control #3
Econometra I
Profesores: Tomas Rau y Javiera Vasquez
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda
23 de abril, 2008
Tiempo Total: 30 Minutos.

1.

Comentes (10 puntos, 5 c/u)

1) Un alto R2 es garanta de que la estimaci


on del modelo de regresion lineal es buena.
R. Falso. Un R2 alto no necesariamente indica que la estimaci
on es buena, esto puede deberse a un
modelo saturado con muchas variables y que artificialemente aumentan la bondad de ajuste (esto
puede ser chequado viendo el R2 ajsutado). Tambien existen modelos matematicamente equivalentes
pero econometricamente distintos, unos con elevado R2 y otros con bajo R2 (ejemplo visto en clases).
2) El teorema de Gauss-Markov establece que dentro de la clase de estimadores insesgados el estimador
MCO es el mas eficiente.
R. Falso/Depende. El teorema de Gauss-Markov establece que dentro de la clase de estimadores LINEALMENTE insesgados el estimador MCO es el mas eficiente, bajo ciertos supuestos. Pueden existir
estimadores no lineales e insesgados con menor varianza que el estimador de MCO.

2.

Problema (20 puntos)


Sea el siguiente modelo de regresion lineal
y = 0 + 1 x1 + 2 x2 + 3 x3 +

donde se cumplen los supuestos usuales vistos en clases.


a) Describa c
omo testeara la siguiente hipotesis
H0 : 31 23 = 8

Ha : 31 23 6= 8
Escriba explicitamente el estadstico a usar, su distribuci
on bajo la hipotesis nula, y cuando rechaza o
no rechaza la hip
otesis nula.
R. Aqui hay dos alternativas: hacer un simple test-t o un test F mediante R = r (caso 3). La primera
es trivial,
31 23 + 8
t= q
tnk
9V ar(1 ) + 4V ar(3 ) 12Cov(1 , 3 )
1

que sigue una distribuci


on t-student con n k grados de libertad. Como la hipotesis es a dos colas y
la distribuci
on t es simetrica debemos comparar el estadstico con el valor tabla t/2,nk , donde es
el nivel de significancia del test (probabilidad de cometer error tipo I). Se rechaza la hipotesis nula si
|t| > t/2,nk .
La otra alternativa es,

[(R r) [R(X X)1 R ]1 (R r)]/q


[(R r) [
2 R(X X)1 R ]1 (R r)]/q F(q,nk)
u
u
/(n k)

(1)

donde R = [0, 3, 0, 2], r = 8 y q = 1. Luego el estadstico sigue una distribuci


on F con (1,n-k) grados

de libertad y se rechaza el test si el estadstico es mayor al valor crtico F(1,nk)


.
b) Suponga que 0 = 1, 1 = 2, 2 = 2,5, 3 = 1, n=1000

2 (X X)1 =
0
0

y
0
4
0
3

0
0
9
0

0
3

0
9

Realice el test descrito en a) con un nivel de significancia del 5 % y diga si rechaza o no la hipotesis
5%
nula. Recuerde que t2,5 %,996 = 1,96 y que F1,996
= 3,84
R. El test t es simplemente
t= q

31 23 + 8

9V ar(1 ) + 4V ar(3 ) 12Cov(1 , 3 )

12
=2
36 + 36 36

con lo cual tenemos que se rechaza la hipotesis nula puesto que t2,5 %,996 = 1,96
La otra manera requiere un poco mas de algebra. Dado que q = 1 podemos reemplazarlo y calculemos
la expresion en corchetes a la menos 1, es decir la varianza de R

2 R(X X)1 R

luego,

36

0 3

0 6

3
 0
0 2
0
0


0 9

0
4
0
3

0
3

0
2

0
0
9
0

0
0
3
3

0 0
9
2

[(R r) [
2 R(X X)1 R ]1 (R r)]/q = (12)(36)1 12/1 = (12)2 /36 = 4

5%
Luego el estadstico es mayor a F1,996
= 3,84 y se rechaza la hipotesis nula.

CONTROLES 4

Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 4

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) En un modelo de regresin lineal simple donde tanto la variable
dependiente como explicativa estn en logaritmos, el parmetro estimado representa una elasticidad. Comente.
Verdadero, cuando tenemos un modelo de regresin simple: ln(yi ) = + ln(xi ) + ui , donde
ambas variables (dependiente y explicativa) estan el logaritmos, el parmetro que representa
el impacto marginal de ln(x) sobre ln(y) representa la elacticidad de y a x.
ln(y)
Veamos esto con ms detalle, = ln(x)
, recordando que la dervivada de una variable en logaln(y)
rimo es ln(x)
= x1 x, tenemos que = ln(x)
= y
x
y
por definicin corresponde la elasticidad de y a x.

x
x

, lo que es implica =

%y
%x ,

lo que

Pregunta 2: (70 puntos) Existe presuncin que los egresados de Administracin de la carrera de Ingeniera Comercial tienen un mayor salario que aquellos egresados de Economa.
(a) Plantee un modelo que permita testear esta hiptesis. Explique explcitamente como lo
testeara.
R: Suponiendo que disponemos datos de los alumnos egresados de Ingeniera Comercial, podramos estimar el siguiente modelo:
Wi = 0 + 1 D1i + ui
donde Wi es el logaritmo natural del salario y D1i es una variable dummy que toma el valor 1
si la persona i egreso de administracin y 0 si egreso de economa (tambin se puede definir D2i
que tome el valor 1 si la persona i egreso de economa y 0 si egreso de administracin e incluir
esta en el modelo, o incluir ambas dummies en el modelo y omitir la constante).
De esta forma:
E[Wi /Administracion]

E[Wi /Economia]

0 + 1
0

Para comprobar esta hiptesis se requiere un parmetro 1 positivo y estadsticamente signi-

ficativo. Explcitamente esto se testea mediante un test-t con H0 : 1 = 0:


1
t= q
tnk
V (1 )
(b) Plantee un modelo que adems permita testear que dicha diferencia entre menciones no es
igual entre universidades (Considere slo las dos universidades ms importante del pas: Universidad de Chile y Universidad Catlica). Explique explcitamente como lo testeara.
Para testear esto adems se debe incorporar una variable dummy que llamaremos D3 , que
tome el valor 1 si la persona i egreso de la Universidad de Chile y 0 si egreso de la Universidad
Catlica, de esta forma el modelo que nos permite testear esto es:
Wi = 0 + 1 D1i + 2 D3i + 3 D1i D3i + ui
De esta forma:
E[Wi /Administracion

en

E[Wi /Economia

U. de Chile] =

en U. de

Chile] =

E[Wi /Administracion

en

U. Catolica] =

E[Wi /Economia

en

U. Catolica] =

0 + 1 + 2 + 3
0 + 2
0 + 1
0

Para testear se debe utilizar un test F para la hiptesis conjunta:


H0 :

H0 :

1
2
3
R

= 0
= 0
= 0
= r

donde R=[031 I3 ] y r=031 .


El estadstico F es:
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
F(q,nk)
u
0 u
/(n k)

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Control 4

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz
en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el
espacio disponible
Pregunta 1: (30 puntos) Bajo el supuesto de normalidad del trmino de error, el estimador Mximo Verosmil (MV) y el de Mnimos Cuadrados Ordinarios (MCO) son exactamente
iguales. Comente.
Efectivamente bajo el supuesto de normalidad del trmino de error, el estimador Mximo Ve coincide con el estimador
rosmil de los parmetros asociados a las variables explicativas ()
MCO. Pero el estimador de la varianza del error ( 2 ) difiere, el estimador Mximo Verosmil de
este parmetro es un estimador sesgado, igual a la suma de los errores estimados al cuadrado
dividido por el tamao de muestra. De esta forma, el comente es FALSO.
Pregunta 2: (70 puntos) Suponga que Ud. quiere estimar la siguiente funcin de produccin
Cobb-Douglas:
Y = AL K eu
para lo cual dispone datos de producto (Y), capital (K) y trabajo (L) de 10 pases latinoamericanos.
a) Plantee una ecuacin de regresin estimable por MCO.
R:
Como la funcin de produccin Cobb-Douglas es una funcin no lineal es variables, para
que sea estimable por MCO se debe linealizar, lo que se hace aplicando logaritmo a esta
funcin, quedando el siguiente modelo logartmico:
ln(Y ) = ln(A) + |{z}
ln(L) + ln(K) + u
|{z}
| {z }
0

ln(Y ) = 0 + 1 ln(L) + 2 ln(K) + u


donde 1 =

ln(Y )
ln(L)

%Y
%L = Y,L corresponde a la elasticidad del producto
ln(Y )
%Y
= %K
= Y,K corresponde a la elasticidad
2 = ln(K)

al factor trabajo, y
con respecto al factor Capital.

(1)
con respecto
del producto

b) Especifique un modelo que le permita testear que para cualquier nivel de Capital(K) y
Trabajo (L), pases grandes tienen en promedio un producto mayor que pases pequeos.
Adems plantee explcitamente un test de hiptesis para ver la significancia estadstica
de esta diferencia.
R:
Para testear esta hiptesis primero debemos definir la siguiente variable dummy:
(
1 Pas grande
D1 =
0 Pas pequeo
Un modelo que nos permita testear que para cualquier nivel de capital y trabajo los pases
grandes producen en promedio ms que los pequeos, requiere introducir esta variable
dummy (D1 ) en el modelo de la ecuacin (1):
ln(Y ) = 0 + 1 ln(L) + 2 ln(K) + 3 D1 + u

(2)

De esta forma:
E(ln(Y)|pas grande, K, L)=0 + 3 + 1 ln(L) + 2 ln(K).
E(ln(Y)|pas pequeo, K, L)=0 + 1 ln(L) + 2 ln(K).
El parmetro 3 es quien mide esta diferencia en el promedio del producto par cualquier nivel fijo de K y L, por lo tanto, para testear si esta diferencia es estadsticamente
significativa, se debe testear la hiptesis de que 3 es estadsticamente significativo, ms
especficamente se debe realizar el siguiente test de hiptesis:
H0 :
H1 :

3 = 0
3 6= 0

la que se realiza mediante un test-t:


3

t= q

V (3 )

tnk

c) Especifique un modelo que le permite testear adems de las diferencias en promedio de


la parte b), que la elasticidad del producto con respecto al trabajo difiere entre pases
grandes y pequeos. Nuevamente plantee explcitamente un test de hiptesis para ver la
significancia estadstica de esta diferencia.
R:
Para testear diferencias en la elasticidad del producto con respecto al trabajo, deberamos
incorporar otra variable ms al modelo antes descrito (ecuacin (2)), correspondiente a
una variable interactiva, la multiplicacin de la dummy y el logaritmo del trabajo, de la
siguiente forma:
ln(Y ) = 0 + 1 ln(L) + 2 ln(K) + 3 D1 + 4 D1 ln(L) + u
2

(3)

De forma tal que,


E(ln(Y)|pas grande, K, L)=0 + 3 + 1 ln(L) + 4 ln(L) + 2 ln(K).
E(ln(Y)|pas pequeo, K, L)=0 + 1 ln(L) + 2 ln(K).
Y as, la elasticidad del producto con respecto al trabajo para cada grupo es:
E(ln(Y)|pas grande, K, L)/ ln(L) =1 + 4
E(ln(Y)|pas pequeo, K, L)/=1
La diferencia en elasticidad del producto con respecto a trabajo entre los pases grandes
y pequeos estar determinada por el parmetro 4 , para ver si la diferencia es estadsticamente significativa se debe realizar el siguiente test:
H0 :
H1 :

4 = 0
4 6= 0

la que se realiza mediante un test-t:


4

t= q

V (4 )

tnk

Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 4
Pregunta 1: (30 puntos) Uno de los supuestos utilizados para derivar el estimador MCO
asuma que las variables independientes eran determinsticas. Si levantamos este supuesto el
estimador MCO sigue siendo insesgado pero ya no es el mejor estimador lineal e insesgado.
Comente.
Falso, cuando tenemos regresores estocsticos tenemos que la media y varianza condicional

del estimador MCO son: E[|X]


= y V [|X]
= 2 (X 0 X)1 , as en trminos condicionales el
estimador es MELI (insesgado y de mnima varianza). Los momentos incondicionales del esti = y V []
= 2 E[(X 0 X)1 ], si bien el estimador es insesgado la varianza slo
mador son: E[]
se puede obtener en trminos de media de las variables explicativas. Sin embargo, como el estimador es MELI para cada valor de X (condicional) tambin lo ser para los valores medios de X.
Pregunta 2: (70 puntos) Considere la siguiente variable aleatoria yt distribuida exponencialmente con parmetro 0 . Su funcin de densidad est dada por:
f (yt ; 0 ) =

1 yt
e 0
0

yt > 0; 0 > 0

Plantee la funcin de verosimulitud asociada a esta funcin de densidad exponencial (20


puntos).
La funcin de densidad conjunta para las T observaciones se obtiene a travs de la pitatoria de la densidad de cada observacin:
f (y; 0 ) =
=

T
Y

T
Y
1 yt
f (yt ; 0 ) =
e 0

0
t=1
t=1
T
1 PT
1
e 0 t=1 yt
0

Ahora la funcin de verosimilitud corresponde algebraicamente a la misma expresin


anterior, slo que tericamente la incgnita es el parmetro y se asume como dada la
muestra de tamao T de la variable y:
T
1 PT
1
L(0 ; y) =
e 0 t=1 yt
0
Aplicando logaritmo natural a la expresin anterior, obtenemos la log-likelihood:
l(0 ; y) =

T ln(0 )

T
1 X
yt
0 t=1

Encuentre las condiciones de primer orden asociadas a la estimacin por maxima verosimilitud de 0 (20 puntos).
1

Para obtener la condicin de primer orden derivamos la log-likelihood con respecto a


0 e igualamos a cero:
T
1 X
l
T
= +
yt = 0
0
2 t=1

Encuentre el estimador mxima verosimilitud de 0 ( 30 puntos).


se obtiene al despejar de la condiEl estimador mximo verosmil de 0 denominado ,
cin de primer orden:

T
T
1 X
yt
+
2 t=1
T
1 X
yt
2

= 0
=

t=1

PT
t=1

yt

Econometra I

Verano 2005-2006

Profesor

Jaime Ruiz-Tagle V.

Ayudante

Roberto Jaramillo M.

Control 4 - Pauta de Correcin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo.
Pregunta 1 (30 puntos)
Una variable aleatoria

x sigue una distribucin exponencial si es que tiene la siguiente

funcin de densidad (pdf):

(
f (x) =
donde

> 0

exp

para
para

x>0
x0

Px

es el parmetro de la distribucin. Usando el mtodo de Mxima

Verosimilitud, muestre que el estimador mximo verosmil de

es

, donde

es el tamao muestral. Esto es, muestre que el estimador mximo verosmil de


promedio muestral

es el

x.

Dada la funcin de densidad, la funcin de verosimilitud ser


L(xi , ) =

n
Y
1
i=1


exp

xi

 n


1
1 X
xi ,
=
exp

y el logaritmo de la funcin de verosimilitud ser


ln L(xi , ) = n ln()

1X
xi .

Tomando derviada con respecto a al parmetro para maximizar la funcin se obtiene


P
ln L(xi , )
1
xi
= n + 2 .

Finalmente, igualando a cero obtenemos


=

xi
= x.
n

Pregunta 2 (30 puntos)


Explique en qu consiste cada uno de los 3 test de hiptesis usados en inferencia bajo
Mxima Verosimilitud. Haga una comparacin crtica de los test, estableciendo sus
ventajas y desventajas.

Los 3 tests usados en inferencia bajo Mxima Verosimilitud son: el test LR (Likelihood
Ratio - Razn de Verosimilitud), el test de Wald y el test LM (Lagrange Multiplier Multiplicador de Lagrange).
Los estadsticos de cada uno de los tests son los siguientes:





LR = 2 ln L(,
) ln L(,
)
(R r)0 [R(X 0 X)1 R0 ](R r)

2
a
LM = n R2
2q
W =

2q
a

2q

donde y corresponden a los estimadores del modelo no restringido, y son los


estimadores del modelo restringido, y el R2 corresponde a aquel de la regresin auxiliar de u sobre X , donde u son los residuos del modelo restringido y X es la matriz de
todas las variables explicativas. Finalmente, q corresponde al nmero de restricciones
involucradas.
Asintticamente los 3 tests son equivalentes en el sentido que el estadstico asociado a cada uno de ellos sigue una distribucin Chi-cuadrado. Dada la naturaleza
asinttica de los test, deben ser aplicados con mucho cuidado en muestras relativamente pequeas, en las cuales se debiera prefererir tests como el F o el t. Una ventaja
importante de estos tests es que permiten testear restricciones no lineales.
En el test LR, si la restriccin reduce signicativamente la funcin de verosimilitud,
entonces el test rechaza la hiptesis nula de las restricciones. Por lo tanto, el LR test
requiere la estimacin del modelo no restringido y del modelo restringido. Sin embargo, la construccin del estadstico LR es extremadamente simple, requiriendo simple
resta. Todos los paquetes econmetricos entregan el valor la funcin de verosimilitud.
El test de Wald involucra slo la estimacin del modelo no restringido, y analiza las
implicancias de las restricciones. La construccin del estadstico W involucra manejo
matricial, hacindolo ms demandante.
El test LM analiza la pendiente de la funcin de verosimilitud y nalmente slo requiere la estimacin del modelo restringido. La construccin del estadstico requiere
una regresin auxiliar.
2

Usualmente, el modelo original y el tipo de restricciones determinarn cul test es


ms sencillo de aplicar. En algunos casos el modelo no restringido puede ser tan complejo que el test LM se hace ms conveniente. En otros casos, las restricciones pueden
generar un mayor costo de estimacin del modelo restringido, haciendo que el test de
Wald sea ms conveniente.

Econometra I
Profesoras: Javiera Vsquez.
Otoo 2006
Control 4
Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) En un modelo que busca explicar que en promedio los hombres
ganan ms que las mujeres, para cualquier nivel de escolaridad, da lo mismo incluir una dummy en la regresin que estimar dos modelos separados, uno para los hombres y otro para las
mujeres. Comente.
Efectivamente en trminos de especificacin, es lo mismo plantear un modelo que capture la
diferencia por gnero mediante una variable dummy, que estimar separadamente un modelo de
ecuacin de mincer, uno para los hombres y otro para las mujeres. Sin embargo, en trminos de
eficiencia no es lo mismo. Al separar los modelos el tamao muestral utilizado es ms pequeo
(en cada uno de ellos) que al estimar un solo modelo, por lo que la primera metodologa es
menos eficiente.
Pregunta 2: (70 puntos) Plantee un modelo que le permita testear que la demanda por helados
en verano es diferente a la demanda promedio en invierno, y que la reaccin ante un cambio en
el precio difiere en estas dos estaciones. Sea explcito en como testeara esto.
Para esta pregunta vamos a dar dos alternativas de respuesta, una 100 % buena y una regular (pero aceptable):
Respuesta 1: Definamos las siguientes Dummies:
(
(
1 verano
1
d1i =
d2i =
0
0

invierno

Entonces el modelo que nos permite testear lo planteado en el enunciado es el siguiente:


Qi = + 1 Pi + 2 d1i + 3 d2i + 4 Pi d1i + 5 Pi d2i + ui
As,
E[Qi |verano, Pi ] = + 1 Pi + 2 + 4 Pi
E[Qi |invierno, Pi ] = + 1 Pi + 3 + 5 Pi
Entonces debemos realizar los siguientes test de hiptesis:
H0 :

2 = 3

H0 :

4 = 5

(1)

Si se cumplen las hiptesis nulas se comprueba que no existe diferencia estadstica en la demanda por helados entre invierno y verano.
Respuesta 2: Definamos la siguiente dummy:
(
1 verano
d1i =
0 invierno

(2)

Se plantea el siguiente modelo:


Qi = + 1 Pi + 2 d1i + 3 Pi d1i + ui
As,
E[Qi |verano, Pi ]
E[Qi |invierno, Pi ]

=
=

+ 1 Pi + 2 + 3 Pi
+ 1 Pi

Entonces debemos realizar los siguientes test de hiptesis:


H0 :
H0 :

2 = 0
3 = 0

Si se cumplen las hiptesis nulas se comprueba que no existe diferencia estadstica en la demanda por helados entre invierno y verano.

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 4

Semestre: Primavera 2006


Profesores: Jos Miguel Benavente, Rodrigo Montero
Tiempo de duracin: 20 minutos
No hay preguntas de ningn tipo para los ayudantes

Comente (6 puntos)
El supuesto de independencia (de las observaciones) es crucial para implementar
el estimador de mxima verosimilitud (MV).

Respuesta. Falso. Es slo un supuesto, el cual podra no cumplirse, al menos,


por dos motivos: (i) el rezago de la variable dependiente (Yt1 ) aparece como
regresor, (ii) los erroes se encuentran autocorrelacionados. Si el supuesto de independencia no se cumpliera, an es posible implementar el estimador de mxima
verosimilitud, para lo cual existen dos alternativas: (1) utilizar una funcin de
distribucin multivariada, o (2) realizar una transformacin del modelo.

Ejercicio (14 puntos)


Considere el siguiente modelo (expresado en trminos matriciales):
Y = X + u
Asumiendo que ui N (0, 2 ) derive los estimadores de mxima verosimilitud
para y 2 . Recuerde que en este contexto:
f (ui ) =

1
2 2
1

u2
i
2 2

Respuesta. Asumiendo que las realizaciones del trmino de error son independientes, la densidad conjunta se escribe de la siguiente manera:
f (u1 , u2 , ..., un ; 2 ) = f (u1 ) f (u2 ) f (un ) = ni=1 f (ui )
Dado el supuesto de normalidad, entonces:
"

#


u2
0
i

1
1
u u2
2
2
n
n
2
2
f (u1 , u2 , ..., un ; ) = i=1
e
= i=1
e
2 2
2 2
La densidad multivariada para Y condicional en X viene dada por la siguiente
expresin:


u


f (Y |X) = f (u)
Y
donde |u/Y | es el valor absoluto del determinante formado por la matriz de
derivadas parciales (nxn) de los elementos de u con respecto a los elementos de
Y . En este caso, esta matriz es la matriz identidad. De esta forma, la funcin de
verosimilitud para Y viene dada por:


(Y X)0 (Y X)

1
e
f (Y1 , Y2 , ..., Yn ; X, , ) =
(2 2 )n/2
2

Luego, para obtener los estimadores de mxima verosimilitud se aplica logaritmo a la expresin anterior y se deriva respecto a y 2 :


n
(Y X)0 (Y X)
n
2
max ln(2) ln( )
2
2
2 2
Luego:
1
ln(L)
=0
= 2 X 0 (Y X )

ln(L)
n
1
0 (Y X )

= 2 + 4 (Y X )
2

Resolviendo:
M V = (X 0 X)1 X 0 Y
y:
2

M
V

0 (Y X )

(Y X )
=
n
2

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 4

Semestre: Primavera 2007


Profesores: Jos Miguel Benavente, Rodrigo Montero
Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros
Tiempo de duracin: 40 minutos
No hay preguntas de ningn tipo para los ayudantes
Est permitido utilizar calculadora

Se ha utilizado un modelo lineal para explicar los gastos de construccin de un


nuevo almacn (Gi ) en funcin del tamao del mismo (Ai ). Para ello se dispona
de los siguientes datos referentes a diez almacenes:
X
X
X
X
Ai = 10
A2i = 76
Gi = 80
Ai Gi = 154
Si se sabe que la calidad promedio de los materiales utilizados (Ci ) es una variable
relevante para explicar los gastos de construccin, qu consecuencias tendr
la omisin de dicha variable en el modelo? Considere la siguiente informacin
adicional:
X
X
X
X
Ci = 15
Ci2 = 102
Ai Ci = 84
Ci Gi = 200
Ayuda: Recuerde que la inversa de una matriz A viene dada por la siguiente
expresin (todos estos pasos llevan puntaje):
A1 =

1
adj(A)
|A|

donde |A| corresponde al determinante de la matriz A, y adj(A) es la adjunta de


A, que corresponde a la matriz traspuesta de cofactores de A. En el caso de una
matriz de 3x3, la matriz de cofactores viene dada por:

C11 C12 C13


C21 C22 C23
C31 C32 C33
donde Cij = (1)i+j Mij , y Mij es el determinante de la submatriz de 2x2 que se
obtiene de eliminar la fila i y la columna j de la matriz A.
1

Respuesta. Se sabe que el omitir una variable relevante tiene dos efectos: (i)
estimacin sesgada de los verdaderos parmetros poblacionales, (ii) estimacin
sesgada de las varianzas de los estimadores de mnimos cuadrados ordinarios. Por
lo tanto, al estimar el modelo omitiendo la calidad promedio de los materiales se
obtendrn estimaciones sesgadas, y esto es lo que se muestra a continuacin. Si
se estima el modelo:
Gi = 0 + 1 Ai + ui
entonces:
M CO =


  
P 1  P
N
Ai
Gi
0
P
P
P
=
Ai
A2i
Ai G i
1

Por lo tanto:
M CO =


1  
  
1  
1
76 10
80
0
10 10
80
=
=

154
10 76
154
660 10 10
1

Finalmente:
M CO

  

0
6, 878
= =
1, 121
1

Sin embargo, el verdadero modelo es el siguiente:


Gi = 0 + 1 Ai + 2 Ci + ui
As, el estimador de mnimos cuadrados ordinarios viene dado por:
1 P


P
P
G
0
N
A
C
i
i
i
P
P
P
P
Ai G i
A
C
M CO = 1 = P Ai P A2i
i
i
P
P 2
2
Ci
Ai Ci
Ci
Ci Gi
Por lo tanto:
M CO


1
80
0
10 10 15
= 1 = 10 76 84 154
200
2
15 84 102

Se sabe que la inversa de una matriz viene dada por:


A1 =

1
adj(A)
|A|

El determinante de la matriz de 3x3 que se debe invertir es 4860. Luego, falta


determinar la matriz de cofactores. As:



84
1+1 76
C11 = (1)
= 696
84 102
2


10
C12 = (1)
15

10
C13 = (1)1+3
15

10
C21 = (1)2+1
84

10
C22 = (1)2+2
15

10
C23 = (1)2+3
15

10
C31 = (1)3+1
76

10
C32 = (1)3+2
10


3+3 10
C33 = (1)
10
1+2

La matriz adjunta (traspuesta de la


manera:

696
240
300


84
= 240
102

76
= 300
84

15
= 240
102

15
= 795
102

10
= 690
84

15
= 300
84

15
= 690
84

10
= 660
76

matriz de cofactores) queda de la siguiente

240 300
795 690
690 660

Por lo tanto:
M CO

696
240 300
80
6, 716
0
1
240
795 690 154 = 0, 746
= 1 =
4860
300 690 660
200
0, 358
2

El sesgo de los estimadores de MCO viene dado por:


sesgo(0 ) = E(0 ) 0 = 6, 878 6, 716 = 0, 162
sesgo(1 ) = E(1 ) 1 = 1, 211 0, 746 = 0, 465
De esta manera, al omitir la calidad promedio de los materiales se estaran sobrestimando los verdaderos parmetros poblacionales.

Pauta Control N4
Econometra I
Profesores: Toms Rau y Javiera Vsquez
Ayudantes: Roberto Gillmore, Eugenio Rojas, y Jorge Seplveda
23 de Mayo de 2008
1. Si Ud. posee la siguiente funcin de produccin Cobb-Douglas:

Yi = ALi K i e ui
donde:
Yi: produccin de la empresa i
Li: cantidad de trabajadores en la empresa i
Ki: capital fijo de la empresa i.
a) Por qu razn el modelo anterior no es estimable por MCO? (5 ptos)
La funcin Cobb-Douglas no es estimable tal cual se plantea, ya que la variable
dependiente (Y) depende en forma no lineal de los parmetros del modelo.
b) Menciones dos alternativas para que este modelo pueda ser estimado (10 ptos)
1- Se puede estimar por Mxima Verosimilud
2- Se puede linealizar el modelo aplicando logaritmo natural y estimar por MCO:
ln Yi = ln( A) + ln Li + ln K i + u i
123

c) En el modelo estimable por MCO, Qu variable agregara para testear que el


producto promedio en las empresas del sector servicios es mayor que en los
otros sectores econmicos?. Explique como testeara esta hiptesis. (15 ptos)
Se debe definir una variable Dummy que tome valor 1 si la empresa pertenece al sector
econmico servicios, y 0 si es que la empresa
1 empresa i pertenece a servicios
Di =
0 en otro caso
Luego incluyendo esta Dummy en el modelo:
ln Yi = + ln Li + ln K i + Di + u i
Se estima que producto promedio (en logaritmo) condicional en trabajo y capital es:

E[ln Y | ln L, ln K , D ] = + ln L + ln K + D
De esta forma el producto promedio (en logaritmo) de las empresas del sector servicios
es:

E[ln Y | ln L, ln K , D] = + ln L + ln K +
Y de los otros sectores econmicos:

E[ln Y | ln L, ln K , D] = + ln L + ln K
Luego para testear si existe una diferencia significativa, se debe realizar un test t sobre
la hiptesis nula de que es igual a cero. Si se rechaza la hiptesis nula la diferencia en
el producto promedio de este sector con respecto a los restantes es estadsticamente
significativa.
d) A partir del modelo anterior, Qu variable agregara para testear que la
productividad marginal del trabajo es mayor en el sector servicios que en otros
sectores econmicos? (15 ptos)
Para testear esta hiptesis se debera agregar al modelo anterior, una variable interactiva
del lnL con la Dummy antes definida:
ln Yi = + ln Li + ln K i + Di + ln Li Di + u i
As el valor esperado condicional del producto (en logaritmos) en este caso es:

E[ln Y | ln L, ln K , D] = + ln L + ln K + D + ln L D
Entonces la elasticidad del producto con respecto al trabajo:
E[ln Y | ln L, ln K , D]
= + D
ln L

As, la elasticidad del sector servicios:


E[ln Y | ln L, ln K , D ]
= +
ln L

Y la de los otros sectores:


E[ln Y | ln L, ln K , D ]
=
ln L

2. Con respecto al siguiente modelo:

ln wi = + 1 Ei + 2 D2i Ei + 3 D3i Ei + ui
Donde:
Wi: salario de la persona i.
Ei: aos de escolaridad de la persona i.
D2i: variable dummy que toma valor 1 si la persona i tiene entre 8 y 11 aos de
escolaridad (incluido los entremos).
D3i: variable dummy que toma valor 1 si la persona i 12 aos de escolaridad o ms.
a) Qu representan los coeficientes 1, 2 y 3? (15 ptos)
Derivando el valor esperado del logaritmo del salario con respecto a los aos de
escolaridad, se obtiene el retorno a la educacin:

E[ln wi | E , D2 , D3 ]
= 1 + 2 D2 i + 3 D3i
E
Para la gente que tiene menos de ocho aos de escolaridad, el retorno a la educacin es:

E[ln wi | E , D2 , D3 ]
= 1
E
Para las personas que tienen 8 aos y ms de escolaridad pero menos de 12 aos de
escolaridad, el retorno a la educacin es:

E[ln wi | E , D2 , D3 ]
= 1 + 2
E
Y finalmente, para las personas que tienen 12 aos de escolaridad o ms, el retorno a la
ecuacin que resulta del modelo es:

E[ln wi | E , D2 , D3 ]
= 1 + 3
E
De esta forma, 1 representa el retorno a la educacin de las personas con menos de 8
aos de educacin (bsica incompleta), el coeficiente 2 representa el aumento en
retorno a la educacin de las personas que tienen entre 8 y 11 aos de educacin
(incluido los extremos) comparado con la gente con menos de 8 aos de escolaridad, y
el coeficiente 3 representa el aumento en retorno a la educacin de las personas que

tienen 12 aos o ms de educacin comparado con la gente con menos de 8 aos de


escolaridad.
b) Si 1=0.05, 2=0.09 y 3=0.13. Realice un grfico de la relacin estimada entre
logaritmo del salario y los aos de educacin. Qu representa este grfico?.
(15 ptos)
Grafico
Retorno a la educacin

CONTROLES 5

Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Pauta Control 5
Pregunta 1: (30 puntos) La omisin de una variable relevante siempre subestima el verdadero
valor del y su varianza. Comente.
Falso, la omisin de una variable relevante siempre produce sesgo en los parmetros a menos
que la correlacin entre la variable omitida y las explicativas incluidas sea cero, sin embargo, la
direccin del sesgo no es siempre negativa, el signo del sesgo depende de dos cosas: la correlacin
entre la variable omitida y las variables explicativas incluidas y el valor del parmetro que tendra asociado la variable omitida (valor poblacional). Para un modelo sencillo con una variable
1 ,x2 )
explicativa (x1 ) y una variable omitida (x2 ) se mostr en clases que el sesgo es: cov(x
V (x1 ) 2 .
Por otra parte, siempre al omitir una variable relevante, la varianza de los parmetros estimada
a partir del modelo incorrecto es menor que la del modelo verdadero que incluye la variable
omitida.
Pregunta 2: (70 puntos)
Suponga que un amigo de usted esta interesado en estimar el retorno a la educacin. Para
esto ha estimado los siguientes dos modelos.
Modelo 1:
Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Expe2i + 6 Dzonai + 7 Dpatroni + ui
Modelo 2:
Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Expe2i + 6 Dzonai + ui
En donde Wi corresponde al logaritmo natural del salario del individuo i , Dsexoi es una variable dicotmica que toma el valor de 1 si el individuo i es hombre, Esci corresponde a laos
aos de educacin del individuo i, Expei y Expe2i corresponden a los aos de experiencia y
experiencia al cuadrado del individuo i respectivamente, Dzonai es una variable dicotmica que
toma el valor de 1 si el individuo vive en una zona urbana y 0 sino, y Dpatroni es una variable
dicotmica que toma el valor de 1 si el individuo es trabajador por cuenta propia.
En base a los resultados de los modelos calcule los criterios de informacin de Akaike y Schwarz
y aconseje a su amigo sobre cual modelo debe considerar.

Modelo 1:
Dependent Variable: LNW
Method: Least Squares
Date: 10/27/04 Time: 00:15
Included observations: 40191
LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6)
*DZONA+C(7)*DPATRON
Coefficient

Std. Error

t-Statistic

Prob.

9.931645
0.389195
0.117759
0.018930
-0.000160
0.188917
0.359617

0.022411
0.010563
0.001023
0.000957
1.38E-05
0.007530
0.007515

443.1514
36.84418
115.1189
19.79067
-11.59811
25.08913
47.85069

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
C(7)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

0.368769
0.368674
0.674479
18280.58
-41197.25

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

11.91058
0.848871
?
?
1.705727

Modelo 2:
Dependent Variable: LNW
Method: Least Squares
Date: 10/27/04 Time: 00:24
Included observations: 40191
LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6)
*DZONA

C(1)
C(2)
C(3)
C(4)
C(5)
C(6)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

Modelo I
Modelo II

Coefficient

Std. Error

t-Statistic

Prob.

9.938190
0.389363
0.120470
0.021630
-0.000151
0.176372

0.023040
0.010860
0.001050
0.000982
1.42E-05
0.007737

431.3386
35.85326
114.7276
22.03435
-10.65890
22.79717

0.0000
0.0000
0.0000
0.0000
0.0000
0.0000

0.332801
0.332718
0.693420
19322.21
-42310.86

AIC

BIC

n
40191
40191

k
7
6

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

11.91058
0.848871
?
?
1.739436

2lnL k
+
n
n
2lnL ln(n) k

+
n
n

lnL
-41197.25
-42310.86

AIC
2.05025
2.10564

BIC
2.0519
2.10707

De acuerdo a ambos criterios se recomienda escoger el primer modelo, ya que este minimiza
ambos criterios de informacin.
2

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Control 5
Pregunta 1: (30 puntos) El estimador de White me permite solucionar el problema de ineficiencia en el estimador MCO cuando los errores son Heterocedsticos. Comente.
Falso, el estimador de White slo me permite estimar en forma consistente la matriz de varianzas y covarianzas de los parmetros en presencia de Heterocedasticidad estimador por MCO. El
estimador MCO siempre ser ineficiente, el estimador eficiente en este contexto es el de Mnimos
Cuadrados Generalizados.
Por lo tanto, White me permite estimar consistentemente la matriz de varianzas ty covarianzas
del estimador MCO (que es ineficiente) para realizar la inferencia en forma correcta, utilizando
esta matriz.
Pregunta 2: (70 puntos) Suponga el siguiente modelo de regresin lineal:
Y = X + u

n1

n1

nkk1

Este modelo puede ser particionado de la siguiente forma:


Y = X1 1 + X2 2 + u

n1

nk1 k1 1

nk2 k2 1

n1

donde k1 + k2 = k

a) Obtenga el estimador MCO del subconjunto de parmetros 1 .


R: El el modelo particionado de la siguiente forma:
Y = X1 1 + X2 2 + u
El sistema de ecuaciones normales (X 0 X) = X 0 Y , se puede escribir de la siguiente forma:

0
0
1
X1 Y
X1 X1 X10 X2
=
X20 Y
X20 X1 X20 X2
2
o alternativamente:
(X10 X1 )1 + (X10 X2 )2 = X10 Y
(X20 X1 )1 + (X20 X2 )2 = X20 Y

(1)
(2)

De (2) obtengo:
(X20 X2 )2 = X20 (Y X1 1 )
2 = (X20 X2 )1 X20 (Y X1 1 )

(3)

Reemplazando (3) en (1):


X10 Y
X10 Y

= (X10 X1 )1 + X10 X2 (X20 X2 )1 X20 (Y X1 1 )


= (X 0 X1 )1 + X 0 X2 (X 0 X2 )1 X 0 Y (X 0 X1 )1 + X 0 X2 (X 0 X2 )1 X 0 X1 1 )
1

Agrupando trminos, se tiene:


X10 [I P2 ]Y = X10 [I P2 ]X1 1
| {z }
| {z }
M2

(4)

M2

donde P2 = X2 (X20 X2 )1 X20 es la matriz de proyeccin, y M2 = I P2 es una matriz


simtrica e idempotente.
De (4) podemos despejar el estimador MCO del subconjunto de parmetros 1 :
1 = (X10 M2 X1 )1 X10 M2 Y

(5)

b) Obtenga la matriz de varianzas y covarianzas del subconjunto de parmetros 1 .


R:
Utilizando (5):
1
1

= (X10 M2 X1 )1 X10 M2 (X1 1 + X2 2 + u)


= (X10 M2 X1 )1 X10 M2 X1 1 + (X10 M2 X1 )1 X10 M2 X2 2 + (X10 M2 X1 )1 X10 M2 u
| {z }
0

1 =
E(1 ) =

1 +

(X10 M2 X1 )1 X10 M2 u

La varianza del subconjunto de parmetros 1 entonces es:


V (1 )

=
=
=
=
=

E[(1 1 )(1 1 )0 ]
E[(X10 M2 X1 )1 X10 M2 uu0 M2 X1 (X10 M2 X1 )1 ]
(X10 M2 X1 )1 X10 M2 E[uu0 ]M2 X1 (X10 M2 X1 )1
(X10 M2 X1 )1 X10 M2 2 IM2 X1 (X10 M2 X1 )1
2 (X10 M2 X1 )1 X10 M2 X1 (X10 M2 X1 )1

V (1 )

= 2 (X10 M2 X1 )1

Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 5
Pregunta 1: (30 puntos) La omisin de variables relevantes produce subestimacin en los parmetros estimados por Mnimos Cuadrados Ordinarios. Comente.
Falso, es correcto que el estimador MCO ser sesgado en presencia de variables relevantes
omitidas, tenemos que E[1 ] = 1 + (X10 X1 )1 X10 X2 2 lo que en un modelo sencillo de dos
1 ,X2 )
variables (una incluida y la otra omitida) se reduce a E[1 ] = 1 + Cov(X
2 . Pero el signo
V (X1 )
del sesgo depende de dos cosas: del signo de 2 y de la covarianza entre X1 y X2 . Existen tres
casos posibles:
1. 2 positivo y Cov(X1 , X2 ) positiva, lo cual genera un sesgo hacia arriba o sobreestimacin.
2. 2 positivo y Cov(X1 , X2 ) negativa, lo cual genera un sesgo hacia abajo o subestimacin.
3. 2 negativo y Cov(X1 , X2 ) positiva, lo cual genera un sesgo hacia abajo o subestimacin.
Pregunta 2: (70 puntos) Demuestre que los criterios de informacin de Akaike (AIC) y Schwarz
(BIC):
AIC

BIC

lnL
k
+2
n
n
lnL
k
2
+ ln(n)
n
n
2

Se puedes escribir aproximadamente de la siguiente forma, bajo el supuesto de normalidad


en el trmino de error en el modelo de regresin lineal Y = X + u:
k
n

AIC

ln(
2 ) + 2

BIC

ln(
2 ) + ln(n)

k
n

Si los errores en el modelo Y = X + u se distribuyen normal con media cero y varianza 2 ,


tenemos que:
Y N (X, 2 )
Ahora debemos encontrar el logaritmo de la funcin de verosimilitud y reemplazarla en ambos
criterios de informacin.
La funcin de densidad (o verosimilitud) individual es:
f (yi ; Xi , , 2 ) = L(, 2 ; yi , Xi )

1
2 2
1
2 2

(yi Xi )2
2 2
u2
i

e 22

De esta forma, la verosimilitud conjunta es:

n P
(yi Xi )2
n
1

L(, 2 ; Y, X) =
e i=1 22
2 2

n Pn 2
i=1 ui
1

=
e 22
2 2
Finalmente el logaritmo de la verosimilitud es:
lnL(, 2 ; Y, X)

n
n
ln(2) ln( 2 )
2
2

Pn

2
i=1 ui
2 2


la que se puede evaluar en los estimadores (,
2 ):
n
n
lnL(, ; Y, X) = ln(2) ln(
2 )
2
2

Pn

Recordemos que
2 =

Pn
i=1

u
2i

2i
i=1 u
2
2

, reemplazando en la expresin anterior:

n
n
n
2
ln(2) ln(
2 )
2
2
2
2
n
n
n
2
lnL = ln(2) ln(
)
2
2
2

n
2
lnL = ln(2) + ln(
)+1
2

lnL =

Por lo tanto, el logaritmo de la verosimilitud (lnL) es aproximadamente igual a:


lnL =

n
ln(
2 )
2

Reemplazando esta ltima expresin en las formulas originales de los criterios de informacin
de Akaike y Schwarz, se demuestra lo planteado.

Econometra I
Profesores: Emerson Melo
Rodrigo Montero
Jaime Ruiz-Tagle / Javiera Vsquez
Primavera 2005
Control 5 - Pauta de Correccin

Rut:

.......................................

Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.

Pregunta 1 (50 puntos)

Considere el siguiente modelo:


yi = 0 + 1 x1i + ui

donde yi es la variable a explicar, x1i es la nica variable explicativa, ui es el trmino de


error y i = 1, . . . , n. Asuma que se cumplen todos los supuestos del Modelo de regresin
Lineal Clsico, y que los errores tienen un distribucin normal ui N (, 2 ).

Utilizando las condiciones de primer orden de la maximizacin de verosimilitud ,

muestre que el estimador mximo verosmil pasa por los puntos medios de los datos sobre yi y xi . Esto es, muestre que se cumple y = 0M V + 1M V x1 , donde 0M V y 1M V son
los estimadores de mxima verosimilitud de 0 y 1 respectivamente.

Para ello, recuerde que la funcin normal para una variable centrada en su media (es
decir, con media igual a cero) se escribe como:


1
x2
f (x) = exp 2 .
2
2

Solucin

normal es:

La funcin de verosimilitud conjunta para errores i.i.d. con distribucin


L=

n
Y



u2
1
exp i2 .
2
2
i=1

Luego, el logaritmo de la funcin de verosimilitud conjunta es:


n
X



1
u2
exp i2
2
2
i=1

n 
X
n
u2i
= n ln() ln(2) +
2 .
2
2

ln(L) =

ln

i=1

Dado que ui = yi 0 1 x1i , la funcin a maximizar es



n 
X
n
(yi 0 1 x1i )2
ln(L) = n ln() ln(2) +

.
2
2 2
i=1

De la condicin de primer orden de maximizacin al derivar con respecto al parmetro


0 , imponiendo que la solucin corresponde a la los estimadores de mxima verosimilitud
(0M V y 1M V ) se obtiene:
2

n
X
i=1

(yi 0M V 1M V x1i )

2 2
n
X

!
= 0

(yi 0M V 1M V x1i ) = 0

i=1
n
X

yi = n 0M V + 1M V

Pni=1
i=1 yi
n

= 0M V +

x1i
i=1
Pn
MV
i=1 x1i

y = 0M V + 1M V x1 .

n
X

Pregunta 2 (50 puntos)

Explique en qu consiste cada uno de los 3 test de hiptesis usados en inferencia bajo Mxima Verosimilitud. Haga una comparacin crtica de los test, estableciendo sus
ventajas y desventajas.

Los 3 tests usados en inferencia bajo Mxima Verosimilitud son: el test LR


(Likelihood Ratio - Razn de Verosimilitud), el test de Wald y el test LM (Lagrange
Multiplier - Multiplicador de Lagrange).
Solucin

Los estadsticos de cada uno de los tests son los siguientes:





LR = 2 ln L(,
) ln L(,
)
W
LM

(R r)0 [R(X 0 X)1 R0 ](R r)

2
a 2
2
= nR
q

2q
a

2q

donde y corresponden a los estimadores del modelo no restringido, y son los


estimadores del modelo restringido, y el R2 corresponde a aquel de la regresin auxiliar
de u sobre X , donde u son los residuos del modelo restringido y X es la matriz de
todas las variables explicativas. Finalmente, q corresponde al nmero de restricciones
involucradas.
Asintticamente los 3 tests son equivalentes en el sentido que el estadstico asociado
a cada uno de ellos sigue una distribucin Chi-cuadrado. Dada la naturaleza asinttica
de los test, deben ser aplicados con mucho cuidado en muestras relativamente pequeas,
en las cuales se debiera prefererir tests como el F o el t. Una ventaja importante de
estos tests es que permiten testear restricciones no lineales.
En el test LR, si la restriccin reduce signicativamente la funcin de verosimilitud,
entonces el test rechaza la hiptesis nula de las restricciones. Por lo tanto, el LR test
requiere la estimacin del modelo no restringido y del modelo restringido. Sin embargo,
la construccin del estadstico LR es extremadamente simple, requiriendo simple resta.
Todos los paquetes econmetricos entregan el valor la funcin de verosimilitud.
3

El test de Wald involucra slo la estimacin del modelo no restringido, y analiza las
implicancias de las restricciones. La construccin del estadstico W involucra manejo
matricial, hacindolo ms demandante.
El test LM analiza la pendiente de la funcin de verosimilitud y nalmente slo requiere la estimacin del modelo restringido. La construccin del estadstico requiere
una regresin auxiliar.
Usualmente, el modelo original y el tipo de restricciones determinarn cul test es ms
sencillo de aplicar. En algunos casos el modelo no restringido puede ser tan complejo
que el test LM se hace ms conveniente. En otros casos, las restricciones pueden generar
un mayor costo de estimacin del modelo restringido, haciendo que el test de Wald sea
ms conveniente.

Econometra I

Verano 2005-2006

Profesor : Jaime Ruiz-Tagle V.


Ayudante : Roberto Jaramillo M.
Control 5 - Pauta de Correcin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no
tiene derecho a reclamo.
Pregunta 1 (30 puntos)

Los criterios de informacin de Akaike (AIC) y Schwartz (BIC) se denen como:


2 ln(L) k
+
n
n
ln(n)
2 ln(L)
+k
,
BIC =
n
n
AIC =

donde L es la funcin de verosimilutud conjunta, k el nmero de regresores y n es el nmero


de observaciones incluidas en el modelo.
(a) (15 puntos) Para qu sirven estos criterios de informacin? Explique las consideraciones
que hay que tener al utilizarlos.

Los criterios de informacin de Akaike y Schwartz se utilizan para seleccionar el mejor


modelo entre modelo anidados. Modelos anidados se reere a modelos que estn contenidos como un caso especial de otro. Los criterios de informacin se basan en el valor
maximizado del logaritmo de la funcin de verosimilitud para cada uno de los modelos.
Las consideraciones que hay que tener son: que los modelos a comparar sean efectivamente anidados y que el nmero de observaciones en utilizado en la estimacin de cada
uno de los modelos sea el mismo.

(b) (15 puntos) Explique intuitivamente por qu se busca minimizar (segn esta denicin)
los criterios de informacin.

Sabemos que el logaritmo de la funcin de verosimilitud es siempre negativo dado que


la funcin de verosimilitud es una multpiplicacin de probabilidades (el logaritmo de un
argumento menor que 1 y mayor que cero es siempre negativo), y que al estimar los
parmetros del modelo por Mxima Verosimilitud se busc maximizar dicho valor. Por
1

lo tanto, dado que para calcular el valor del ndice se usa el valor del logaritmo de la
funcin de verosimilitud, sabemos que ambos ndices, Akaike y Schwartz, son positivos.
Un valor de ln L ms cercano a cero indicar un mejor ajuste, de modo que el ndice
ser minimizado para obtener el modelo ptimo.
Pregunta 2 (30 puntos)

(a) (10 puntos) Si se omite una variable relevante en la estimacin de un modelo se produce un sesgo. Cul la estimacin que est sesgada? De qu depende el signo del sesgo?

Al omitir una variable relevante del modelo se producir un sesgo en la estimacin de los
parmetros de todas las variables del modelo. El signo del sesgo depende de la relacin
existente entre la variable omitida y el resto de las variables y del signo del parmetro
de la variable omitida en el modelo verdadero. Adems, se producir un sesgo en la estimacin la varianza de los estimadores de los parmetros. En particular, se subestimar
la varianza de los estimadores. Finalmente se sobreestimar la varianza de los errores.

(b) (10 puntos) Explique en qu consiste la heterocedasticidad y por qu podra surgir en


la estimacin de un modelo economtrico. Adems, explique las consecuencias en la estimacin e interpretacin de los resultados del modelo.

La heterocedasticidad corresponde a la existencia de errores cuyas varianzas no son


iguales, rompiendo con el supuesto de que los errores son homocedsticos con varianza i2 = u2 i. La heterocedasticidad podra surgir en un modelo economtrico porque
podra ocurrir que sea ms fcil predecir (el modelo es mejor) para cierto tipo de observaciones. Por ejemplo, en un contexto de una estimacin de salarios, podra ser ms fcil
predecir para aquellos con baja educacin y ms difcil para aquellos con alta educacin.
Ello resulta en errores de estimacin del modelo con varianzas ms altas para aquellos
con alta educacin.
La presencia de heterocedasticidad, al afectar solamente la varianza de los errores, no
genera sesgo en la estimacin de los parmetros del modelo. No obstante, s se produce un sesgo en la estimacin de las varianzas de los parmetros. En particular, se
obtienen varianzas ms grandes (el estimador de Mnimos Cuadrados Ordinarios deja
de ser MELI). Por esto, y dado que los tests de inferencia se construyen basados en las
varianzas de los estimadores, se obtendr que los tests de hiptesis se invalidan, por lo
que la interpretacin de los resultados de la estimacin del modelo se hace incierta.

(c) (10 puntos) Explique en qu consiste y para qu sirve el mtodo de estimacin de Mnimos Cuadrados Generalizados Factibles (MCGF). [Nota: No es necesaria una demostracin
matricial, pero el uso de expresiones algebraicas puede contribuir a una explicacin ms
clara].

Cuando estamos en presencia de heterocedasticidad, se puede estimar correctamente las


2

varianzas si se conoce la estructura de la matriz de covarianzas y aplicando el mtodo


de Mnimos Cuadrados Generalizados (MCG). No obstante, cuando no se conoce la estructura de la matriz de covarianzas, no se puede aplicar MCG, pero s se puede aplicar
Mnimos Cuadrados Generalizados Factibles (MCGF).
El mtodo de MCGF (White, 1980) utiliza la se realiza en 2 etapas. En la primera
etapa se estima el modelo por MCO. En la segunda etapa, con la informacin contenida
en la matriz de covarianzas de los residuos, se corrige la matriz de covarianzas inicial
para tener una estimacin consistente.
La matriz de covarianzas del estimador de MCO viene dada por:

V ar(|X)
= (X 0 X)1 (X 0 u2 X)(X 0 X)1
1
= n(X 0 X)1 ( u2 X 0 X)(X 0 X)1
n

Se desconoce la matriz . Luego el mtodo de MCGF propone estimar n1 u2 X 0 X como


n

X
= 1

u
2i xi x0i .
n
i=1

Finalmente, la matriz de covarianzas corregida resulta

0 X)1 .
V ar(|X)
= n(X 0 X)1 (X

Universidad de Chile
Facultad de Economia y Negocios
CONTROL 5
Econometra I
Oto
no 2006

Profesoras: Javiera Vasquez y Claudia Sanhueza.


Nombre:...........................................................................................................
Rut:...........................................................................................................
1. Dado el modelo de regresion:
y i = + ui
Donde E(ui ) = 0 y V (ui ) = x2i . Encuentre el estimador MELI de .
Respuesta
Dada la heterocedasticidad presente en el error, el metodo mas eficiente de estimacion es MCG, ya que se conoce la matriz de varianzas
y covarianzas del error:

x21 0 0
0 x22 0
..
..
. 0
.
0
0 0 x2n

1
x21

x22
..
.
0
0
0

1
, =
.

1
x2n

Como el modelo incluye solo una variable explicativa, la constante, la


matriz X es un vector de unos y por lo tanto:

h
i

0 1
(X X) = 1 1

1
x21

0
..
.
0

x22
..
.
0
0
0

0
1
0

..

.
0 1

1
x2n

T
X

1
=

2
i=1 xi

X Y =

1
x21

i
1 1

0
..
.
0

...

0
1
x22

y1
T
0
X

yi

.
. =
2

0 y
i=1 xi
n
1

x2n

Con lo cual es estimador MCG queda:


yi
i=1 x2
i
PT 1
i=1 x2
i

PT

M CG = (X X) X Y =

2. La omision de una variable relevante siempre sobrestima el verdadero


valor del parametro y su varianza.
Respuesta
Falso, no siempre se sobrestima, la omision de una variable relevante
siempre produce sesgo en los parametros a menos que la correlacion
entre la variable omitida y las explicativas incluidas sea cero, y el signo
del sesgo depende de dos cosas: la correlacion entre la variable omitida
y las variables explicativas incluidas y el valor del parametro asociado
la variable omitida (valor poblacional). Para un modelo sencillo con
una variable explicativa (x1) y una variable omitida (x2) el sesgo es:
cov(x1 ,x2 )
2 , donde se aprecia claramente lo anterior. Con respecto a la
var(x1 )
varianza, el sesgo de esta no es claro, pues no podemos estimar 2 de
manera correcta.

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 5

Semestre: Primavera 2006


Profesores: Jos Miguel Benavente, Rodrigo Montero
Tiempo de duracin: 20 minutos
No hay preguntas de ningn tipo para los ayudantes
Comente (6 puntos)
Los modelos no lineales no pueden ser estimados por mnimos cuadrados ordinarios (MCO).
Respuesta. Falso. Existen modelos no lineales que son linealizables, y por ende,
son susceptibles de ser estimados a travs del mtodo de mnimos cuadrados ordinarios. Un ejemplo de estos modelos lo constituye la funcin Cobb-Douglas. En
este caso particular, la linealizacin se efecta a travs de una transformacin logartmica. No obstante lo anterior, hay modelos que no son linealizables, y por lo
tanto, no pueden ser estimador por MCO. En este escenario existen dos alternativas de estimacin: (i) mnimos cuadrados no lineales, (ii) mxima verosimilitud.
En ambos casos ser necesario utilizar mtodos numricos para obtener la solucin.

Ejercicio (14 puntos)


Se tiene una muestra de 20 trabajadores, de los cuales slo 6 utilizan un computador en su lugar de trabajo. El salario promedio de aquellos que no utilizan un
computador es de $280.000, mientras que la remuneracin (promedio) de aquellos
que s utilizan uno es de $300.000.

1. Especifique el modelo que puede ser estimado para cuantificar el retorno al


uso del computador en el lugar de trabajo. Para ello considere la inclusin
de dos variables dummies. (3 puntos)
Respuesta. El modelo tiene la siguiente forma:

Yi = 1 D1i + 2 D2i + ui
donde Yi es el salario del trabajador, D1i es una variable dummy que toma
el valor uno si la persona no utiliza un computador en su lugar de trabajo,
y cero si no, D2i es una variable dummy que toma el valor uno si la persona
utiliza un computador en su lugar de trabajo, y cero si no, y finalmente, ui
es un trmino de error bien comportado.
2. Encuentre los estimadores MCO del modelo anterior. (6 puntos)
Respuesta. En trminos matriciales, el modelo puede escribirse de la siguiente forma:
Y = X + u
donde:

d11

d21

d12 d22

X= .
.. = (D1 D2 )
.
.
.

d1n d1n
y:

1
=
2
Luego:

= (X 0 X)1 X 0 Y =

D10 D1

D10 D2

D20 D1

D20 D2

D10 Y

D20 Y

(1)

Finalmente:

1 P

d1i Yi
Y1
280,000
1
N1 0
= =

P
=

d2i Yi
Y2
300,000
2
0 N2

(2)

3. Encuentre la matriz de varianzas y covarianzas. (3 puntos)


Respuesta. La estimacin para la matriz de varianzas y covarianzas viene
dada por la siguiente expresin:
=
var()
2 (X 0 X)1
Dado que no se conocen los salarios individuales, no es posible estimar 2 .
Por lo tanto:

=
var()
2

N1

N2

2
14

2
6

4. Especifique nuevamente el modelo pero ahora incluya slo una variable dummy, y deje como categora base a aquellos que no utilizan un computador
en su lugar de trabajo. Cmo se relacionan los coeficientes de este modelo
con aquellos definidos en la parte (1)? (2 puntos)
Respuesta. El modelo a estimar sera el siguiente:
Yi = 0 + 1 D2i + ei
Por lo tanto, se cumple lo siguiente:
0 = 1
1 = 2 1

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 5

Semestre: Primavera 2007


Profesores: Jos Miguel Benavente, Rodrigo Montero
Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros
Tiempo de duracin: 40 minutos
No hay preguntas de ningn tipo para los ayudantes
Est permitido utilizar calculadora

Considere dos muestras de datos para estimar el siguiente modelo: Yi = 0 +


1 Xi + ui . La primera de ellas (muestra I) contiene la siguiente informacin:



50 300
0
XX=
Y 0 X = 300 2000
Y 0 Y = 2100
300 2100
Por su parte, la segunda muestra (muestra II) presenta las siguientes caractersticas:



50 300
0
XX=
Y 0 X = 300 2200
Y 0 Y = 2800
300 2100
As, se dispone en total de 100 datos, pero que han sido agrupados en dos muestras. En base a esta informacin responda lo siguiente:
1. Calcule los estimadores de mnimos cuadrados ordinarios (MCO) de las dos
muestras por separado. (30 puntos)
Respuesta. Para la muestra I se tiene lo siguiente:
  
1 
  
0

50
300
300
2
M
CO

= =
=
2/3
300
2100
2000
1
Para la muestra II:
M CO =

  
1 
  
0
50 300
300
2
=
=

300 2100
2200
4/3
1

2. Estime la varianza de los residuos de MCO (


2 ) para cada una de las mues0
0
0
tras. (Ayuda: recuerde que: u u = Y Y X 0 Y ) (30 puntos)
Respuesta. Para la muestra I:


 300
500
0
0
0 0

u u = Y Y X Y = 2100 2 2/3
=
2000
3
Luego:
I 2 =

500/3
= 3, 472
48

Para la muestra II:


0


u u = Y Y X Y = 2800 2 4/3


1400
300
=
2200
3

Luego:
1400/3
= 9, 722
48
3. Aplique el test de Goldfeld y Quandt para evaluar la presencia de heteroscedasticidad en los residuos de ambas muestras. Utilice un valor crtico
para la distribucin F igual a 1,61. (Ayuda: recuerde que el numerador de
este test corresponde a la muestra que tiene asociada una mayor varianza
en los residuos) (30 puntos)
Respuesta. La hiptesis nula de este test es la presencia de errores homoscedsticos. El test es el siguiente:
II 2 =

II 2
uII 0 uII /NII
=
uI 0 uI /NI
I 2
que se distribuye F con NII y NI grados de libertad en el numerador y
denominador, respectivamente, ya que el numerador del test corresponde
a la varianza estimada de los residuos de la muestra que tiene asociada la
mayor varianza. Por lo tanto:
9, 722
= 2, 8
GQ =
3, 472
valor que es mayor al F crtico de tabla (1,61), por lo que se rechaza la
hiptesis nula de errores homoscedsticos.
GQ =

4. Cules seran las consecuencias para la estimacin de MCO el rechazar la


hiptesis nula planteada por el test de Goldfeld y Quandt? (10 puntos)
Respuesta. Frente a la presencia de errores heteroscedsticos, el estimador
MCO es insesgado y consistente, sin embargo, ya no es el ms eficiente. En
este contexto habra que aplicar el mtodo de mnimos cuadrados generalizados (MCG) si es que se quisiera estimar utilizando las dos muestras en
conjunto.
2

Departamento de Economa

Universidad de Chile

STA300

Econometra I
Profesores: Tom
as Rau y Javiera V
asquez.
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sep
ulveda.
o 2008, Pauta Control 5
Oton

1. Suponga el siguiente modelo con una variables explicativa x1 mas una constante:

y = + x1 + u
De esta forma la matriz X es de la siguiente forma:

X=

1
1
1
..
.

x11
x12
x13
..
.

x1n

Muestre que el estimador de obtenido a traves de la regresion particionada equivale al estimador


del modelo original en desvos con respecto a la media.
Respuesta
y = X + u

Donde X = [i x1 ]

Donde i es un vector de dimensi


on n de unos. El estimador particionado de es
1
= (x01 M x1 ) (x01 M y)

Donde
M = I i(i0 i)1 i0
Es facil ver que i0 i = n y que

ii0 =

1
1
..
.

1
1
..
.

..
.

1
1

1
1 nn

Lo anterior implica:

1
n
1
n

1
n
1
n

..
.

..
.

1
n

1
n

i(i0 i)1 i0 = .
..

1
n
1
n
1
n
1
n

nn

Por lo tanto la matriz M corresponde a la matriz de desviaciones con respecto a la media.


1

Departamento de Economa

Universidad de Chile

2. La omisi
on de variables relevantes siempre sobreestima el verdadero valor del parametro y su
varianza. Comente.
Respuesta
Falso, la omisi
on de variables relevantes no genera problemas de eficiencia, al contrario, la varianza es
menor, pero s genera problemas de sesgo, el cual depende de dos cosas:
i) La covarianza entre la variable omitida y la includa.
ii) Signo del parametro poblacional de la variable omitida.
Vemos que se estara sobreestimando si ambos son positivos o negativos y subestimando si es que
existe diferencia en el signo de estos elementos.

CONTROLES 6

Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 6

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas
a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta
con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos)Si existe Heterocedasticidad en los errores, el estimador
Mnimos Cuadrados Ordinarios ser sesgado, sin embargo, cuando existe autocorrelacin en los errores no se produce sesgo en los parmetros estimados. (Comente).
Falso, ambos problemas Heterocedasticidad y Autocorrelacin no generan problemas en la propiedad de insesgamiento de los parmetros estimados por MCO,
ya que el supuesto de que E(u) = 0 no se ha quebrado. Ambos problemas generan
problemas de eficiencia en la estimacin por MCO.
Pregunta 2: (70 puntos)
Dado el modelo de regresin yi = + i , donde E(i ) = 0, V (i ) = 2 x2i .
(a) Encuentre el estimador MELI de .
El estimador eficiente de es el estimador MCG
el patrn de Heterocedasticidad.

0
x21 0
0 x2 0
2

= .. . .
..
..
.
.
.
.
0 0 x2n

(ya que conozco la matriz o

(1)

De esta forma 1 es:

1
x21

0
1

x22
..
...
.
0

0
..
.
0

0
0
..
.
1
x2n

(2)

Adems como nuestro modelo incluye como variable explicativa slo la constante,
nuestra matriz X es:

1
1

X = ..
(3)
.
1
De esta forma:

X X=

1 1

X Y =

1
x21

1 1

0
1

x22
..
...
.
0

0
..
.
0

1
x21

0
..
.
0

0
1

x22
..
...
.
0

0
0
..
.
1
x2n

0
0
..
.

1
x2n

PT
0

M CG = (X X) (X Y ) =

T
X
1

=
t=1 x2t

y1
y2
..
.
yT

yt
t=1 x2t
PT 1
t=1 x2t

(b) Encuentre el estimador de la varianza de .


El estimador de la varianza de es:
2

V (
M CG ) =
2 (X 0 1 X)1 = PT

1
t=1 x2t

1
1
..
.

(4)

T
X
yt

=
t=1 x2t

(5)

Econometra I
Profesores: A. Otero y J. Vsquez.
Otoo 2005
Pauta Control 6
Pregunta 1: (30 puntos) El estimador consistente de Newey and West es el ms eficiente dentro de los estimadores lineales cuando existe autocorrelacin.
Falso, cuando tenemos problemas de autocorrelacin el estimador MCO deja de ser eficiente, su varianza es igual a 2 (X 0 X)1 X 0 X(X 0 X)1 > 2 (X 0 X)1 . El estimador de Newey and
West nos permite estimar consistentemente esta varianza, la cual sigue siendo ineficiente.
Pregunta 2: (70 puntos) Considere el Modelo: yt = xt +ut , donde E(ut ) = 0, V (ut ) = k(xt )2
y Cov(ut , us ) = 0 t 6= s. Adems dispone de 5 observaciones de la variable dependiente y de
la variable explicativa:
yt
2
3
10
1
3

xt
1
2
4
1
1

Encuentre el estimador eficiente de y de su varianza.


Este modelo no tiene problemas de autocorrelacin, pero si de heterocedasticidad, ya que la
varianza del error cambia para para observacin t. De esta forma, el estimador eficiente es el de
MCG que consiste en transformar el modelo original dividiendo cada observacin de la variable
dependiente y explicativas por la desviacin estndar del error asociado a esta observacin, una
vez transformado el modelo se estima por MCO.
La variables yt y xt transformadas son:
yt

xt

yt
yt
yt

=p
=
2
2
t
xt k
k xt
xt
xt
1
=p
=
2
2
t
k
k xt

(10 puntos)
El mtodo eficiente de MCG consiste en estimar por MCO el modelo: yt = xt + ut , doniid

de ut (0, 2 ):

PT

M CG

t=1

PT

yt xt

2
t=1 (xt )
PT
yt
t=1 xt k

PT

t=1

PT

1
2 k

yt
t=1 xt
T
2 k

PT
M CG

yt
t=1 xt

Reemplazando los valores de las 5 observaciones que se dispone:


M CG

=
=

2
1

3
2

10
4

1
1

3
1

5
2 + 1,5 + 2,5 + 1 + 3
10
=
=2
5
5

(40 puntos)
La varianza del estimador MCG es:
V (M CG ) = 2 (X 0 1 X)1

0
V (M CG ) = (X X )1

Por lo tanto:
V (M CG ) =

PT

PT

2
t=1 (xt )

t=1

T
2 k
2

k
2k
=
T
10

V (M CG ) =
(20 puntos)

Econometra
Facultad de Ciencias Econmicas y Administrativas
Universidad de Chile
Control 6

Semestre: Primavera 2005


Profesores: Emerson Melo, Rodrigo Montero y Jaime Ruiz-Tagle
Rut:

.......................................

Tiempo de duracin: 30 minutos


No hay preguntas de ningn tipo para los ayudantes.

Un investigador quiere estimar la siguiente relacin:


Si = + SiP + i

(1)

donde Si representa los aos de escolaridad del individuo i, SiP representan los
aos de escolaridad (promedio) de los padres del individuo i, y i es un trmino
de error bien comportado. En otras palabras, se est modelando el impacto que
tiene la escolaridad de los padres sobre los niveles de escolaridad de sus hijos. Sin
embargo, este investigador ha olvidado incluir la habilidad de los hijos como un
determinante clave de su escolaridad. En realidad, la verdadera relacin existente
entre la escolaridad de los hijos y la de sus padres debera ser estimada a travs
de la siguiente ecuacin:
Si = + SiP + Hi + i

(2)

1. Demuestre que al estimar a partir de la ecuacin (1) se incurre en un


sesgo.
1

Respuesta. El estimador de mnimos cuadrados ordinarios (MCO) de


viene dado por:

PN P
s si

= PNi=1 iP
2
i=1 (si )
donde la variable en minsculas denota que se encuentra en desviacin respecto de su media. Por otro lado, la ecuacin (2) en desvos respecto de la
media viene dada por:
si = sPi + hi + i
Reemplazando si en la frmula de la estimacin de MCO, se tiene lo siguiente:
=
finalmente:

PN
i=1

sPi (sPi + hi + i )
PN P 2
i=1 (si )

PN

PN

P
i=1 si i
+
P
N
P 2
P 2
i=1 (si )
i=1 (si )
Aplicando esperanza a la expresin anterior:
P
i=1 si hi

= + PN

=+
E()

Cov(SiP , Hi )
V ar(SiP )

Por lo tanto, al estimar a travs de (1) se incurre en un sesgo, el cual


viene dado por:
=
E()

Cov(SiP , Hi )
V ar(SiP )

2. De qu depende el sesgo de la estimacin?


Respuesta. Como puede apreciarse del resultado anterior, el sesgo depende
de dos elementos:
a) () El efecto que tiene la variable omitida, habilidad, sobre la variable
dependiente del modelo (escolaridad)
b) (Cov(SiP , Hi ) La relacin que existe entre la variable omitida, habilidad, y la variable explicativa incluida en la estimacin del modelo
(escolaridad de los padres)
2

3. Es posible especular respecto de la direccin de este sesgo?


Respuesta. Por supuesto que s. En primer lugar, es muy posible que el
efecto que tiene la habilidad sobre la escolaridad de las personas sea positivo
(), ya que personas ms hbiles debieran alcanzar, en promedio, mayores
niveles educativos. Por otro lado, es tambin bastante probable que padres
con mayor escolaridad tengan a su vez hijos con mayor habilidad (hay un
mayor estmulo, y adems, es probable que exista una correlacin positiva
entre habilidades intergeneracionales). Por lo tanto, es muy probable que el
estimador MCO est sesgado hacia arriba.
4. Suponga que dispone de los siguientes datos:
Escolaridad (S)

Escolaridad de los padres (S P )

Habilidad (H)

12

11

12

16

14

17

10

21

20

10

Si usted omite la variable habilidad en su estimacin, cul es el coeficiente


estimado para ?
Respuesta. El estimador MCO viene dado por:
PN P
s si
Cov(Si , SiP )
41, 95

=
= 0, 9808
= PNi=1 iP =
P
2
42, 77
V ar(Si )
i=1 (si )
5. Si ahora incluyera la variable habilidad en la estimacin, cmo esperara
usted que fuera el coeficiente estimado para ? Justifique (5 puntos)
Respuesta. De acuerdo a lo sealado en (3) lo ms probable es que el
estimador est sesgado hacia arriba, por lo que se esperara que la nueva
3

estimacin arrojara un coeficiente menor que el encontrado anteriormente.


Para poder justificar esto con la informacin que se dispone habra que
asumir que el efecto que tiene la habilidad sobre la escolaridad de las personas es positivo ( > 0), supuesto que no es fuerte. Por otro lado, habra
que pronunciarse respecto de la relacin existente entre la habilidad (H) y
la escolaridad de los padres (SiP ). Sin embargo, esto es posible de saber a
partir de los datos. En efecto:
Cov(SiP , Hi ) = 41, 95
Con estos dos elementos, se concluye que el sesgo de la estimacin sera
postivo.

Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Control 6

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) La existencia de una tendencia creciente en la variable dependiente
que no es considerada en modelo implica una sobrestimacin del verdadero valor del parmetro.
Comente.
La mayora de las variables econmicas tienen una tendencia, generalmente creciente. Si el
conjunto de variables explicativas no explican adecuadamente este comportamiento, entonces el
trmino de error incorporar dicha tendencia, lo que conduce a la existencia de autocorrelacin
positiva. Con rachas de residuos por sobre la media y luego bajo la media.

X Modelo
verdadero
XX
X
Modelo
X
XX
X
estimado
X
X
X
X
XX
X
X
X
X
X
X
X X

Autocorrelacin producida por una tendencia

Pregunta 2: (70 puntos) Suponga el siguiente modelo de regresin: yt = xt + ut con t=1,2 y


3 (slo 3 observaciones), adems ut sigue un proceso autorregresivo de segundo orden AR(2):
ut = 0,1ut1 + 0,5ut2 + t
Encuentre la matriz de varianzas y covarianzas del error. Disponemos de 3 observaciones, por
lo tanto la matriz de varianzas y covarianzas del error sera de la siguiente forma:
2

12 13
E[uu0 ] = 2 = 21 2 23
31 32 2
1

De esta forma, necesitamos computar la varianza homocedstica del error, y dos covarianzas:
1 , que es la covarianza entre dos trminos de error distanciados u periodo y 2 que es la covarianza entre dos errores distanciados dos periodos.
El trmino de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2:
ut = 1 ut1 + 2 ut2 + t

1 = 0,1,

2 = 0,5

Primero computamos la varianza del error ( ):


2 = E[u2t ] =
2 =
2

E[21 u2t1 + 21 2 ut1 ut2 + 22 ut2 + 21 ut1 t + 22 ut2 t + 2t ]


21 2 + 22 2 + 21 2 1 + 2
21 2
2
2 0,1 0,5
2

+
=

+
1
1
1 21 22
1 21 22
1 (0,1)2 (0,5)2
1 (0,1)2 (0,5)2
2
0,1

1 +
(1)
0,64
0,64

Ahora calculemos la covarianza de primer orden (errores distanciados un periodo (1 ):


1

=
=

E[ut ut1 ] = E[(1 ut1 + 2 ut2 + t )ut1 ]


1 2 + 2 1
1
0,1 2
2 =
= 0,2 2
1 2
0,5

(2)

Reemplazando (2) en (1):

0,02
0,64

0,1
2
0,2 2 +
0,64
0,64
2
0,64
2
0,62

(3)

Reemplazando (3) en (2):


1 =

0,2
2
0,62

(4)

Por ltimo, calculemos la covarianza de segundo orden:


2

=
=

E[ut ut2 ] = E[(1 ut1 + 2 ut2 + t )ut2 ]


1 1 + 2 2
0,2
2
0,1
2 + 0,5
0,62
0,62
0,52 2

0,62

Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error:

0,2
0,52
2
2

1
0,2 0,52
0,62
0,62
0,62
2

0,2
0,2
2
2 =

0,2
1
0,2
E[uu0 ] =
0,62
0,62
0,62
0,62
2

0,52 0,2
1
0,52
0,2
2
2
0,62
0,62
0,62

(5)

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Control 6

Semestre: Primavera 2006


Profesores: Jos Miguel Benavente, Rodrigo Montero
Tiempo de duracin: 20 minutos
No hay preguntas de ningn tipo para los ayudantes
Comente (6 puntos)
En un proceso autoregresivo de primer orden, la estimacin (MCO) de la pendiente ser inconsistente.
Respuesta. Falso. En un proceso AR(1), la pendiente se estima de la siguiente
manera (suponga que la ecuacin a estimar incluye un intercepto):
PT
PT
yt1 ut
t=2 yt yt1

= + Pt=2
= PT 2
T
2
t=2 yt1
t=2 yt1
Aplicando esperanza:
=+E
E()

"P

T
yt1 ut
Pt=2
T
2
t=2 yt1

El insesgamiento se cumplir en la medida que el segundo trmino del lado derecho sea cero. Es posible demostrar que el sesgo es igual a -(1 + 3)/T . Por lo
tanto, el sesgo desaparece a medida que crece T , es decir, el estimador de MCO
es consistente.

Ejercicio (14 puntos)


Considere el siguiente modelo:
Yi = + Xi + ui
1

Existen sospechas de que la varianza del trmino de error para las primeras 22
observaciones (12 ) no es la misma que para las restantes 32 observaciones (22 ).
De hecho, para las primeras 22 observaciones (aquellas con los Xi ms bajos), los
datos producen los siguientes resultados (expresados en desviaciones respecto a
P
P 2
P 2
la media):
xy = 100,
x = 10 y
y = 1040. Para el siguiente grupo de
P
P 2
P 2
observaciones (32), los resultados son:
xy = 216,
x = 16 y
y = 3156.
En base a esta informacin responda lo siguiente:
1. Realice un test de Goldfeld-Quandt al 5 % para determinar si las varianzas
son las mismas para ambos grupos de observaciones. (Ayuda: (1) Para implementar el test no debe omitir observaciones. Trabaje directamente con
ambos grupos de datos; (2) Asuma que el F crtico es de 2,04.) (8 puntos)
Respuesta. El modelo, en desvos respecto a la media es el siguiente:
yi = xi + ui
Por lo tanto, la suma de cuadrados de la regresin (ESS) es igual a 2 x2i .
De esta manera, para el primer grupo de observaciones se tiene lo siguiente:
 P 2
xy
2 2
ESS1 = xi = P 2 x2i = 1000
x
Por lo tanto, la suma de los errores al cuadrado (RSS1 ) es:
RSS1 =

y 2 ESS1 = 40

Para el segundo grupo de observaciones se tiene lo siguiente:


 P 2
xy
2 2
ESS2 = xi = P 2 x2i = 2916
x
Por lo tanto, la suma de los errores al cuadrado (RSS2 ) es:
RSS2 =

y 2 ESS2 = 240

Luego, es estadstico de Goldfeld-Quandt es el siguiente:


u02 u2
Fm,m
u01 u1
con m = (22 + 32 0)/2 2 = 25. Por lo tanto, dado que:
240
= 6 > 2, 04
40
se rechaza la hiptesis nula de homoscedasticidad.
2. Asumiendo que la varianza del trmino de error difiere en ambos grupos
(12 6= 22 ), cmo obtendra el estimador de mnimos cuadrados factibles
(M CF )? (6 puntos)
Respuesta. De acuerdo a lo encontrado en el apartado anterior, las varianzas de ambos grupos efectivamente difieren. Para estimar por MCF se
requiere contar con una estimacin para la matriz de varianzas y covarianzas. Para el primer grupo se tiene lo siguiente:

12 =

40
u01 u1
=
=2
n1 k
20

22 =

u02 u2
240
=
=8
n2 k
30

Y para el segundo grupo:

Por lo tanto:
1 2

12 =
4 2
Una opcin entonces es corregir los datos del primer modelo, de manera
de hacer homogneas las varianzas. Para ello, se debe premultiplicar por la
matriz P . Se sabe que:
P 0 P = 1

Dado que es una matriz diagonal con 1/4 en su diagonal, entonces, se


cumple lo siguiente:
0

2
2 0 0

0 2 0 0

.. .. . .
.. ..
. . .
. .

0
0 0 2

4 0



2 0 0

.. . .
.. = ..
. . .
.

0 2
0

4 0

.. . .
..
. .
.

0 4

Luego:
Y = + X + u
donde Y = 2Y , y as respectivamente para las otras variables. Por lo tanto,
P
para el primer grupo de observaciones, ahora se tiene que
xy = 400 y
P 2
x = 40. El estimador MCF de ser:
400 + 216
=
= 11
40 + 16
3. Cmo se estimara la varianza del estimador de mnimos cuadrados ordinarios, V ar(M CO ), si la varianza del trmino de error difiere entre los dos
perodos? (6 puntos)
M CO viene dada por la
Respuesta. La estimacin de la varianza de beta
siguiente expresin:
= (X 0 X)1 X 0 W X(X 0 X)1
var(beta)
donde la matriz W es una diagonal con 22 dos (2s), seguidos de 32 ochos
(8s). Por lo tanto:
=
var(beta)

1
1
(2 10 + 8 16)
= 0, 22
(10 + 16)
(10 + 16)

Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Control 7

Nombre:

..........................................................................................

Rut:

.......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes,
no puede usar calculadora, no puedo tener nada ms que lpiz en su escritorio, si contesta con
lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible
Pregunta 1: (30 puntos) Si existe Heterocedasticidad en los errores, el estimador Mnimos
Cuadrados Ordinarios ser insesgado, sin embargo, cuando existe autocorrelacin en los errores
se produce sesgo en los parmetros estimados. (Comente).
Falso, ambos problemas Heterocedasticidad y Autocorrelacin no generan problemas en la propiedad de insesgamiento de los parmetros estimados por MCO, ya que el supuesto de que
E(u) = 0 no se ha quebrado. Ambos problemas generan problemas de eficiencia en la estimacin por MCO.
Pregunta 2: (70 puntos)
Suponga que en el siguiente modelo de regresin: yt = xt + ut con t=1,2,3 (slo 3 observaciones en la muestra), ut sigue un proceso autorregresivo de segundo orden AR(2):
ut = 0,1ut1 + 0,5ut2 + t
Encuentre la matriz de varianzas y covarianzas del error (u).
Disponemos de 3 observaciones, por lo tanto la matriz de varianzas y covarianzas del error
sera de la siguiente forma:
2

12 13
E[uu0 ] = 2 = 21 2 23
31 32 2
De esta forma, necesitamos computar la varianza homocedstica del error, y dos covarianzas:
1 , que es la covarianza entre dos trminos de error distanciados u periodo y 2 que es la covarianza entre dos errores distanciados dos periodos.
El trmino de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2:
ut = 1 ut1 + 2 ut2 + t

1 = 0,1,

2 = 0,5

Primero computamos la varianza del error ( 2 ):


2 = E[u2t ] =
2 =
2

E[21 u2t1 + 21 2 ut1 ut2 + 22 ut2 + 21 ut1 t + 22 ut2 t + 2t ]


21 2 + 22 2 + 21 2 1 + 2
21 2
2
2 0,1 0,5
2

+
=

+
1
1
1 21 22
1 21 22
1 (0,1)2 (0,5)2
1 (0,1)2 (0,5)2
2

0,1
1 +
(1)
0,64
0,64

Ahora calculemos la covarianza de primer orden (errores distanciados un periodo (1 ):


1

=
=

E[ut ut1 ] = E[(1 ut1 + 2 ut2 + t )ut1 ]


1 2 + 2 1
1
0,1 2
= 0,2 2
2 =
1 2
0,5

(2)

Reemplazando (2) en (1):

0,02
0,64

0,1
2
0,2 2 +
0,64
0,64
2

0,64
2
0,62

(3)

Reemplazando (3) en (2):


1 =

0,2
2
0,62

(4)

Por ltimo, calculemos la covarianza de segundo orden:


2

=
=

E[ut ut2 ] = E[(1 ut1 + 2 ut2 + t )ut2 ]


1 1 + 2 2
0,2
2
0,1
2 + 0,5
0,62
0,62
0,52 2

0,62

Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error:

0,2
2 0,52
2
1
0,2 0,52
0,62
0,62
0,62
2

0,2
0,2
2
2 =
0,2
1
0,2
E[uu0 ] =
0,62
0,62
0,62
0,62
2

0,52
0,2
1
0,52
0,2
2
2

0,62
0,62
0,62

(5)

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Control Recuperativo
Pregunta 1: (30 puntos) Si la variable dependiente se encuentra medida con error, el estimador MCO subestima el valor poblacional de los parmetros. Sin embargo, si la(s) variable(s)
explicativa(s) esta(n) medida(s) con error, el estimador MCO sobreestima el valor poblacional
de los parmetros. Comente.
Falso, si slo la variable dependiente esta medida con error, los supuestos para que MCO sea
insesgado no se ven afectados. Sin embargo, si la variable explicativa esta medida con error,
se rompe el supuesto cov(ut , xt ) = 0, el estimador MCO es sesgado hacia el origen, siempre
subestima el verdadero valor del parmetro.
Pregunta 2: (70 puntos) Dado el siguiente modelo:
yt = 0 + 1 xt + ut
ut = ut1 + t
iid

donde t N (0, 2 ). Adems dispone de las siguientes observaciones:


t
yt
xt

1
22
4

2
26
6

3
32
10

4
34
12

5
40
14

6
46
16

7
46
20

8
50
22

Obtenga una estimacin eficiente de los parmetros 0 y 1 , sabiendo que = 0,5.


R:
Para estimar eficiente el modelo debemos utilizar el mtodo de Mnimos Cuadrados Generalizados, que consiste en transformar el modelo original de forma tal que el error este libre de
autocorrelacin, como en este caso el error sigue un procedimiento AR(1) se debe transformar
de la siguiente forma la variable dependiente y explicativa del modelo:
yt = yt 0,5yt1
xt = xt 0,5xt1
De esta forma, se tienen los siguientes datos transformados:
t
1
2
3
4
5
6
7
8
Suma

yt
22
26
32
34
40
46
46
50

xt
4
6
10
12
14
16
20
22

yt

xt

x y

x2

15
19
18
23
26
23
27
151

4
7
7
8
9
12
12
59

60
133
126
184
234
276
324
1337

16
49
49
64
81
144
144
547

El estimador MCG consiste en estimar por MCO el modelo transformado:


yt = 0 (1 ) +1 xt + t
| {z }

As, el estimador MCG de los parmetros es:


0
0
M CG = (X X )1 X Y

P8

7 59
t=2 xt
P
=
8
2

59 547
t=2 xt
t=2 xt
P8

0
y
151
X Y = P8 t=2 t =
1337
t=2 yt xt

P8

X X =

M CG

M CG

7
59

10,67241379
1,293103448

59
547

151
1337

Debemos recuperar 0 de la siguiente forma:

0 (1 )

(1 )
10,67241379
= 21,34482759
0,5

De esta forma, los estimadores eficientes de 0 y 1 son 1.29 y 21.35, respectivamente.

SOLEMNES

Solemne Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004

Nombre:

...........................................................................................

Rut:

.......................................

Ud. Dispone de 120 minutos para resolver la Solemne, no puede hacer consultas a
los ayudantes, slo lpiz y calculadora sobre su escritorio, si contesta con lpiz mina no
tiene derecho a reclamo. Contestar slo en el espacio disponible.

I. Comentes: De los siguientes 7 comentes Ud. debe elegir solo 4 de


ellos. Cada comente tiene 10 puntos asignados.
Comente 1: En el modelo de regresin lineal siempre se cumple que la

Pn

i
i=1 u

= 0.

Repuesta:
Falso, esto slo se cumple cuando el modelo incluye constante.Recordemos la CPO
de
X 0 X = X 0 Y , donde
de este vector de dimensin
Kx1 es:
P MCO:
P el primer
P elemento
P

(1 + 2 x2 + ... + k xk ) = y (y 1 2 x2 ... k xk ) = 0 u
= 0. Si el
trmino constante no se incluye, esta primera CPO no existe. Recuerde que la constante

ajusta la regresin de manera tal que se cumpla


P que Y = Y , si sta no se incluye no se
garantiza tal igualdad, como tampoco que
u
= 0.

Comente 2: Suponga que la variable dependiente, pero no la independiente, esta expresada en desvos con respecto a la media. Qu implicancias tiene esto sobre el posible
sesgo de la estimacin por MCO?
Repuesta:
No hay implicacias en el insesgamiento de en un modelo del tipo y = + x + u. Pero
al estar y en devios respecto a su media, el modelo puede ser expresado de la siguiente
manera: y = + x + u, donde la constante que estimemos no ser la misma que
en un modelo donde y no est en desvios con respecto a su media, est nueva constante
ser tal que ajuste la nueva escala de y (en desvios con respecto a la media) de manera
que y = y. Por lo tanto la constante ser sesgada.

NO ESCRIBIR EN ESTA PGINA PORQUE NO SE VA A CORREGIR

Comente 3: Los Experimentos de Montecarlo no son un ejercicio muy til, porque


debemos conocer los verdaderos valores de los parmetros.
Repuesta:

Falso, son un ejercicio muy til. Por lo dems, no se requiere el conocimiento de los
verdaderos parmetros, ya que en este tipo de ejercicios uno es el "Dios", por lo tanto,
uno determina cmo se generan las y, yo s exactamente cual es su estructura y yo genero la muestra de variables dependientes. Luego esto me permite ver el comportamiento
de los parmetros estimados, cuando, por ejemplo, se invalida algn supuesto de MCO,
ya que conozco (yo lo impuse) los verdaderos parmetros.

Comente 4: Si estimo un modelo de regresin donde las ingresos son la variable dependiente y la escolaridad la variable explicativa, debera obtener el mismo valor para el
parmetro si es que estimo un modelo de regresin donde la escolaridad es la variable
dependiente y los ingresos la variable explicativa, ya que el anlisis de regresin mide
simplemente la relacin estadstica entre las variables.
Repuesta:
Falso, en un anlisis de correlacin da lo mismo la causalidad, en tal caso ambas variables son tratadas en forma simtrica. Sin embargo, en el anlisis de regresin se estudia
el valor de Y (dependiente) condicional al valor de X (explicativa). Para una estimacin
no hay razones para pensar que un ao adicional de educacin
del tipo y = + x,
tiene el mismo impacto sobre el ingreso promedio, que el que tiene un peso adicional de
ingreso sobre el promedio de educacin. mide el impacto de un aumento unitario de
x sobre el promedio de y.

NO ESCRIBIR EN ESTA PGINA PORQUE NO SE VA A CORREGIR

Comente 5: Si el tamao de la muestra aumenta, el R2 debe disminuir.

Repuesta:
El comente es verdadero ya que el R2 no tiene correccin por los grados de libertad.
Una regresin con N variables explicativas ajustan perfectamente a la muestra de N
observaciones. A medida que el nmero de observaciones aumenta el ajuste se deteriora
ya que el perfecto ajuste de las N primeras observaciones tienen una influencia cada vez
menor en el ajuste de toda la muestra. Por ejemplo, dado el modelo: y = + x + u con
dos observaciones el ajuste es perfecto (una recta que une los dos puntos), si aumento
a tres el nmero de observaciones el ajuste (medido por el R2 ) va disminuyendo.

Comente 6: Si los errores del modelo de regresin lineal no tienen distribucin normal,
a pesar de que los estimadores MCO ya no son MELI, siguen siendo insesgados.

Repuesta:
El comente es falso ya que el resultado de que los estimadores por MCO son MELI no
requiere que los errores se distribuyan normal. En efecto tal propiedad requiere que los
errores cumplan la siguiente condicin: E(ui ) = 0 i, V ar(ui ) = 2 I i y Cov(ui uj ) = 0
i 6= j, es decir, que los errores ui iid sean independientes e idnticamente distribuidos.

Comente 7: El coeficiente de determinacin (R2 ) siempre es positivo y menor a uno.


Comente

Repuesta:
La no negatividad del R2 , tal como la expresin ST = SE + SR, son vlidas cuando existe trmino constante en el modelo. Cuando no se incluye constante el R2 puede
tomar cualquier valor, siempre menor o igual a uno, pero incluyendo todos los reales
negativos.

II. Preguntas Tericas: De las siguientes 3 preguntas Ud. debe elegir


slo 2 de ellas. Cada pregunta tiene 20 puntos asignados.
Pregunta 1: Considere el siguiente modelo de regresin lineal:
Yi = 1 + ui ,

E(ui ) = 0,

E(u2i ) = u2

E(ui uj ) = 0 i 6= j

Encuentre la esperanza, varianza y


(i) Derive el estimador MCO de 1 y llmelo .
error cuadrtico medio de este estimador.
(ii) Considere el siguientes estimador alternativo de 1 :
nY
e =
n+1
donde n es el tamao de la muestra y Y el promedio muestral de Y . Encuentre la
esperanza, varianza y error cuadrtico medio de este otro estimador.
e elegira Ud. y bajo que criterio?.
(iii) Cal de estos dos estimadores ( )
Respuesta Pregunta 1:

(i) Yi = 1 + ui , tengo slo una variable explicativa, la cual es igual a 1.



1
.

x = i donde i =
.
.
1

1
.

Pn

= (X 0 X)1 X 0 Y X 0 X = 1 . . . 1
. = i=1 1 = n (escalar)
.
1

y1
.
P
Pn

= yi = y
=
.
y
(escalar),

X 0Y = 1 . . . 1
i
i=1
n

.
yn
P
P
P
P
y
1
i
=E
E(yi ) = 1
E(1 +ui ) = 1
1 = n1 = 1 (insesgado)
E()
=
n

= E( E())
2
V ar()

= ECM ()

como E(1 ) = 1 V ar()

Continuacin Respuesta Pregunta 1:


P
2
P
2
yi
(1 +ui )
= E( E())
2=E
V ar()

=
E

1
1
n
n

2
P 2
P 2
P
ui
ui
( ui )
n1
= E n + n 1 = E
=E
como ui son iid
n
n2
P 2 P
2
E( ui ) = E(ui ) ya que E(ui uj ) = 0
=
V ar()
(8 puntos)

nE(u2i )
n2

2
u
n

= ECM ()

P
P
yi
yi
=E
= n+1
E()
n+1 =
1
n1
es sesgado 1 1 = n+1
1 = n+1
P

(ii) =

nY
n+1

n n
n+1

=E
V ar()

yi
n+1

como ui son iid


=
V ar()

1
n+1

E(yi ) =

n
n+1 1

n
n+1 1
P
E( ui )2

h
i2

2
P 2
1 P
1 P
1
= E n+1
(yi 1 ) = E n+1
ui = (n+1)
ui )
2 E(
P
2
2
= E(ui ) = nu (puesto que E(ui uj ) = 0 i 6= j)

n
2
(n+1)2 u

P 2
ui
1
= E n+1
=
+ n+1
2

P
1
n
1
2
2
21 ui + 12 ) = (n+1)
2 +
2 (nu + 1 ) =
(n + 1)2 u
n+1
|
{z
} | {z }
=E
ECM ()

yi
n+1

=E

yi n1 1
n+1

varianza

P
1
E( ui
(n+1)2

sesgo2

(8 puntos)
(iii) Si interesa el insesgamiento como nico criterio elegira MCO. Sin embargo, si se
n
ya que V ar()
=
elige el estimador ms eficiente debera elegir ,
2 <
(n+1)2 u
2
u
Si elegimos por error cuadrtico medio, tengo que para n < 2 u2 2
= V ar().
n

< ECM ().

se cumple que ECM ()


(4 puntos)

1 2u

Pregunta 2: Demuestre que el estimador insesgado de u2 en un modelo de regresin


lineal con k variables explicativas es:

eu2 =

u
0 u

nk

Respuesta Pregunta 2:
Primero, el vector de residuos estimados puede escribirse en funcin de los residuos
poblacionales de la siguiente forma:
u
= Mu
Donde M = In X(X 0 X)X 0 , matriz de dimensin nxn idempotente y que satisface
MX = 0
E(
u0 u
) = E(u0 M 0 M u) = E(u0 M u), por las caractersticas de la matriz M.
Como u0 M u es un escalar E(u0 M u) = E[T r(u0 M u)]
Recordemos que la traza es un operador lineal y antes de introducir la esperanza podemos, por propiedades de la traza, cambiar el orden de las matrices.
E(u0 M u) = E[T r(u0 M u) = E[tr(M uu0 )] = T r[E(M uu0 )] = T r[M E(uu0 )] = T r[M u2 In ] =
u2 T r(M ) = u2 [T r(In ) T r[X(X 0 X)X 0 ])] = u2 (n k)
Por lo tanto como E(
u0 u
) = u2 (n k) para que la suma de los errores al cuadrado
sea un estimador insesgado de u2 debemos dividir por (n k).

u2 =

u
0 u

nk

E(
u2 ) =

(20 puntos)

E(
u0 u
)
nk

2
(nk)u
nk

= u2

Continuacin Respuesta Pregunta 2:

Pregunta 3: En un modelo de regresin Y = X + u, encuentre la varianza del error


de prediccin cuando se predice el valor esperado de la variable dependiente.
Respuesta Pregunta 3:
Si se quiere predecir E(Y ) y no un valor puntual de Y, se define el error de prediccin de la siguiente forma:
\

e0 = E(Y0 ) E(Y
0 ) = E(Y0 ) X0 = X0 X0 = X0 ( )
=
Si se cumplen todos los supuestos bajo los cuales es MELI E()
E(
e0 ) = 0.
V ar(
e0 ) = E[(
e0 E(
e0 ))(
e0 E(
e0 ))0 ] = E(
e0 e00 )

0X 0 )
= E(X0 ( )(
)
0

= X0 E( )( )0 X00
0)
= X0 V ar(X
0
V ar(
e0 ) = u2 X0 (X 0 X)1 X00
(20 puntos)

Continuacin Respuesta Pregunta 3:

III. Ejercicio Prctico: La siguiente pregunta es obligatoria. Esta


pregunta tiene 40 puntos asignados.
Considere el siguiente modelo de regresin lineal con 3 variables:
yi = 1 + 2 x2,i + 3 x3,i + ui
se dispone de la siguiente informacin:

33 0 0
132
X 0 X = 0 40 20 X 0 Y = 24
0 20 60
92

n
X

yi2 = 678

i=1

n
X
(yi Y )2 = 150
i=1

(i) Cual es el tamao de la muestra?.


(ii) Calcular la ecuacin de regresin.
(iii) Contraste la hiptesis de que las dos pendientes suman uno.
(iv) Calcular la prediccin para yf , dado x2,f = 4 y x3,f = 2. Obtener un intervalo
de confianza al 95 % para dicha prediccin, donde f denota predicho.
Respuesta Ejercicio Prctico:

P
P
n
x
x
2
3
P
P
P
(i) Como X 0 X = P x2 P x22
3
Px2 x
2
x3
x2 x3
x3

y
P
X 0 Y = P yx2
yx3

el tamao de la muestar es 33.


(4 puntos)

(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectos
calculamos las medias de las variables:
P

2 = X2 = 0 X
3 = X3 = 0 Y = y = 132 = 4
X
n
n
33
P n
2 ) = P X2 ; P(X3 X
3 ) = P X3

(X

X
2
P
2 )(Y Y ) = P(Y Y )X2 = P Y X2 Y P X2 = P Y X2
(X2 X
Anlogamente

P
3 )(Y Y ) = P Y X3
(X3 X

Por lo tanto, las submatrices de X 0 X y X 0 Y estn en desviaciones con respecto a


la media. De esta forma, el modelo en desvos se expresa mediante las siguientes
matrices:

40 20
24
0
0
XX=
y XY =
20 60
92

Continuacin Respuesta Ejercicio Prctico:

60 20
0,03 0,01
1
(X 0 X)1 = 2400400
=
20 40
0,01 0,02

= (X 0 X)1 X 0 Y =

0,03 0,01
0,01 0,02

24
92

0,2
1,6

el parmetro constante se recupera de la siguiente forma:


2 3 X
3 = Y = 4
1 = Y 2 X
1 = 4 2 = 0,2 3 = 1,6
La recta de regresin queda: Y = 4 0,2X2 + 1,6X3
(12 puntos)
(iii) H0 : 2 + 3 = 1
t=

2 +3 1

V ar(2 )+V ar(3 )+2Cov(2 ,3 )


P 2
^b
u

V ar()
=
eu2 (X 0 X)1 = nk

t333=30

0 (Y X )
= Y 0 Y 20 X 0 Y + 0 X 0 X
u
= Y X (Y X )

132

P
Como Y 0 Y = y 2 = 678 0 X 0 Y = 4 0,2 1,6 24 = 670,4
92

33
0
0
4

y adems 0 X 0 X = 4 0,2 1,6 0 40 20 0,2 = 670,4


0 20 60
1,6
u
0 u
= 678 2 670,4 + 670,4 = 7,6
u2 = 7,6
30 0,25

0,03 0,01
0,0076 0,0025

V ar( ) = 0,25
=
0,01 0,02
0,0025 0,0051
t=

0,2+1,61

0,0076+0,005120,0025

0,4
0,0076

Al 5 % de significancia: t 0,05 ,30 = t1 0,05 ,30 = t0,975,30 = 2,042


2

como tc = 4,59 > 2,042 = ttabla se rechazaH0 : 2 + 3 = 1 (12 puntos)

Continuacin Respuesta Ejercicio Prctico:


(iv) Yf = Xf = 4 0,2 (4) + 1,6 + (2) = 8
Intervalo de confianza:
q
q
0 ) < Yf < Yf + t0,975,30 V ar(e
0 )) = 0,95
P r(Yf t0,975,30 V ar(e

0) =
V ar(e
u2 +
u

1 4 2

1
33

0
0

0
0
1
0,03 0,01 4
0,01 0,02
2

q
0 ) = 0,66
= 0,25 + 0,25 0,75 = 0,44 V ar(e
P r(6,65 < Yf < 9,35) = 0,95
(12 puntos)

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Pauta Solemne
Comente 1: (10 puntos) En un modelo de regresin lineal simple (Yi = 1 + 2 Xi + ui ), si
la variable independiente no vara, el estimador MCO 2 ser igual al valor poblacional del
parmetro (2 ).
El estimador de 2 es un modelo de regresin simple es: =

(Xi X)(Yi Y )
P
,
(Xi X)2

si X (variable

independiente) no vara entonces cada observacin Xi es igual a X, y por lo tanto, el estimador


MCO no esta definido. Recuerde que el estimador MCO requiere que las X 0 s varen (Supuesto
8). De esta forma, el comente es falso.
Comente 2: (10 puntos) El estimador MCO es el Mejor Estimador Lineal Insesgado, bajo
el supuesto de normalidad del trmino de error.
El Teorema de Gauss-Markov demuestre que MCO es el Mejor Estimador Lineal Insesgado
(MELI), bajo los supuestos de independencia e idntica distribucin del trmino de error, independiente de cual sea esa distribucin. De esta forma, el comente es falso ya que para que
MCO cumpla con la propiedad MELI se requiere solamente errores i.i.d.
Comente 3: (10 puntos) El anlisis de regresin estudia el grado de asociacin lineal entre
dos variable aleatorias.
Falso, el anlisis de regresin si bien hace un estudio de dependencia entre dos variables, este
se hace entre una variable aleatoria (variable dependiente) y una variable fija (variable independiente) y adems no se ve el grado de asociacin lineal entre ellas, sino se trata de predecir
el valor esperado de la variable dependiente condicional a la variable independiente. Lo que se
menciona en el comente es el anlisis de correlacin, algo completamente diferente al anlisis
de regresin.
Comente 4: (10 puntos) Si en el lmite la varianza de un estimador tiende a cero a medida que el tamao de la muestra crece, entonces dicho estimador es consistente.
Si un estimador converge en media cuadrtica a su valor poblacional , este estimador es
consistente. Para que converger en media cuadrtica, se tiene que cumplir que en el limite el
error cuadrtico medio es cero, es decir, lmn E[ ]2 = 0. Slo si el estimador es insesgado
convergencia en media cuadrtica es equivalente a decir que en el lmite la varianza tienda a
cero. Entonces el comente es Falso, esto se cumple SOLO si el estimador es insesgado.

Pregunta 1: (15 puntos) Encuentre la expresin para la suma total al cuadrado cuando el
modelo de regresin no incluye un trmino constante.
Respuesta Pregunta 1:
Recordemos que la variable y puede ser expresada en funcin de su valor estimado y del error
estimado:
y = y + u

(1)

Si premultiplicamos la expresin anterior por y 0 , tenemos (ojo, NO hemos expresado el modelo


en desvos):
y 0 y = y 0 y + y 0 u

(2)

Reemplazando (1) en (2), y utilizando la condicin de ortogonalidad entre las X y u


:
y 0 y = (
y+u
)0 y + (
y+u
)0 u

0
0
0
y y = y y + u
y + y u
+
u0 u

|{z} |{z}

(3)
(4)

0
N
X

Yi2 =

i=1

N
X

Yi2 +

i=1

N
X

u
2i

(5)

i=1

La suma total de los cuadrados (ST), la suma total explicada (SE) y la suma total de los
residuos (SR), se definen de la siguiente forma:
ST

N
X

(Yi Y ) =

i=1

SE

N
X

N
X

Yi2

NY

i=1

(Yi Y )2 =

i=1

SR

N
X

N
X

N
X

Yi2 = ST + N Y

(6)

i=1
2

Yi N Y

i=1

N
X

Yi2 = SE + N Y

(7)

i=1

u
2i

(8)

i=1

Utilizando (6), (7) y (8) en (5):


2

2
ST + N Y = SE + N Y + SR

2
2
ST = SE + SR + N Y Y

Esta expresin difiere de la vista en clases por el ltimo trmino, pero si el modelo incluyese
constante se garantiza que el promedio observado de la variable dependiente es igual al promedio
estimado para esta variable, con lo cual el ltimo trmino es igual a cero, y se tiene la expresin
tpica de descomposicin de varianza.

Pregunta 2: (15 puntos) Demuestre que el R2 siempre es mayor o igual que el R .


Respuesta Pregunta 2:

u
0 u

Y 0M Y

(9)

u
0 u
/(n k)
Y 0 M Y /(n 1)

(10)

R2 = 1

2 = 1
R

Lo que se puede expresar alternativamente como:


u
0 u

Y 0M Y
0 u
/(n k)
2) = u
(1 R
0
Y M Y /(n 1)
(1 R2 ) =

(11)
(12)

Si k=1, de la expresin (12) tenemos que:


2) =
(1 R
R2

Por otro lado, si k>1 tenemos que

u
0 u
/(n 1)
u
0 u

=
= (1 R2 )
0
0
Y M Y /(n 1)
Y MY
2
R
(n1)
(nk)

2) =
(1 R

> 1:

(n 1)
u
0 u
/(n k)
u
0 u

= 0
0
Y M Y /(n 1) |Y {z
M Y} (n k)
| {z }
(1R2 )

2 ) = (1 R2 ) (> 1)
(1 R
2 ) > (1 R2 )
(1 R
2 < R2
R

>1

Pregunta 3: (40 puntos) Considere el siguiente modelo de regresin lineal con 3 variables:
yi = 1 + 2 x2,i + 3 x3,i + ui
se dispone de la siguiente informacin:

33 0
0
132
0
0
X X = 0 40 20 X Y = 24
0 20 60
92

n
X

yi2

= 678

i=1

n
X

(yi Y )2 = 150

i=1

(i) (5 puntos) Cual es el tamao de la muestra?.


(ii) (15 puntos) Calcular la ecuacin de regresin.
(iii) (10 puntos) Vea si los parmetros son estadsticamente significativos.
(iv) (10 puntos) Contraste la hiptesis de que las dos pendientes suman uno.
Respuesta Pregunta 3:

Pn
(i) Como X 0 X = P x2
x3

P
P x22
P x2
x2 x3

P
P x3

3
Px2 x
x23

P
y
P
X 0 Y = P yx2
yx3

el tamao de la muestra es 33.


(5 puntos)

(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectos calculamos las medias de las variables:
P
P
P
X2
X3
y
132
X2 =
= 0 X3 =
=0 Y =
=
=4
n
n
n
33
X
X
X
X

(X2 X 2 ) =
X2 ;
(X3 X 3 ) =
X3
X
X
X
X
X
(Y Y )X2 =
Y X2 Y
X2 =
Y X2
(X2 X 2 )(Y Y ) =

Anlogamente

3 )(Y Y ) =
(X3 X

Y X3

Por lo tanto, las submatrices de X 0 X y X 0 Y estn en desviaciones con respecto a la


media. De esta forma, el modelo en desvos se expresa mediante las siguientes matrices:

40 20
24
X 0X =
y X 0Y =
20 60
92

Continuacin Respuesta Pregunta 3:

1
60 20
0,03 0,01
(X 0 X)1 =
=
20 40
0,01 0,02
2400 400

= (X 0 X)1 X 0 Y =

0,03
0,01

0,01
0,02

24
92

0,2
1,6

El parmetro constante se recupera de la siguiente forma:


2 3 X
3 = Y = 4
1 = Y 2 X
1 = 4

2 = 0,2

3 = 1,6

La recta de regresin queda: Y = 4 0,2X2 + 1,6X3


(15 puntos)
(iii)
^b
V ar()
=
eu2 (X 0 X)1 =

u
2
nk

0 (Y X )
= Y 0 Y 20 X 0 Y + 0 X 0 X
u
= Y X (Y X )
Como

Y 0Y =

0 X 0 Y =

y 2 = 678

0,2 1,6

132
24 = 670,4
92

y adems

0 X 0 X =

0,2

1,6

33
0
0

0
40
20

0
4
20 0,2 = 670,4
60
1,6

u
0 u
= 678 2 670,4 + 670,4 = 7,6
u2 =

33 0
= 0,25 0 40
V^
ar()
0 20

7,6
0,25
30

1
0
0,0076767677
0
20 =
0
0,0076
60
0
0,00253333

Test de significancia de 1 :

tc =

4
= 45,653155 t30
0,0076767677
5

0
0,00253333
0,0050666667

si compramos el valor calculado para nuestro estadstico (tc ) con el tt de tabla a un 5 %


de significancia y con 30 grados de libertad, que es 2.042. La conclusin es que se rechaza
la H0 : 1 = 0, y el parmetro de constante resulta ser estadsticamente significativo.
Test de significancia de 2 :

0,2
= 2,2941573 t30
tc =
0,0076
Si lo comparamos con el valor de tabla de la distribucin t (-2.042), el estadstico calculado
es menor al de tabla (o mayor en valor absoluto), de esta forma se rechaza la hiptesis
nula de que 2 es igual a cero, y el parmetro resulta ser estadsticamente significativo.
Test de significancia de 3 :

tc =

1,6
= 22,478059 t30
0,0050666667

Si lo comparamos con el valor de tabla de la distribucin t (2.042), el estadstico calculado


es mayor al de tabla, de esta forma, se rechaza la hiptesis nula de que 3 es igual a cero,
y el parmetro resulta ser estadsticamente significativo.
(10 puntos).

(iv) H0 : 2 + 3 = 1
2 + 3 1

t= q

V ar(2 ) + V ar(3 ) + 2Cov(2 , 3 )

t=

t30

0,2 + 1,6 1
0,4
=
0,0076 + 0,0051 2 0,0025
0,0076

Al 5 % de significancia: t0,975,30 = 2,042

tc = 4,59 > 2,042 = ttabla


se rechaza H0 : 2 + 3 = 1

(10 puntos)

Econometra I
Profesora: Andrs Otero
Javiera Vsquez.
Otoo 2005
Pauta Solemne

Parte I: Comentes (30 puntos) (Contestar slo en las lneas disponible)


Pregunta 1: (5 puntos) Si el coeficiente de correlacin en valor absoluto esta entre 0 y 1,
el parmetro de pendiente en un modelo de regresin lineal simple tambin lo estar. Comente.
Respuesta: El coeficiente de correlacin y el coeficiente de regresin son conceptualmente
distintos, el primero mide la asociacin lineal entre dos variables y el segundo la influencia
de una variable independiente X sobre el valor promedio de Y. Adems, se puede demostrar
algebraicamente que:
pP
y2
b
= xy pP i2
|{z}
xi
[0,1]

Por lo tanto, aunque el coeficiente de correlacin este entre 0 y 1, b va a depender de la escala


de las variables del modelo.
Pregunta 2: (5 puntos) El teorema de Gauss Markov dice que el estimador Mnimos Cuadrados Ordinarios es el estimador con menor error cuadrtico medio entre todos los estimadores
lineales e insesgados. Comente.
= V AR()
+ sesgo2 . Por lo tanto, aplicando la propiedad
Respuesta: Verdadero, ECM ()
de insesgamiento de MCO tendremos que el ECM es igual a la varianza del estimador. De esta
forma el teorema de Gauss Markov nos dice que el estimador MCO es el estimador ms eficiente
(menor varianza y por ende menor ECM) entre todos los estimadores lineales e INSESGADOS.
Pregunta 3: (5 puntos) Si el p-value asociado a cierta hiptesis nula es 0, no puedo rechazar
la hiptesis nula.
Respuesta: Falso, el p-value mide el nivel de significancia asociado al t-calculado de cierta
hiptesis nula. Si este toma el valor de 0, significa que rechazo la hiptesis nula a un 0 % de
significancia (cometiendo 0 % de error de tipo I).
Pregunta 4: (5 puntos) El estimador de Mxima Verosimilitud es equivalente al estimador
de Mnimos cuadrados Ordinarios. Comente.
Respuesta: Falso, slo bajo el supuesto de normalidad en el trmino de error, el estimador
MCO y MV de b coincidirn. Sin embargo, el estimador de la varianza del error no coincide ya
que el estimador de MV de 2 es sesgado.
P 2
P 2

2
2
6=
M V =

M CO =
nk
n
1

Pregunta 5: (5 puntos) En un modelo de regresin lineal que busca explicar el salario promedio
utilizando como variable explicativa la educacin, se obtiene la siguiente estimacin muestral:
\
Salario=40000+15000*Educacin.
Interprete.
Respuesta: Este modelo estima un impacto marginal de la educacin sobre el salario de 15000,
es decir, un ao adicional de educacin gener un icremento de 15000 en el salario promedio.
Adems, se estima que una persona sin educacin obtiene un salario promedio de 40000.
Pregunta 6: (5 puntos) En un modelo de regresin lineal: Yi = 0 + 1 X1 + 2 X2 + u, se
determina el siguiente intervalo de confianza para 2 , P r[1,3956 < 2 < 2,8974] = 95 %, que
puede concluir sobre la significancia del parmetro 2 y sobre la hiptesis nula de que 2 es
igual a 3.5.
Respuesta: La significancia de un parmetro o el testeo de una hiptesis en particular se
puede realizar utilizando un intervalo de confianza. Testeando la hiptesis nula de significancia
H0 : 2 = 0, podemos ver que 0 cae en la zona de no rechazo, con lo cual se puede concluir que
el parmetro es significativo. Para H0 : 2 = 3,5, podemos ver que 3.5 cae fuera de la zona de
confianza determinada por el intervalo de confianza, por lo tanto se rechaza que 2 = 3,5.

Parte II: Ejercicios Cortos (30 puntos) (Contestar slo en el espacio disponible)

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 1: Suponga que para estimar el modelo Yt = + Xt + ut se dispone de las siguientes observaciones:
t=
Xt

1
1

2
2

3
3

4
4

5
5

6
6

y se propone utilizar el estimador e = 18 (Y6 + Y5 Y2 Y1 ). Determine si el estimador es


insesgado, calcule su varianza muestral y comprela con la del estimador MCO.
Respuesta: Reemplazando Y6 , Y5 , Y2 e Y1 por su expresin poblacional tenemos que:
1
e = [ + X6 + u6 + + X5 + u5 X2 u2 X1 u1 ]
8
Luego reemplazando X6 , X5 , X2 y X1 por sus valores observados, tenemos lo siguiente:
1
[ + 6 + u6 + + 5 + u5 2 u2 1 u1 ]
8
1
e =
[8 + u6 + u5 u2 u1 ]
8
[u6 + u5 u2 u1 ]
e = +
8
e =

(1)
(2)

Si los errores cumplen con los supuestos tradicionales de tener media 0, varianza 2 y ser independientes entre ellos, se puede demostrar al tomar valor esperado a la expresin (2) que e es
insesgado. (5 puntos).
Ahora la varianza de e se obtiene de la siguiente forma:
e =
V []

e 2 = E[e ]2
E[e E()]

(3)

Reemplazando (2) en (3):

e =
V []
e =
V []
e =
V []
e =
V []
e =
V []

2
[u6 + u5 u2 u1 ]
8
2
E[u6 ] + E[u5 ]2 + E[u2 ]2 + E[u1 ]2
64
2 + 2 + 2 + 2
64
4 2
64
2
16

dado supuesto

de independencia

(5 puntos)
de este modelo es conocida e igual a:
Por otra parte, la varianza del estimador MCO ()
2

= 2 (X 0 X)1 = P
V []
6

X)2

i=1 (Xi

P6
P6
P6
2
Tenemos que X = 21
= 3,5, adems i=1 (Xi X)2 = i=1 Xi2 6 X , donde i=1 Xi2 = 91.
P6 6
De esta forma, i=1 (Xi X)2 =91 6 12,25 = 17,5
Por lo tanto:
2
=
V []
17,5

e
El estimador MCO tiene menor varianza que el estimado .
(5 puntos)
Ejercicio 2: Demuestre
que en un modelo de regresin simple: Y = 1 + 2 Xi + ui , la raz

cuadrada del R2 ( R2 ), es igual al coeficiente de correlacin entre X e Y .


Respuesta:
El R2 se define como:
R2 =

20 X20 M0 X2 2
Y 0 M0 Y

En un modelo de regresin simple como el que se plantea, donde solo hay una variable explicativa
ms el trmino constante, el R2 se puede reescribir de la siguiente forma:
Pn
(Xi X)2
2
R2 = 2Pni=1
2
i=1 (Yi Y )
Aplicando raz cuadrada a la expresin anterior:
qP
n
2

i=1 (Xi X)
R2 = 2 qP
n
2
i=1 (Yi Y )

(4)

El estimador MCO de 2 en este modelo de regresin simple se define como:


Pn
(Yi Y )(Xi X)
2 = i=1
Pn
2
i=1 (Xi X)

(5)

Reemplazando (5) en (6) y reduciendo trminos:

Pn
R2

i=1 (Yi Y )(Xi


Pn
2
i=1 (Xi X)

X)

Pn

R2

n
i=1 (Xi

X)2

i=1 (Yi

Y )2

qP
n

Y )(Xi X)
qP
= xy
n
2
2
(X

X)
(Y

Y
)
i
i
i=1
i=1

= qP
n

i=1 (Yi

qP

(15 puntos)
4

(6)

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 3: Con la informacin disponible de Homecenter entre los aos 1994 y 2004 sobre Nmero de Tiendas (N ) y tamao de la tienda (T AM ), se quiere estimar el valor promedio
del ingreso total en millones de dlares (IN GT ). Se estima el siguiente modelo de regresin
lineal:
IN GT = 0 + 1 N + 2 T AM + u
A continuacin se presenta la estimacin realizada en Eviews:
Dependent Variable: INGT
Method: Least Squares
Date: 04/15/05 Time: 15:59
Sample: 1994 2004
Included observations: 11
INGT=C(1)+C(2)*N+C(3)*TAM

C(1)
C(2)
C(3)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

Coefficient

Std. Error

t-Statistic

Prob.

8085.608
51.42006
-125.7441

3035.113
3.656119
39.65131

2.664022

0.0286

-3.171246

0.0132

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

276.5529
611852.2
-75.70325

4196.545
3933.725
14.30968
14.41820
0.812131

donde:
- S.D dependent var (sy ) es la desviacin estndar de la variable dependiente, la que se construye
de la siguiente forma:
s
PN
2
i=1 (yi y)
sy =
N 1
qP 2
u
- S.E. of regression es el error estndar de la regresin ( = N ki ).
- Sum squared resid corresponde a la suma de los errores al cuadrado.
Con esta informacin se le pide a Ud. que interprete el modelo, testee la significancia individual de cada uno de los parmetros y testee la significancia global del modelo.

Respuesta:

ttnk = tt8 (95 %) = 2,306


De la informacin de la tabla tenemos que c(1) y c(3) caen en la zona de rechazo si testeamos
la hiptesis nula que los parmetros son iguales a cero. Por lo tanto, la constante y el tamao
de la empresa son variables significativas para explicar el ingreso total.
Probabilidad

No se
Rechaza

Se
Rechaza
(2,5%))

Se
Rechaza
(2,5%)

t)=2.306

t=-2.306

tc=-3.17

tc=2.66

Para ver la significancia del nmero de tiendas debemos calcular el test t asociado a esta
hiptesis nula.
1 0
51,42
tc = q
=
= 14,06
3,66
V (1 )
Con lo cual se rechaza H0 de que 1 = 0, ya que tc > tt = 2,306. Por lo tanto, el parmetro es
significativo. Para ver la significancia global del modelo se puede utilizar la siguiente definicin
del estadstico de Fischer:
Fq,nk =

R2 =

s
Sy =

R2
k1
(1R2 )
nk

Fk1,nk

ESS
RSS
u
b0 u
b0
R2 = 1
=1 P
T SS
T SS
(Yi Y )2

P
X
(Yi Y )2
= 3933,725
(Yi Y )2 = 154741923,76
n1
s

Sy =

X
u0 u0
= 276,5529
u
2 = 611852,052
nk
6

R2 = 1

611852,05
= 0,996
154741923,76

Fc =

0,996
2
10,996
8

' 996

t
F2,8
= 5,32

Por lo tanto, se rechaza la hiptesis de que todas las pendientes del modelo son iguales a cero.
El modelo es globalmente significativo.
Ejercicio 4: Sea la matriz X 0 X asociado al siguiente modelo de regresin lineal:
Y = 0 + 1 X1 + 2 X2 + u

5
X 0 X = 20
20

20
90
71

20
71
96

42
X 0 Y = 186
150

Se le pide que exprese ambas matrices en desvos con respecto a la media y obtenga el estimador
mnimos cuadrados ordinarios de 0 , 1 y 2 .
Respuesta:
X
X
2
(Xi X i )2 =
(Xi )2 nX
X

(Xi X i )(Xj X j ) =

X 0 Xdes =

P
(X1 X 1 )2

(Xi Xj ) nX i X j

P
(XP
1 X 1 )(X2 X 2 )
(X2 X 2 )2

Del enunciadoPse pueden extraer


los siguientes datos: n = 5; X 1 =
P
P
X12 = 90 y
X22 = 96;
X2 X3 = 71

20
5

= 4; X 2 =

x21 = 90 5(4)2 = 10;

x22 = 96 5(4)2 = 16;

x2 x3 = 71 5 4 4 = 9

Donde las variables en minsculas representan desviaciones con respecto a la media.

20
5

= 4;

10 9
9 16

X Xdes =

X Ydes

Adems,

(Y

Y
X
)(X

)
i
i
1
1
= P
(Yi Y i )(X2 X 2 )

P
P
(Yi Y i )(Xi X i ) =
Yi Xi nY i X i
X

yx1 = 18;

18
18

X 0 Ydes =

b =

1
b =
79

10
9

16 9
9 10

9
16

yx2 = 18

18

18

18
1,5949

=
18
0,2278

De esta forma, 1 = 1,5949, 2 = 0,2278 y 0 = Y 1 X 1 2 X 2 = 8,41,59494+0,22784 =


2,93.

Parte III: Ejercicio Obligatorio (60 puntos) (Contestar slo en el espacio


disponible)
Suponga que esta interesado en estimar el ingreso de una tienda, para lo cual dispone de 90
datos sobre: ingreso total en millones de pesos (ingt), el nmero de competidores en el mercado
(nc), el gasto en publicidad en millones de pesos (gp) y el nmero de vendedores (nv). Ud. debe
estimar el siguiente modelo de regresin lineal:
ingt = 0 + 1 nc + 2 gp + 3 nv + u
donde las matrices (X 0 X)1 y X 0 Y vienen

5 3
3 6
0
1
(X X) =
2 2
0 4
y adems
u2 = 0,5 y

P90

i=1 (Yi

dadas por:

2
0
2 4

4
3
3
4

3
2

X 0Y =
1
2

Y )2 = 80

(i) (6 puntos) Interprete el modelo, Que signos esperara Ud. de para los parmetros de este
modelo?
Se espera que el nivel de ingresos de esta tienda, dependa negativamente del nmero
de competidores, positivamente del gato en publicidad y positivamente del nmero de
vendedores. De esta forma, podramos esperar un signo negativo para 1 y positivo para
2 y 3 .
(ii) (8 puntos) Encuentre el estimador MCO de los parmetros de este modelo.
El estimador MCO del vector de parmetros = (X 0 X)1 X 0 Y , utilizando la informacin
disponible:


0
1


2 =
3

11
7

12
3

5
3
2
0

3
6
2
4

2
2
4
3


0
3
2
4

3 1
4
2

(iii) (8 puntos) Testee la significancia estadstica de 0 , 1 , 2 y 3 .


Para ver la significancia individual de cada uno de los parmetros del modelo se utiliza el siguiente estadstico t:
i

tc = q

V ar(i )

asociado a la hipotesis

nula H0 : i = 0

Para realizar los test primero necesitamos computar la matriz de varianzas y


de los parmetros:


5 3 2
0
2,5 1,5 1
3 6 2 4
3
1
2
0
1
=
=
V ar[]
(X X) = 0,5
2 2 4
3
2
0 4 3
4

covarianzas

0
2

1,5
2

Para todas las hiptesis nulas se utiliza el mismo valor de tabla de la distribucin tstudent: tt = t86,95 % 1,99.
Test de significancia de 0 :
11
tc =
= 6,96
2,5
Se rechaza la hiptesis nula de que 0 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 1 :
7
tc = = 4,04
3
Se rechaza la hiptesis nula de que 1 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 2 :
12
tc = = 8,46
2
Se rechaza la hiptesis nula de que 2 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 3 :
3
tc = = 2,12
2
Se rechaza la hiptesis nula de que 3 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.

(iv) (8 puntos) Qu factor es ms importante en determinar el los ingresos?. Como consultor,


que recomendara?
El gasto en publicidad y el nmero de vendedores tienen un impacto positivo sobre el
nivel de ingresos, por el orden de magnitud parece ser ms importante el gasto en publicidad, un milln adicional en gasto en publicidad aumenta en 12 millones el ingreso, por
otra parte un aumento en 4 vendedores lograra el mismo aumento en los ingresos totales,
habra que ver que resulta ms rentable aumentar en 1 milln el gasto en publicidad o o
contratar 4 trabajadores ms.
10

(v) (8 puntos) Determine la Bondad de Ajuste del modelo, a travs del R2 y R .

R2

=
=

u
0 u

0
Y M0 Y
Pn
u
2
1 Pn i=1 i 2
i=1 (Yi Y )

Pn
Pn
u
2i
De la informacin que se entrega sabemos que
2 = i=1
= 0,5, por lo tanto i=1 u
2i =
86
2
86 0,5 = 43. Adems se nos entrega la informacin de que (Yi Y ) = 80. Reemplazando:

R2 = 1

43
= 0,4625
80

Para obtener el R utilizamos la siguiente definicin y luego reemplazando los valores


correspondientes:
Pn
u
2 /(n k)
2
R = 1 Pn i=1 i 2
i=1 (Yi Y ) /(n 1)
43/86
0,5 89
2
R = 1
=1
= 0,44375
80/89
80
(vi) (8 puntos) Testee la hiptesis de que todos los coeficientes a excepcin de la constante son
cero.
Bajo esta hiptesis nula el estadstico F calculado se puede escribir de la siguiente forma:
Fc =

R2 /(k 1)
(1 R2 )/(n k)

Reemplazando por lo valores correspondientes:


Fc =

0,4625/3
0,154
=
= 24.6
0,5375/86
0,00625

El valor de tabla del estadstico F a un 5 % de significancia y con 3 grados de libertad


en el numerador y 86 en el denominador es aproximadamente 2.7, con lo cual se rechaza
la hiptesis nula de que todos los parmetros del modelo a excepcin del de la constante
sean igual a cero, es decir, el modelo es globalmente significativo.
(vii) (8 puntos) Construya un intervalo de confianza para 1 , 2 , 3 y 2 .
Los intervalos de confianza para los parmetros 1 , 2 y 3 se construyen de la siguiente
forma:

q
q

P r i t0,975,86 V ar(i ) < i < i + t0,975,86 V ar(i ) = 95 %


Intervalo de Confianza de 1 :
h

i
P r 7 1,99 3 < 1 < 7 + 1,99 3 = 95 %
P r [10,45 < 1 < 3,55] = 95 %
11

Intervalo de Confianza de 2 :
h

i
P r 12 1,99 2 < 2 < 12 + 1,99 2 = 95 %
P r [9,19 < 2 < 14,81] = 95 %
Intervalo de Confianza de 3 :
h

i
P r 3 1,99 2 < 3 < 3 + 1,99 2 = 95 %
P r [0,19 < 3 < 5,81] = 95 %
Por otra parte, el intervalo de confianza para 2 se obtiene de la siguiente forma:
#
"
2
(n

k)e

(n k)e
2
< 2 <
= 95 %
Pr
20,95,86
20,05,86
El valor de tabla de 20,95,86 65 (para la correccin se utiliz 43.8) y el de 20,05,86 107
(para la correccin se utiliz 18.5). POr lo tanto,

86 0,5
86 0,5
2
Pr
< <
= 95 %
43,8
18,5

P r 0,98 < 2 < 2,32 = 95 %


(viii) (6 puntos) Que nivel de ingresos totales esperara Ud. para el ao 2005, si se espera que
una nueva tienda abra en el mercado con lo cual tendra 10 competidores, el gasto en
publicidad sea 100 y el el nmero de vendedores sea 30.
Del modelo estimado tenemos que el valor promedio del ingreso de la empresa depende de la siguiente forma de las variable explicativas:
d = 11 7 nc + 12 gp + 3 nv
ingt
Reemplazando nc por 10, gp por 100 y nv por 30, se obtiene un valor predicho para el
ingreso del prximo ao de 1,231 millones de pesos.

12

Econometra I
Profesores:
Emerson Melo
Rodrigo Montero
Javiera Vsquez
Primavera 2005
Pauta Solemne

Parte I: Comentes (30 puntos) (Contestar slo en las lneas disponible)


Pregunta 1: (5 puntos) Si los coeficientes asociados a las pendientes de la regresin no son
estadsticamente significativos a nivel individual, entonces, tampoco lo sern en conjunto. Comente.
Respuesta:
Respuesta: No necesariamente. Es posible que los coeficientes asociados a las pendientes de la
regresin no sean significativos a nivel individual, pero s lo sean en su conjunto. Esto se debe a
que podra ocurrir que la contribucin individual que hace cada uno de los elementos presentes
en X no sea significativa en s, pero que en conjunto la covarianza existente entre stos permita
explicar de manera signficativa la variable dependiente.
Pregunta 2: (5 puntos) Significancia estadstica implica significancia econmica. Comente.
Respuesta: Falso. La significancia estadstica (obtenida a travs de un test t) no permite
inferir que se est en presencia de signifcancia econmica. Esto ltimo depende crticamente
del modelo terico subyacente. Recuerde que cuando el N (tamao de la muestra) es lo suficientemente grande, entonces, es muy probable que todos los coeficientes estimados resulten
ser estadsticamente significativos. Por otro lado, que el coeficiente estimado no sea estadsticamente significativo no quiere decir que no lo sea desde el punto de vista del modelo que se est
estudiando. Muchas cosas (problemas) podran estar pasando con los datos, por lo tanto, no se
debe hacer teora a partir de stos.
Pregunta 3: (5 puntos) Si el p-value asociado a cierta hiptesis nula es 0 no existir zona
de rechazo y por lo tanto, no es posible rechazar la hiptesis nula.
Respuesta: Falso, el p-value mide el nivel de significancia asociado al t-calculado de cierta
hiptesis nula. Si este toma el valor de 0, significa que rechazo la hiptesis nula a un 0 % de
significancia (cometiendo 0 % de error de tipo I).
Pregunta 4: (5 puntos) En el modelo de regresin lineal clsico dado que la distribucin
de los errores no tiene relevancia para la forma de los estimadores, siempre podremos realizar
los test de hpotesis tradicionales (tests t y F). Comente.
Respuesta: Falso, el supuesto de Normalidad es clave para poder derivar los estadsticos de
prueba. Si los errores poseen otra distribucin, entonces no es posible derivar los test t y F
tradicionales.
1

Pregunta 5: (5 puntos) En un modelo de regresin lineal clsico siempre ser conveniente


incluir regresores, ya que esto permite aumentar el R2 .
Respuesta: Falso, sabemos que una mejor medida de la bondad de ajuste del modelo, es
2 que justamente controla por el nmero de regresores presentes en el modelo. Adems,
el R
cada vez que se incluyen regresores, se debe considerar el sentido econmico de incluirlo.
Pregunta 6: (5 puntos) En un modelo de regresin lineal: Yi = 0 + 1 X1 + 2 X2 + u, se
determina el siguiente intervalo de confianza para 2 , P r[2,5367 < 2 < 3,2785] = 95 %, Que
puede concluir sobre la significancia del parmetro 2 y sobre la hiptesis nula de que 2 es
igual a 3.1?.
Respuesta: El intervalo de confianza de un parmetro mide el rango de valores posibles que
puede tomar, mide la zona donde no podemos rechazar la hiptesis nula de que el parmetro
tome cierto valor (el que esta contenido en el intervalo de confianza). Como la hiptesis de significancia del parmetro testea que 2 = 0, y 0 esta fuera de intervalo de confianza se rechaza
que 2 sea igual a cero y se puede concluir que el parmetro es estadsticamente significativo.
Adems como 3.1 esta dentro del intervalo de confianza, no se puede rechazar que 2 sea igual
a 3.1.

Parte II: Ejercicios Cortos (Contestar slo en el espacio disponible)


Ejercicio 1: (15 puntos) En el modelo de regresin lineal clsico:
Y = X + U
0

u
u

Demuestre usando matrices que


= nk
es un estimador insesgado de la varianza del error del
modelo. (Ind: Utilice el operador Traza)

Respuesta:
Lo primero que debemos darnos cuenta para demostrar lo que se pide, es que :
u
= Y X = Y (X 0 X)1 X 0 Y = [Inn (X 0 X)1 X 0 ]Y
S definimos M = [Inn (X 0 X)1 X 0 ] , que como es bien sabemos es una matriz smetrica e
idempotente. Luego
u
= M Y = M (X + U ) = M U
De esta forma, podemos escribir
u
0 u
= U 0M U
Tomando esperanza en la expresin anterior, asumiendo X fijo
E(
u0 u
) = E(U 0 M U )
Usando el operador traza escribimos:
E(T r(U 0 M U )) = E(T r(M U 0 U ))
y por propiedad del operador traza y de la esperanaza, se tiene
T r(M E(U U 0 )) = T r(M 2 Inn ) = 2 T r(M )
donde

T r(M ) = T r(Inn ) T r((X 0 X)1 X 0 ) = T r(Inn ) T r(Ikk ) = n k

de donde se obtiene que:


E(
u0 u
) = (n k) 2
y de esta forma el estimador insesgado ser:
2 =

u
0 u

nk

Ejercicio 2: (15 puntos) El profesor O. Thero es un acadmico muy dedicado a sus labores, y
ama la docencia; es por ello que durante el semestre recin pasado dict en cuatro universidades
distintas el curso "Introduccin a la Microeconoma". Una de las grandes interrogantes para
este docente se refiere a cules seran los determinantes del xito de sus estudiantes. Es por ello
que una vez concluido los cursos decidi ir en busca de la respuesta, y construy una base de
datos que contiene la informacin para cada uno de sus 300 estudiantes. El modelo que l ha
estimado es el siguiente:
Ni = + Hi + Yi + Si + ui
Donde Ni representa la nota final obtenida por el alumno i, Hi corresponde a las horas promedio
que el alumno dedicaba cada semana al estudio de dicha asignatura (de acuerdo a la informacin
que recopil en una breve encuesta hecha al final del curso), Yi es el ingreso per cpita de la
familia y Si representa los aos de escolaridad (promedio simple1 ) de los padres. Los resultados
de la estimacin se presentan en la siguiente tabla:

Constante
Horas
Ingreso
Escolaridad de padres
N
F-Test (p-value)
R2
R2 ajustado

Coeficiente
2.48
0.187
9.9e(-07)
-0.002

Error Estndar
0.074
0.005
1.32e(-07)
0.007
300
0
0.78
0.77

p-value
0
0
0
0.691

En base a esta informacin:


i) Calcule el test t de significancia estadstica para cada uno de los parmetros estimados (Ayuda: utilice como valor crtico de tabla 1,96) (4 puntos)
Respuesta: La prueba consiste en calcular el estadstico t asociado a cada uno de los
coeficientes estimados:
t =

2, 48
= 33, 51 > 1, 96 signif icativo
0, 074

t =

0, 187
= 37, 4 > 1, 96 signif icativo
0, 005

t =
t =

9, 9
= 7, 5 > 1, 96 signif icativo
1, 32

0, 002
= | 0, 28| < 1, 96 no es signif icativo
0, 007

ii) Qu significa que el p-value del coeficiente asociado a la escolaridad de los padres sea de
0,691? (2 puntos)
1S
i

Si +Sim
,
2

donde p=padre y m=madre

Respuesta: El p-value representa la probabilidad de que el valor crtico sea mayor que
el t calculado, es decir, describe el nivel de signficancia asociado a un estadstico t particular. Por lo tanto, un p-value de 0,05 representa significancia estadstica del coeficiente
estimado con un nivel de confianza del 95 %. Como en este caso el p-value es ostensiblemente mayor que dicho valor, entonces, se puede concluir que el coeficiente asociado a la
escolaridad de los padres, no es estadsticamente significativo al 5 % (ni tampoco al 10 %).
iii) Qu significa que el p-value del test F sea de 0? (2 puntos)
Respuesta: El test F permite determinar la signifcancia estadstica conjunta del modelo
(testea que todas los coeficientes asociados a las pendientes son igual a cero). Si el p-value
de dicho test es cero (0), entonces, se rechaza la hiptesis nula con un 99 % de confianza,
es decir, el modelo es signifcativo en su conjunto.
iv) Cul es la nota esperada para un alumno que dedicaba 10 horas a la semana al estudio de
la asignatura, cuyo ingreso familiar per cpita es de $43.000 y que la escolaridad promedio
de los padres es de 17 aos? (2 puntos)
Respuesta:
i = 2, 48 + 0, 187 (10) + 9, 9e(7) (43,000) 0, 002 (17) = 4, 3
N
v) Por qu podra preferir usted fijarse en el R2 ajustado ms que en el R2 ? (2 puntos)
Respuesta: El R2 presenta muchas deficiencias, dentro de las cuales cabe mencionar
que es monotnonico en la incorporacin de regresores adicionales. Por el contrario el R2
ajustado penaliza la incorporacin de regresores por la prdida de grados de libertad en
que se incurre. Por lo tanto, eventualmente, mientras que el R2 siempre aumenta con la
incorporacin de una variable independiente adicional, el R2 ajustado podra disminuir.
vi) Qu crticas podra usted hacerle a este modelo (mencione dos)? (4 puntos)
Respuesta: (1) Es posible que las respuestas de los alumnos estn sesgadas a la hora
de responder acerca de cuntas horas dedic en promedio a la semana a estudiar la asignatura. (2) Un determinante significativo de las notas de las personas viene dado por su
habilidad, la cual no es observable en este caso, y por ende, no se incorpora en el modelo.
(3) La estimacin MCO no restringe a que la prediccin de la nota se encuentre en el
rango uno siete. Por lo tanto, podra darse el caso que para alguna persona en particular,
el modelo arroje una nota estimada que no pertenezca al rango admisible.
vii) Si el modelo fuera estimado nuevamente pero utilizando como variable dependiente el
logaritmo de la nota final del curso (N = ln(N )), qu representaran los coeficientes
estimados? (2 puntos)
Respuesta: En este caso, los coeficientes estimados representaran semielasticidades.

Ejercicio 3: (15 puntos) Para estimar el modelo yi = xi +ui se propone el siguiente estimador:
Pn
xi yi
= 2 i=1
Pn
2
+
i=1 xi
2
i) Pruebe que dicho estimador subestima el verdadero valor del parmetro. (8 puntos)
ii) Pruebe que (7 puntos):
E[ ]2 =

2
2

2
Pn
i=1

x2i

Respuesta:
i)
=
=
=
=
E[]

Pn
i=1 xi yi
Pn
2
2
i=1 xi
2 +
Pn
i=1 xi (xi + ui )
Pn
2
2
i=1 xi
2 +
Pn
Pn
xi ui
i=1 x2i
+ 2 i=1
Pn
Pn
2
2
2
i=1 xi
i=1 xi
2 +
2 +
Pn
i=1 x2i
Pn
2

2
i=1 xi
2 +

Por lo tanto, el sesgo es:



E[]

Pn
i=1 x2i

Pn
2
2
i=1 xi
2 +


E[]

2
2


Pn
+ i=1 x2i

> 0 E[]
> , subestima ya que en valor esperado es menos
Si <0 E[]
negativo que .
< 0 E[]
< , subestima ya que en valor esperado es menos
Si >0 E[]
positivo que .
ii) Primero obtengamos :

Pn
i=1 x2i
+
Pn
2
2
i=1 xi
2 +


+
Pn
+ i=1 x2i

2
2

Pn

xi ui

Pn
2
i=1 xi

i=1
2
2

+
Pn

xi ui
Pn
2
i=1 xi

i=1
2
2

Ahora apliquemos elevamos al cuadrado la expresin anterior y aplicamos valor esperado:

2 2
Pn
Pn
2
2
E ( i=1 xi ui ) 2 i=1 xi ui +
E[ ]2 =
h
i2
Pn
2
2
i=1 xi
2 +
Pn
4
2 i=1 x2i + 2
2

E[ ] = h
i2
Pn
2
2
+
x
2
i=1 i

2
n
2

x2i + 2
i=1
E[ ]2 =
h
i2
Pn
2
2
+
x
2
i=1 i

E[ ]2

2
2

2
Pn
i=1

x2i

Parte III (30 puntos) (Contestar slo en el espacio disponible)


Suponga que esta interesado en estimar la inversin realizada por una empresa, para lo cual
dispone de 90 observaciones mensuales sobre: inversin en millones de pesos (inv), tasa de inters (r), utilidades en millones de pesos (ut) y crecimiento del PIB proyectado para el prximo
periodo (pib). Ud. debe estimar el siguiente modelo de regresin lineal:
inv = 0 + 1 r + 2 ut + 3 pib + u
donde las matrices (X 0 X)1 y X 0 Y vienen

5 3

3
6
(X 0 X)1 =
2 2
0 4
y adems
u2 = 0,5 y

P90

i=1 (Yi

dadas por:

2
0
2 4

4
3
3
4

3
2

X 0Y =
1
2

Y )2 = 80

(i) (5 puntos) Encuentre el estimador MCO de los parmetros de este modelo.


El estimador MCO del vector de parmetros = (X 0 X)1 X 0 Y , utilizando la informacin
disponible:


0
5 3 2
0
3
1 3 6 2 4 2

= =

2 2 4
3 1
2
0 4 3
4
2
3

11
7

=
12
3
(ii) (6 puntos) Testee la significancia estadstica de 1 , 2 y 3 .
Para ver la significancia individual de cada uno de los parmetros del modelo se utiliza el
siguiente estadstico t:
i

tc = q

V ar(i )

asociado a la hipotesis

nula H0 : i = 0

Para realizar los test primero necesitamos computar la matriz de varianzas y


de los parmetros:


5 3 2
0
2,5 1,5 1

3
6
2
4
3
1
=
=
V ar[]
2 (X 0 X)1 = 0,5
2 2 4
3
2
0 4 3
4

covarianzas

0
2

1,5
2

Para todas las hiptesis nulas se utiliza el mismo valor de tabla de la distribucin tstudent: tt = t86,95 % 1,99.
8

Test de significancia de 1 :
7
tc = = 4,04
3
Se rechaza la hiptesis nula de que 1 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 2 :
12
tc = = 8,46
2
Se rechaza la hiptesis nula de que 2 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.
Test de significancia de 3 :
3
tc = = 2,12
2
Se rechaza la hiptesis nula de que 3 sea igual a cero, con lo cual el parmetro resulta
ser estadsticamente significativo.

(iii) (3 puntos) Qu factor es ms importante en determinar el la inversin?. Como consultor,


que recomendara? De la regresin se puede ver que la tasa de inters tiene un efecto
negativo sobre la inversin, y que tanto las utilidades como el crecimiento esperado del PIB
tienen un efecto positivo. De esta forma, se recomienda que en meses donde las utilidades
han aumentado y se espera un mayor crecimiento del PIB, la inversin aumente.
2

(iv) (6 puntos) Determine la Bondad de Ajuste del modelo, a travs del R2 y R .

R2

=
=

u
0 u

0
Y M0 Y
Pn
u
2
1 Pn i=1 i 2
i=1 (Yi Y )

Pn
Pn
u
2i
De la informacin que se entrega sabemos que
2 = i=1
= 0,5, por lo tanto i=1 u
2i =
86
2
86 0,5 = 43. Adems se nos entrega la informacin de que (Yi Y ) = 80. Reemplazando:

R2 = 1

43
= 0,4625
80

Para obtener el R utilizamos la siguiente definicin y luego reemplazando los valores


correspondientes:
Pn
u
2 /(n k)
2
R = 1 Pn i=1 i 2
i=1 (Yi Y ) /(n 1)
0,5 89
43/86
2
=1
= 0,44375
R = 1
80/89
80
9

(v) (3puntos) Testee la hiptesis de que todos los coeficientes a excepcin de la constante son
cero.
Bajo esta hiptesis nula el estadstico F calculado se puede escribir de la siguiente forma:
Fc =

R2 /(k 1)
(1 R2 )/(n k)

Reemplazando por lo valores correspondientes:


Fc =

0,154
0,4625/3
=
= 24.6
0,5375/86
0,00625

El valor de tabla del estadstico F a un 5 % de significancia y con 3 grados de libertad


en el numerador y 86 en el denominador es aproximadamente 2.7, con lo cual se rechaza
la hiptesis nula de que todos los parmetros del modelo a excepcin del de la constante
sean igual a cero, es decir, el modelo es globalmente significativo.
(vi) (3 puntos) Construya un intervalo de confianza para 2 y 2 .
El intervalo de confianza para 2 se construyen de la siguiente forma:

q
q

P r i t0,975,86 V ar(i ) < i < i + t0,975,86 V ar(i ) = 95 %


Intervalo de Confianza de 2 :
h

i
P r 12 1,99 2 < 2 < 12 + 1,99 2 = 95 %
P r [9,19 < 2 < 14,81] = 95 %
Por otra parte, el intervalo de confianza para 2 se obtiene de la siguiente forma:
#
"
(n k)e
2
(n k)e
2
2
< <
Pr
= 95 %
20,95,86
20,05,86
El valor de tabla de 20,95,86 65 (para la correccin se utiliz 43.8) y el de 20,05,86 107
(para la correccin se utiliz 18.5). Por lo tanto,

86 0,5
86 0,5
Pr
< 2 <
= 95 %
43,8
18,5

P r 0,98 < 2 < 2,32 = 95 %


(vii) (4 puntos) Que nivel de inversin esperara Ud. para el ao 2006, si se espera que la tasa
de inters sea un 4 %, las utilidades 10 millones de pesos y que el pib crecer en un 7 %.
Del modelo estimado tenemos que el valor promedio de la inversin de la empresa depende
de la siguiente forma de las variable explicativas:
d = 11 7 r + 12 ut + 3 pib
inv
Reemplazando r por 0.04, ut por 10 y pib por 0.07, se obtiene un valor predicho para la
inversin del prximo ao es de 130.93 millones de pesos.

10

Econometra I

Verano 2005-2006

Profesor

Jaime Ruiz-Tagle V.

Ayudante

Roberto Jaramillo M.

Prueba Solemne - Pauta de Correccin

Instrucciones
Ud. Dispone de 90 minutos para resolver este control. No puede hacer consultas a los
ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz
mina no tiene derecho a reclamo.

Pregunta 1 (30 puntos)


Considere un modelo con una sola variable explicativa

Yi = 0 + 1 Xi + ui ,
donde

Yi

(1)

es el peso de una persona medido en gramos que se quiere explicar con la

variable explicativa

Xi

que es la altura medida en centmetros.

Usted sugiere que es ms intuitivo usar kilogramos y metros para las medidas, en
cuyo caso el modelo a estimar sera

Yi = 0 + 1 Xi + vi ,
donde

Yi

(2)

es el peso de una persona medido en kilogramos y

Xi

es la altura medida

en metros. [Recuerde que 1kg = 1.000 gramos y que 1m = 100cm.]

(a) (5 puntos) Son los modelos equivalentes? Explique intituivamente.


Los modelos son equivalentes porque la relacin entre peso y altura no tiene por
qu verse alterada de acuerdo a las unidades de medida. Ciertamente los parmetros sern distintos, pero reejarn exactamente la misma relacin entre las variables. Simplemente se trata de un modelo con variables reescaladas.

(b) (10 puntos) A partir de la estimacin por MCO en (1) y (2), derive una expresin
para la relacin existente entre los los estimadores

y entre

1 .

Sabemos que la estimacin por MCO arroja

donde

yi

xi

P
xi yi

1 = P 2
xi

son las variables en desviaciones con respecto a la media. Adems,

i
Yi = 0 + 1 X
Dado que

yi =

yi
;
1,000

xi =

xi
, el modelo alternativo implica estimadores MCO
100

P
xy
1 = P i 2i =
xi

1
1,000100
1
100100

xi yi
x2i

1
1
10

.
Yi = 0 + 1 X
i

De donde se obtiene

0 = Yi 1 X
i
1

= Yi
1 X
i
10
1
1
1
=

1 Xi
Yi
1,000
10 100
i
1 h
i
Yi 1 X
=
1,000
1
0 .
0 =
1,000

(c) (5 puntos) Cul modelo explica mejor el peso de una persona? Explique intituivamente.
Dado que los modelos son equivalentes y que los parmetros son tienen una
relacin proporcional, ambos modelos explican de igual forma el peso de una persona. La nica diferencia es la unidad de medida, pero el la capacidad del modelo
para esplicar es la misma porque se esta ocupando exactamente la misma informacin.

(d) (10 puntos) Derive una expresin para la relacin entre el coeciente de bondad
del ajuste R2 del modelo en (1) y para el coeciente R2 en el modelo (2).
Sabemos que

R2 =

ESS
T SS

=1

RSS
, donde
T SS

RSS =

u2i

T SS =

P
(Yi Y )2 .

Dadas las relaciones de las variables,

1
1,0002

T SS =

T SS .

Por otro lado,

Por lo tanto,

Finalmente,

RSS =

2
ui .

P 2
(Yi Y ) =

1,0002

P
(Yi Y )2 =

Pero

Yi
ui = Yi Yi =
(
0 + 1 Xi )
1,000


1
1
1
Yi
0 + 1 Xi

=
1,000
1,000
10
100


1
Yi
0 + 1 Xi

=
1,000 1,000
Yi
Yi
=

1,000 1,000
ui
=
.
1,000
P 2
1
ui .
RSS = 1,000
2
RSS
T SS

R2 = 1

=1

1
RSS
1,0002
1
T SS
1,0002

=1

RSS
T SS

= R2 .

Pregunta 2 (30 puntos)


Se tiene el siguiente modelo con 2 variables explicativas:

Yi = 1 + 2 X2i + 3 X3i + ui ,

(3)

(a) (5 puntos) Explique cmo testeara la hiptesis que los parmetros de las variables explicativas son iguales entre s. Plantee el problema matricialmente.
Se busca testear la hiptesis en forma matricial

H0 :
donde

R = r

qkk1

q1

corresponde al nmero de restricciones. Dado que slo hay una restriccin

dado que

H0 : 2 = 3 H0 : 2 3 = 0,

la forma matricial es

H0 :

z }| {
R
r
1
z
}|
{
z }| {
0 1 1 2 = 0 .
3
3

(b) (5 puntos) Explique cmo testeara la hiptesis conjunta que el parmetro de la


variable X2 es igual a 5 y que el parmetro de la variable X3 es no signicativo.
Plantee el problema matricialmente.
Se busca testear la hiptesis en forma matricial donde

corresponde al nmero

de restricciones, en este caso 2. La hiptesis nula est dad por

H0 : 2 = 5
3 = 0
O equivalentente en forma matricial

H0 :

2
3

5
0

De donde se obtiene que

H0 :

z }| {
r
z
}|
z }| {
{


1
0 1 0
5
2 =
.
0 0 1
0
3

(c) (5 puntos) Muestre que la varianza de R es u2 R(X 0 X)1 R0 , donde R es la matriz


que se utiliza para testear hiptesis lineales conjuntas.
Sabemos que, si se cumplen los supuestos del modelo, el estimador de MCO es
insesgado con varianza
forma

= R ,
E[R]

= 2 (X 0 X)1 .
V ar()

Por lo tanto,

=
E[]

y de esta

y la varianza ser:

= E[(R R)(R R)0 ]


V ar(R)
= E[R( )( )0 R0 ]
= RE[( )( )0 ]R0
{z
}
|

V ar()

= R (X X)1 R0
= 2 R(X 0 X)1 R0 .

(d) (10 puntos) Derive una expresin algebraica para el estadgrafo F explicitando
cada uno de sus pasos.
4

Dado que los errores se distribuyen u N (0, 2 I) por los supuestos del modelo, el
estimador de MCO se distribuye se distribuye N (, 2 (X 0 X)1 ), y nalmente
R N (R, 2 R(X 0 X)1 R0 ). Estandarizando la distribucin, se tiene que
R R
p
N (0, 1),
2 R(X 0 X)1 R0

y bajo la hiptesis nula (si es que sta se cumple)

R r
p
N (0, 1).
2 R(X 0 X)1 R0

Tomando la forma cuadrtica de la expresin anterior y aplicando la propiedad


de que una normal estndar al cuadrado se distribuye como una chi-cuadrado con
1 grado de libertad y que la suma de q chi-cuadrados se distrbuye chi-cuadrado
con q grados de libertad, se obtiene
(R r)0 [ 2 R(X 0 X)1 R0 ]1 (R r) 2q .

Por otro lado, se puede demostrar que u2u 2nk . Por lo tanto utilizando la
propiedad de que una distribucin F es una divisin de dos chi-cuadrado dividas
por sus respectivos grados de libertad, se puede obtener
0

0 [ 2 R(X 0 X)1 R0 ]1 (Rr)

(Rr)
q
u
0 u

2 (nk)

Fq,nk ,

lo que se simplica a
0 [R(X 0 X)1 R0 ]1 (Rr)

(Rr)
q
u
0 u

nk

Fq,nk .

u
u

Dado que nk
corresponde al estimador insesgado de la varianza de los errores
2

, el estadgrafo F nalmente se calcula como


0

(R r)0 R[
2 (X 0 X)1 R0 ]1 (R r)
Fq,nk .
q

(e) (5 puntos) Suponga que el estadgrafo F de la hiptesis en (b) es igual a 3.13.


Si la estimacin se hizo con 20 observaciones, rechazara la hiptesis nula? De
qu tamao tendra que haber sido la muestra para que, con el estadgrafo que
se calcul, se hubiese rechazado la hiptesis nula con un 95 % de conanza. [Recuerde que la distribucin F se escribe como Fd1 ,d2 , donde d1 y d2 son los grados
5

de libertad correspondientes.]
Dado que el nmero de restricciones es q = 2 y que n k = 17, los valores cticos
correspondientes en las tablas de la distribucin F son: F2,17 ( = 10 %) = 2,64,
F2,17 ( = 5 %) = 3,59, F2,17 ( = 1 %) = 6,11. Por lo tanto, la hiptesis nula se
rechaza al 90 % de signicancia y no se puede rechazar al 95 % o ms de conanza, porque slo al 90 % el estadgrafo calculado es mayor al valor crtico de tabla.
Los valores crticos de tabla cercanos a 3.13 con un 95 % de conanza son F2,60 ( =
5 %) = 3,15 y F2,120 ( = 5 %) = 3,07. Por lo tanto, con una muestra de tamao
n >= 123 se garantiza que el test se hubiera aceptado porque el estadgrafo calculado habra sido mayor al valor crtico de tabla.

Pregunta 3 (30 puntos)

(a) (10 puntos) Explique por qu en la prediccin puntual existen dos fuentes de error.
En la prediccin puntual se pretende predecir un valor en particular de la variable
dependiente con el modelo estimado. Entonces, el error de prediccin puntual se
puede escribir como
ei = Yi Yi = Xi + ui Xi
+ ui ,
= Xi ( )
corresponde al error de estimacin de los parmetros y ui cordonde ( )
responde al error aleatorio. Al querer predecir un valor en particular tendremos
2 fuentes de error; una proveniente de la estimacin de los parmetros (es una
estimacin que siempre contiene algn grado de error) y otra proveniente de la
naturaleza estocstica del modelo, donde aunque el modelo sea perfecto siempre
habr un componente aleatorio que genere error.

(b) (10 puntos) Utilizando la matriz de desvos M 0, derive la expresin matricial para
el coeciente R2. Recuerde que para ello debe hacer una descomposicin de la
varianza total de la variable a explicar entre la parte explicada de la varianza y
la parte residual.
Primero expresamos el modelo general (asumiento que se usa una constante) en
desvos con respecto a la media, para lo cual premultiplicamos por la matriz M 0

y descomponemos la matriz X = [X X ] con X


1

M 0Y

=i

, es decir, la constante:

M 0 X + M 0 u
M 0 X + M 0 u
M 0 X1 1 + M 0 X2 2 + M 0 u
M 0 i1 + M 0 X2 2 + M 0 u
|{z}

=
=
=
=

=0
0

= M X2 2 + M 0 u
= M 0 X2 2 + u.

M 0Y

Luego premultiplicamos por Y para obtener la expresin de la suma total de los


cuadrados (TSS):
0

T SS = Y 0 M 0 Y = Y 0 (M 0 X2 2 + u)
T SS = (X + u)0 (M 0 X2 2 + u)
u0 u
X 0 u + u0 M 0 X2 2 + |{z}
= 0 X 0 M 0 X2 2 + 0 |{z}
| {z }
{z
}
|
=0

ESS

=0

RSS

T SS = ESS + RSS,

donde ESS es la parte explicada de la varianza total y RSS es la parte residual


(los trminos que sea hacen iguales a cero lo hacen porque las variables explicativas
son ortogonales a los residuos por construccin del modelo de MCO). Finalmente,
para construir el coeciente de R se determina qu parte de la varianza total es
explicada por el modelo, es decir,
2

ESS RSS
+
T SS
T SS
ESS
RSS
R2 =
=1
.
T SS
T SS

1=

(c) (10 puntos) Derive una expresin para el

estimador de la varianza de los parmet-

ros estimados por MCO. Explicite los supuestos que utilice.

Sabemos que el estimador de MCO es insesgado (bajo los supuestos del modelo) y es igual a
= (X 0 X)1 X 0 Y
= (X 0 X)1 X 0 (X + u)
= + (X 0 X)1 X 0 u).

Por lo tanto, la varianza es

= E[( E[])(
E[])
0] =
V ar()
=
=
=
=
V ar()

E[((X 0 X)1 X 0 u)((X 0 X)1 X 0 u)0 ]


E[(X 0 X)1 X 0 uu0 X(X 0 X)1 ]
(X 0 X)1 X 0 E[uu0 ]X(X 0 X)1
(X 0 X)1 X 0 u2 IX(X 0 X)1
u2 (X 0 X)1 .

Esto es porque se asume que los errores son homocedsticos y que no existe autocorrelacin.

F Values for = 0.10

F Value for = 0.10

d2

d1
5

d2

10

12

15

20

d1
24

30

40

60

120

inf

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf

39.86
8.53
5.54
4.54
4.06
3.78
3.59
3.46
3.36
3.29
3.23
3.18
3.14
3.10
3.07
3.05
3.03
3.01
2.99
2.97
2.96
2.95
2.94
2.93
2.92
2.91
2.90
2.89
2.89
2.88
2.84
2.79
2.75
2.71

49.5
9.00
5.46
4.32
3.78
3.46
3.26
3.11
3.01
2.92
2.86
2.81
2.76
2.73
2.70
2.67
2.64
2.62
2.61
2.59
2.57
2.56
2.55
2.54
2.53
2.52
2.51
2.50
2.50
2.49
2.44
2.39
2.35
2.30

53.59
9.16
5.39
4.19
3.62
3.29
3.07
2.92
2.81
2.73
2.66
2.61
2.56
2.52
2.49
2.46
2.44
2.42
2.40
2.38
2.36
2.35
2.34
2.33
2.32
2.31
2.30
2.29
2.28
2.28
2.23
2.18
2.13
2.08

55.83
9.24
5.34
4.11
3.52
3.18
2.96
2.81
2.69
2.61
2.54
2.48
2.43
2.39
2.36
2.33
2.31
2.29
2.27
2.25
2.23
2.22
2.21
2.19
2.18
2.17
2.17
2.16
2.15
2.14
2.09
2.04
1.99
1.94

57.24
9.29
5.31
4.05
3.45
3.11
2.88
2.73
2.61
2.52
2.45
2.39
2.35
2.31
2.27
2.24
2.22
2.20
2.18
2.16
2.14
2.13
2.11
2.10
2.09
2.08
2.07
2.06
2.06
2.05
2.00
1.95
1.90
1.85

58.2
9.33
5.28
4.01
3.40
3.05
2.83
2.67
2.55
2.46
2.39
2.33
2.28
2.24
2.21
2.18
2.15
2.13
2.11
2.09
2.08
2.06
2.05
2.04
2.02
2.01
2.00
2.00
1.99
1.98
1.93
1.87
1.82
1.77

58.91
9.35
5.27
3.98
3.37
3.01
2.78
2.62
2.51
2.41
2.34
2.28
2.23
2.19
2.16
2.13
2.10
2.08
2.06
2.04
2.02
2.01
1.99
1.98
1.97
1.96
1.95
1.94
1.93
1.93
1.87
1.82
1.77
1.72

59.44
9.37
5.25
3.95
3.34
2.98
2.75
2.59
2.47
2.38
2.3
2.24
2.20
2.15
2.12
2.09
2.06
2.04
2.02
2.00
1.98
1.97
1.95
1.94
1.93
1.92
1.91
1.90
1.89
1.88
1.83
1.77
1.72
1.67

59.86
9.38
5.24
3.94
3.32
2.96
2.72
2.56
2.44
2.35
2.27
2.21
2.16
2.12
2.09
2.06
2.03
2.00
1.98
1.96
1.95
1.93
1.92
1.91
1.89
1.88
1.87
1.87
1.86
1.85
1.79
1.74
1.68
1.63

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf

60.19
9.39
5.23
3.92
3.30
2.94
2.70
2.54
2.42
2.32
2.25
2.19
2.40
2.10
2.06
2.03
2.00
1.98
1.96
1.94
1.92
1.90
1.89
1.88
1.87
1.86
1.85
1.84
1.83
1.82
1.76
1.71
1.65
1.60

60.71
9.41
5.22
3.90
3.27
2.90
2.67
2.50
2.38
2.28
2.21
2.15
2.10
2.05
2.02
1.99
1.96
1.93
1.91
1.89
1.87
1.86
1.84
1.83
1.82
1.81
1.80
1.79
1.78
1.77
1.71
1.66
1.60
1.55

61.22
9.42
5.20
3.87
3.24
2.87
2.63
2.46
2.34
2.24
2.17
2.10
2.05
2.01
1.97
1.94
1.91
1.89
1.86
1.84
1.83
1.81
1.80
1.78
1.77
1.76
1.75
1.74
1.73
1.72
1.66
1.60
1.55
1.49

61.74
9.44
5.18
3.84
3.21
2.84
2.59
2.42
2.30
2.20
2.12
2.06
2.01
1.96
1.92
1.89
1.86
1.84
1.81
1.79
1.78
1.76
1.74
1.73
1.72
1.71
1.70
1.69
1.68
1.67
1.61
1.54
1.48
1.42

62
9.45
5.18
3.83
3.19
2.82
2.58
2.40
2.28
2.18
2.10
2.04
1.98
1.94
1.90
1.87
1.84
1.81
1.79
1.77
1.75
1.73
1.72
1.70
1.69
1.80
1.67
1.66
1.65
1.64
1.57
1.51
1.45
1.38

62.26
9.46
5.17
3.82
3.17
2.80
2.56
2.38
2.25
2.16
2.08
2.01
1.96
1.91
1.87
1.84
1.81
1.78
1.76
1.74
1.72
1.70
1.69
1.67
1.66
1.65
1.64
1.63
1.62
1.61
1.54
1.48
1.41
1.34

62.53
9.47
5.16
3.80
3.16
2.78
2.54
2.36
2.23
2.13
2.05
1.99
1.93
1.89
1.85
1.81
1.78
1.75
1.73
1.71
1.69
1.67
1.66
1.64
1.63
1.61
1.60
1.59
1.58
1.57
1.51
1.44
1.37
1.30

62.79
9.47
5.15
3.79
3.14
2.76
2.51
2.34
2.21
2.11
2.03
1.96
1.90
1.86
1.82
1.78
1.75
1.72
1.70
1.68
1.66
1.64
1.62
1.61
1.59
1.58
1.57
1.56
1.55
1.54
1.47
1.40
1.32
1.24

63.06
9.48
5.14
3.78
3.12
2.74
2.49
2.32
2.18
2.08
2.00
1.93
1.88
1.83
1.79
1.75
1.72
1.69
1.67
1.64
1.62
1.60
1.59
1.57
1.56
1.54
1.53
1.52
1.51
1.50
1.42
1.35
1.26
1.17

63.33
9.49
5.13
3.76
3.10
2.72
2.47
2.29
2.16
2.06
1.97
1.90
1.85
1.80
1.76
1.72
1.69
1.66
1.63
1.61
1.59
1.57
1.55
1.53
1.52
1.50
1.49
1.48
1.47
1.46
1.38
1.29
1.19
1.00

919

920

F Values for = 0.05

F Values for = 0.05

d2

d1
5

d2

10

12

15

20

d1
24

30

40

60

120

inf

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf

161.4
18.51
10.13
7.71
6.61
5.99
5.59
5.32
5.12
4.96
4.84
4.75
4.67
4.60
4.54
4.49
4.45
4.41
4.38
4.35
4.32
4.30
4.28
4.26
4.24
4.23
4.21
4.20
4.18
4.17
4.08
4.00
3.92
3.84

199.5
19.00
9.55
6.94
5.79
5.14
4.74
4.46
4.26
4.10
3.98
3.89
3.81
3.74
3.68
3.63
3.59
3.55
3.52
3.49
3.47
3.44
3.42
3.40
3.39
3.37
3.35
3.34
3.33
3.32
3.23
3.15
3.07
3.00

215.7
19.16
9.28
6.59
5.41
4.76
4.35
4.07
3.86
3.71
3.59
3.49
3.41
3.34
3.29
3.24
3.20
3.16
3.13
3.10
3.07
3.05
3.03
3.01
2.99
2.98
2.96
2.95
2.93
2.92
2.84
2.76
2.68
2.60

224.6
19.25
9.12
6.39
5.19
4.53
4.12
3.84
3.63
3.48
3.36
3.26
3.18
3.11
3.06
3.01
2.96
2.93
2.90
2.87
2.84
2.82
2.80
2.78
2.76
2.74
2.73
2.71
2.70
2.69
2.61
2.53
2.45
2.37

230.2
19.3
9.01
6.26
5.05
4.39
3.97
3.69
3.48
3.33
3.20
3.11
3.03
2.96
2.90
2.85
2.81
2.77
2.74
2.71
2.68
2.66
2.64
2.62
2.60
2.59
2.57
2.56
2.55
2.53
2.45
2.37
2.29
2.21

234.0
19.33
8.94
6.16
4.95
4.28
3.87
3.58
3.37
3.22
3.09
3.00
2.92
2.85
2.79
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.53
2.51
2.49
2.47
2.46
2.45
2.43
2.42
2.34
2.25
2.17
2.10

236.8
19.35
8.89
6.09
4.88
4.21
3.79
3.50
3.29
3.14
3.01
2.91
2.83
2.76
2.71
2.66
2.61
2.58
2.54
2.51
2.49
2.46
2.44
2.42
2.40
2.39
2.37
2.36
2.35
2.33
2.25
2.17
2.09
2.01

238.9
19.37
8.85
6.04
4.82
4.15
3.73
3.44
3.23
3.07
2.95
2.85
2.77
2.70
2.64
2.59
2.55
2.51
2.48
2.45
2.42
2.40
2.37
2.36
2.34
2.32
2.31
2.29
2.28
2.27
2.18
2.10
2.02
1.94

240.5
19.38
8.81
6.00
4.77
4.10
3.68
3.39
3.18
3.02
2.90
2.80
2.71
2.65
2.59
2.54
2.49
2.46
2.42
2.39
2.37
2.34
2.32
2.30
2.28
2.27
2.25
2.24
2.22
2.21
2.12
2.04
1.96
1.88

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf

241.9
19.4
8.79
5.96
4.74
4.06
3.64
3.35
3.14
2.98
2.85
2.75
2.67
2.60
2.54
2.49
2.45
2.41
2.38
2.35
2.32
2.30
2.27
2.25
2.24
2.22
2.20
2.19
2.18
2.16
2.08
1.99
1.91
1.83

243.9
19.41
8.74
5.91
4.68
4.00
3.57
3.28
3.07
2.91
2.79
2.69
2.60
2.53
2.48
2.42
2.38
2.34
2.31
2.28
2.25
2.23
2.20
2.18
2.16
2.15
2.13
2.12
2.10
2.09
2.00
1.92
1.83
1.75

245.9
19.43
8.70
5.86
4.62
3.94
3.51
3.22
3.01
2.85
2.72
2.62
2.53
2.46
2.40
2.35
2.31
2.27
2.23
2.20
2.18
2.15
2.13
2.11
2.09
2.07
2.06
2.04
2.03
2.01
1.92
1.84
1.75
1.67

248.0
19.45
8.66
5.80
4.56
3.87
3.44
3.15
2.94
2.77
2.65
2.54
2.46
2.39
2.33
2.28
2.23
2.19
2.16
2.12
2.10
2.07
2.05
2.03
2.01
1.99
1.97
1.96
1.94
1.93
1.84
1.75
1.66
1.57

249.1
19.45
8.64
5.77
4.53
3.84
3.41
3.12
2.90
2.74
2.61
2.51
2.42
2.35
2.29
2.24
2.19
2.15
2.11
2.08
2.05
2.03
2.01
1.98
1.96
1.95
1.93
1.91
1.90
1.89
1.79
1.70
1.10
1.52

250.1
19.46
8.62
5.75
4.50
3.81
3.38
3.08
2.86
2.70
2.57
2.47
2.38
2.31
2.25
2.19
2.15
2.11
2.07
2.04
2.01
1.98
1.96
1.94
1.92
1.90
1.88
1.87
1.85
1.84
1.74
1.65
1.55
1.46

251.1
19.47
8.59
5.72
4.46
3.77
3.34
3.04
2.83
2.66
2.53
2.43
2.34
2.27
2.20
2.15
2.10
2.06
2.03
1.99
1.96
1.94
1.91
1.89
1.87
1.85
1.84
1.82
1.81
1.79
1.69
1.59
1.50
1.39

252.2
19.48
8.57
5.69
4.43
3.74
3.30
3.01
2.79
2.62
2.49
2.38
2.30
2.22
2.16
2.11
2.06
2.02
1.98
1.95
1.92
1.89
1.86
1.84
1.82
1.80
1.79
1.77
1.75
1.74
1.64
1.53
1.43
1.32

253.3
19.49
8.55
5.66
4.40
3.70
3.27
2.97
2.75
2.58
2.45
2.34
2.25
2.18
2.11
2.06
2.01
1.97
1.93
1.90
1.87
1.84
1.81
1.79
1.77
1.75
1.73
1.71
1.70
1.68
1.58
1.47
1.35
1.22

254.3
19.5
8.53
5.63
4.36
3.67
3.23
2.93
2.71
2.54
2.40
2.30
2.21
2.13
2.07
2.01
1.96
1.92
1.88
1.84
1.81
1.78
1.76
1.73
1.71
1.69
1.67
1.65
1.64
1.62
1.51
1.39
1.25
1.00

921

922

F Values for = 0.01

F Values for = 0.01

d2

d1
5

d2

10

12

15

20

d1
24

30

40

60

120

inf

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf

4052
98.50
34.12
21.20
16.26
13.75
12.25
11.26
10.56
10.04
9.65
9.33
9.07
8.86
8.68
8.53
8.40
8.29
8.18
8.10
8.02
7.95
7.88
7.82
7.77
7.72
7.68
7.64
7.60
7.56
7.31
7.08
6.85
6.63

4999.5
99.00
30.82
18.00
13.27
10.92
9.55
8.65
8.02
7.56
7.21
6.93
6.70
6.51
6.36
6.23
6.11
6.01
5.93
5.85
5.78
5.72
5.66
5.61
5.57
5.53
5.49
5.45
5.42
5.39
5.18
4.98
4.79
4.61

5403
99.17
29.46
16.69
12.06
9.78
8.45
7.59
6.99
6.55
6.22
5.95
5.74
5.56
5.42
5.29
5.18
5.09
5.01
4.94
4.87
4.82
4.76
4.72
4.68
4.64
4.60
4.57
4.54
4.51
4.31
4.13
3.95
3.78

5625
99.25
28.71
15.98
11.39
9.15
7.85
7.01
6.42
5.99
5.67
5.41
5.21
5.04
4.89
4.77
4.67
4.58
4.50
4.43
4.37
4.31
4.26
4.22
4.18
4.14
4.11
4.07
4.04
4.02
3.83
3.65
3.48
3.32

5764
99.30
28.24
15.52
10.97
8.75
7.46
6.63
6.06
5.64
5.32
5.06
4.86
4.69
4.56
4.44
4.34
4.25
4.17
4.10
4.04
3.99
3.94
3.90
3.85
3.82
3.78
3.75
3.73
3.70
3.51
3.34
3.17
3.02

5859
99.33
27.91
15.21
10.67
8.47
7.19
6.37
5.80
5.39
5.07
4.82
4.62
4.46
4.32
4.20
4.10
4.01
3.94
3.87
3.81
3.76
3.71
3.67
3.63
3.59
3.56
3.53
3.50
3.47
3.29
3.12
2.96
2.80

5928
99.36
27.67
14.98
10.46
8.26
6.99
6.18
5.61
5.2
4.89
4.64
4.44
4.28
4.14
4.03
3.93
3.84
3.77
3.70
3.64
3.59
3.54
3.50
3.46
3.42
3.39
3.36
3.33
3.30
3.12
2.95
2.79
2.64

5982
99.37
27.49
14.80
10.29
8.10
6.84
6.03
5.47
5.06
4.74
4.50
4.30
4.14
4.00
3.89
3.79
3.71
3.63
3.56
3.51
3.45
3.41
3.36
3.32
3.29
3.26
3.23
3.20
3.17
2.99
2.82
2.66
2.51

6022
99.39
27.35
14.66
10.16
7.98
6.72
5.91
5.35
4.94
4.63
4.39
4.14
4.03
3.89
3.78
3.68
3.60
3.52
3.46
3.40
3.35
3.30
3.26
3.22
3.18
3.15
3.12
3.09
3.07
2.89
2.72
2.56
2.41

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
inf

6056
99.40
27.23
14.55
10.05
7.87
6.62
5.81
5.26
4.85
4.54
4.30
4.10
3.94
3.80
3.69
3.59
3.51
3.43
3.37
3.31
3.26
3.21
3.17
3.13
3.09
3.06
3.03
3.00
2.98
2.80
2.63
2.47
2.32

6106
99.42
27.05
14.37
9.89
7.72
6.47
5.67
5.11
4.71
4.40
4.16
3.96
3.80
3.67
3.55
3.46
3.37
3.30
3.23
3.17
3.12
3.07
3.03
2.99
2.96
2.93
2.90
2.87
2.84
2.66
2.50
2.34
2.18

6157
99.43
26.87
14.20
9.72
7.56
6.31
5.52
4.96
4.56
4.25
4.01
3.82
3.66
3.52
3.41
3.31
3.23
3.15
3.09
3.03
2.98
2.93
2.89
2.85
2.81
2.78
2.75
2.73
2.70
2.52
2.35
2.19
2.04

6209
99.45
26.69
14.02
9.55
7.40
6.16
5.36
4.81
4.41
4.10
3.86
3.66
3.51
3.37
3.26
3.16
3.08
3.00
2.94
2.88
2.83
2.78
2.74
2.70
2.66
2.63
2.60
2.57
2.55
2.37
2.20
2.03
1.88

6235
99.46
26.60
13.93
9.47
7.31
6.07
5.28
4.73
4.33
4.02
3.78
3.59
3.43
3.29
3.18
3.08
3.00
2.92
2.86
2.80
2.75
2.70
2.66
2.62
2.58
2.55
2.52
2.49
2.47
2.29
2.12
1.95
1.79

6261
99.47
26.50
13.84
9.38
7.23
5.99
5.20
4.65
4.25
3.94
3.70
3.51
3.35
3.21
3.10
3.00
2.92
2.84
2.78
2.72
2.67
2.62
2.58
2.54
2.50
2.47
2.44
2.41
2.39
2.20
2.03
1.86
1.70

6287
99.47
26.41
13.75
9.29
7.14
5.91
5.12
4.57
4.17
3.86
3.62
3.43
3.27
3.13
3.02
2.92
2.84
2.76
2.69
2.64
2.58
2.54
2.49
2.45
2.42
2.38
2.35
2.33
2.30
2.11
1.94
1.76
1.59

6313
99.48
26.32
13.65
9.20
7.06
5.82
5.03
4.48
4.08
3.78
3.54
3.34
3.18
3.05
2.93
2.83
2.75
2.67
2.61
2.55
2.50
2.45
2.40
2.36
2.33
2.29
2.26
2.23
2.21
2.02
1.84
1.66
1.47

6339
99.49
26.22
13.56
9.11
6.97
5.74
4.95
4.40
4.00
3.69
3.45
3.25
3.09
2.96
2.84
2.75
2.66
2.58
2.52
2.46
2.40
2.35
2.31
2.27
2.23
2.20
2.17
2.14
2.11
1.92
1.73
1.53
1.32

6366
99.50
26.13
13.46
9.02
6.88
5.65
4.86
4.31
3.91
3.60
3.36
3.17
3.00
2.87
2.75
2.65
2.57
2.49
2.42
2.36
2.31
2.26
2.21
2.17
2.13
2.10
2.06
2.03
2.01
1.80
1.60
1.38
1.00

923

924

Econometra I
Profesoras: Claudia Sanhueza
Javiera Vsquez.
Otoo 2006
Pauta Solemne
Comentes: (30 puntos)
1. En un modelo de regresin lineal simple 0 = 3, 0 y 1 = 2, 0,
a) la media de Y es 3,0 + 2,0 = 5,0.
b) se espera que Y aumente en 2,0 si X aumenta en 1 unidad.
c) los supuestos de mnimos cuadrados se cumplen.
d ) el valor de 0 no importa.
R: La media de Y se describe como 0 + 1 x, luego depender del valor de X cual sea la
media de Y . Respecto a que se cumplan los supuestos de MCO, es necesario tener mas
informacin, y la afirmacin de que el valor de 0 carece de cualquier fundamento. Por
ultimo la afirmacin verdadera es el hecho de que dado que 1 = 2, 0, es la pendiente en
este modelo, representa el cambio marginal de una unidad adicional de X, por lo tanto
se espera que Y aumente en dos unidades por cada unidad adicional de X.
2. En el modelo de regresin lineal Y = X + u, el estimador MCO alcanza la cota inferior
de Cramer-Rao.
R: Falso. Bajo el supuesto de normalidad del trmino de error, se tiene que el estimador
MCO y MV de son equivalentes, pero no as el estimador de la varianza del error 2 .
Entonces bajo el supuesto de normalidad tenemos que el estimador MCO de alcanza la
cota inferior de Cramer-Rao, pero no as el estimador de 2 .
3. En un modelo de regresin simple Y = + X + u, si la correlacin entre Y y X es
positiva, el parmetro estimado de tambin ser positivo.
R: Verdadero. En un modelo de regresin lineal simple es posible escribir el parmetro
de la siguiente forma:
p
V ar(Y )
Cov(Y, X)
=
= x,y p
V ar(X)
V ar(X)
por tanto como el ratio entre las races de las varianzas de X e Y es siempre positivo, el
signo del parmetro esta directamente determinado por el signo de la correlacin.
4. Cuando hay un problema de variable omitida,
a) el supuesto que E(ui |Xi ) = 0 es violado.
b) el supuesto que (Xi , Yi ) son iid es violado.
c) el supuesto que (Xi , ui ) tiene cuarto momento finito es violado.
d ) hay perfecta multicolinealidad.
1

R: El problema de variable omitida (se dice solo variable omitida y no variable omitida
relevante porque si dicha variable no fuera relevante no sera omitida) implica que el
error de la regresin del modelo incorrecto esta capturando la informacin acerca de
la variable omitida, por tanto si la variable omitida es correlacionada con alguna de las
variables incluidas luego E(ui |Xi ) 6= 0. El resto de las afirmaciones no son implicancias
derivadas del problema de variable omitida.
5. Si no hay suficientes variables explicativas en la regresin entonces los parmetros estimados estarn sesgados.
R: El hecho de que el numero de regresores afecte el sesgo de un parmetro estimado
es falso, sin embargo si se excluyen variables relevantes, y ocurre que ellas estn correlacionadas con las incluidas, esto producir un sesgo, pero una cantidad reducida de
variables explicativas, a priori, no tiene implicarais en el sesgo de un estimador.
6. Es equivalente realizar un Test F de significancia global del modelo y realizar varios test
de significancia individual de todos los parmetros.
R: Falso, aunque realicemos todos los test de significancia individual para las pendientes del modelo este resultado no va a ser equivalente al test de significancia global, ya
que este ltimo considera la correlacin entre las variables explicativas. Puede existir un
caso extremo que las variables tengan una correlacin muy alta y esta varianza conjunta
explique el comportamiento de la variable independiente, aunque cada una por separado
no es capaz de explicar el comportamiento de Y .

Demostraciones (30 puntos)


1. (15 puntos) En un modelo de regresin lineal con dos regresores yi =0 +1 X1i +2 X2i +ui .
Demuestre que si los errores son homosedsticos y n es grande entonces la varianza del
estimador de b1 se puede escribir como:
2b =
1

1
u2
1

2
n 1 2X1 X2 X
1

donde 2X1 X2 es el coeficiente de correlacin poblacional entre los regresores X1 y X2 , y


2
X
es la varianza poblacional de X1
1
Respuesta:
Primero expresamos el modelo en desviaciones con respecto a la media:
1 ) + 2 (X2i X
2 ) + (
)
Yi Y = 1 (X1i X
ui u
= 0 entonces queda:
Como u
e1i + 2 X
e2i + u
Yei = 1 X
i
Donde e representa que la variable esta en desviaciones con respecto a su media. La
e y la X
e 0X
e quedan:
matriz X

e11
X

e = ..
X
.
e
X1n

e21
" P
X
e2
.. , X
0
e = P X1i
eX
.
e2i X
e1i
X
e2n
X

P e e #
X X
P 1ie 2 2i
X2i

e y la multiplicamos por u2 para obtener la matriz de varianzas y


e 0X
Ahora invertimos X

covarianzas de
"
P e e #
P e2
u2
X
X2i
X
2 e 0 e 1
P e e
P e1i2 2i
u (X X) = P
P e e 2
P e2
2
e
X
X
X

X1i X2i ( X1i X2i )


2i 1i
1i
De la cual podemos obtener una expresin para la varianza de 1 :
P e2
u2 X
2i
V (1 ) = P
P
e2
e 2 (P X
e1i X
e2i )2
X
X
1i
2i
Ahora, sabemos que la correlacin entre 2 variables esta definida como:
X1 ,X2

P e e
Cov(X1i , X2i )
X1i X2i
=p
= qP
V (X1i )V (X2i )
e2 P X
e2
X
1i
2i

Ahora obtenemos 2X1 ,X2 y luego lo reemplazamos en la expresin para V (1 )


2X1 ,X2

P e e 2
( X
1i X2i )
=P
P e2
2
e
X1i X
2i
3

P e2
P e2
u2 X
u2 X
2i
2i

V (1 ) = P
P e2 P e2 = P e2 P e2
e 2 2
e2 P X
X
X
X
(1

2X1 ,X2 )
X
X
1i
2i
1i
2i
1i
2i
X1 ,X2
Luego simplificando la expresin, y reemplazando la varianza poblacional de X1
1
2
u2
1
=
2u
V (1 ) = P
2
e 2 (1 2
n 1 X1 ,X2 X1
X
1i
X1 ,X2 )

2. (15 puntos) Demuestre que la varianza del error de una prediccin individual, en un
modelo de regresin lineal simple, se puede expresar de la siguiente forma:

1
(X0 X)2
P
V AR(Y0 Y0 ) = 2 1 + +
n
xi
R: Si se desea predecir el valor individual de Y correspondiente a X = X0 , es decir, se quiere
obtener:
Y0 = 1 + 2 X0 + u0
Se predice de la siguiente forma:
Y0 = 1 + 2 X0
El error de prediccin Y0 Y0 es:
Y0 Y0

1 + 2 X0 + u0 (1 + 2 X0 )
= (1 1 ) + (2 2 )X0 + u0
=

(1)
(2)

Por consiguiente,
E[Y0 Y0 ] =
=

E(1 1 ) + E(2 2 )X0 + E(u0 )


0

porque 1 y 2 son insesgados, X0 es un nmero fijo y E(u0 ) es cero pos los supuestos tpicos.
Elevando (2) al cuadrado y tomando valor esperado se obtiene:
V [Y0 Y0 ] =

V (1 ) + V (2 )X02 + 2X0 cov(1 , 2 ) + V (u0 )

(3)

Adems tenemos que:


V (1 ) =
V (2 ) =
Cov(1 , 2 ) =

P 2
X
P i2 2
n xi
2
P 2
x
i 2

X P 2
xi

Reemplazando (4), (5) y (6) en (3):


P 2
2
X
2

P i2 2 + P 2 X02 + 2X0 X P 2 + 2
V [Y0 Y0 ] =
n xi
xi
xi

2
(X0 X)
1
P 2
V [Y0 Y0 ] = 2 1 + +
n
xi

(4)
(5)
(6)

Ejercicio Matemtico (20 puntos) Una muestra de 20 observaciones correspondientes al


modelo:
Yi = + Xi + u i = 1, ..., n
en el que los errores se distribuyen independiente e idnticamente normal con media cero y
varianza constante, ofrece los siguientes datos:
X
X
X
Yi = 21,9
(Yi Y )2 = 86,9
(Xi X)(Yi Y ) = 106,4
X
X
Xi = 186,2
(Xi X)2 = 215,4
Estimar y y calcular los errores estndar, estimar el valor de la media condicional correspondiente a X = 10, y encontrar un intervalo de confianza del 95 % para esta media.
Respuesta:
Utilizando MCO en desvios, los estimadores de y son:
P

(Xi X)(Yi Y )
106,4
= 0,494
=
P
2
215,4
(Xi X)
= 21,9 0,494 186,2 = 3,504
Y X
20
20

qP
u
2
Para calcular el error estndar, u =
nk , necesitamos la suma de los errores al cuadrado.
Esta se puede obtener de la siguiente ecuacin:
X

u
2

=
Para obtener

i )2
(Yi
X
i Y i + 2
i)
(Yi2 +
2 + 2 Xi2 2
Yi 2X
X
X
X
X
X
Xi2 2

Yi 2
Xi Yi + 2

Xi
Yi2 + n
2 + 2

u
2 hay que obtener los valores que falta, que son

Xi Yi ,

X
i Y ) = =
Y
(Xi X)(Y
Xi Yi nX
X
X
i Y ) + nX
Y

Xi Yi =
(Xi X)(Y
= 106,4 + 20 9,31 1,095
X
Xi Yi = 310,289
X

2
(Xi X)
X

Xi2
X

Xi2

=
=

X
X

Xi2 y

Yi2 :

(8)

2
Xi2 nX
2 + nX
2
(Xi X)

215,4 + 20 9,312

1948,922
6

(7)

(9)

(Yi Y )2
X

Yi2

=
=
=

X
X

Yi2 nY 2
(Yi Y )2 + nY 2

86,9 + 20 1,0952

Reemplazando 8,9 y 10 en 7 queda:


X

u
2 = 34,343

qP

u
2
nk

Por lo tanto, el error estndar u =

es:
rP

u2
u

u
2
nk
r
34,343
=
20 2
= 1,908
= 1,381
=

El valor de la media condicional para X = 10 es:

Y0
Y0
Y 0

=
=
=

+ X0
3,504 + 0,494 10
1,436

La desviacin estndar del error de prediccin:


e2 = u2 (1 + X0 (X 0 X)1 X00 )
La que para un modelo con constante y pendiente se resume en:

e2

e2
e

(X X0 )2
Pi
u2 1 +
2
n (Xi X)
2500,9
= 1,908(1 +
)
20 4308
= 3,017
= 1,737
=

(10)

El t de tabla para un test de dos colas con un 95 % de confianza es tt = 2,101, por lo que el
intervalo de confianza queda:

Y0 tt,/2 e Y 0
1,436 2,101 1,737 Y 0
2,213 Y 0

Y0 + tt,1/2 e
1,436 + 2,101 1,737
5,085

Ejercicio Emprico (40 puntos)

En la Table 5.2 se presentan los resultados de las regresiones de desempeo educacional en la


razn profesor-alumno y otras variables de control de caractersticas de los estudiantes usando
colegios del grado K-8 de los distritos del Estado de California en Estados Unidos. EL modelo
general es:
yi = c + 1 X1i + 2 X2i + 3 X3i + 4 X4i + ui
Donde y es el puntaje promedio de los colegios en el distrito (desempeo educacional), X1i es la
razn profesor alumno, X2i es el porcentaje de alumnos que no saben ingls, X3i es el porcentaje de alumnos que tienen derecho a almuerzo subsidiado, X4i es el porcentaje de los ingresos
del colegio que proviene del Gobierno, y c es el intercepto. SER es la desviacin estndar de
2
la regresin (b
2 ), R es el R cuadrado ajustado, y n es el nmero de observaciones de la regresin.
Notar que las columnas indican las variables explicativas que se incluyen en la regresin. No
todas ellas contienen todas las variables explicativas y controles.

Las desviaciones estndares de los parmetros estimados se encuentra entre parntesis abajo de los estimadores.
Un coeficiente individual es estadsticamente significativo al nivel 5 % (*), nivel 1 % (**) usando
un test de dos colas.
Usando los resultados de la Tabla 5.2 adjunta conteste las siguientes preguntas:
1. En la regresin de la columna (3), el valor estimado de 1 es -1,00. Qu significa un valor
de -1,00 en esta regresin?
R: Mientras mas alumnos sean por profesor, existe una incidencia negativa sobre el puntaje estimado, adems este efecto es estadsticamente distinto de cero al 1 % de significancia.
En otras palabras, si el ratio alumnos/profesores aumenta en una unidad, se espera que
el promedio caiga en un punto, segn nuestra especificacin.
2. Usando los resultados de la columna (3), construya un intervalo de confianza para 1 del
99 %.
R: Un intervalo de confianza de 1 de significancia, con varianza desconocida y T-k
grados de libertad, se define como:
P r[1 t1 2 ,T k (1 ) < 1 < 1 + t1 2 ,T k (1 ) ] = 1

(1)

Remplazando valores1
1 2, 575(0, 27) < 1 < 1 + 2, 575(0, 27)

(2)

1, 69525 < 1 < 0, 30475

(3)

3. Construya el R2 de la regresin en la columna (3).


R: Recordemos que:

Despejando para R2 :

T 1
2
2

R = 1 (1 R )
T k

T k 2
R =1+
(R 1)
T 1

(4)

Remplazando los datos:

R2 = 1 +

420 4
(0, 773 1)
420 1

= R2 = 0, 7746

(5)

(6)
(7)

4. El R en la regresin de la columna (3) es muchas mayor que la regresin de la columna


(1). Esto significa que puede ser eliminado un potencial sesgo de variable omitida? Explique.
1 Como

el tamao muestral es lo suficientemente grande, se puede usar una normal estandar para encontrar
los valores tipificados (T > 100).

10

2 , a diferencia del R2 el cual aumenta al incluir ms regreR: Es posible, ya que el R


sores, corrige por los grados de libertad que se van perdiendo al incluir ms regresores.
2 se define como:
Recordemos que R
0

/(T k)
2 = 1 +
(1)
R
Y 0 M Y /(T 1)
Adems posteriormente las variables que fueron omitidas en (1) e incluidas en (3) resultaron ser significativas al 1 %, por lo tanto, es probable que se este eliminado un potencial
sesgo de variable relevante omitida.
5. Sea 4 el coeficiente de la variable porcentaje de ingresos pblicos".
a) Es 4 estadsticamente significativo en la regresin de la columna (4)? Construya un
intervalo de confianza para 4 del 95 % usando la regresin de la columna (4).
R: Por enunciado sabemos que es significativo al 1 %. Recordemos la definicin de
un intervalo de confianza al 1 :
P r[4 t1 2 ,T k (4 ) < 4 < 4 + t1 2 ,T k (4 ) ] = 1

(1)

Remplazando valores:
0, 79 1, 96(0, 068) < 4 < 0, 79 + 1, 96(0, 068)

(2)

0, 92328 < 4 < 0, 65672

(3)

b) Es 4 estadsticamente significativo en la columna (5)? Construya un intervalo de


confianza para 4 del 95 % usando la regresin de la columna (5).
R: Por enunciado sabemos que no es significativo al 5 % ni al o %. Usando la definicin
de un intervalo de confianza:
0, 048 1, 96(0, 059) < 4 < 0, 048 + 1, 96(0, 059)

(4)

0, 06764 < 4 < 0, 16364

(5)

Notemos que el intervalo de confianza pasa por cero.


c) Explica porque las respuestas de a y b son diferentes.
R: Por que en (4) se omiti X3 , la cual esta correlacionada con X4 , es decir que
4 en (3) esta siendo sub estimada, ya que cov(X3 , X4 ) 6= 0, la intuicin de este razonamiento es que mientras mayor sea la ayuda estatal, mayores sern los subsidios
de almuerzos otorgados. Como ejemplo de esto, cuando en el modelo lineal simple,
se omite una variable relevante, obtenemos:

cov(X1 , X2 )

2
(6)
E(1 ) = i +
V (X1 )
Siendo X2 la variable relevante omitida, el signo del sesgo del parmetro depender
de la cov(X1 , X2 ) y del beta de la variable omitida.
11

6. Se lleva a cabo un test F para testear la hiptesis nula H0 : 2 = 4 = 0 para la


especificacin de la regresin de la columna (5). El valor calculado del test es 6.88.
a) Es H0 rechazada al 1 % de significancia? Explique.
R: El valor tipificado es: F = 6, 88, el cual debe ser comparado con el valor critico,
que se obtiene de una F(2,415) , ya que se tienen 2 restricciones y 415 grados de libertad con 1 % de significancia. La hiptesis es rechazada, ya que F(2,415) 4, 6, por lo
que nuestro valor tipificado es mucho mayor al valor critico, es decir cae en la zona
de rechazo.
b) Est el punto 2 = 4 = 0 contenido en el intervalo de confianza del conjunto al
99 % para 2 y 4 ? Explique.
R: Usando un intervalo de confianza para 2 y 4 :
P r[(2 +4 )t1 2 ,T k (2 +4 ) < 2 +4 < (2 +4 )+t1 2 ,T k (2 +4 ) ] = 1 (1)
Recordemos que (2 + 4 ) = (2 ) + (4 ) + 2cov(2 , 4 ), si suponemos que la
covarianza es pequea, entonces (1) es aproximadamente:
0, 082 2, 575(0, 036 + 0, 059) < 2 + 4 < 0, 082 + 2, 575(0, 036 + 0, 059) (2)
0, 326625 < 2 + 4 < 0, 162625

(3)

El intervalo de confianza pasa por 0, por lo cual el punto 2 = 0 y 4 = 0 esta


contenido en el intervalo.
7. En la regresin representada en la columna (1), est la razn profesor alumno no correlacionada con el error de la regresin? Es esta correlacin positiva o negativa?
R: Existe una correlacin, ya que hay variables relevantes omitidas. Por lo cual se viola el supuesto que E(i , Xi ) = 0. En otras palabras, en las innovaciones o en el trmino
de error, existen componentes sistemticos, no ortogonales a las variables incluidas, que
explican la variable dependiente.
8. Comparando las columnas (1) y (2), crees que la razn profesor alumno y el porcentaje
de aprendices de ingls correlacionado positiva o negativamente? Explique.
R: A modo de dar una intuicin del problema, usamos el modelo lineal simple, para
poder observar como afecta la no inclusin de una variable relevante, en cuyo caso nuestro estimador estar sesgado:

cov(X1 , X2 )

2
(1)
E(1 ) = i +
V (X1 )
Siendo X2 la variable relevante omitida, el signo del sesgo del parmetro depender de
la cov(X1 , X2 ) y del beta de la variable omitida. En (1), 1 esta siendo sub estimado
comparado con (2). La correlacin es positiva ya que 2 < 0 en el modelo (2), por lo cual
cov(X1 , X2 ) > 0.
9. Supongamos que el tamao muestral aumenta al doble, entonces n = 840. Como esperas
que cambien los errores estndares de los estimadores MCO? Explique.
12

R: Si T aumenta el doble, contamos con una mayor parte de la poblacin, por lo cual
estaremos mas cerca de estimar los verdaderos parmetros poblacionales, adems nuestras
estimaciones son ms precisas, ya que aumenta la variabilidad de las variables independientes, con esto la varianza de los betas ser menor. Como la estimacin es ahora mas
precisas, los errores de MCO son menores.

13

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Solemne

Semestre: Primavera 2006


Profesores: Jos Miguel Benavente, Rodrigo Montero
Tiempo de duracin: 110 minutos
No hay preguntas de ningn tipo para los ayudantes

1.

Comente en no ms de 10 lneas las siguientes


afirmaciones (30 puntos)

1. El supuesto de normalidad es clave para que el estimador de mnimos


cuadrados ordinarios sea MELI.
Respuesta. Falso. El estimador de mnimos cuadrados ordinarios es el
mejor estimador lineal e insesgado. Dentro de los supuestos necesarios para
que eso se cumpla estn: (i) el modelo es lineal (Y = X + ), (ii) la matriz
X es de rango completo, (iii) los errores (disturbios) son esfricos, es decir,
tienen media cero, y covarianza nula, y (iv) los regresores son no estocsticos. El supuesto de normalidad slo es necesario para realizar inferencia
estadstica, puesto que de esa manera se obtiene una distribucin conocida
para el vector de parmetros estimados.
2. Mientras mayor sea la variabilidad de los datos ms ineficientes sern las
estimaciones de MCO.
Respuesta. Considere la varianza del estimador en el contexto del modelo
de dos variables:
2
= P
var()
x2
El denominador de la expresin representa la variablidad de los xs, es decir,
a la variabilidad de los datos. De esta manera, mientras mayor sea sta,
menor ser la varianza del estimador MCO, y por lo tanto, ms precisas
(eficientes) sern las estimaciones. El comente es falso.

3. Si una variable es econmicamente significativa, entonces, no debiera ocurrir que estadsticamente no lo fuera.
Respuesta. Falso. En trminos econmicos, la signficancia de la variable
viene determinada por el modelo terico subyacente. Sin embargo, a nivel
estadstico la significancia estar determinada en parte por la naturaleza y
caractersticas de los datos. En particular, la variable podra ser estadsticamente no significativa debido a una alta colinealidad en los datos (covarianza). Esto ocurre pues mientras mayor sea sta, mayor ser tambin la
varianza del estimador, y por lo tanto, ms probabilidades hay que el cero
est contenido en el intervalo de confianza asociado.
4. El anlisis economtrico permite descartar teoras, y de esa manera, progresar en el entendimiento de la economa.
Respuesta. En parte esto es correcto. En la medida que el anlisis economtrico sea el apropiado, y que los datos no estn muy contaminados, entonces,
es posible validar teoras a partir de ste. Sin embargo, las conclusiones de
todo anlisis economtrico deben ponderarse adecuadamente en funcin de
las limitaciones que ste ofrece. Ahora bien, si existe abundante evidencia
emprica que apoya cierta afirmacin terica, entonces, habra fundamento
para poder establecer que el modelo explica relativamente bien la realidad.
5. La singularidad de la matriz (X 0 X) no afecta la precisin de las estimaciones.
Respuesta. La precisin de las estimaciones vienen dadas por su varianza,
es decir:
= 2 (X 0 X)1
var()
(1)
En la medida que la matriz (X 0 X)1 sea singular, esto es, no invertible,
entonces, su inversa no existe, pues su determinante tiende a cero. Por lo
tanto, se tendrn varianzas gigantes, y en el lmite, es decir, cuando la
matriz es singular, stas no se podrn calcular. Por lo tanto, el comente es
falso.
6. Siempre es mejor utilizar un slo modelo para predecir, en lugar de escoger
una combinacin de distintos modelos.
Respuesta. Falso. En la medida que se reconoce que ningn modelo es
perfecto, y que por lo tanto, los defectos de uno pueden ser las virtudes
de otro, entonces, al tomar ms de un modelo para realizar proyecciones, y
hacer una ponderacin de stas, ser posible obtener mejores estimaciones.
Esto ocurrira pues los errores de unos con otros tenderan a cancelarse,
obtenindose as una mejor prediccin.

2.

Demostraciones (30 puntos)

1. Considere el siguiente modelo: Yi = + Xi + i . Demuestre que:



2 
X
M CO
2 1
+P 2
var(

)=
n
xi
Respuesta. Se sabe que:
= + X
+
= ( )X
+

= Y X
X

Por lo tanto:
+

= ( )X

Por lo tanto, la varianza de


puede escribirse como:
+
2 E( )2 + E(

E(
)2 = E[( )X
]2 = X
2 ) 2XE[(
)
]
Por otro lado, se sabe que:
2
E( )2 = P 2
x
y:
E(
2 ) =
Adems:
E[( )
] = E
E[( )
] =

1
P

x2

2
n

P  X 
x 1
P 2

x
n

E[(x1 1 + x2 2 + + xn n )(1 + 2 + + n )]
P
2 x

E[( )
] = P 2 = 0
n x

Reemplazando estos trminos en la expresin original, se llega a lo siguiente:


2
2
2 P +
E(
)2 = X
x2
n

Finalmente:
2

E(
) =

2 
1
X
+P 2
n
x

2. Demuestre que
2 = nki es un estimador insesgado de 2 .
Respuesta. Considere lo siguiente:

= Y X = Y X(X 0 X)1 X 0 Y = M Y
con:
M = I X(X 0 X)1 X 0
donde M es una matriz simtrica e idempotente. Note adems lo siguiente:

= M Y = M (X + ) = M .
Un estimador natural de 2 sera la suma de los errores estimados al cuadrado, es decir:
X
=

0
Aplicando esperanza:
E(
0
) = E(0 M 0 M ) = E(0 M )
Dado que la traza de un escalar es un escalar, se tiene:
E(0 M ) = E[tr(0 M )] = E[tr(0 M )] = 2 tr(M )
Reemplazando M :
E(0 M ) = 2 tr(I) 2 tr[X(X 0 X)1 X 0 ] = 2 tr(I) 2 tr[(X 0 X)1 (X 0 X)]
Por lo tanto:
E(0 M ) = 2 (n k)
Es decir, la suma de los cuadrados de los errores estimados es un estimador
sesgado de 2 . Por lo tanto, y dado el resultado anterior:
P 2

i
2

=
nk
corresponde a un estimador insesgado de 2 .

3.

Matemtico (20 puntos)

Se quiere explicar la evolucin de la demanda de pescado de una ciudad (Dt ),


en funcin del ingreso medio disponible (Yt ). Para ello se dispone de datos de
los cien ltimos meses, (donde la demanda viene medida en toneladas mtricas,
TM, y el ingreso disponible en millones de pesos). Se dispone de la siguiente
informacin:
X
X
X
Yt = 6
Dt = 3
Dt2 = 10
X
X
Yt2 = 36
Dt Yt = 15
con t = 1, 2, ..., 100.
1. Escriba un modelo de regresin adecuado para la estimacin de la demanda
de pescado en funcin del ingreso y calcule los coeficientes estimados por
MCO.
Respuesta. El modelo a estimar sera el siguiente:
Dt = 0 + 1 Yt + t
con t = 1, ..., 100, y t correspondera al trmino de error con media cero y
varianza homoscedstica. La estimacin viene dada por:
= (X 0 X)1 X 0 D

(2)

Se tiene lo siguiente:
1   

  
100 6
3
0, 005051
0
=
=
6 36
15
0, 415825
1
2. Se piensa que una forma mejor de estimar la demanda sera incluyendo
adems del ingreso medio disponible, los precios de pescado (Pt ) como nueva
variable explicativa. Sabiendo que:
X
X
X
X
Pt = 4
Yt Pt = 30
Pt2 = 100
Pt Dt = 5
calcule los nuevos coeficientes estimados.
Respuesta. El nuevo a modelo a estimar viene dado por:
Dt = 0 + 1 Yt + 2 Pt + t
Aplicando MCO se tiene lo siguiente:

1

0
100 6
4
3
0, 004041
1 = 6 36 30 15 = 0, 499282
4 30 100
5
0, 09995
2
5

2 de los modelos estimados. Comente qu modelo sera


3. Obtenga el R2 y R
preferido en base a los resultados anteriores.
Respuesta. Se sabe que:
+  = X + 
D=D
Por lo tanto:
0 X + 0  = X
0 D + 0 
+ )0 (D
+ ) = D
0D
+ 0  = X
D 0 D = (D

(3)

Por otro lado, la variabilidad de D viene dada por:


X
X
2=
2 = D 0 D nD
2
(Dt D)
Dt2 nD
Por lo tanto, la descomposicin de la varianza viene dada por:
0 D nD
2 = (X
2 ) + 0 
D 0 D nD

(4)

es decir: T SS = ESS + RSS. De esta manera, el R2 del primer modelo viene


dado por:
0 D nD
2
X
R2 =
(5)
2 = 0, 621
D 0 D nD
2 por:
y el R
2 = 1 (1 R2 )
R

n1
nk


= 0, 617

(6)

Para el segundo modelo los resultados son:


0 D nD
2
X
R =
2 = 0, 697
D 0 D nD
2

(7)

2 por:
y el R
2 = 1 (1 R2 )
R

n1
nk


= 0, 691

(8)

2 , es decir, el segundo
El modelo preferido ser aquel que tenga el mayor R
2
modelo. No sera correcto fijarse en el R , pues ste es monotnico frente a la
2 toma en cuenta la
incorporacin de regresores adicionales, mientras que el R
prdida en grados de libertad en que se incurre.

4.

Analtico (20 puntos)

Considere la siguiente estimacin que ha sido generada a partir de la informacin proporcionada por la Encuesta de Caracterizacin Nacional (CASEN) para
el ao 2003:
Variable

Coeficiente

Desviacin Estndar

Aos de escolaridad
Experiencia laboral
Experiencia laboral al cuadrado
Constante

0,1202
0,0212
-0,0000938
5,0379

0,0007037
0,0006365
0,0000127
0,0112151

El modelo estimado es el siguiente:


Yi = 0 + 1 X1i + 2 X2i + 3 X3i + i
donde Yi corresponde al logaritmo del salario por hora, X1i son los aos de escolaridad, X2i representa la experiencia laboral del individuo, y X3i es el cuadrado
2
de sta (es decir, X2i
).
1. Son econmicamente significativos los coeficientes asociados a las pendientes?
Respuesta. La teora econmica establece que los factores productivos
deben ser retribuidos de acuerdo a la contribucin marginal que hacen al
proceso productivo, es decir, de acuerdo a su productividad. La productividad de los trabajadores no es observable, por lo que sta suele aproximarse
mediante las variables incluidas en este modelo, esto es, aos de escolaridad
y experiencia laboral. El cuadrado de esta ltima trata de capturar el perfil
decreciente que tiene el premio a la experiencia en el mercado laboral (de
hecho, el coeficiente asociado es negativo).
2. Son estadsticamente significativos los coeficientes asociados a las pendientes?
Respuesta. Para evaluar esto se requieren construir los test t de cada uno
de los coeficientes estimados:
t1 =

0, 1202
1
=
= 170, 81

1
0, 0007037

t2 =

2
0, 0212
=
= 33, 3

2
0, 0006365
7

t3 =

3
0, 0000938
=
= 7, 38

3
0, 0000127

Por lo tanto, las pendientes del modelo son estadsticamente distintas de


cero, pues el intervalo de confianza (al 95 %) no contendra el cero, ya que
los t son todos mayores que dos (2) en valor absoluto.
3. Es la constante estadsticamente significativa? Si as fuera, tendra sentido desde un punto de vista econmico?
Respuesta. A continuacin se presenta el test t para la constante del modelo:
5, 0379
0
=
= 449, 2
t0 =

0
0, 0112151
Dado que el t es mayor que dos, entonces, la constante es significativa. Este
resultado tiene sentido desde un punto de vista econmico, pues reflejara de
alguna forma el salario mnimo que paga el mercado, es decir, independiente
del capital humano de la persona sta recibira al menos dicha cantidad.
4. Cul es el salario (mensual) estimado para una persona con 14 aos de
escolaridad, y cuatro aos de experiencia laboral? (Asuma que la jornada
laboral es de 45 horas a la semana, y que el mes tiene 4,2 semanas)
Respuesta. La prediccin es la siguiente:
Yi = 0 + 1 X1i + 2 X2i + 3 X3i
Reemplazando:
Yi = 5, 0379 + 0, 1202(14) + 0, 0212(4) 0, 0000938(16) = 6, 8039992
Aplicando e() se llega a que el salario por hora estimado es de $901. Como la persona trabaja 45 horas a la semana, y el mes tiene 4,2 semanas,
entonces, el salario mensual estimado para esta persona es de $170.289.

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Solemne

Semestre: Primavera 2007


Profesores: Jos Miguel Benavente, Rodrigo Montero
Ayudantes: Rodrigo Bravo, Felipe Ros, Loreto Silva
Tiempo de duracin: 120 minutos
No hay preguntas de ningn tipo para los ayudantes

1.

(30 puntos) Comente en no ms de 10 lneas


las siguientes afirmaciones:

1. El estimador de mnimos cuadrados ordinarios (MCO) maximiza el valor


del R2 .
Respuesta. Verdadero. Dado que el estimador MCO minimiza la suma de
los residuos al cuadrado, entonces, automticamente lo que hace es maximizar la el valor del R2 , el cual se define de la siguiente manera:
P 2
u
2
R = 1 P 2i
yi
donde yi = Yi Y .
2. Si un estimador es estadsticamente significativo, entonces, tambin es significativo desde un punto de vista econmico.
Respuesta. Falso. El hecho de que un coeficiente de una ecuacin sea estadsticamente significativo, no quiere decir que sea significativo desde el
punto de vista econmico. La significancia econmica del coeficiente viene
dada por el modelo en cuestin, el cual sustenta la inclusin de una determinada variable. Sin embargo, podra darse el caso que, por un problema de
los datos, el coeficiente no sea estadsticamente significativo, an cuando el
modelo establezca que dicha variable es relevante para explicar la variable
dependiente (Y ).
1

3. Una de las principales ventajas del test t es que es insensible al tamao de


la muestra, y por lo tanto, sus resultados siempre son confiables.
Respuesta. Falso. Se sabe que el test t se define de la siguiente manera:
t =

A su vez, sin perder generalidad, se sabe que para el caso del modelo de dos
variables (Yi = + Xi + ui ), la varianza del estimador MCO viene dada
por:
2
= P
var()
x2i
donde:

u2i
N k
donde k corresponde al nmero de parmetros a estimar. De esta manera,
es posible apreciar cmo el tamao muestral (N ) afecta el valor del test
y por ende, mayor
t. Mientras mayor sea N menor es la varianza de ,
es el valor del test t. En consecuencia, es ms probable que el coeficiente
estimado resulte ser estadsticamente significativo.
P

2.

Matemticos

1. (30 puntos) Sea el siguiente modelo:


Yi = + Xi + ui
donde ui se encuentra independiente e idnticamente distribuido con media
cero y varianza 2 . Considere los siguientes dos estimadores alternativos
para la pendiente del modelo (b):
Yn Y1
Xn X1
P
Yi
b2 = P
Xi

b1 =

a) Determine si b1 y b2 son estimadores insesgados de .


Respuesta.


Yn Y1
1
E(b1 ) = E
=
(Xn X1 ) =
Xn X1
Xn X1
2

ya que E(Yi ) = + Xi . Por lo tanto, b1 es un estimador insesgado de


. Por otro lado:
P 
X
Yi
1
1 X
E(b2 ) = E P
= P E(
Yi ) = P
( + Xi )
Xi
Xi
Xi
Por lo tanto:
X
n
1
Xi ) = P
+ 6=
E(b2 ) = P (n +
Xi
Xi
Es decir, b2 es un estimador sesgado de .
b) Encuentre las varianzas de b1 y b2 .
Respuesta. En primer lugar se debe establecer lo siguiente:
var(Yi ) = var( + Xi + ui ) = 2
ya que y son parmetros fijos, y Xi es una variable exgena al
modelo (los valores de Xi son fijos. Luego:
var(b1 ) =

2 2
1
var(Y

Y
)
=
n
1
(Xn X1 )2
(Xn X1 )2

ya que cov(Yi , Yj ) = 0 para todo i 6= j, puesto que el trmino de error


(ui ) tiene una distribucin independiente. Por otro lado:
X
n 2
1
P
var(
Y
)
=
var(b2 ) = P
i
( Xi )2
( Xi )2
c) Muestre que var(b1 ) var(b), donde b corresponde al estimador de
mnimos cuadrados ordinarios para la pendiente del modelo.
Respuesta. Se sabe que:
2
var(b) = P 2
xi
Luego, se debe demostrar lo siguiente:
donde xi = Xi X.
2 2
2
P

2
(Xn X1 )2
(Xi X)
o bien que:
2

2 (Xn X1 )2
(Xi X)

y v = (Xn X).
Por
Se definen las siguientes variables, u = (X1 X)
lo tanto:
2

2 = 2(u2 +
(Xi X)

n1
X

2 + v 2 ) 2(u2 + v 2 )
(Xi X)

i=2

Por otro lado:


(Xn X1 )2 = (v u)2
As, habra que probar que:
2(u2 + v 2 ) (v u)2 = v 2 2vu + u2
Luego:
u2 + v 2 2vu u2 + v 2 + 2vu 0
Por lo tanto, para que var(b1 ) var(b), bastara con probar que:
(u + v)2 0
lo cual se cumple.
d ) Muestre que existe un conjunto de datos Xi , con i = 1, 2, ..., n, para
los cuales se cumple que var(b2 ) < var(b). Contradice este resultado
el Teorema de Gauss-Markov?
Respuesta. Supongamos los siguientes datos: X1 = 1, X2 = 2 y
X3 = 3. Luego:
3 2
n 2
=
= 0, 083 2
var(b2 ) = P
( Xi )2
36
Por otro lado:
2
2
2
var(b) = P 2 =
=
= 0, 5 2
2
2
2
xi
(1 2) + (2 2) + (3 2)
2
Por lo tanto, var(b) var(b2 ), sin embargo, este resultado no contradice el teorema de Gauss-Markov ya que b2 no es un estimador
insesgado de .
2. (30 puntos) Considere la siguiente informacin sobre precios y cantidad
demandada:

i
1
2
3
4
5
6
7
8
9
10
11
12

Precio (P ) Cantidad (Q)


1
89
1
86
1
74
1
79
1
68
1
84
0,95
139
0,95
122
0,95
102
0,95
186
0,95
179
0,95
187

En base a estos datos, se plantea el siguiente modelo:


Qi = + Pi + ei
Donde ei representa el trmino de error que cumple con los supuestos convencionales.
a) Encuentre los estimadores de mnimos cuadrados ordinarios (MCO)
para y .
Respuesta. La estimacin para la pendiente del modelo viene dada
por:
P
P

p i qi
(Pi P )(Qi Q)

P
P
=
= 1450
=
p2i
(Pi P )2
Por otro lado, el intercepto se estima como:
P = 1530

=Q
b) Calcule la suma de los cuadrados totales (TSS), la suma de los cuadrados de la regresin (ESS), la suma de los errores al cuadrado (RSS) y
el coeficiente R2 .
Respuesta. La suma de los cuadrados totales viene dada por:
X
X
2=
2 = 22760, 25
T SS =
(Qi Q)
Q2i nQ
La suma de los cuadrados de la regresin viene dada por:
X
2 = 15768, 75
ESS = 2
(Qi Q)

La suma de los errores al cuadrado viene dada por:


RSS = T SS ESS = 22760, 25 15768, 75 = 6991, 5
Y finalmente:
R2 =

ESS
15768, 75
=
= 0, 69
T SS
22760, 25

c) Estime la varianza ( 2 ) del trmino de error (ei ).


Respuesta.

2 =

RSS
6991, 5
e2i
=
=
= 699, 15
n2
n2
10

d ) Calcule el error estndar de b (el estimador MCO de ) y haga un test


sobre su significancia estadstica (H0 : = 0), utilizando un nivel de
significancia del 5 %. (Ayuda: el valor crtico de una distribucin t de
dos colas con diez grados de libertad es c =2,23)
Respuesta. El error estndar de b viene dado por:
r
699, 15

=
= 305, 31
b = pP
0, 0075
(Pi P )2
Por otro lado:

b
1450
= 4, 74
=
b
305, 31
por lo tanto, se rechaza la hiptesuis nula, y el coeficiente es estadsticamente significativo.
tb =

e) Construya un intervalo de confianza de 95 % para .


Respuesta. El intervalo viene dado por:
b cb < < b + cb
Por lo tanto:
2130, 8 < < 769, 15

3.

(15 puntos) Analtico

La movilidad social es un tema que preocupa a las autoridades de muchos pases. Economas que presentan una elevada movilidad social son aquellas en donde
existe una elevada probabilidad de avanzar a lo largo de la distribucin de ingresos, mediante un acceso razonable a las oportunidades que ofrece el mercado.
Una de las principales herramientas para lograr movilidad social es la educacin,
6

puesto que permite a las personas aumentar su capacidad de generacin de ingresos.


Con el objetivo de poder evaluar el nivel de movilidad social de Samunda, un
prspero pas africano, un investigador propone la siguiente regresin:
SiH = + SiP + i
donde SiH representa los aos de escolaridad del individuo i, SiP denota los aos
de escolaridad promedio de los padres del individuo i (promedio simple de la
escolaridad del padre y de la madre), y i es un trmino de error que resume
todos los otros aspectos que no han sido incluidos de manera explcita en la
ecuacin, pero que afectan la escolaridad de i. Se sabe que 0 < < 1. En base a
esta informacin, responda:
1. Explique el trasfondo econmico de la ecuacin anterior.
Respuesta. Bsicamente, el modelo establece que la escolaridad de los
padres es un determinante fundamental de la escolaridad que puedan alcanzar los hijos.
2. Suponiendo que se cuenta con informacin confiable para estimar mediante
mnimos cuadrados ordinarios (MCO) la relacin planteada: qu representara M CO en el contexto de la discusin sobre movilidad social? (Ayuda:
piense en qu significara que = 1, es decir, que el impacto que tiene el
nivel de escolaridad de los padres sobre la de los hijos fuera total.)
Respuesta. En la medida que = 1, entonces, no existira movilidad
puesto que la escolaridad de los padres deerminara, en promedio, uno a uno
la escolaridad de los hijos. Si = 0, entonces, no habra ninguna relacin
entre la escolaridad de los padres y la de los hijos. En otras palabras, si el
padre tuviera solo educacin bsica incompleta, eso no sera razn para que
el hijo no pudiera alcanzar la educacin superior.
3. Qu crticas podra hacerle al modelo propuesto? Mencione tres.
Respuesta.
a) Omite variables relvantes, como por ejemplo, la habilidad de los individuos
b) La relacin no tiene por qu ser lineal, pudiera haber una relacin ms
sofisticada para este modelo
c) Pudiera ser que la escolaridad del padre influya de mayor manera en la
escolaridad de los hijos, por lo que el promedo simple de la escolaridad
de los progenitores podra no ser la ms apropiada.

Rut:____________________________

Facultad de Economa y Negocios


Universidad de Chile
PAUTA SOLEMNE
Econometra 1
Primavera 2007

Profesora: Claudia Sanhueza


Ayudante: Jos Manuel Eguiguren
Felipe Rios
Tiempo:
Puntaje Total: p.
1)

Preguntas de Eleccin Mltiple. (p)


i. In the multiple regression model, the adjusted R2, R 2
a. cannot be negative.
b. will never be greater than the regression R2.
c. equals the square of the correlation coefficient r.
d. cannot decrease when an additional explanatory variable is added.
Answer: b

ii. Consider the following multiple regression models (a) to (d) below. DFemme = 1 if
the individual is a female, and is zero otherwise; DMale is a binary variable which
takes on the value one if the individual is male, and is zero otherwise; DMarried is a
binary variable which is unity for married individuals and is zero otherwise, and
DSingle is (1-DMarried). Regressing weekly earnings (Earn) on a set of explanatory
variables, you will experience perfect multicollinearity in the following cases unless:

a. Earn
i = 0 + 1 DFemme + 2 Dmale + 3 X 3i .

b. Earn
i = 0 + 1 DMarried + 2 DSingle + 3 X 3i .

= + DFemme + X .
c. Earn
i

3i

d. Earn
i = 1 DFemme + 2 Dmale + 3 DMarried + 4 DSingle + 5 X 3i .
Answer: c

iii. When there are omitted variables in the regression, which are determinants of the
dependent variable, then
a. you cannot measure the effect of the omitted variable, but the estimator of
your included variable(s) is (are) unaffected.
b. this has no effect on the estimator of your included variable because the
other variable is not included.

Rut:____________________________

c. this will always bias the OLS estimator of the included variable.
d. the OLS estimator is biased if the omitted variable is correlated with the
included variable.
Answer: d

iv. The assumption that X has full column rank implies that
a.
b.
c.
d.

the number of observations equals the number of regressors.


binary variables are absent from the list of regressors.
there is no perfect multicollinearity.
none of the regressors appear in natural logarithm form.

Answer: c
v. One implication of the extended least squares assumptions in the multiple regression
model is that
a.
b.
c.
d.

feasible GLS should be used for estimation.


E(U|X) = In.
XX is singular.
the conditional distribution of U given X is N(0n, u2 In).

Answer: d
vi. The following linear hypothesis can be tested using the F-test with the exception of
a. 2 = 1 and 3 = 4 / 5 .
e. 2 = 0 .
f. 1 + 2 = 1 and 3 = 2 4 .
g. 0 = 1 and 1 = 0.
Answer: a

vii. One of the properties of the OLS estimator is


a. X = 0k+1.
b. that the coefficient vector has full rank.
c. X(Y X ) = 0k+1.
d. (XX)-1= XY
viii. The GLS estimator is defined as

a. (X -1X)-1(X -1Y).
b. (XX)-1XY.

Rut:____________________________

c. AY.
d. (XX)-1XU.
Answer: a
ix.
a.
b.
c.
d.

cannot be calculated since the population parameter is unknown.


= (XX)-1XU .
= Y - Y .
= + (XX)-1XU

Answer: b
x. In the case when the errors are homoskedastic and normally distributed, conditional
on X, then
a. is distributed N( , | X ),where | X = u2 I(k+1).
b. is distributed N(, ), where =

n ( )

/n = Q X1 V QX1 /n.

c. is distributed N( , | X ),where | X = u2 (X'X)-1.


d. U = PXY where PX = X(XX)-1X.
Answer: c

2)

Ensayos y Preguntas Largas (p)

2.1. Give several economic examples of how to test various joint linear hypotheses
using matrix notation. Include specifications of R = r where you test for (i) all
coefficients other than the constant being zero, (ii) a subset of coefficients being
zero, and (iii) equality of coefficients. Talk about the possible distributions involved
in finding critical values for your hypotheses.
Answer: Answers will vary by student. Many restrictions involve the equality of coefficients across
different types of entities in cross-sections (stability). Using earnings functions,
students may suggest testing for the presence of regional effects, as in the textbook
example at the end of Chapter 5 (exercises). The textbook tested jointly for the presence
of interaction effects in the student achievement example at the end of Chapter 6.
Students may want to test for the equality of returns to education and on-the-job training.
The panel chapter allowed for the presence of fixed effects, the presence of which can be
tested for. Testing for constant returns to scale in production functions is also frequently
mentioned.

Consider the multiple regression model with k regressors plus the

Rut:____________________________

constant. Let R be of order q (k + 1) , where q are the number of


restrictions. Then to test (i) for all coefficients other than the constant to be
zero, H 0 : 1 = 0, 2 = 0,..., k = 0 vs. H1 : j 0 , at least one j, j=1,,n,
you have R = [0k1 Ik ] and r = 0k1. In large samples, the test will produce
the overall regression F-statistic, which has a Fk , distribution. In case (ii),
reorder the variables so that the regressors with non-zero coefficients
appear first, followed by the regressors with coefficients that are
hypothesized to be zero. This leads to the following formulation
Yi = 0 + 1X1i + 2X2i + g g g + k-qXk-q,i
+k-q+1Xk-q+1,i +k-q+2Xk-q+2,i + . . . + kXki + ui,
i = 1,, n. R = [0q (k-q+1) Iq ] and r = 0q1. In large samples, the test will produce an
F-statistic, which has an Fq , distribution. In (iii), assume that the task at hand is to
test the equality of two coefficients, say H 0 : 1 = 2 vs. H1 : 1 2 , as in section
5.8 of the textbook. Then R = [0 1 -1 0 0], r = 0 and q = 1. This is a single
restriction, and the F-statistic is the square of the corresponding t-statistic. Hence
critical values can be found either from F1, or from the standard normal table, after
taking the square root.

2.2. Consider the multiple regression model from Chapter 5, where k = 2 and the
assumptions of the multiple regression model hold.
(a)

Show what the X matrix and the vector would look like in this case.
1 X 11

1 X 12
Answer: X =
M M

1 X 1n

(b)

X 21
0

X 22

, and = 1

2
X 2 n

Having collected data for 104 countries of the world from the Penn World Tables,
you want to estimate the effect of the population growth rate (X1i) and the saving
rate (X2i) (average investment share of GDP from 1980 to 1990) on GDP per worker
(relative to the U.S.) in 1990. What are your expected signs for the regression
coefficient? What is the order of the (XX) here?
Answer: You would expect the population growth rate to have a negative
coefficient, and the saving rate to have a positive coefficient. The order of
XX is 3 3.

(c)

You are asked to find the OLS estimator for the intercept and slope in this model

Rut:____________________________

using the formula = (XX)-1XY. Since you are more comfortable in inverting a
22 matrix (the inverse of a 22 matrix is,
1

a b
1 d b

)
ad bc c a
c d
you decide to write the multiple regression model in deviations from mean form.
Show what the X matrix, the (XX) matrix, and the XY matrix would look like now.
(Hint: use small letters to indicate deviations from mean, i.e., zi = Zi Z and note
that
+
X +
X + u$ i
Yi =
0
1 1i
2 2i
+
X +
X .
Y =
0

Subtracting the second equation from the first, you get

x +
x + u$ i .)
yi =
1 1i
2 2i
x11
x
Answer: X = 12
M

x1n

(d)

x21
x22
, XX =
M

x2 n

n 2
x1i
i =1
n
x1i x2i
i =1

x
x

1i 2 i
yi x1i
i =1
, XY = i =1
.
n
n

2
x2 i

yi x2 i

i =1

i =1
n

Show that the slope for the population growth rate is given by
n

1 =

i =1

i =1

i =1

x x
i =1

n 2
x1i
i =1
Answer: n

x1i x2i
i =1

yi x1i x22i yi x2i x1i x2i

2
1i

i =1

2
2i

i =1

( x1i x2 i ) 2
i =1

n 2
x1i x2 i

x2 i
1
i =1
=
i =1
n
n
n
n
n
2
2
2
2
x
x

(
x
x
)
x

1i 1i
1i 2i

2i
x1i x2 i
i =1
i =1
i =1
i =1

i =1
n

x1i x2 i
i =1
.
n

x12i

i =1

Rut:____________________________

yi x1i
i =1
results in the two least squares estimators
Post multiplying this expression with n

yi x2 i
i =1

n
n
n
n

2
yi x1i x2 i yi x2 i x1i x2i
i =1
i =1
i =1 n i =1 n

n
2
2
2

x1i x2i ( x1i x2i )

i =1
.
1 = n i =1 ni =1
, and hence gives the formula for
1
n
n

2
2
y
x
x

y
x
x
x

i 2 i 1i
i 1i 1i 2 i

i =1
i =1
i =1
i =1

n
n
n
2
2
2

(
)
x
x

x
x

1i 2i
1i 2i

i =1
i =1
i =1

Rut:____________________________

(e)

The various sums needed to calculate the OLS estimates are given below:
n

i =1

i =1

i =1

yi2 = 8.3103; x12i = .0122; x22i = 0.6422


n

yx

i 1i

i =1

i =1

i =1

= 0.2304; yi x2i = 1.5676; x1i x2i = 0.0520

Find the numerical values for the effect of population growth and the saving rate on
per capita income and interpret these.

0.2304 0.6422 (1.5676 (0.0520))

1
0.0122 0.6422 (0.0520) 2

=
Answer: =

1.5676 0.0122 ((0.2304) (0.0520)


2

0.0122 0.6422 (0.0520) 2

12.953
1.393 .

A reduction of the population growth rate by one percent increases the per capita income relative to the United States by roughly
0.13. An increase in the saving rate by ten percent increases per capita income relative to the United States by roughly 0.14.

(f)

Indicate how you would find the intercept in the above case. Is this coefficient of
interest in the interpretation of the determinants of per capita income? If not, then
why estimate it?
Answer: The first order condition for the OLS estimator in the case of k = 2 is
n

Y =n
i =1

i =1

i =1

0 + 1 X 1i + 2 X 2i , which, after dividing by n, results in

X
X . The intercept is only of interest if there are
0 = Y
1 1
2 2
observations close to the origin, which is not the case here. If it is set to
zero, then the regression is forced through the origin, instead being
allowed to choose a level.
2.3. Define the GLS estimator and discuss its properties when is known. Why is this
estimator sometimes called infeasible GLS? What happens when is unknown?
What would the matrix look like for the case of independent sampling with
heteroskedastic errors, where var( ui | X i ) = ch( X i ) = 2 X 12i ? Since the inverse of
the error variance-covariance matrix is needed to compute the GLS estimator, find
1 . The textbook shows that the original model Y = X + U will be transformed
into Y% = X% + U% , where Y% = FY, X% = FX, and U% = FU, and FF = -1. Find F
in the above case, and describe what effect the transformation has on the original
data.

Rut:____________________________

Answer: GLS = (X -1X)-1(X -1Y). The key point for the GLS estimator with
known is that is used to create a transformed regression model such
that the resulting error term satisfies the Gauss-Markov conditions. In that
case, GLS is BLUE. However, since is typically unknown, the
estimator cannot be calculated, and is therefore sometimes referred to as
infeasible GLS. If is unknown, then a feasible GLS estimator can be
calculated if is a known function of a number of parameters which can
be estimated. Once the parameters have been estimated, they can then be
used to calculate , which is the estimator of . The feasible GLS
estimator is then

GLS = (X 1 X)-1(X 1 Y).


In the above example of heteroskedasticity,
X 112
0

0 X 122
E(UU|X) = (X) = 2
M
M

0
0
1
0 L
X2
11

1
L
1 0
1
X 122
(X) = 2

M
M O

0
0 L

L
L
O
L

0
0
M
1
X 12n

0
,
M

X 12n

, F=

1
X
11

1
X 12

0
.
M

1
X 1n

The transformation in effect scales all variables by X 1 .

Prueba Solemne
Econometra I
Profesor: Tomas Rau Binder
Ayudante: Victor Nahuelpan
27 de diciembre
Tiempo Total: 120 Minutos.

1.

Preguntas Cortas (5 puntos, m


aximo 5 renglones)

1. Defina funci
on de regresi
on poblacional. R. La funci
on de regresion poblacional es el lugar geometrico de las medias condicionales E(Yi |Xi ) = f (Xi )
que puede ser una funci
on cualquiera. Un caso particular es la recta de
regresion poblacional Y = X + u.
2. Demuestre que E(u|X) = 0 E(u) = 0. R. Por Ley de las Esperanzas
Iteradas (Iterated Law of Expectations) sabemos que E(E(u|X)) = E(u).
Luego, reemplazando E(u|X) = 0, tenemos que E(u) = 0.
3. Muestre que = (X X)1 X Y es insesgado. R. Reemplazando la recta
de regresion poblacional tenemos que = + (X X)1 X u. Tomando
valor esperado y usando el supuesto 2 (X no estoc
asticas) y supuesto 3
= .
(E(u|X) = 0) tenemos que E()
4. Muestre que el rango de Mnn = In X(X X)1 X es igual a n k
donde X es de orden n k. Recuerde que el rango de una matriz simetrica e idempotente es igual a su traza. R. Usando las propiedades: tr(AB)=tr(A)-tr(B) y tr(AB)=tr(BA). Tenemos que:

r(M ) = tr(M )

=
=

tr(In ) tr(X(X X)1 X ) = n tr((X X)1 X X)


n tr(Ik ) = n k

5. Que establece el Teorema de Gauss-Markov? R. Establece que bajo los


supuestos vistos en clases, el estimador MCO es MELI (mejor estimador
linealmente insesgado) o BLUE (best linear unbiased estimator )
1

6. Comente la siguiente afirmaci


on: dado que los estimadores MCO de y 2
en el modelo de regresion lineal son identicos a los obtenidos por M
axima
Verosimilitud, da lo mismo usar cualquiera de los dos metodos de estimaci
on. R. Falso, el estimador MV para es el mismo que MCO si se asume
normalidad en los errores. Ademas, el estimador MV para 2 es sesgado. Por otra parte, los estimadores MV tienen propiedades deseables que
MCO no tienen como invarianza ante transformaciones, permiten estimar
modelos no lineales y testear hipotesis no lineales, entre otras.

2.

Preguntas de Desarrollo

1. Suponga que el modelo de regresion lineal


yi = 1 + 2 xi + ui
donde f (ui ) = (1/)eui / y ui 0. Este modelo es bien particular puesto
que los errores son asumidos positivos. Note que el valor esperado de ui
es igual a . Muestre que el estimador MCO de 2 es insesgado pero que
el estimador MCO de 1 es sesgado. Es consistente el estimador MCO
de 1 ? Por u
ltimo, bajo que condiciones es el estimador MCO de 1
consistente? (10 puntos)
R. Escribiendo el model en desviacones a la media tenemos: y = 2 x + u
y sabemos que
P
xy
2 = P 2
xi

Luego un poquito de algebra despues de reemplazar la funci


on de regresion
poblacional en desviaciones respecto de la media tenemos,
P
x
i u
i
2 = 2 + P 2
x
P i
P
x

E(
u)
xi E(ui u)
Pi 2 i = 2 +
P 2
E(2 ) = 2 +
x
i
x
i
P
x

)
i
P
= 2
E(2 ) = 2 +
x2i

Para 1 sabemos que:

= Y 2 X

= 1 + 2 X + u 2 X
tomando valor esperado
E(1 )

= 1 + 2 X + E(u) E(2 )X
= 1 +
2

Ahora, es claro que el estimador MCO para 1 no es consistente a no ser


que 0 cuando n es muy grande.
2. Sea la funci
on de regresion poblacional y = 1 + 2 x + u y considere la
siguiente muestra aleatoria simple:

1
2
1
1

Y =
1 X= 1
1
0

3
1

2
0

a) Calcule el estimador mnimo cuadratico de y 2 . (10 puntos)


R. Podemos ver que en desviaciones con respecto de la media, la
muestra es

3/2
1
1/2
0

y=
0 x = 1/2
3/2
1
P
P 2
ademas:
xi yi = 3/2 + 3/2 = 3,
xi = (3/2)2 + (1/2)2 + (1/2)2 +
2
(3/2) = 20/4 = 5. Luego
2 = 3/5 = 0,6
1 = Y 2 X = 1 (3/5) (3/2) = 1 9/10 = 0,1
Para estimar 2 necesitamos los residuos

1 (3/5) (3/2) = 0,1


0 + (3/5) (1/2) = 0,3
u
=
0 (3/5) (1/2) = 0,3
1 + (3/5) (3/2) = 0,1
Luego,

0,01
2 0,09
u

= 0,09
0,01

u
2i = 0,2 y
2 = 0,2/2 = 0,1 dado que n k = 2.

b) Testee la hip
otesis nula H0 : 2 = 0 (a dos colas). Es 2 significativo
al 5 %?Y al 10 %? Ver Cuadro 1 para los valores crticos. (10 puntos)
P
R. Sabemos que la varianza de 2 =
2 / x2i = 0,1/5 = 0,02. Por
lo tanto el error est
andar de 2 es 2/10 = 0,141. El test t es:
t=

2
6/10
= 4,24
=

2/10
SE(2 )

y el valor crtico de una t-student con 2 grados de libertad para


= 5 % es 4.303. Por lo tanto se rechaza H0 . Si = 10 % el crtico
es 2.92 luego no se rechaza H0 .
3

c) Calcule el R2 y R2 ajustado. (10 puntos) R. Sabemos que R2 =


ESS/T SS, luego
P 2 2
P
x
2 x2
0,62 5
R2 = P 2 2 i = 2P 2 i =
= 0,90
2
yi
yi
El R2 ajustado se escribe:

RSS/(n k)
0,2/2
=1
= 0,85
T SS/(n 1)
2/3

Ra2 = 1

3. Suponga que la distribuci


on condicional de y dado x es una exponencial
con par
ametro x.
1 y/x
f (y|x, ) =
e
x
donde y > 0, x > 0
a) Obtenga el estimador maximo verosmil de . (10 puntos) R. Escribamos la funci
on de verosimilitud (en log)

n 
X
yi
log logxi
l=
xi
i=1
tomando derivadas obtenemeos el score:
s() =

X
l
= n/ + (1/2 )
yi /xi

igualando el score a 0 obtenemos:


1X
=
yi /xi
n
b) Considere la siguiente muestra aleatoria simple

2
1
4
2

Y =
1 X = 1
3
3

obtenga una estimaci


on de . (5 puntos)
R. Note que si reemplazamos nos queda = (1/4) (2 + 2 + 1 + 1) =
3/2.
c) Pruebe la siguiente hipotesis: H0 : = 3 y H1 : 6= 3 usando un Test
de Wald. (15 puntos)
Indicacion: recuerde que el valor esperado de una distribuci
on exponencial con parametro es igual a y considere las xs fijas. Use el
4

valor crtico de una 2 con 1 grado de libertad con =5 % visto en


clases.
R. El test de Wald es:
W = (R r) I()(R r)
En este caso R = 1 y r = 3. Necesitamos la matriz de informacion
que podemos calcularla como el negativo del valor esperado de la
matriz de segundas derivadas (que en este caso es un escalar). Luego,
I() = E


X
2l
= n/2 + (2/3 )
E(yi /xi )
2

usando que las xs son fijas y que E(yi |xi ) = xi , tenemos que
I() = n/2 + (2/3 )

X xi
xi

= n/2 + 2n/2 = n/2

=
Luego, reemplazamos el valor de R = 2, r = 3 y evaluando I()
2

4/(3/2) = 16/9 = 1.7, entonces


W = (1,5 3) (1.7)(1,5 3) = (3/2)2 (16/9) = 4
El crtico de una 2 con 1 grado de libertad y =5 % es 3.84. Luego
se rechaza H0 .

Cuadro 1: Valores Crticos para una distribuci


on t-Student
n-k
1
2
3
4
5
6
7

90 %
3.078
1.886
1.638
1.533
1.476
1.44
1.415

95 %
6.314
2.92
2.353
2.132
2.015
1.943
1.895

97.50 %
12.71
4.303
3.182
2.776
2.571
2.447
2.365

99 %
31.82
6.965
4.541
3.747
3.365
3.143
2.998

99.50 %
63.66
9.925
5.841
4.604
4.032
3.707
3.499

Pauta Prueba Solemne


Econometra I
Profesores: Tomas Rau y Javiera Vasquez
Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sep
ulveda
06 de mayo de 2008
Tiempo Total: 150 minutos.
Puntaje Total: 130 puntos.

1.

Comentes (5 puntos, m
aximo 5 renglones)

1. La funci
on de regresion poblacional es el lugar geometrico de las esperanzas
condicionales para distintos valores de X.
R. Verdadero. La funci
on de regresion poblacional es el lugar geometrico
de la esperanza condicional de y en X, luego es una funci
on de X. En
particular E(Y |X = x), para distintos valores de X = x. Si bien no se
explicita en el texto si la esperanza es sobre y, se puede asumir dado que
hablamos de una funci
on de regresion.
2. Si tenemos dos estimadores de un par
ametro: uno sesgado y otro insesgado,
elegiremos siempre el insesgado.
R. Falso. Preferiremos aquel que tenga un menor error cuadratico medio.
3. Si tenemos dos columnas de la matriz X linealmente dependientes el estimador MCO de es igual a cero.
R. Falso. El estimador MCO de no existe puesto que X X no tiene
inversa si dos columnas de X son linealmente dependientes.
4. Cuando tenemos hip
otesis lineales del tipo R = r, si q = 1 podemos usar
un simple test t.
R. Verdadero. Cuando q = 1, podemos escribir un test t teniendo cuida
do en incorporar las covarianzas en el c
alculo del error est
andar de R.
Ademas, para un est
adistico que sigue una F con (1,n-k) grados de libertad, su raz cuadrada sigue una t-student con n k grados de libertad.
1

5. La varianza del error de predicci


on en el modelo de regresion lineal aumenta a medida que aumenta el valor de x.
R. Verdadero/depende. Como se pudo apreciar en la clase 11, la varianza
del error de predicci
on depende de una forma cuadratica de X y como se
vio en el gr
afico, el intervalo de confianza aumenta con x siempre y cuando
estemos a la derecha de x. La varianza tambien aumenta si nos movemos
a la izquierda de x. Es por ello que la menor varianza (luego el intervalo
de confianza mas angosto) se logra en la media.
6. El metodo de maxima verosimilitud y de mnimos cuadrados ordinarios
son equivalentes en el caso del modelo de regresion lineal puesto que arroja
los mismos estimadores.
R. Falso. En el caso en que los residuos sean independientes e identicamente distribuidos con funci
on de densidad de probabilidad normal, el
estimador MV de y el estimador MCO de son numericamente equivalentes (no as el de 2 ) pero los metodos no son equivalentes. El metodo de
MV permite testear hipotesis no lineales y es invariante a transformaciones
y no as el metodo de MCO.

2.

Preguntas de Desarrollo

1. (50 puntos) Sea el modelo de regresion con k variables Y = X + u, donde


Y es un vector de n 1, X una matriz de n k, un vector de k 1
y u un vector de n 1. Suponga que se cumplen los supuestos vistos en
clases y en especialPE(u|X) = 0. Sea xi la i-esima columna de la matriz
n
X y suponga que m=1 xim xjm = 0 para todo i 6= j, es decir que las
columnas son ortogonales.
a) Si la primera columna de X es un vector de unos, que implica el
supuesto de ortogonalidad de las columnas de la matriz X? Ayuda:
analice algunos elementos de X X. (10 puntos)
R. Si la primera columna es unP
vector de unos, y usando el supuesto
n
de ortogonalidad tenemos que m=1 xjm = 0 para todo j = 2, .., k
lo que implica que las medias son ceros para todas las variables.

b) Demuestre que el estimador MCO de 1 , ..., k es equivalente a estimar por MCO el modelo de UNA variable, es decir y = i xi + u para
cada i = 1, .., k. (20 puntos)
R El estimador MCO de 1 , ..., k est
a dado por la formula usual:
= (X X)1 X Y

Pn
Dado que m=1 xjm = 0, tenemos que todos los elementos fuera de
la diagonal de X X son ceros (recuerde que la multiplicacion es fila
por columna). As,

y ademas

X X =

n P 0 0
0
x22,i 0
.. .. . .
..
.
. .
.
0
0 0

P
P yi

x2,i yi

X Y = .
.
.
P
xk,i yi

0
0
..
.
P

x2k,i

Usando el hecho que la inversa de una matriz diagonal A con elemento


aii es diagonal con elemento 1/aii tenemos que

P
yi
P n
x2,i yi
P 2
x2,i

..
.

P
x yi
P k,i
x2k,i

Ahora, si se estima separadamente el modelo de UNA variable, es


decir y = i xi + u para cada i = 1, .., k, es facil notar que,
mn
i

X
(yj i xi,j )2
j

obtenemos

P
j xi,j yj

i = P 2
j xi,j
P
P 2
incluso para i = 1 puesto que j x1,j = j 12 = n, luego
i =

yi

c) Suponga que Ud. dispone de la informacion dada en el Cuadro 1


P 2
y adicionalmente Ud. sabe que
ui = 2,5. Usando algebra matricial obtenga X X y X Y . Obtenga los estimadores de 1 , 2 , 3 . (10
puntos)
R. Como sabemos, debemos multiplicar fila por columna, luego
3

Cuadro 1: Datos
x1 x2 x3 y
1
1 -2
1
1 -1
1 -2
1 -1 -1
1
1
1
2
0
1
0
0
0

1
1
X X = 1 1
2
1
y

1 1 1

1 1 0

1 2 0

1 2

1
1
5

0
1 1
=

1
2
0
0
0

1
1
1
1
1

1
1
X Y = 1 1
2
1

1 1 1

1 1 0

1 2 0

y finalmente

1
2
1
0
0

0 0
4 0
0 10

= 2

1/5
0
0
0
0
0 1/4
0 2 = 0,5
=
0
0 1/10
5
0,5

d) Usando los resultados obtenidos en c), testee la siguiente hipotesis al


5%
H0 :

1 + 3
2

HA :

1 + 3
2

4
0

6=

4
0

Indicacion: escriba la hipotesis de la manera R = r y utilice el test


F visto en clases cuya formula est
a dada por

(10 puntos)

(R r) [R(X X)1 R ]1 (R r)/q


u
u
/(n k)

R. Escribamos la matriz R


1
0

1 + 3 4
2

1 0
0 1

y R r,
R r =

9/2
1/2

ahora, escribamos R(X X)1 R


R(X X)1 R

=
=

1/5
0
0 1/4
0
0



1
1/5
0 1/10
0
0 1/4
0
1


3/10
0
0 1/4


1
0

0 1
1 0

0
1 0
0 0 1
1/10
1 0

0
1
0

luego
[R(X X)1 R ]1 =
y as,

(R r) [R(X X)1 R ]1 (R r)

=
=
=

10/3 0
0 4

10/3 0
0 4



 9/2
90/6 2
1/2

9/2 1/2

810/12 + 1 = 68,5

y finalmente,
68,5/2
(R r) [R(X X)1 R ]1 (R r)/q
=
= 27,4

u u/(n k)
2,5/2
5%
el valor crtico de una F(2,2)
= 19, luego se rechaza la hipotesis nula.

2. (50 puntos) Suponga el modelo de regresion lineal


yi = 1 + 2 x2,i + ui
donde ui is independiente e identicamente
(i.i.d.) con funci
on
distribuido
u2i /22
2
de densidad de probabilidad f (ui ) = (1/ 2 )e
. Asuma que las
xs son no estoc
asticas y note que x1,i = 1 para todo i.
5



9/2
1/2

a) Escriba el logaritmo de la funci


on del verosimiltud l(1 , 2 , 2 ; y, x).
(9 puntos)
R. El log de la funci
on de verosimilitud para una observaci
on es
1
1
(yi 1 2 xi )2
li (1 , 2 , 2 ) = ln(2) ln( 2 )
2
2
2 2
luego el logaritmo de la funci
on de verosimilitud es la suma,
l(1 , 2 , 2 ) =

n
n
ln(2) ln( 2 )
2
2

b) Encuentre el Score. (9 puntos)

(yi 1 2 xi )2
2 2

R. El Score es el vector de derivadas con los siguientes componentes


l
1
l
2
l
2

(yi 1 2 xi )
2
P
(yi 1 2 xi )xi
=
2
n
1 X
= 2+ 4
(yi 1 2 xi )2
2
2
=

c) Encuentre el estimador MV de 1 , 2 y 2 . (9 puntos)

R. Igualando a cero el Score obtenemos los estimadores MV


1

y 2 x
P
P
yi xi y xi
P
nx2 x2i
P
(yi 1 2 xi )2
n

d) Suponga que Ud. dispone de la informacion dada en el Cuadro 2.


Obtenga el estimador MV de 1 y 2 . [Puede usar los resultados de
ortogonalidad] (9 puntos)
R. Usando el resultado del problema 1) parte b) y el hecho que
el Cuadro 2 tiene exactamente los mismos valores para x1 , x2 e y,
sabemos que
1
2
6

= 0
= 0,5

e) Suponga que se quiere testear la siguiente hipotesis: H0 : 1 = f (2 )


y se estima el modelo
obteniendo la siguiente suma de
P restringido
errores al cuadrado: ni=1 u
2r,i = 10. Ademas Ud. conoce la suma de
Pn
los errores al cuadrado del modelo sin restricciones i=1 u
2nr,i = 5.
Demuestre que
#
"
n
n
X
X
2
2
u
nr,i )
u
r,i ) ln(
LR = n ln(
i=1

i=1

Realice el test de LR al 5 % usando el valor crtico de una 2 con un


grado de libertad (3.84). (14 puntos).
R. Como vimos en clases
LR = 2[l(nr,1 , nr,2 ,
2 ) l(r,1 , r,2 ,
r2 )]
Ahora, el logaritmo de la funci
on de verosimilitud evaluada en el
estimador no restringido y restringido est
a dada por
n
n
l(nr,1 , nr,2 ,
) = ln(2) ln
2
2

n
n
= ln(2) ln
2
2

l(r,1 , r,2 ,
r2 )

u
2nr,i
n

u
2r,i
n

n
2

n
2

donde en el tercer termino del log de la funci


on de verosimilitud viene
de reemplazar el estimador de 2 para los dos casos. En el segundo
termino se reemplaza el estimador de 2 por la suma de los errores
al cuadrado en ambos casos. As,
"

LR = n ln

n
X
i=1

u2r,i

ln

n
X

u
2nr,i

i=1

!#

Evaluando la expresion tenemos que,


LR = 5[ln(10) ln(5)] = 3,46

se aprecia que el estadstico LR=3.46 es menor que 25 % (1) = 3,84,


luego no se rechaza la hipotesis nula H0 : 1 = f (2 ). Como vimos,
MV permite testear hipotesis no lineales de una manera relativamente
sencilla.

Cuadro 2: Datos
x1 x2
y
1
1
1
1 -1 -2
1 -1
1
1
1
0
1
0
0

Cuadro 3: Valores Crticos para la F al 5 %


df num/df den
1
2
3
4
5
2 18.51
19 19.16 19.25 19.3
3 10.13 9.55
9.28
9.12 9.01
4
7.71 6.94
6.59
6.39 6.26
5
6.61 5.79
5.41
5.19 5.05

EXMENES

Econometra I
Profesores: J.M. Benavente, A. Otero y J. Vsquez.
Primavera 2004
Examen Final

Nombre:

...........................................................................................

Rut:

.......................................

Ud. Dispone de 120 minutos para resolver el examen, no puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene
derecho a reclamo.

1.

Comentes
( 35 puntos)Debe responder 5 de los siguientes 8 comentes. Debe justificar sus respuestas

Comente 1: ( 7 puntos) La omisin de una variable relevante siempre siempre sesga la estimacin MCO de . Comente.
Falso, el sesgo que se produce en el parmetro depende de la covarianza entre la variables
explicativas y la omitida, y el valor poblacional de la variable omitida.
= 1 +
En un modelo de regresin simple: E()

cov(x1 ,x2 )
var(x1 ) omitida

Si cov(x1 , x2 ) = 0 no existe sesgo,


Si omitida = 0 no existe sesgo.
Comente 2: (7 puntos) La presencia de errores no esfricos implica que la estimacin de la
varianza MCO de V () estar sesgada. Comente.
mco =
El estimador de MCO de la varianza era var(
)
2 (x0 x)1 , sin embargo, en presencia de
errores no esfricos y estimando por MCO, la varianza de que obtenemos es: 2 (x0 x)1 (x0 x)(x0 x)1 ,
dado que es una matriz definida positiva, siempre se cumple que:
mco =
var(
)
2 (x0 x)1 >
2 (x0 x)1 (x0 x)(x0 x)1
Donde (x0 x)(x0 x)1 corresponde al sesgo (> 1).
Comente 3: ( 7 puntos) Un estadstico de Durbin-Watson de 4 significa inequivocamente una
presencia de autocorrelacin positiva. Comente.
La hiptesis nula de este estadstico es: Ho : = 0 (no hay autocorrelacin), dado que
1

Dw '= 2(1 ) podemos apreciar que cuando = 1 significa que Dw '= 4. De esta
forma si se rechaza Ho : = 0, porque Dw = 4, es en favor de la hiptesis alternativa de
autocorrelacin negativa.
Falso, inequivocamente hay autocorrelacin negativa.
Comente 4: ( 7 puntos) Un sntoma de la existencia de multicolinealidad es la presencia de
un R2 ajustado alto . Comente.
El sntoma corresponde no simplemente a la observacin de un R2 alto, sino que adems acompaado por estadsticos t que nos hacen concluir que los parmetros no son significativos (t
bajos). Esto porque en presencia de multicolinealidades, las varianzas de los estimadores son
altas, pues (x0 x) es cercano a cero. Lo que resulta en estadsticos t pequeos.
Comente 5: ( 7 puntos) La estimacin por Mxima Verosimilitud es MELI. Comente.
Falso, el estimador MELI es el de MCO. El estimador MV es asintonticamente ms eficiente ya que alcanza la cota de Cramer-Rao, aun cuando en muestras finitas puede ser sesgado.
Bajo el supuesto de normalidad,el estimador MV y MCO de coinciden. Sin embargo, difieren
en la estimacin de sus varianzas, ya que la varianza de MV es sesgada. De esta forma, MV es
el mejor estimador pero en muestras grandes (Cramer-Rao).
Comente 6: ( 7 puntos) Si los errores del modelo de regresin lineal no tienen distribucin
normal, a pesar de que los estimadores OLS ya no son MELI siguen siendo insesgados. Comente.
La propiedad de Meli no requiere de un supuesto especfico de la distribucin de los errores,
simplemente requiere que stas sean iid. Bajo independencia e idntica distribucin (cualquiera
sea), MCO ser MELI.
Comente 7: ( 7 puntos) La inclusin de variables independientes rezagadas no trae consecuencias de sesgo ni de eficiencia en las estimaciones MCO . Comente.
Verdadero, cuando se incluyen rezagos de la variable dependiente MCO pierde la propiedad
de insesgamiento, pero sigue siendo consistente. Sin embrago, si asumimos fijo los regresores
(variables independientes), sus rezagos tambin los sern y por lo tanto, no se produce ningn
problema con las propiedades de MCO. El nico peligro es que se puede generar un problema
de multicolinealidad.
Comente 8: ( 7 puntos) La utilizacin de la matriz de White permite corregir el problema de
heterocedasticidad sin saber a priori la especificacin de esta. Comente.
Falso, la estimacin de White no corrige la heterocedasticidad, sino que permite obtener
un estimador consistente de la matriz de varianzas y covarianzas con heterocedasticidad, y de
esta forma, poder realizar la inferencia. Efectivamente, esto se puede hacer sin conocer el patrn
de heterocedasticidad.
Pero no se corrige la heterocedasticidad.

2.

Demostraciones
( 40 puntos) Debe responder 2 de las siguientes 4 demostraciones.

Pregunta 1: ( 20 puntos)
Demuestre que el R2 ajustado es menor que el R2 .
Respuesta:
u
0 u

0
Y MY

(1)

u
0 u
/(n k)
0
Y M Y /(n 1)

(2)

R2 = 1

2 = 1
R
Reemplazando (1) en (2):

2
2 = 1 (1 R2 ) (n 1) = (n k) (1 R )(n 1)
R
(n k)
(n k)

2 = (n k) (1 R2 )(n 1) = (1 k) + R2 (n 1)
(n k)R
2 = (1 k) + R2 (n 1)
R
(n k)
(n k)
2 = 0 + R2 = R2 , por ende son iguales.
Para K = 1, R
2 = () + R2 (< 1) R
2 < R2
Para K > 1, R

Pregunta 2: ( 20 puntos)
Considerando el siguiente modelo de regresin lineal con error de medicin en la variable explicativa

Yi = Xi + ui

ui N (0, 2 )

En donde Xi = Xi + ei
Demuestre que el estimador por variables instrumentales se puede escribir como
V I

0 X
)1 X
0 y
(X

[X Z(Z 0 Z)1 Z 0 X ]1 X Z(Z 0 Z)1 Z 0 y

(3)

Respuesta:
Modelo verdadero: Yi = Xi + ui , se observa: Xi = Xi + ei
Como Xi est medida con error, se puede utilizar el instrumento Z. Para obtener el estimador de variables instrumentales hago un estimador en dos etapas:
Primera etapa: regresin entre Xi y Zi , para obtener Xi :
Xi = Zi + vi
= (Z 0 Z)1 Z 0 X
X = Z(Z 0 Z)1 Z 0 X

Segunda etapa: regresin entre Y y X del modelo original.


Yi = Xi + ui
0
0
V I = (X X )1 X Y

Dado que X = Z(Z 0 Z)1 Z 0 X , podemos escribir V I en funcin de Z.


0
0
V I = (X Z(Z 0 Z)1 Z 0 Z(Z 0 Z)1 Z 0 X )1 X Z(Z 0 Z)1 Z 0 Y

0
0
V I = (X Z(Z 0 Z)1 Z 0 X )1 X Z(Z 0 Z)1 Z 0 Y

Pregunta 3: ( 20 puntos)
Considerando el siguiente modelo de regresin lineal

Yi = Xi + ui

ui N (0, 2 )

Demuestre que el estimador de MCO de es igual al estimador Mxima Verosimilitud de .


Respuesta:
Sea Y = X + U , para calcular MCo tenemos que:
0 (Y X )]
= mn
mn[(Y X )

N
X

u
2

i=1

0 Y + 0 X 0 X ]

mn[Y 0 Y 2X

= 0 2X 0 Y + 2X 0 X = 0 M CO = (X 0 X)1 X 0 Y

MV: bajo el supuesto de u N (0, 2 ), la verosimilitud es:


L=

(Y X)0 (Y X)
1
2 2
e
n
(2 2 ) 2

ln(L) = l = ln(2) ln( 2 ) ln

n
2

(Y X)0 (Y X)
2 2

l
1
= 2 2(Y X)(X 0 ) = 0 M V = (X 0 X)1 X 0 Y

2
Maximizar l con respecto a es lo mismo que minimizar (Y X)0 (Y X). Para ambos casos
se resuelve igual problema, por lo que el estimador resultante es anlogo en ambas estimaciones.

Pregunta 4: ( 20 puntos)
Demuestre que la inclusin de variables irrelevantes disminuye la eficiencia de las estimaciones
MCO.
Respuestas:
Modelo correcto: Y = X1 1 + u
Modelo incorrecto: Y = X1 1 + X2 2 + u
Recordando la regresin particionada: el estimador de 1 del modelo incorrecto es:
1 = (X10 M2 X1 )1 X10 M2 Y
Donde M2 = I X2 (X20 X2 )1 X20
1 = (X10 M2 X1 )1 X10 M2 (X1 1 + u) = 1 + (X10 M2 X1 )1 X10 M2 u
E(1 ) = 1 + (X10 M2 X1 )1 X10 M2 E(u)
Como E(u) = 0 E(1 ) = 1
Respecto a la varianza:
V (1 ) = E[(1 E(1 ))(1 E(1 ))0 ]
= E[(X10 M2 X1 )1 X10 M2 uu0 M2 X1 (X10 M2 X1 )1 ]
Como M2 es idempotente y simtrica.
V (1 ) = 2 (X10 M2 X1 )1 X10 M2 X1 (X10 M2 X1 )1
= 2 (X10 M2 X1 )1
La varianza verdadera (estimando el el modelo correcto) sera:
V (1 ) = 2 (X 0 X)1
1
1
[V (1 )]1 [V (1 )]1 = 2 (X10 X1 ) 2 (X10 M2 X1 )

1
= 2 X10 [I M2 ]X1

1
= 2 X10 X2 (X20 X2 )1 X20 X1

Donde esta ltima es una matriz semidefinida positiva


[V (1 )]1 > [V (1 )]1 [V (1 )] < [V (1 )]
6

3.

Pregunta Obligatoria
( 45 puntos)

Suponga que un amigo de usted esta interesado en estimar el retorno a la educacin utilizando una encuesta de corte transversal, pero no esta muy seguro de los resultados obtenidos.
El modelo que su amigo estim es el siguiente.

Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + ui


En donde Wi corresponde al logaritmo natural del salario del individuo i , Dsexoi es una
variable dicotmica que toma el valor de 1 si el individuo i es hombre, Esci corresponde a los
aos de educacin del individuo i, Expei corresponden a los aos de experiencia construida
mediante la proxy Expei = Edad Esci 6.
Los resultados obtenidos de su estimacin son los siguientes.

Dependent Variable: W
Method: Least Squares
Included observations: 4021 after adjustments
W=C(1)+C(2)*DSEXO+C(3)*ESC+ C(4)*EXPE

C(1)
C(2)
C(3)
C(4)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

Coefficient

Std. Error

t-Statistic

Prob.

10.16332
0.347502
0.123967
0.012138

0.061402
0.034635
0.003168
0.000964

165.5208
10.03325

0.0000
0.0000

12.58711

0.0000

0.302890
0.302369
0.701184
1974.992
-4276.154

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

11.89096
0.839496
2.128900
2.135167

1. (5 puntos) Interprete el parmetro 3 . Es significativo?. Cunto aumenta en promedio


Wi ante un cambio porcentual de 1 % de los aos de educacin? (Esc) = 9).
Respuesta:
3 representa el retorno a la educacin, mide el impacto marginal de un ao de educacin sobre el ingreso.
3 =

lnWi
%Wi
=
ESCi
ESCi

Mide en cuanto cambia en trminos porcentuales el ingreso, frente a un aumento en un


7

ao de educacin.
Como t =

0,123967
0,003168

= 39,13, (n k) = 4021 4 = 4017 y, adems, t4017,95 % = 1,96

Esto implica que tc > tt se rechaza Ho : 3 = 0 3 es estadsticamente significativo.


A su vez, como:
4 %Wi = 3 4 %ESCESC
= 0,123967 0,01 9
= 0,01115703
= 1,11 %
2. (7 puntos) Si su amigo quisiera testear la hiptesis de que los hombres poseen un mayor
retorno a la educacin superior. Qu especificacin le recomendara y como testeara la
significancia de esta hiptesis?.
Respuesta:

Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Dsexo ESCi + ui


E[Wi /hombre] = 1 + 2 + 3 Esci + 4 Expei + 5 ESCi
E[Wi /mujer] = 1 + 3 Esci + 4 Expei
En el caso de los hombres el retorno a la educacin es:
E[Wi /hombre]
= 3 + 5
ESC
Para la mujeres:
E[Wi /mujer]
= 3
ESC
Entonces para testear la hiptesis de que los hombres tienen mayor retorno a la educacin,
habra que ver la significancia de 5 en la especificacin anterior (Ho : 5 = 0).
3. (7 puntos) Suponga que el investigador omite en la estimacin la variable Expei . Cules son los efectos en la estimacin del retorno a la educacin.(Cov(Expei , Esci ) = 51,04)
Respuesta:
cov(Expe, ESC)
3 = 3 +
4
V (ECS)
51,04
= 3
0,012138
V (ESC)
8

Dado que si incluyramos la variable experiencia su coeficiente sera positivo y dada la


correlacin positiva entre EXP y ESC (por la forma en que la experiencia se construye);
la omisin de la variable experiencia generara un sesgo hacia abajo en el parmetro del
retorno a la educacin.
4. (7 puntos) Su amigo esta preocupado por la posibilidad de que el modelo estimado presente heterocedasticidad. Sin embargo, no tiene muy claro los efectos de este problema y no
sabe como tratarla. Cules seran tericamente los efectos sobre las estimaciones realizadas si existiera heterocedasticidad?. Explique detalladamente algn mtodo para testear
su presencia. Ante el desconocimiento de la estructura de heterocedasticidad. Cul sera
el consejo que le dara a su amigo?.
Respuesta:
La presencia de heterocedasticidad no genera problemas sobre la propiedad de insesgamiento del estimador de MCO, pero si sobre su eficiencia. Si se conoce el patrn de
heterocedasticidad o se puede estimar, el estimador eficiente es el de MCG o MCF respectivamente.
Posibles test: White, G. y Quant, Breusch y Pagan y Glesjer (en apunte est descrito).
Si se desconoce el patrn de heterocedasticidad y es difcil de estimar, lo mejor es obtener una estimacin consistente de la matriz de varianzas y covarianzas por el mtodo de
White, lo que me permite realizar la inferencia de forma correcta.
5. (7 puntos) Suponga que la varianza de los errores est dada por V (u) = 2 Expei . Como
estimara el modelo? Qu resultados esperara en comparacin a los resultados obtenidos
en la estimacin?.
Respuesta:
Si conozco el patrn de

Expe1
0
0

0
Expe
0
2

0
0
.

0
0
0

0
0
0
0
0
0

heterocedasticidad : i2 = 2 Expei , puedo componer la matriz :

. .
0

. .
0

0 .
0

. 0
.

0 .
.
. . Expen

Y estimar eficientemente mediante el mtodo de mnimos cuadrados generalizados:


M CG = (X 0 1 X)1 X 0 1 Y
Lo que es equivalente a aplicar MCO a un modelo transformado, cuya transformacin
consiste en dividir cada observacin de variable dependientes y explicativas por Expei .
6. (7 puntos) Su amigo esta preocupado, adems, por la posibilidad de que el modelo estimado presente autocorrelacin. Sin embargo, no tiene muy claro, nuevamente, los efectos
de este problema y no sabe como tratarla. Cules seran tericamente los efectos sobre
las estimaciones realizadas si existiera autocorrelacin?. Su amigo le proporciona adems
los resultados de una estimacin de un proceso AR(1) para los residuos de la regresin
original. Construya el estadstico Durwin-Watson y testee la presencia de autocorrelacin.
Explique intuitivamente por qu este modelo arroja estos resultados.
9

Dependent Variable: RESID01


Method: Least Squares
Date: 12/01/04 Time: 12:27
Sample (adjusted): 6 6499
Included observations: 2480 after adjustments
RESID01=C(1)*RESID01(-1)

C(1)

Coefficient

Std. Error

t-Statistic

0.0085142

0.020

0.4208

Prob.
0.673

Respuesta:
La autocorrelacin al igual que la heterocedasticidad, no tiene impactos sobre el insesgamiento, pero si sobre la eficiencia de estimador de MCO.
Un posible test es el Durbin-Watson (hay otros, ver apuntes)
Si se desconoce el patrn de autocorrelacin y no es posible estimarlo eficientemente, se
puede utilizar la estimacin consistente de la matriz de varianzas y covarianzas utilizando
el mtodo de Newey and West, para realizar la inferencia.
Si ocupamos DW tenemos que : DW = 2(1 ) = 2(1 0,0085142) = 1,98
Con lo que se rechaza la hiptesis nula de autocorrelacin.
El modelo arroja estos resultados, pues es un modelo de corte transversal donde es muy
extrao encontrar autocorrelacin entre individuos, recordar que la autocorrelacin es un
problema comn de series de tiempo.
7. (5 puntos) Como se mencion en el enunciado la variable experiencia se construy como
Expei = Edad Esci 6. Qu consecuencias puede acarrear esta especificacin de la
variable experiencia?. Explique detalladamente.
Respuesta:
Como la variable experiencia es construida a partir de otra variable explicativa (ESC),
esto genera un gran grado de asociacin entre dos variables explicativas del modelo o
multicolinealidad.

10

Econometra I
Profesora: Javiera Vsquez.
Verano 2005
Examen
Comente 1: (10 puntos) Ud. posee informacin de la estimacin de los siguientes modelos:
Modelo
(1) yi = 0 + 1 x1,i + 2 x2,i + ui
(2) yi = 0 + 1 x1,i + 3 x3,i + ui

R2
0.96
0.85

Akaike
2.15
2.10

Schwarz
3.19
2.98

De acuerdo a esta informacin me debera quedar con el modelo (2). Comente.


Falso, de acuerdo a la informacin reportada me debera quedar con el modelo (1) que es
el que tiene un mayor R2 . Si bien el modelo (2) tiene menores criterios de informacin que el
(1), estos modelos no son comparables utilizando los criterios de informacin ya que no son
modelos anidados.
Comente 2: (10 puntos) El R2 mide la proporcin de la varianza de la variable dependiente
que es explicada por la varianza de las variables explicativas, de esta forma, siempre es un
nmero que esta entre 0 y 1. Comente.
Depende, cuando el modelo de regresin incluye un trmino constante, se cumple que: ST =
SR + SE, lo que se conoce como la descomposicin de varianza, lo que garantiza que el R2
sea siempre positivo. Sin embargo, si el modelo no incluye constante, no se cumple la ecuacin
anterior de descomposicin de varianza y el R2 puede tomar valores negativos, pero sigue siendo
siempre menor a 1.
Comente 3: (10 puntos) La omisin de una variable relevante siempre sesga la estimacin
MCO de . Comente.
Falso, la omisin de una variable relevante siempre produce sesgo en los parmetros a menos que la correlacin entre la variable omitida y las explicativas incluidas sea cero, el signo del
sesgo depende de dos cosas: la correlacin entre la variable omitida y las variables explicativas
incluidas y el valor del parmetro que tendra asociado la variable omitida (valor poblacional).
Para un modelo sencillo con una variable explicativa (x1 ) y una variable omitida (x2 ) se mostr
1 ,x2 )
en clases que el sesgo es: cov(x
V (x1 ) 2 .
Comente 4: (10 puntos) Si el estadstico Durbin-Watson (DW) tomo el valor de 2, estamos
seguros que no existe autocorrelacin en nuestro modelo. Comente.
Si el estadstico Durbin-Watson toma valor de 2, el coeficiente de correlacin asociado a este valor del estadstico es de 0. Recordar que DW ' 2(1 ), de esta forma si DW es 2 implica
que = 0. Sin embargo, como la hiptesis nula es de no autocorrelacin en los errores, a pesar
de que con este valor del estadstico no puede rechazar la nula, no significa que pueda aceptar
que no existe autocorrelacin. Adems este test slo sirve para testear autocorrelacin de primer
orden, entonces a pesar de que no se puede rechazar la hiptesis nula de autocorrelacin de este
tipo, puede existir autocorrelacin de un orden superior. El comente es Falso.
1

Pregunta 1: (15 puntos) Considere la siguiente funcin de densidad condicional


f (y|x) =

ey (y)x
x!

y 0,

Obtenga el estimador de mxima verosimilitud de .


Respuesta Pregunta 1:
Para cada observacin i se tiene la siguiente densidad:
f (yi |xi , ) =

eyi (yi )xi


xi !

La verosimilitud asociada a cada observacin i es:


yi

e
(yi )xi
li (|yi , xi ) = ln
xi !
= ln yi + xi (ln + ln yi ) ln(xi !)

(1)

De esta forma, aplicando sumatoria a la ecuacin (1) obtengo la verosimilitud conjunta:


L(|y, x) = n ln

n
X

yi + ln

i=1

n
X

xi +

i=1

n
X

xi ln yi

i=1

n
X

ln(xi !)

i=1

Maximizando (2) con respecto a obtenemos el estimador Mximo Verosmil:


n

L
n X
=
yi +

i=1

n
X
i=1

Pn

yi +

i=1

xi

n
X

xi

= 0
= 0

i=1

Pn
n + i=1 xi
Pn
i=1 yi
1+x
y

(2)

Pregunta 2: (15 puntos) En el siguiente modelo de regresin lineal simple:


yi = xi + ui

i = 1, ..., n

donde xi esta medida con error, de forma tal que slo accedemos a la variable xi = xi + i ,
iid

con i (0, 2 ). Demuestre que el estimador de variables instrumentales, es un estimador


consistente.
Respuesta Pregunta 2:
El estimador de variables instrumentales en este caso es:
Pn
zi yi
V I = Pni=1
z
i=1 i xi
Entonces, reemplazando yi por su versin poblacional yi = xi + ui :
Pn
z (xi + ui )
Pni
V I = i=1

i=1 zi xi
Ahora sumando y restando i a la expresin entre parntesis y operando:
Pn
i + ui + i i )
i=1 zi (x
P
V I =
n

i=1 zi xi
x

i
z }| {
z }| {
z
((
x
+
i ) + ui i )
i
i=1 i
Pn

i=1 zi xi

Pn

V I

V I

V I

V I

Pn

z (xi + i )
i=1
Pni
zi xi
Pi=1
n
z i i
+ Pni=1
z
i xi
Pi=1
n
zi i /n
+ Pni=1
z
i=1 i xi /n

Aplicando plim a la expresin anterior:


plimV I

Pn
plim i=1 zi i /n
Pn
plim i=1 zi xi /n

plim +

z }| {
E(zi i )
+
E(zi xi )
| {z }

=0

plimV I

6=0

plimV I

Para que z sea un instrumento vlido debe cumplir con que E(zi i ) = 0 y E(zi xi ) 6= 0, con lo
cual se demuestra que el estimador de variable instrumentales es consistente.

Pregunta 3: (15 puntos) Considere el siguiente modelo:


yt = C(1) + C(2)xt + C(3)yt1 + ut
Del cual se obtiene el siguiente output en Eviews:
Dependent Variable: Y
Method: Least Squares
Date: 01/21/05 Time: 23:31
Sample (adjusted): 1976 2003
Included observations: 28 after adjustments
Y=C(1)+C(2)*X+C(3)*Y(-1)
Coefficient
C(1)
C(2)
C(3)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

1.021150
0.271875
0.712607
0.987964
0.987001
1.975875
97.60204
-57.21199

Std.
Error

t-Statistic

Prob.

1.074276
0.138389
0.143427

0.950547
1.964572
4.968432

0.3509
0.0607
0.0000

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

32.68142
17.33004
4.300857
4.443593
1.572226

Testee la existencia de autocorrelacin en los errores.


Respuesta Pregunta 3:
Como el modelo incluye la variable dependiente rezagada como regresor, no se puede utilizar el
test de Durbin-Watson. Se tiene que utilizar el siguiente test h-Durbin:

r
DW
n
h= 1

N (0, 1)
2
1 n
2
Utilizando la informacin de la tabla anterior:
DW
1.572226

n
28

2
(0,143427)2

De esta forma,

s
1,572226
28
h= 1

= 1,738115749
2
1 28 (0,143427)2
El valor de tabla de la distribucin normal estndar a un 95 % de confianza es 1.960 y a un
90 % de confianza es 1.645, entonces a un 5 % de significancia no se puede rechazar la nula de
no autocorrelacin en los errores, sin embargo a un 10 % de significancia se rechaza la hiptesis
nula. Tambin podemos calcular el p-value:
(1,738115749) = 0,9582 p = 2[1 (1,738115749)] = 0,0836

Pregunta 4: (20 puntos) Suponga que Ud. tiene que estimar el siguiente modelo:
yi = 1 x1,i + 2 x2,i + ui

con i = 1, ..., 102.

De la cual obtiene los siguientes resultados:

0,5
10 8
0,7
0,56
=
=
X 0X =
V ()
0,4
8 10
0,56
0,7

V (y) = 25,2

a) Realice los test de significancia para cada uno de los parmetros.


b) Determine el nmero de condicin de la matriz X, para ver la presencia de colinealidad entre
las variables explicativas.
Respuesta Pregunta 4:
(a) Test de significancia de 1 :
0,5
= 0,59 tt = t100 1,98
tc =
0,7
No se puede rechazar la hiptesis nula de que 1 sea 0, el parmetro no es estadsticamente
significativo.
Test de significancia de 2 :
0,4
tc =
= 0,47 tt = t100 1,98
0,7
No se puede rechazar la hiptesis nula de que 2 sea 0, el parmetro no es estadsticamente
significativo.
(b) El nmero de condicin de la matriz X, se obtiene con el siguiente coeficiente de Belsley:
r
max
=
min
donde max y min son los valores propios de la matriz B=S(XX)S.
En esta caso la matriz (XX) contiene los elementos necesiarios para construir la matriz S:
Pn

Pn
x2
10 8
i=1 x1i x2i
P
X 0 X = Pn i=1 1i
=
n
2
8 10
i=1 x2i x1i
i=1 x2i
De esta forma,
"
0

B = S(X X)S

=
=

0
1
10

1
10

1
8
10

8
10

10 8
8 10

"

1
10

0
1
10

Continuacin Respuesta Pregunta 4:


Ahora debemos obtener los valores propios de la matriz B, para cual debemos resolver el
siguiente sistema de ecuaciones:

1
8

10

|B I|

0
1

8
1

10

10
2
8
(1 )2
10
8
10

= 0
= 0
= 0

(1 ) =
(1 1 ) =
(1 2 ) =

8
10

8
2
1 =
10
10
8
18

2 =
10
10

De esta forma podemos construir el coeficiente de Belsley (recordar que un nmero mayor a 25
sugiere la presencia de multicolinealidad):
s
r
18
18
10
=
= 9=3
=
2
2
10
No existe evidencia de presencia de multicolinealidad entre las variables explicativas de este
modelo.

Pregunta 5: (20 puntos) Dado el modelo de regresin:


yi = + i

donde E(i ) = 0

V (i ) = 2 x2i

(a) Encuentre el estimador MELI de .


(b) Encuentre el estimador de la varianza de .
Respuesta Pregunta 5:
(a) El estimador eficiente de es el estimador MCG (ya que conozco la matriz o el patrn de Heterocedasticidad.

2
x1
0
0
0 x22 0

= .
(3)
..
..
..
..
.
.
.
0
De esta forma 1 es:

1
x21

..
.
0

1
x22

0
..
.
0

x2n

..

0
0
..
.

(4)

1
x2n

Adems como nuestro modelo incluye como variable explicativa slo la constante, nuestra matriz
X es:

1
1

X= .
(5)
..
1
De esta forma:

X 0 1 X =

1 1

X 0 1 Y =

1 1

1
x21

0
..
.
0

1
x21

..
.
0

1
x22

..

..
.
0

1
x22

0
..
.
0

..

0
0
..
.

1
x2n

0
0
..
.

M CG = (X

X)

(X

Y)=

yt
t=1 x2t
PT 1
t=1 x2t

(b) El estimador de la varianza de es:


2

V (
M CG ) =
2 (X 0 1 X)1 = PT

1
t=1 x2t

y1
y2
..
.
yT

1
x2n

PT

1
1
..
.

T
X
1

=
t=1 x2t

(6)

T
X
yt

=
t=1 x2t

(7)

Econometra I
Profesores: Andrs Otero
Javiera Vsquez.
Otoo 2005
Pauta Examen

Parte I: Comentes (30 puntos) (Contestar slo en las lneas disponible)


Pregunta 1: (5 puntos) Si en un modelo de regresin de la forma: Yt = Xt + ut el estadstico Durbin-Watson nos indica presencia de autocorrelacin, bastar con incluir la variable
dependiente rezagada un periodo (Yt1 ) como regresor para solucionar definitivamente el problema. Comente.
Falso, la autocorrelacin puede ser provocada por dos cosas: si la variable dependiente tiene una tendencia y esta no esta siendo capturada por las variables explicativas y por un patrn
dinmico omitido. En el primer caso incluir la variable Yt1 como regresor no soluciona el problema, en el segundo caso puede que al incluir un rezago de la variable dependiente se solucione
el problema de autocorrelacin si es que esta es de orden 1, pero si la autocorrelacin es de un
orden superior habr que incluir ms rezagos de la variable dependiente como regresor.
Pregunta 2: (5 puntos) El problema de error de medicin no es preocupante, ya que slo
genera inconsistencia en el estimador MCO de la variable que esta medida con error. Comente.
Falso, se puede demostrar que:
plim

M CO = [xx + ]1

(No es necesario poner esta ecuacin).


Es decir, cuando existe error de medida, basta con que slo una de las variables explicativas este medida con error para generar inconsistencia en todos los parmetros estimadosPpor
MCO. Basta con la la matriz W tenga una de sus columnas distinta de cero, para que
sea distinta de cero y se genere la inconsistencia. Esto porque una variable explicativa con error
contamina toda la matriz (X 0 X).
Pregunta 3: (5 puntos) Una de las variables macroeconmicas ms estudiadas empricamente
ha sido la tasa de inters real(r). Suponga que usted esta interesado en estimar cuales son las
variables que explican el comportamiento de la tasa de inters real. Sin embargo, no dispone
de esta serie. Frente a este problema un amigo de usted, gentilmente, le ha ofrecido ayuda. Su
amigo le propone construir la tasa de inters real mediante la identidad de Fischer, la cual define
a la tasa de inters real como la diferencia entre la tasa de inters nominal y las expectativas
de inflacin r = i e .Donde i corresponde a la tasa de inters nominal y e a las expectativas
de inflacin. A partir de esto le ha aconsejado estimar el siguiente modelo

rt = 0 + 1 i + 2 e + Xt + t
Donde X es un conjunto de k 3 variables explicativas tales como tipo de cambio nominal,
oferta monetaria, tasa de inters externa y otros. Y es un error bien comportado.
1

Qu le dira a su amigo acerca de la especificacin propuesta? Cmo esperara que fuera


el ajuste del modelo y la significancia de los parmetros.?
Habra que decirle al amigo que esta cometiendo un importante error y que es mejor que
revise los libros de econometra de nuevo. El esta proponiendo correr una regresin para una
ecuacin contable, por lo que por definicin el modelo tendr un buen ajuste y los parmetros
sern significativos. La causalidad de la tasa de inters nominal y las expectativas de inflacin
sobre la tasa de inters real que se esta tratando de estudiar esta dada por definicin dada la
forma en que se construy esta ltima.
Pregunta 4: (5 puntos) Es sabido que la presencia de heterocedasticidad arroja problema
de eficiencia en las estimaciones. En este contexto el estimador Mnimos Cuadrados Generalizados Factibles ser el mejor estimado lineal insesgado. Por lo tanto, siempre es mejor implementar
MCGF que la correccin consistente de White.
La eficiencia del estimador MCGF depende de la calidad de la estimacin del patrn de heterocedasticidad. Si esta estimacin es muy mala, por que por ejemplo no estamos seguro del
patrn heterocedstico, podemos estar agregando ms problemas al modelo. Por lo tanto, en
algunos escenarios es mejor utilizar el estimador consistente de White.
Pregunta 5: (5 puntos) Un R2 alto siempre nos indica que nuestro modelo esta bien especificado. Comente.
Falso, modelos con presencia de multicolinealidad pueden arrojar elevados R2 . Sin embargo,
la estimacin de los parmetros del modelo ser ineficiente arojando conclusiones errneas sobre la significancia de los parmetros involucrados.
Pregunta 6: (5 puntos) El estimador Mximo Verosmil es el ms eficiente de todos los estimadores. Comente.
Efectivamente, el estimador Mximo Verosmil es el ms eficiente de todos los estimadores
al alcanzar la cota inferior de Cramer-Rao, que es la mnima varianza asinttica que puede
alcanzar cualquier estimador. Sin embargo, esta eficiencia en slo en forma asinttica, en muestras pequeas el estimador ms eficiente (Teorema de Gauss-Markov) es MCO (si se cumplen
los supuestos). Por lo tanto, el comente es falso.

Parte II: Ejercicios (Contestar slo en el espacio disponible)


Debe resolver obligatoriamente los siguientes cuatro ejercicios
Ejercicio 1: (15 puntos) Con datos de salario por hora y produccin por hora para Estados
Unidos (1959-1998), se obtienen los siguientes resultados en Eviews:
120
Dependent Variable: SALARIO
Method: Least Squares
Date: 07/05/05 Time: 19:46
Sample: 1959 1998
Included observations: 40
SALARIO=C(1)+C(2)*PROD

110
100
90
80

Coefficient

Std. Error

t-Statistic

Prob.

29.51925
0.713659

1.942347
0.024105

15.19773
29.60658

0.0000
0.0000

70
C(1)
C(2)

60
50

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

40
1960 1965 1970

1975 1980 1985 1990 1995

produccion por hora

0.958449
0.957356
2.675533
272.0220
-95.09761

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

85.64500
12.95632
4.854881
4.939325
0.122904

salario por hora

Breusch-Godfrey Serial Correlation LM Test:


F-statistic
Obs*R-squared

75.13900
32.26962

Probability
Probability

0.000000
0.000000

Dependent Variable: SALARIO


Method: Least Squares
Date: 07/05/05 Time: 19:51
Sample: 1959 1998
Included observations: 40
SALARIO=C(1)+C(2)*PROD+C(3)*@TREND

-2

C(1)
C(2)
C(3)

Coefficient

Std. Error

t-Statistic

Prob.

0.571953
1.305693
-0.903238

13.59850
0.276476
0.420341

0.042060
4.722620
-2.148822

0.9667
0.0000
0.0383

-4
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

-6
1960 1965 1970 1975 1980 1985 1990
SALARIO Residuals

1995

C(4)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

0.914245
0.873615
0.873615
0.910629
31.51134
-51.18093

Std. Error
0.056337

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

85.64500
12.95632
4.787279
4.913945
0.204600

Dependent Variable: DSALARIO


Method: Least Squares
Date: 07/05/05 Time: 19:57
Sample (adjusted): 1960 1998
Included observations: 39 after adjustments
DSALARIO=C(5)+C(6)*DPROD

Dependent Variable: ERRORES


Method: Least Squares
Date: 07/05/05 Time: 19:54
Sample (adjusted): 1960 1998
Included observations: 39 after adjustments
ERRORES=C(4)*ERRORES(-1)
Coefficient

0.963059
0.961063
2.556609
241.8413
-92.74559

t-Statistic
16.22811

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

Coefficient

Std. Error

t-Statistic

Prob.

4.109836
0.528938

0.656965
0.077395

6.255797
6.834267

0.0000
0.0000

Prob.
0.0000
0.120615
2.561492
2.675945
2.718600
1.472987

C(5)
C(6)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

0.557983
0.546037
0.858069
27.24242
-48.34227

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

8.500412
1.273537
2.581655
2.666966
1.620598

Qu puede concluir sobre el modelo estimado?. Sea bastante detallado y utilice las herramientas aprendidas en clases.
Respuesta:
1. Se puede ver grficamente que tanto el salario por hora como la produccin por hora
tienen un comportamiento tendencial, estos ya es un indicio de que podemos estar en
presencia de autocorrelacin. (1 punto)
2. La estimacin del modelo: salario = 0 + 1 P rod tiene parmetros estadsticamente significativos, con un R2 alto, nos muestra que por cada unidad adicional de produccin esto
se refleja en un aumento de salario de 0.71 (1 punto), pero podemos ver que tenemos un
problema de autocorrelacin, ya que el estadstico Durbin-Watson toma un valor de 0.12
con lo cual cae en la zona de rechazo de la nula de autocorrelacin en favor de la hiptesis
alternativa de autocorrelacin positiva (3 puntos). Esto se confirma con el resultado del
test de Breusch-Godfrey, ya que tiene un p-value de 0 %, lo que nos indica rechazo de la
hiptesis nula de no autocorrelacin con 0 % de error tipo I (2 puntos); y con la inspeccin
grfica de los residuos del modelo, los que claramente tienen el comportamiento esperado
bajo autocorrelacin positiva (rachas de valores por sobre la media seguidas de rachas de
valores por debajo de la media) (2 puntos).
3. Como se menciono en un comienzo la autocorrelacin puede ser provocada por la tendencia
de las variables, sin embargo, la estimacin que incluye una tendencia como variable
explicativa muestra que a pesar de que esta es estadsticamente significativa y que los
criterios de informacin nos muestran que esta especificacin es mejor a la anterior, el
problema de autocorrelacin sigue presente (DW=0.2) (2 puntos).
4. Si la tendencia no es slo lo que causa la autocorrelacin, debe ser porque adems existe
un comportamiento dinmico omitido, el cual debera estar en el error. La estimacin de
un proceso autorregresivo de primer orden para los errores muestra que efectivamente el
error tiene un comportamiento dinmico, el coeficiente de correlacin serial es de 0,9 y
significativo (1 punto).
5. Al transformar las variables en diferencias: DSalariot = Salariot 0,9 Salariot1 y
DP rodt = P rodt 0,9 P rodt1 , y estimar el modelo con estas variables transformadas
(primer paso del mtodo de Cochrane-Orcutt), vemos que el problema de autocorrelacin
ha desaparecido (DW=1.62) (2 puntos).
Conclusin: el modelo estimado tiene un problema de autocorrelacin provocado tanto por la
existencia de una tendencia como de un comportamiento dinmico omitido (1 punto).

Ejercicio 2: (15 puntos) Suponga que se tiene el siguiente modelo


yt = Xt + ut

E(ut ) = 0

V ar(ut ) = 2 E(yt )2

Explique detalladamente cuales son las consecuencias sobre MCO cuando es aplicado a este
modelo Cmo estimara este modelo? Que estimador utilizara? De que depender la eficiencia de su estimacin?. Plantee una expresin para el estimador ptimo de y de u2 .
Respuesta:
Este modelo presenta heterocedasticidad por lo que las estimaciones por MCO son ineficientes.
El patrn que sigue la heterocedasticidad depende del valor esperado de la variable dependiente
yt , es decir, E(yt ) = Xt . Dado que es desconocido no podemos aplicar el estimador MCG. Sin
embargo, podemos aplicar MCGF y el estimador Mximo Verosimilutud (MV). La aplicacin
del primero requiere una estimacin en dos etapas, ya que es necesario obtener para aplicar el
mtodo. De esta forma se puede estimar el modelo por MCO ignorando la heterocedasticidad
y luego usar esta estimacin para normalizar las variables y aplicar MCGF. Este mtodo ser
menos eficiente que MV debido a que este ltimo estimar en conjunto todos los parmetros
involucrados. (5 puntos)
Para encontrar las expresiones de y
2 lo podan hacer por MV o MCG.
Estimador Mximo Verosmil:
La funcin de densidad (equivalente a la verosimilitud) para cada yt N (xt , 2 (xt )2 ) es:
1

f (yt ) = p

2 2 (xt )2

(y x )2

2t2 (x t)2
t

El logaritmo de la verosimilitud es:


1
1
(yt xt )2
l(yt ) = ln(2) ln 2 ln() ln(xt )
2
2
2 2 (xt )2
As, el logaritmo de la verosimilitud conjunta es:
l(y) =

T
T
X
X
T
T
(yt xt )2
ln(2) ln 2 T ln()
ln(xt )
2
2
2 2 (xt )2
t=1
t=1

(1)

Maximizando (1) con respecto a y 2 obtenemos las condiciones de primer orden, las cuales
nos entregan el estimador MV de ambos parmetros:
l

l
2

T
T
2
t
T
1 X (yt xt )
1 X (yt xt )x
+
+
=0
x2t
x2t
2 3 t=1

2 2 t=1

T
2
T
1 X (yt xt )
=
+
=0
2
xt
2
4 2 t=1
22

De (3) tengo:
1
2
4 2

T
X
2
(yt xt )
t=1

x2t
5

T
22

(2)
(3)

De esta forma el estimador MV de 2 es:


PT
t=1

2
(yt xt )
2
(xt )

(4)

Reemplazando (4) en (2):

T
T
2
t
1 X (yt xt )
1 X (yt xt )x
T
+
+
x2t

2 t=1
x2t 2

2 2 t=1
|
{z
}
T
2

= 0

T
T
T
1 X yt
+ +

= 0


2 2 t=1 xt
T =

T
X
yt
x
t=1 t

De esta forma, el estimador MV de es:


PT

yt
t=1 xt

(10 puntos)
Estimador MCF:
La variables yt , xt y ut transformadas son (para lo cual previamente se debe estimar ):
yt

xt

ut

yt
yt
yt
=q
=

t
xt
2 x2t
xt
xt
1
=q
=
t

2 x2t
ut
ut
ut
=q
=

t
x
2
t
2 xt
iid

El mtodo de MCF consiste en estimar por MCO el modelo: yt = xt + ut , donde ut (0, 2 ):


M CF

PT
=

t=1

PT

yt xt

2
t=1 (xt )
yt
1
t
t=1 x
PT 1 2
t=1
P
T
yt
1
t=1 xt
2
T
2

PT
=

PT
M CF

yt
t=1 xt

T
6

El estimador MCF de 2 corresponde al promedio muestral de la suma de los errores estimados


al cuadrados (pero de los errores transformados):
PT
2

M
CF

ut )2
t=1 (

PT
2

M
CF

t=1

2
(yt xt )

(xt )2

(10 puntos)

Ejercicio 3: (15 puntos) El semestre pasado mostr empricamente que a los alumnos con
mejor rendimiento en los controles les iba mejor en el examen.
En esta oportunidad se obtuvo la siguiente regresin estimada:

Modelo 1:
Dependent Variable: EXAMEN
Method: Least Squares
Date: 07/06/05 Time: 16:46
Sample: 1 110
Included observations: 110
EXAMEN=C(1)+C(2)*CONTROLES

C(1)
C(2)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood

Coefficient

Std. Error

t-Statistic

Prob.

1.180496
0.664234

0.625536
0.135391

1.887175
4.906056

0.0618
0.0000

0.182248
0.174676
1.023741
113.1888
-157.6550

Mean dependent var


S.D. dependent var
Akaike info criterion
Schwarz criterion
Durbin-Watson stat

4.211818
1.126880
2.902818
2.951918
2.024406

a) Qu problemas puede presentar esta estimacin?. Explique.


b) Especifique Ud. un modelo que le permita explicar la nota del examen incluyendo todas la
variables relevantes, y que a su vez le permita testear diferencias por gnero. Explcitamente, Cmo lo testeara?.
c) Ahora plantee un modelo que le permita testear si existen diferencias en la productividad del
estudio entre hombres y mujeres (midiendo productividad en horas de estudio). Explique
y grafique.
Respuesta:
a) Presentar serios problemas de omisin de variables relevantes. Ya que es muy probable que
el rendimiento del alumno no solo dependa de como le fue en los controles pasados si no de
un conjunto de otros regresores. Como por ejemplo las horas de estudio dedicadas para el
examen. Como es sabido el sesgo en la estimacin depender del signo de los parmetros
que acompaen a las variables omitidas y de la relacin de estas con las variables que si
se incluyeron en el modelo.
b) Podra ser:
N.Examen = 0 + 1 N.Controles + 2 DummyGenero + 3 Xi +

(5)

Donde Xi corresponde a un conjunto de variables significativas que explican el rendimiento


del alumno en el examen. La manera de testear diferencias por gnero es a trves de un
test t al parmetro 2 .

c) Ahora plantee un modelo que le permita testear si existen diferencias en la productividad del
estudio entre hombres y mujeres (midiendo productividad en horas de estudio). Explique
y grafique.
N.Examen = 0 +1 N.Controles+2 DummyGenero+3 Xi +4 DummyGeneroHE +
(6)
Donde HE corresponde a las horas estudiadas para rendir el examen.

Nota

+DG
0+2

0
Horas Estudiadas

Ejercicio 4: (5 puntos) Sobre la tarea realizada para el curso, responda las siguientes preguntas:
a) Seale el modelo estimado y la procedencia de los datos utilizados.
b) Principales problemas de su estimacin y como los detecto.
c) Principales conclusiones.
Respuesta:Individual

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 5: Considere el siguiente modelo:
yt = 1 +

xt
+ ut
xt + 2

los resultados de la regresin son :



6 5

=
2

ut N (0, 2 )

con
2 = 16 y

y2 = 18

Estos resultados se obtuvieron con la siguiente muestra de valores de X, xt = {4, 3, 3, 4}.


Compute los criterios de informacin del modelo original y uno que asume que 2 = 0. Cul
prefiere?. [Ayuda: recuerde que cuando el error de un modelo se distribuye normal los criterios
de informacin se pueden escribir en funcin de
2]
Respuesta:
Cuando el error del modelo de regresin sigue una distribucin normal, los criterios de informacin pueden ser aproximados de la siguiente forma:
k
n

AIC

ln(
2 ) + 2

BIC

ln(
2 ) + ln(n)

k
n

De esta forma, del modelo sin restringir se tiene los siguientes valores de los criterios de informacin:
AIC
BIC

2
= 3,773
4
2
= ln(16) + ln(4) = 3,466
4
= ln(16) + 2

El modelo restringido (asumiendo que 2 =0) queda de la siguiente forma:


yt
yt

= 1 + 1 + ut
= 3 + ut

Como es un modelo que slo incluye una constante el estimador MCO de 3 es:
PT
yt

3 = t=1 = Y
T
El estimador de la varianza del error de este modelo es entonces:
PT
t
t=1 u

2 =
T k
PT

t=1 (yt 3 xt )
=
T k
PT
t=1 (yt Y 1)
=
T k
2
2

=
y
10

Por lo tanto, los criterios de informacin del modelo restingido son:


AIC
BIC

1
= 3,390
4
1
= ln(18) + ln(4) = 3,237
4
= ln(18) + 2

Finalmente, de acuerdo a los criterios de informacin es mejor el segundo modelo.

11

Ejercicio 6: Si x tiene una distribucin uniforme, es decir:


f (xt ) =

0<x<

Encuentre el estimador Mximo Verosmil de .


Respuesta:
Al tener xt tiene una distribucin uniforme, significa que la probabilidad de observar cualquier xt es constante e igual a 1 , la funcin de densidad de esta variable se puede dibujar de
la siguiente forma:

f(xt)

f(xt)=1/

xt

Como se puede apreciar esta funcin no tiene un mximo en el rango [0, ] de xt , la solucin
al problema de maximizar la probabilidad de ocurrencia de la muestra ser una solucin esquina.
Como alpha determina el rango donde se mueve xt , el valor que me maximiza la probabilidad de ocurrencia de xt es:

M V = max{xt }
Veamos esto con ms detalle, supongamos que tenemos la siguinete muestra de x = {1, 5, 3, 4, 2, 1,5, 9},
los cuales tienen una distribucin uniforme, que pasa si tomo
= min{xt }, en este caso yo
estoy estimado que xt se puede mover entre 0 y 1, de acuerdo a esto la probabilidad de que
mi muestra venga de una distribucin uniforme con este es bastante baja, ya que claramente
observo valores mayores a 1 (Figura 1). Si eligiera
= 2 significa que xt se puede mover entre
0 y 2, este valor de tampoco maximiza la probabilidad de ocurrencia de la muestra, ya que
observo varios valores de xt mayores a dos (Figura 2). La nica forma de maximizar la probabilidad de ocurrencia de la muestra, es escoger
igual al mximo valor observado de xt , as
de acuerdo a esta densidad xt se puede mover entre 0 y el mximo, y no existe ningn valor
observado de xt que quede fuera de este rango.

12

f(xt)

f(xt)

No se
deberia
observar

No se
deberia
observar

0 1 2 3 4 5 6 7 8 9

0 1 2 3 4 5 6 7 8 9

xt

Figura 2: Si alfa fuese igual a 2

Figura 1: Si alfa fuese igual a 1 (min)

f(xt)
Es posible
observar todas
las
observaciones

0 1 2 3 4 5 6 7 8 9

Figura 3: Si alfa fuese igual a 9 (max)

13

xt

xt

Econometra
Facultad de Ciencias Econmicas y Administrativas
Universidad de Chile
Pauta Examen Final

Semestre: Primavera 2005


Profesores: Emerson Melo, Rodrigo Montero y Jaime Ruiz-Tagle / Javiera Vsquez
No hay preguntas de ningn tipo para los ayudantes.
Rut
.......................................
Folio
.......................................
Tiempo: 120 minutos
Puntaje Total: 120 Puntos

1.

Pregunta 1: Modelo Lineal Generalizado (40


puntos)
Considere el siguiente modelo de regresin lineal multiple:

Y = X1 + X2 2 + U
donde X1 y X2 son matrices de n k1 y n k2 respectivamente, mientras que 1
y 2 son de dimensin k1 1 y k2 1, Y es de dimensin n 1, y el trmino de
error U cumple los supuestos del modelo de regresin lineal clsico.
1. Plantee el problema de mnimos cuadrados asociado al modelo.(5 puntos)
Sol: El problema de mnimos cuadrados viene dado por
mn(Y X1 1 X2 2 )0 (Y X1 1 X2 2 )

1 ,2

Los supuestos sobre el trmino de error no son necesarios para plantear


el problema de optimizacin anterior, son necesarios cuando necesitamos
saber acerca de las propiedades de los estimadores.
2. Demuestre que los estimadores 1 y 2 vienen dados por:

1 = (X10 M2 X1 )1 X10 M2 Y
2 = (X20 M1 X2 )1 X20 M1 Y
donde Mi = [I Xi (Xi0 Xi )1 Xi0 ] i = 1, 2 (15 puntos)
Sol:En clases vimos que las ecuaciones normales de este problema corresponden a
X10 X1 1 + X10 X2 2 = X10 Y
X20 X1 1 + X20 X2 2 = X20 Y
Si despejamos 1 en la primera ecuacin y lo reemplazamos en la segunda
tenemos que resulta una ecuacin en trminos de 2 , que se escribe como:
X20 X1 [(X10 X1 )1 X10 (X10 X1 )1 X10 X2 2 ] + X20 X2 2 = X20 Y
Si se resuelve para 2 encontramos la expresin que se pide
3. Demuestre que E(i ) = i con i = 1, 2 (5 puntos)
Sol: Consideremos el caso para 1 , donde lo podemos reescribir como
1 = 1 + (X10 M2 X1 )1 X10 M2 X2 2 + (X10 M2 X1 )1 X10 M2 U
Pero podemos ver que M2 X2 = 0, ademas si tomamos esperanza y dado los
supuestos del enunciado, se concluye que E(i ) = 0, i=1,2
2

4. Demuestre que
V(i ) = u2 (X10 M2 X1 )1 (5 puntos)
Sol: Es facl ver que a partir de la parte c) se puede escribir
1 1 = (X10 M2 X1 )1 X10 M2 U
Luego, para (1 1 )(1 1 )0 , tenemos
(1 1 )(1 1 )0 = (X10 M2 X1 )1 X10 M2 U U 0 M2 X1 (X10 M2 X1 )1
Tomando E() en la expresin anterior, concluimos
5. Suponga ahora que los errores se distribuyen normalmente con media cero
y varianza constante, es decir, U N (0, 2 I). Si usted estima el modelo anterior por Mxima Verosimilitud que forma deben tener 1 y 2 .
Porque? (5 puntos)
Sol:Bajo supuestos de Normalidad, independencia y que adems los errores
se distribuyen identicamente, se tiene que los estimadores de MV coinciden
con los de OLS. Este es un resultado que probamos en clases, donde se
mostr que los estimadores de MCO y de MV coinciden bajo las condiciones
sealadas anteriormente.
6. Suponga ahora que los errores se distribuyen normalmente con media cero,
pero

V(ui ) = i2

Cov(ui , uj ) = 0 i 6= j
Cambian sus conclusiones respecto a la parte e?. (5 puntos)

Sol:Cuando tenemos errores heterocedsticos, se rompe el supuesto de que


sean idenicamente distribuidos. Luego a pesar de ser errores normales y no correlacionados, ya no se distribuyen de manera identica, por lo tanto tenemos que
el resultado de la parte e) no es vlido.

2.

Pregunta 2: Heteroscedasticidad (40 Puntos)


Considere el siguiente modelo:
Y = X + U
donde Y es un vector de dimensin nx1, y X es una matriz de dimensin nxk.

Finalmente, representa el vector de coeficientes a ser estimados (kx1) y U (nx1)


corresponde al trmino de error que tiene la siguiente distribucin U (0, 2 I).
1. Derive la matriz de varianzas y covarianzas del estimador de mnimos cuadrados ordinarios (MCO) de . (5 puntos)
Respuesta. Se sabe que:
M CO = (X 0 X)1 X 0 Y
Reemplazando:
M CO = (X 0 X)1 X 0 (X + U ) = + (X 0 X)1 X 0 U
Despejando:
M CO = (X 0 X)1 X 0 U
Por lo tanto:
(M CO )(M CO )0 = (X 0 X)1 X 0 U U 0 X 0 (X 0 X)1
Aplicando esperanza:
E[(M CO )(M CO )0 ] = (X 0 X)1 X 0 E(U U 0 )X 0 (X 0 X)1
4

E[(M CO )(M CO )0 ] = (X 0 X)1 X 0 2 IX 0 (X 0 X)1


Finalmente:
V ar(M CO ) = 2 (X 0 X)1
A continuacin asuma que: E(U U 0 ) = 2 :
2. Derive la nueva matriz de varianzas y covarianzas del estimador de mnimos
cuadrados ordinarios (MCO) de . (5 puntos)
Respuesta. Retomando el desarrollo anterior:
E[(M CO )(M CO )0 ] = (X 0 X)1 X 0 E(U U 0 )X 0 (X 0 X)1
Sin embargo, ahora se considera que:
E(U U 0 ) = 2
Por lo tanto:
E[(M CO )(M CO )0 ] = (X 0 X)1 X 0 2 X 0 (X 0 X)1
Finalmente:
V ar(M CO ) = 2 (X 0 X)1 X 0 X 0 (X 0 X)1
3. Derive la matriz de varianzas y covarianzas del estimador MCG de . (5
puntos)
Respuesta. Se sabe que:
M CG = (X 0 1 X)1 X 0 1 Y
Reemplazando:
M CG = (X 0 1 X)1 X 0 1 (X + U ) = + (X 0 1 X)1 X 0 1 U
Despejando:
M CG = (X 0 1 X)1 X 0 1 U
5

Por lo tanto:
(M CG )(M CG )0 = (X 0 1 X)1 X 0 1 U U 0 1 X 0 (X 0 1 X)1
Aplicando esperanza:
E[(M CG )(M CG )0 ] = (X 0 1 X)1 X 0 1 E(U U 0 )1 X 0 (X 0 1 X)1
E[(M CG )(M CG )0 ] = (X 0 1 X)1 X 0 1 2 1 X 0 (X 0 1 X)1
Finalmente:
V ar(M CG ) = 2 (X 0 1 X)1
Considere ahora el siguiente modelo de slo dos variables:
Yi = + Xi + Ui
Suponga adems que la heteroscedasticidad toma la siguiente forma:
i2 = 2 Xi2
4. Encuentre E(U U 0 ). (5 puntos)
Respuesta. Como el trmino de error es heteroscedstico y libre de autocorrelacin la matriz de varianza y covarianza de ste toma la siguiente
forma:

2
1

X12

0

.

.. 0
22 0
=
.
...
0
0 ..

0 n2
0

X2 0
1

0 X22 0
0
2
E(U U ) = .
..
.
..
0

0 0
0

0
E(U U 0 ) =
..
.

2 X22

0
...

..
.
= 2

2
Xn

0
..
.
0
2 Xn2

5. Qu transformacin le hara a los datos para llevar a cabo de la estimacin


por MCG? (Ayuda: Recuerde que la matriz P tiene que cumplir lo siguiente
P 0 P = 1 ) (10 puntos)
Respuesta. Se tiene que cumplir lo siguiente:
P 0 P = 1
Dado que:

X2
1

Entonces:

0
..
.

X22

..
0
.

...
0

0 Xn2

1/X12

Por lo tanto:

0
..
.

1/X22
0

0
..
.

0
..
.

0
1/Xn2

1/X12

0
P P =

0
..
.

1/X22
0

0
..
.

0
..
.

0
1/Xn2

De esta manera, se desprende que:

1/X1
0

..

0
1/X2 0
.
P =
..
..
.
.
0
0

0 1/Xn

La transformacin, entonces, sera: X = P X y Y = P Y , donde X es una


matriz de nx2 e Y es un vector de nx1.
7

Considere ahora los siguientes datos:

4 1

6 3

12 15

6. Calcule el estimador de mnimos cuadrados generalizados para y . (10


puntos)
Respuesta. El modelo a estimar es el siguiente:
Yi = + Xi + Ui
Por lo tanto:

P5
x y

= P5i=1
2
i=1 (x )
donde la variable en minsculas denota que se encuentra en desviacin respecto de su media. Finalmente:
1, 22
y:

Y X = 1, 65

3.

Pregunta 3 (40 puntos)

3.1.

Problemas con los datos (20 puntos)

Considere el modelo:
yi = 0 + 1 xi + ui

(1)

donde ui N (0, u2 ). Se sabe que la variable xi est medida con error, de modo
que slo se observa
xi = xi + vi
8

donde vi N (0, v2 ) y es independiente de ui , de xi y de yi .

(a) (3 puntos) Reescriba el modelo en la equacin (1) en funcin slo de las


variables observables y de los trminos de error.

Respuesta:
y i = 0 + 1 x i + ui
= 0 + 1 (xi vi ) + ui
= 0 + 1 x i 1 v i + ui
= 0 + 1 xi + (ui 1 vi )
| {z }
i

yi = 0 + 1 xi + i .

(b) (5 puntos) Muestre que en el modelo en (a) el error est correlacionado con
la variable observable xi . Explique las implicancias de este problema.
Respuesta:
Cov(i , xi ) = Cov(ui 1 vi ,

x i + vi )

= Cov(ui , xi ) + Cov(ui , vi ) 1 Cov(vi , xi ) 1 Cov(vi , vi )


= 0 + 0 1 0 1 v2
Cov(i , xi ) = 1 v2 .
Se observa que el error i est correlacionado con la variable observable xi .
Esto implica que la estimacin por MCO generar estimadores sesgados de
9

los parmetros .

(c) (5 puntos) Explique cmo se podra solucionar el problema en (b).

Respuesta: Una forma de correccin es la utilizacin de variables instrumentales. La idea es utilizar un instrumento en vez de la variable medida
con error. Para ello, se requiere que el instrumento no est correlacionado
con el trmino de error y que el instrumento s est correlacionado con la
variable explicativa para la cual acta como instrumento (la variable medida
con error).

(d) (7 puntos) En el modelo en la equacin (1) considere ahora que slo la variable
dependiene yi est medida con error i N (0, 2 ), el que es independiente
de xi y de ui . Cules son las implicancias de este problema de medicin?
Explique y justifique algebraicamente.
Respuesta: Si slo la variable dependiente est medida con error, se tiene que
slo se observa:
yi = yi + i .
De este modo, el modelo observable es
yi = 0 + 1 xi + ui
yi + i = 0 + 1 xi + ui
yi = 0 + 1 xi + ui i
yi = 0 + 1 xi + (ui i )
| {z }
i

yi = 0 + 1 xi + i .
10

Se tendr entonces que la covarianza entre el trmino de error y las variables


explicativas es igual a cero:
Cov(i , xi ) = Cov(ui i ,

xi )

= Cov(ui , xi ) + Cov(i , xi )
Cov(i , xi ) = 0.
Por lo tanto, no habr problema de sesgo en la estimacin de los parmetros.

3.2.

Prediccin (20 puntos)

(a) (10 puntos) Cuando se analiza la capacidad de prediccin de un modelo en


un perodo en particular, habitualmente se utiliza el ndice Raz del Error
Cuadrtico Medio (Root of Mean Square Error - RMSE) o el Promedio del
Error Absoluto (Mean of Absolute Error - MAE). Defina estos dos ndices
y explique intuitivamente qu significa cada uno de ellos. Qu problema
tienen?

Respuesta: Los ndices se definen como


sP
P
M AE =

ybi )2
n0

i (yi

RM SE =
i

|yi ybi |
n0

donde n0 corresponde al nmero de observaciones sobre las cuales se analiza


la calidad de la prediccin.

El RMSE corresponde a una medida de diferencia de los valores predichos


respecto a los valores verdaderos. Estas diferencias se consideran al cuadrado
11

y luego se calcula la raz para re-escalar el ndice. El ndice MAE es similar,


pero considera el valor absoluto de las diferencias. Ambos ndices calculan
un error promedio en la prediccin para un conjunto de observaciones en
particular (habitualmente un perodo en particular en series de tiempo). El
problema obvio que ambos ndices presentan es que la escala de comparacin
para distintos valores de yi .

(b) (5 puntos) Considere dos modelos


(1)

yt = 0 + 1 x1t + ut

(2)

yt = 0 + 1 x1t + 2 x2t + ut ,

con t = 1 . . . T . Al estimar ambos modelos por MCO se calcula el ndice


RMSE. En el modelo (1) obtiene un RMSE=1.8, mientras que en modelo 2
se obtiene RMSE=1.5. Cul modelo tiene menor error de prediccin? Son
comparables los RMSE?

Respuesta: El modelo (2) tiene menor error de prediccin porque el error


promedio es 1.5, menor a 1.8. Esta comparacin es vlida slo porque se considera el mismo perodo, es decir, el mismo conjunto de observaciones para yt .

(c) (5 puntos) En el modelo en (b), luego de estimar por MCO se calcula el


ndice RMSE para el subperodo ta hasta T para el modelo (1) y se obtiene
RMSE=1.2. Cul modelo es mejor para predecir?

Respuesta: En (a) el ndice RMSE es calculado para toda la muestra, de


modo que para toda la muestra el modelo (2) es mejor para predecir. Sin

12

emabargo, si el objetivo fundamental es predecir slo en el subperodo ta hasta T , el modelo (1) es ms adecuado porque para ese subperodo presenta un
error medio ms bajo.

13

Universidad de Chile
Facultad de Economia y Negocios

PAUTA EXAMEN
Econometra I
Otoo 2006

Profesoras: Javiera Vasquez y Claudia Sanhueza.


Puntaje Total: 88 puntos.
1. (40 puntos) Establezca si cada una de las siguientes afirmaciones es verdadera, falsa o
incierta. Y demuestre su argumento matemticamente.
a) Slo en el caso que se omita una variable que tiene una varianza no constante se
generar el problema de heterocedasticidad, si la variable omitida tiene una varianza
constante no se genera mayor problema.
RESPUESTA:
Supongamos el siguiente modelo:
yi = 0 + 1 xi + ui
en el cual se ha omitido la variable zi , de forma tal que el error del modelo ui tiene
los siguientes componentes:
ui = zi + i

iid

i (0, 2 )

De esta forma la varianza del error del modelo, ui es:


v(ui ) =
v(ui ) =

V (zi ) + V (i )
V (zi ) + 2

Si V (zi ) es constante entonces V (ui ) es constante y el modelo es homocedstico, en el


caso contrario tendremos heterocedasticidad. Por lo tanto, el comente es verdadero.
b) Un tema de preocupacin en anlisis de datos de corte transversal es la medicin
de ciertas variables con error. De echo, cuando una variable es medida con error se
produce sesgo en la estimacin de los parmetros.
RESPUESTA:
Depende, si la variable dependiente esta medida con error no se genera problema de
sesgo, sin embargo, si una o mas variables explicativas estn medidas con error se

genera un problema de sesgo en todos los parmetros del modelo.


Supongamos el siguiente modelo:
yi = 0 + 1 xi + ui
adems tenemos que no observamos yi sino yi que esta medida con error:
yi
yi

yi + i donde i (0, 2 )
yi i

=
=

escribiendo el modelo en funcin de la variable observada:


yi = 0 + 1 xi + ui + i
| {z }
i

donde i cumple con los supuesto tradicionales bajo los cuales MCO es insesgado.
Ahora si xi esta medida con error, de forma tal que observamos xi , tal que:
xi
xi

=
=

xi + i donde i (0, 2 )
xi i

escribiendo el modelo en funcin de la variable observada:


yi
yi

=
=

0 + 1 (xi i ) + ui
0 + 1 xi + (ui 1 i )
{z
}
|
i

como la covarianza entre i y xi es distinta de cero, se rompe el supuesto 6 MCO,


y el estimador de ser sesgado.
Cov(i , xi )

= Cov(ui 1 i , xi + i )
= Cov(ui , xi ) 1 Cov(i , xi ) + Cov(ui , i ) Cov(i , i )
= 0 1 0 + 0 1 2
= 1 2
| {z }
6=0

c) Tanto si existe heterosedasticidad como si hay una variable omitida relevante se


violan los supuestos del modelo de regresin lineal. Por lo tanto, los estimadores
MCO sern sesgados e ineficientes bajo cualquiera de estas circunstancias.
RESPUESTA:
Cuando tenemos heterocedasticidad la varianza del trmino de error deja de ser 2 I
pasando a ser 2 , como el error sigue teniendo valor esperado iguala cero, en estas
circunstancias el estimador MCO sigue siendo insesgado:
=
=
E[]
=
E[]

+ (X 0 X)1 X 0 u
+ (X 0 X)1 X 0 E[u]

Pero la matriz de varianzas y covarianzas de es mayor a 2 (X 0 X)1 , con lo cual


el estimados deja de ser eficiente:
=
V []
=
V []
=
V []

E())
0]
E[( E())(
E[(X 0 X)1 X 0 uu0 X(X 0 X)1 ]
2 (X 0 X)1 X 0 X(X 0 X)1

Ahora cuando omitimos variables relevantes, y si esta variable esta correlacionada


con las variables incluidas en el modelo, se produce un problema de sesgo, pero no
de eficiencia:
Si en el modelo:
Yi = 0 + 1 Xi + ui
Se ha omitido la variable zi , tenemos que el modelo verdadero es:
Yi = 0 + 1 Xi + 2 Zi + i

donde i (0, 2 )

El estimador MCO de 1 se define de la siguiente forma:


P
xi yi
1 = P 2
x
P i
x
i (1 xi + 2 zi + i )
P 2
1 =
x
P i
P

z
i xi
2
i xi

1 = 1 + P 2 + P 2
x
x
P i
P i

z
x
E[
2
i i
i ]xi
E[1 ] = 1 + P 2 + P 2
x
xi
P i

z
x
2
i i
E[1 ] = 1 + P 2
xi
| {z }
6=0

De esta forma el comente es Falso.


d ) Si la correlacin muestral entre dos variables independientes es 0,95 entonces probablemente el estadstico t de MCO no ser vlido (es decir la distribucin no ser una
t bajo H0 ).
RESPUESTA:
Falso, cuando tenemos una alta correlacin entre las variables explicativas del modelo
la matriz (XX) es casi singular (determinante cercano a cero), lo que hace que la
matriz de varianzas y covarianzas de los parmetros MCO 2 (X 0 X)1 sea grande.
Como los estadisticos t para una hiptesis lineal se definen como:
i i
t= q
V (i )
De esta forma, el estadstico t en esta situacin tender a ser mucho ms pequeo,
por ende no se va a rechazar la hiptesis nula en casos que si debera ser rechazada,
se comente ms error tipo II, pero la distribucin del estadstico sigue siendo t.
3

e) Tanto el error de media en una variable dependiente, como si hay una variable omitida
relevante pueden corregirse usando la metodologa de variables instrumentales. Es
ms, este ltimo estimador es insesgado.
RESPUESTA:
Mitad falso mitad verdadero. El error de medida en la variable dependiente no produce sesgo. Por lo tanto no hay para que usar variables instrumentales (IV).
Demostracin en b).
En el caso de variable omitida relevante si hay sesgo y se puede corregir usando IV.
Demostracin: Supongamos el siguiente modelo de regresin simple:
yi = xi + ui
Donde existe una variable hiomitida,
la cual est correlacionada con xi . Es decir

ui = hi + i , donde i es iid 0, 2 . Si existe una variable zi correlacionada con xi


(E (zi xi ) 6= 0) y no correlacionada con ui (E (zi ui ) = 0), o sea no correlacionada con
hi (E (zi hi ) = 0), entonces zi puede ser usada como una variable instrumental para
xi , y IV ser insesgado.
Demostracin. Sabemos que el estimador de variables instrumentales ser:
P
zi yi
IV = P
zi xi
P
zi (xi + ui )
P
=
zi xi
P
zi (hi + i )
P
= +
zi xi
P
P
zi hi
zi i
= + P
+P
zi xi
zi xi
Tomando E (.) tenemos
E (IV )

= + E

zh
z
P i i +E P i i
zi xi
zi xi

Ya que i es iid 0, 2 y E (zi hi ) = 0.


2. (10 puntos) Suponga que el desempleo se puede explicar exclusivamente por el comportamiento del ndice mensual de actividad econmica (IMACEC):
T Dt = + IM ACECt + ut
Ahora plantee un modelo ms general que le permita testear que el impacto del IMACEC
sobre la Tasa de Desempleo difiere entre el primer trimestre y el tercer trimestre del ao.
Sea explcito en como lo testeara.
RESPUESTA:

Definamos las siguientes Dummies:


(
1 primer trimestre: enero, febrero, marzo
d1i =
0
(
1 tercer trimestre: julio, agosto, septiembre
d2i =
0
Entonces el modelo que nos permite testear lo planteado en el enunciado es el siguiente:
T Dt = + IM ACECt + 2 IM ACECt d1i + 3 IM ACECt d2i + ut
As,
E[T Dt |primertrimestre, IM ACECt ] = + IM ACECt + 2 IM ACECt
E[T Dt |tercertrimestre, IM ACECt ] = + IM ACECt + 3 IM ACECt
Entonces debemos realizar el siguiente test de hiptesis:
H0 :

2 = 3

Si se cumplen la hiptesis nula se comprueba que no existe diferencia estadstica entre el


impacto del IMACEC sobre la tasa de desempleo entre el primer y tercer trimestre.
3. (10 puntos) En el siguiente modelo de regresin:
Yi = 1 + 2 Di + ui
donde Y representa el salario por hora, y D es la variable dicotmica, que toma el valor 1 si
es un titulado universitario y 0 si es titulado de educacin media. Utilizando las frmulas
del estimador MCO, demuestre que 1 = Y m y 2 = Y u Y m , donde el subndice m
significa con educacin media y u titulado universitario.
RESPUESTA:
En este modelo se tiene la siguiente matriz de variables explicativas (X):
X = [i D]
donde i es un vector columna de puros unos, y D es la variable dicotmica que toma
valores 1 y 0.
As se definen las siguientes matrices:
0

ii
i0 D
n nu
X 0X =
=
D0 i D0 D
nu nu
0
" PY #
iY
P i
X 0Y =
=
Yi
D0 Y
D=1

donde n es el tamao muestral, nu es la cantidad de individuos con educacin universitaria en la muestra, adems definamos nm como
Pla cantidad de individuos con educacin
media, de forma tal que n = nu +nm . Adems
Yi es la suma de la variable dependiente
D=1

slo para los individuos con la dummy igual a uno, es decir, los con educacin universitaria.
Ahora calculemos la inversa de la matriz (X 0 X):
0

(X X)

1
=
n nu nu nu

nu
nu

nu
n

1
nm
n1m

n1m

n
nu nm )

De esta forma, el estimador MCO es:

(X 0 X)1 X 0 Y =

D=1

nm
P
Yi

Yi

D=0

nm

nm
P
Yi

D=1

nm

Yi

D=0

nm

Yi

D=1

nm

Yi

D=0

nm
Yi

D=0

nm

Ym
YuYm

Yi

Yi

D=1

Yi
nm

nm

Yi

D=1

nu nm

Yi

D=1

n
nu

Yi

nm
P

nu nm

D=0

Yi

D=1

Yi

nm
P
Yi

Yi

D=1

Yi

nu nm

D=0

D=0

nm

D=0
nm

nm
P
Yi

Yi +

D=1

" PY #

P i

Yi =

Yi

D=0

n1m
n
nu nm

D=0

1
nm
n1m

nm
nu

D=1

nu

4. (13 puntos) Sea hijos el nmero de hijos de una mujer y educ los aos de escolaridad de
ella. Un modelo simple que regresiona fertilidad y educacin es:
hijos = 0 + 1 educ + u
en el que u es el error observado.
a) Qu factores contiene u? Es probable que se correlacione con educacin? Que
efectos tendra esto sobre la estimacin de 1 ? Demuestre matemticamente su respuesta.
RESPUESTA:
u contiene todos los factores que tambin determinan la eleccin del nmero de
hijos que tiene una mujer y un trmino de error aleatorio.
6

Si alguno de los factores que contiene u est correlacionado con educ entonces
estimar por MCO entregar estimadores de 1 sesgados. Por ejemplo, el nivel
de ingresos de una mujer tambin afecta en su decisin de si tener hijos o no,
y est altamente correlacionada con educacin. Tambin el estado civil de la
mujer, a mayor educacin de la mujer mayor es la probabilidad de disolucin
matrimonial.
Demostracin.
Sea F es el set de variables omitidas correlacionadas con educacin (E (educ.F ) 6= 0).

1 0
= X0 X
Xy
0

Donde = [0 , 1 ] , X = [1|educ] e y = hijos. Entonces:

1 0

1 0
E () = X0 X
X (X + u) = + X0 X
X (F + )
0 1 0
0 1 0
= + X X
X F + X X
X
1

= + (X 0 X) X 0 F
{z
}
|
6=0

Por lo tanto, 1 estar sesgado.


b) Un anlisis de regresin simple planteara el efecto ceteris paribus de la educacin
en la fertilidad? Explique.
RESPUESTA:
Un anlisis de regresin simple como el que se plantea originalmente (hijos = 0 + 1 educ + u),
asume que un efecto de educ sujeto a una serie de supuestos c/r al error u. Este anlisis ceteris paribus es ms pertinente a un anlisis de regresin lineal mltiple, en el
cual cada parmetro mide el efecto sobre la variable dependiente de alguna variable
independiente, asumiendo constantes todas las otras variable dependientes.
5. (15 puntos) El modelo siguiente permite que el salario adems dependa de los aos de
educacin de ambos padres, denominada educpm:
log(sal) = 0 + 1 educ + 2 educ educpm + 3 exper + 4 antig + u
a) Muestre cul es, en forma decimal, la retribucin de otro ao de educacin en este
modelo. Qu signo esperara de 2 ? Por qu?
RESPUESTA:
La variacin porcentual en los salarios por un ao adicional de educacin es:
%sal
log(sal)
=
= %sal = 1 + 2 educpm
educ
educ = 1
Si la educacin de los padres es mayor mayor probablemente ser la educacin de los
hijos, por lo tanto 2 debera ser positivo.
b) Con datos la ecuacin estimada es:
log(sal)

5, 65 + 0, 047educ + 0, 00078 (educ educpm)


(0,13)

(0,010)

(0,00021)

+0, 019exper + 0, 010antig + u


(0,004)

(0,003)

n=722, R2 =0,169
Interprete el coeficiente del trmino de interaccin. (Ayuda: elegir dos valores especficos de educpm y comparar efecto de educ)
RESPUESTA:
Un ao adicional de educacin implica 0, 047 + 0, 00078 educpm % ms de salarios.
Es decir una persona cuyos padres tienen 18 aos de educacin tiene un retorno a la
educacin total de 0, 047 + 0, 00078 18.
Una persona cuyos padres tiene en promedio 17 aos de educacin tienen un retorno
a la educacin de 0, 047 + 0, 00078 17.
La diferencia es de 0, 00078.
Es decir, un ao adicional en la educacin de los padres reporta 0,00078 ms de
log(sal), esto es 0, 078 % ms de salario.
c) Cuando educpm se agrega como una variable adicional en la ecuacin, obtenemos:
log(sal) =

4, 94 + 0, 97 educ + 0, 033educpm
(0,38)

(0,027)

(0,017)

+0, 0016 (educ educpm) + 0, 020exper


(0,0012)

(0,004)

+0, 010antig + u
(0,003)

n=722, R2 =0,174
El salario depende ahora de manera positiva de la educacin de los padres? Pruebe
la hiptesis nula de que el salario no depende de la instruccin de los padres.
RESPUESTA:
Si, ahora el salario depende en forma positiva e independiente de la educacin de los
padres.
log(sal)
= 0, 033 + 0, 0016 educ
educpm
Probando la hiptesis nula de que el salario no depende de la instruccin de los
padres.
Primero, en esta estimacin ambas variables relacionadas con la educacion de los
padres son no significativas en forma independiente. Los valores de los test t respectivos son:
t = 0, 033/0, 017 = 1, 94
t = 0, 0016/0, 0012 = 1, 33
Ambos son menores a 1,96 que es el valor del test t al 95 % de confianza con muchas
observaciones. Sin embargo, antes cuando estaba solamente la variable interactiva
esta era significativa al 95 %, 0,00078/0,00021=3,71.
Por lo tanto, la educacin de los padres en forma independiente no es significativa,
pero en forma interactiva si lo es. El efecto de la educacin de los padres es a travs
de que afectan la educacin de los hijos. Pero no tienen un efecto directo en que
los hijos tengan mayores salarios. Esta ltima hiptesis sera verdad si, por ejemplo,
padres ms educados tienen ms networks (pitutos) para que sus hijos tengan mejores
trabajos y por lo tanto mejores salarios.
8

Adicionalmente uno podra testear la hiptesis de que ambos parmetros en conjunto


sean cero, pero esto no se puede hacer con los datos entregados.
H0 : educpm = 0 y educeducpm = 0
Hipotesis conjunta de que ambos parametros sean cero. Un subconjunto de las pendientes del modelo son cero. Para testear esto se ocupa un test F, el cual es:
F =

(b
u0 u
b u
b0 u
b) /k2
F(k2 ,nk)
0
u
bu
b/ (n k)

donde u
b denotan los residuos MCO restringidos (donde k2 representa el nmero de
regresores del modelo restringido o sin las dos variables asociadas a la educacin de
los padres), mientras que u
b representan los residuos del modelo MCO original.

Econometra
Facultad de Economa y Negocios
Universidad de Chile
Pauta Examen

Semestre: Primavera 2007


Profesores: Jos Miguel Benavente, Rodrigo Montero
Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros
Tiempo de duracin: 150 minutos
No hay preguntas de ningn tipo para los ayudantes
Est permitido utilizar calculadora

1.

Teora (40 puntos)

La empresa Gini est evaluando implementar una nueva estructura de remuneraciones, para lo cual es fundamental entender primero cmo se determinan en la
actualidad los salarios de sus trabajadores. Es por ello que han decidido contratarlo
a usted, flamante ex-alumno del curso de econometra 1 para que les ayude en el
anlisis economtrico de su problema. Con el objetivo de abordar adecuadamente el
problema planteado, usted propone estimar la siguiente ecuacin:
wi = 0 + 1 Si + 2 Xi + i
donde wi representa el logaritmo del salario que percibe el trabajador i, Si corresponde a los aos de escolaridad del trabajador, Xi son los aos que lleva el trabajador en la empresa Gini (antiguedad), y finalmente, i corresponde a un trmino
de error con media cero y varianza 2 .
1. Analice si en este modelo se est omitiendo alguna variable relevante. Adems,
establezca cules seran las consecuencias sobre la estimacin de los parmetros
(por MCO) de dicha omisin. (8 puntos)
Respuesta. El modelo planteado omite claramente algunas variables que son
relevantes, como por ejemplo, la habilidad, la antiguedad al cuadrado (para
ver perfil creciente o decreciente de la experiencia), y variables que reflejen
caractersticas cualitativas como gnero.
Por lo tanto, la estimacin por MCO ser sesgada; la direccin de este sesgo
depender de la correlacin de la posible variable omitida con las variables
explicativas y con la variable dependiente del modelo.
2. Explique al menos dos procedimientos que usted utilizara para detectar la
presencia de heteroscedasticidad en los residuos. En caso de haberla, cules
1

seran las consecuencias sobre la estimacin de MCO? Cmo podra corregir


el problema? (8 puntos)
Respuesta. Se deben mencionar y describir brevemente dos de los siguientes
tests: White, Goldfeld y Quandt, Breusch-Pagan, Glesjer.
La estimacin por MCO no ser sesgada, sin embargo, las varianzas s sern
sesgadas.
3. Usted observa en los datos que existe un elevado grado de asociacin (negativo) entre la variable antiguedad y escolaridad del trabajador. Cmo podra
usted determinar si tiene en verdad un problema de multicolinealidad en los
datos? En caso de haberla, cules seran las consecuencias para la estimacin
de MCO. (8 puntos)
Respuesta. Se debe mencionar y describir el test de Belsey y uno o ms
sntomas que indiquen la presencia de multicolinealidad. Algunos de ellos podran ser: R2 alto con coeficientes estadsticamente no significativos, pequeo
cambio en los datos produce grandes variaciones en estimaciones por MCO, y
coeficientes con signos y magnitudes distintas a las esperadas.
En presencia de multicolinealidad, MCO sigue siendo MELI, sin embargo, las
varianzas sern muy grandes.
4. Suponga que es posible clasificar a los trabajadores de la empresa Gini en
tres categoras: operarios, personal administrativo y profesionales. Explique
detalladamente cmo podra incorporar esta informacin al modelo planteado
originalmente. (8 puntos)
Respuesta. Se deben definir detalladamente las variables dummies a incorporar: una para cada categora (1 si pertenece a ella y 0 en caso contrario).
En caso de incoporar las tres variables dummies (hay tres categoras de trabajadores) se debe dejar fuera del modelo la constante.
5. Suponga que usted no est seguro con cul de ambas especificaciones quedarse,
es decir, la que excluye la informacin planteada en la pregunta anterior, o bien,
aquella que explcitamente la incluye (tipo de trabajador: operarios, personal
administrativo y profesionales). Cmo podra determinar usted qu especificacin es mejor? (8 puntos)
Respuesta. Se debe notar que el modelo 1 est anidado en el modelo planteado en la pregunta anterior, por ende, es posible utilizar los denominados criterios de informacin, como el criterio de Akaike y Schwarz. Se escoge el modelo
que minimice el criterio de informacin.

2.

Ejercicios (50 puntos)

1. (25 puntos) Considere el siguiente modelo con perturbaciones no esfricas, para


el cual usted dispone de cuatro observaciones:
Yi = 0 + 1 Xi + ui

donde var(ui ) = i 2 , y 1 =1; 2 =2; 3 =3; 4 =4. Por otro lado, se tiene lo
siguiente: Yi =(3,6,9,12), y Xi =(1,2,4,5). Estime los parmetros 0 y 0 por el
mtodo de mnimos cuadrados ordinarios.
Respuesta.
bM CG = (X 0 1 X)1 X 0 1 Y

1 1
1 2

X =
1 4
1 5

3
6

Y =
9
12
= V ar() = E(0 )

1 0 0 0
0 2 0 0

= 2
0 0 3 0
0 0 0 4

1 0 0 0
0 2 0 0

= 2
0 0 3 0
0 0 0 4

1 0 0 0
1

1
0 2 01 0
1 =

2
0 0 3 0

0 0 0 14
Por lo tanto, sustituyendo con lo anterior, se pueden obtener los de mnimos
cuadrados generalizados:


1, 066
b
M CG =
2, 133
2. (25 puntos) Las ventas de gasolina en una determinada zona geogrfica se
modelaron a travs de la siguiente especificacin:
= 70 0, 01P + 0, 2Y 1, 5S1 + 3, 6S2 + 4, 7S3
Q
donde Q representan las ventas, P es el precio, Y corresponde al ingreso
disponible, y Si son variables dummies trimestrales (i=1,2,3,4). Los valores
esperados para Y y P para el prximo ao vienen dados por:
Trimestre
P
Y

1
110
100

2
116
102

3
122
104

4
114
103

a) Calcule las ventas esperadas para para cada trimestre del prximo ao.
(7 puntos)
Respuesta. Las ventas esperadas para cada trimestre del prximo ao
vienen dadas por:
1 = 70 0, 01P1 + 0, 2Y1 1, 5 = 87, 4
Q
2 = 70 0, 01P2 + 0, 2Y2 + 3, 6 = 92, 84
Q
3 = 70 0, 01P3 + 0, 2Y3 + 4, 7 = 94, 28
Q
4 = 70 0, 01P4 + 0, 2Y4 = 89, 46
Q
b) Otro investigador propone utilizar los mismos datos para estimar una
ecuacin igual que la anterior, pero desea utilizar las variables dummies
S2 , S3 y S4 . Encuentre los coeficientes asociados a esta especificacin. (9
puntos)
Respuesta. Este investigador propone el siguiente modelo:
Q = 1 + 2 S2 + 3 S3 + 4 S4 + P + Y
Adems, se sabe que la siguiente identidad se cumple para estos datos:
S4 = 1 S1 S 2 S3
Luego, reemplazando en la ecuacin anterior:
Q = 1 + 2 S2 + 3 S3 + 4 (1 S1 S2 S3 ) + P + Y
Reagrupando trminos:
Q = (1 + 4 ) 4 S1 + (2 4 )S2 + (3 4 )S3 + P + Y
que corresponde a la regresin original. Por lo tanto, haciendo uso de la
estimacin original, se tiene que:
1 + 4 = 70
4 = 1, 5
2 4 = 3, 6
3 4 = 4, 7
= 0, 01
= 0, 2
As, los coeficientes estimados por este investigador sern: 1 = 68,5; 2
= 5,1; 3 = 6,2; 4 = 1,5; = -0,01 y = 0,2.

c) Un tercer investigador propone utilizar las cuatro variables dummies: S1 ,


S2 , S3 y S4 . Encuentre los coeficientes asociados a esta estimacin. (9
puntos)
Respuesta. El modelo a estimar utilizando las cuatro variables dummies
es el siguiente:
Q = 1 S1 + 2 S2 + 3 S3 + 4 S4 + P + Y
Haciendo uso de la misma identidad que en la pregunta anterior:
Q = 4 + (1 4 )S1 + (2 4 )S2 + (3 4 )S3 + P + Y
que corresponde a la regresin original. Por lo tanto, haciendo uso de los
resultados de la estimacin original, se tiene que la estimacin llevada a
cabo por este tercer investigador ser: 1 = 68,5; 2 = 73,6; 3 = 74,7;
4 = 70; = -0,01 y = 0,2.

3.

(40 puntos) Analtico


Con datos para 100 firmas se ha estimado la siguiente relacin:
Yi = + Xi + i

donde Yi es el logaritmo del salario promedio anual de los gerentes de la firma i, y


Xi es el logaritmo de las utilidades (beneficios anuales). El siguiente grfico muestra
la dispersin de las observaciones (se han eliminado los datos correspondientes a
cuatro firmas pues tenan utilidades negativas en el ao en cuestin):
Figura 1: Salarios de gerentes y utilidades de la empresa
8.5

LOGSALARY

8.0

7.5

7.0

6.5
0

LOGPROFIT

10

12

Los resultados de la estimacin son los siguientes:


Figura 2: Determinantes de los salarios de los gerentes
Dependent Variable: LOGSALARY
Method: Least Squares
Sample(adjusted): 5 100
Included observations: 96 after adjusting endpoints
Variable
Coefficient
Std. Error
t-Statistic
C
6.350.338
0.128961
4.924.249
LOGPROFIT
0.162212
0.021984
7.378.765
R-squared
0.366774
Mean dependent var

Prob.
0.0000
0.0000
7.269.493

Adjusted R-squared

0.360037

S.D. dependent var

0.408740

S.E. of regression

0.326982

Akaike info criterion

0.622791

Sum squared resid

1.005.023

Schwarz criterion

0.676215

Log likelihood

-2.789.396

F-statistic

5.444.617

Durbin-Watson stat

2.233.248

Prob(F-statistic)

0.000000

1. Note que se han dejado fuera cuatro observaciones para llevar a cabo la estimacin, por qu? (8 puntos)
Respuesta. Se dejaron fuera pues las utilidades de esas cuatro empresas eran
negativas (prdidas), por lo tanto, la funcin logaritmo se indefine.
2. Son estadsticamente significativos los coeficientes estimados? Tiene el signo esperado? (8 puntos)
Respuesta. Son estadsticamente significativos, lo cual se desprende del pvaue (menor a 0,05), o bien, del cuociente entre el valor estimado del coeficiente y la desviacin estndar del mismo (cuyo valor es mayor que 1,97).
3. Segn los resultados del test de Ramsey RESET, habra un problema de especificacin del modelo? (8 puntos)

Figura 3: Test de Ramsey RESET


Ramsey RESET Test:
F-statistic
0.878905
Probability
Log likelihood ratio
0.902997
Probability
Test Equation: Dependent Variable: LOGSALARY

0.350930
0.341979

Method: Least Squares


Sample: 5 100 ; Included observations: 96
Variable

Coefficient

Std. Error

t-Statistic

Prob.

-5.981.640

1.315.475

-0.454713

0.6504

LOGPROFIT

-0.582640

0.794813

-0.733053

0.4654

FITTED^2

0.312867

0.333725

0.937499

0.3509

Respuesta. Este test fue diseado originalmente para detectar la omisin de


variables relevantes en el modelo (Xs). Sin embargo, en la prctica ha resultado muy til para detectar no linealidades presentes en el modelo. El p-value
del test es mayor que 0,05 por lo tanto, no se puede rechazar la hiptesis nula
de que el modelo est bien especificado.
4. Segn los resultados del test de White sobre heteroscedasticidad, existe un
problema de este tipo en los residuos? (8 puntos)
Figura 4: Test de heteroscedasticidad de White
White Heteroskedasticity Test:
F-statistic
0.589335
Obs*R-squared
1.201.465

Probability
Probability

0.556754
0.548410

Test Equation: Dependent Variable: RESOLS^2


Method: Least Squares
Sample: 5 100 ; Included observations: 96
Variable

Coefficient

Std. Error

t-Statistic

Prob.

-0.032151

0.140858

-0.228249

0.8200

LOGPROFIT

0.048798

0.046586

1.047.494

0.2976

LOGPROFIT^2

-0.004059

0.003746

-1.083.502

0.2814

R-squared

0.012515

Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puede
rechazar la hiptesis nula de que los residuos del modelo son homoscedsticos.
5. Segn los resultados del test de Breusch-Godfrey sobre correlacin serial, ex7

iste un problema de este tipo en los residuos? (8 puntos)


Figura 5: Test de autocorrelacin serial de BreuschGodfrey
Breusch-Godfrey Serial Correlation LM Test:
F-statistic
0.759000
Probability
Obs*R-squared
1.558.288
Probability
Test Equation: Dependent Variable: RESOLS
Method: Least Squares
Variable
Coefficient
Std. Error

0.471043
0.458798

t-Statistic

Prob.

-0.005453

0.129438

-0.042130

0.9665

LOGPROFIT

0.001021

0.022068

0.046281

0.9632

RESOLS(-1)

-0.119031

0.104460

-1.139.490

0.2575

RESOLS(-2)

0.035061

0.105207

0.333255

0.7397

R-squared

0.016232

Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puede
rechazar la hiptesis nula de que los residuos no estn autocorrelacionados.

ECONOMETRIA I
PROFESORA: JAVIERA VASQUEZ
Pauta Examen

I. Comentes (25 puntos)

I.1. El estimador MCO es el mejor estimador siempre que se cumpla el supuesto de


normalidad en el trmino de error, de no ser as es preferible el estimador Mximo
Verosmil. Comente.
Respuesta:
Falso, para que MCO sea el mejor estimador LINEAL INSESGADO se requiere slo
que el error sea independiente e idnticamente distribuido, el supuesto de
normalidad slo es necesario para la inferencia y predicciones. Por el contrario, el
estimador Mximo Verosmil SI requiere el supuesto de distribucin del trmino de
error (ya sea normal o alguna otra) para la estimacin. El estimador MV es preferible
cuando la muestra es grande y el modelo no es lineal.
I.2 Suponga que Ud. esta interesado en estimar la demanda por entradas al
concierto de The Police, Qu problemas puede presentar en la estimacin de esta
demanda?Qu metodologa es la ms apropiada en este caso?
Respuesta:
Para estimar la demanda por el concierto de The Police podemos utilizar la demanda
por artistas similares y ver que ha pasado cuando se han realizado estos conciertos,
es decir, podemos tomar datos de nmero de personas en conciertos con
caracterstica similares y tratar de explicarlo por el da que se realiza, cantidad de
conciertos en la misma semana, etc. El problema es que la variable dependiente,
nmero de personas en el concierto, en algunos casos puede estar censurada ya que
para algunos conciertos puede que la demanda haya sido mayor a la capacidad el
Estadio Nacional (agotndose las entradas), para todos estos conciertos donde se
agotaron las entradas la variable dependiente esta censurada a partir de la
capacitada del estadio (80.000 personas). La metodologa de estimacin ms
apropiada en este caso es el modelo Tobit, que considera dentro de la estimacin la
probabilidad de estar censurado.
I.3 El nico problema de estimar por MCO un modelo de probabilidad (donde la
variable dependiente es binaria) es que las predicciones de la probabilidad pueden
estar fuera del rango [0,1]. Comente.
Respuesta:
Si bien este es un problema del modelo de probabilidad lineal no es el nico, dos
problemas adicionales es que el modelo de probabilidad tiene heterocedasticidad, y
1

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

que MCO cumple con las caractersticas deseable cuando el modelo lineal, supuesto
que no se cumple en los modelos de probabilidad, no incluir la no linealidad es
equivalente a omitir una variable relevante generando sesgo en la estimacin.
I.4 Si en la estimacin de un modelo de regresin de la forma Yt=Xt+ut el
estadstico de Durban-Watson nos indica presencia de autocorrelacin, bastar con
incluir la variable dependiente rezada un periodo como regresor para solucionar
definitivamente el problema. Comente.
Respuesta:
Falso, la autocorrelacin puede ser provocada por dos cosas: si la variable
dependiente tiene una tendencia y esta no esta siendo capturada por las variables
explicativas y por un patrn dinmico omitido. En el primer caso incluir la variable Yt1 como regresor no soluciona el problema, en el segundo caso puede que al incluir un
rezago de la variable dependiente se solucione el problema de autocorrelacin si es
que esta es de orden 1, pero si la autocorrelacin es de un orden superior habr que
incluir ms rezagos de la variable dependiente como regresor.

I.5 Indique cuales son los problemas en la estimacin MCO que generan problema de
slo problemas de sesgo e inconsistencia, y cuales generan slo problemas de
eficiencia.
Respuesta:
Problemas de sesgo/inconsistecia:

Omisin de variables relevantes


Error de medicin en las variables explicativas
No linealidades omitidas

Problemas de eficiencia:

Inclusin de variables irrelevantes


Multicolinealidad
Heterocedasticidad/autocorrelacin

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

II. Demostracin (20 puntos)

Considere el
explicativas:

siguiente modelo de regresin mltiple que contiene tres variables

Yi = 0 + 1 X 1 + 2 X 2 + 3 X 3 + ui
Pero Ud. esta interesado en estimar
(=1+2).

la suma de los parmetros de X1 y X2

(i)

Muestre que = 1 + 2 es un estimador insesgado de .

(ii)

Encuentre la Var () en trminos de Var ( 1 ) , Var ( 2 ) , y corr ( 1 , 2 )

Respuesta:
(i)

Te tiene que demostrar que:

E[] =
E[ 1 + 2 ] = 1 + 2
Para lo cual hay que demostrar que los estimadores de 1 y 2 son insesgados.
El modelo anterior se puede escribir como Y=X+u, donde es un vector que
contiene los cuatro parmetros del modelo, y X una matriz que contiene las tres
variables explicativas del modelo ms una columna de unos que representa la
constante. El estimador MCO del modelo es:

= ( X ' X ) 1 X 'Y
Reemplazando Y por la especificacin poblacional del modelo, se tiene:

= ( X ' X ) 1 X ' ( X + u )
= ( X ' X ) 1 X ' X + ( X ' X ) 1 X ' u
= + ( X ' X ) 1 X ' u
Tomando valor esperado a la expresin anterior, y bajo los supuestos clsicos del
modelo MCO, que el error es bien comportado, se obtiene que el estimador es
insesgado.

E[ ] = + ( X ' X ) 1 X ' {
E[u ]
0

E[ ] =
3

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Por lo tanto,

E[ 1 ] = 1
E[ 2 ] = 2
E[ 1 + 2 ] = 1 + 2
E[] =
(ii)

La varianza del estimador de equivale a:

V () = E[ E ()]2
Como acabamos de demostrar que el estimador es insesgado:

V () = E[ ]2
Ahora reemplazando en funcin de los coeficientes s:

V () = E[ 1 + 2 ( 1 + 2 )]2
Reorganizando trminos, elevando al cuadrado y aplicando valor esperado:

V () = E[ 1 + 2 ( 1 + 2 )]2
V () = E[( 1 1 ) + ( 2 2 )]2
V () = E[( 1 1 ) 2 + 2( 1 1 ) ( 2 2 ) + ( 2 2 ) 2 ]
V () = E[( 1 1 ) 2 ] + 2 E[( 1 1 ) ( 2 2 )] + E ( 2 2 ) 2 ]
V () = V ( 1 ) + 2 cov(1 , 2 ) + V ( 2 )
III. Ejercicio matemtico (20 puntos)

Suponga que una variable aleatoria Y tiene la siguiente funcin de distribucin de


probabilidad:

Pr(Y = 1) = p

f (Y ) = Pr(Y = 2) = q
Pr(Y = 3) = 1 p q

Considerando esta funcin de distribucin de probabilidad se toma una muestra


aleatoria con n observaciones denotadas como Y1, Y2,, Yn.
4

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

(i)

Derive la funcin de verosimilitud de los parmetros p y q.

Respuesta:
Sea n1 el nmero de observaciones donde Y=1, n2 el nmero de observaciones
donde Y=2, y por lo tanto n-n1-n2 el nmero de observaciones donde Y=3. Entonces
la distribucin de probabilidad conjunta de las n observaciones se puede escribir de
la siguiente forma:
n

Pr(Y1 = y1 , Y2 = y 2 ,..., Yn = y n ) = Pr(Yi = yi ) = p n1 q n2 (1 p q ) n n1 n2


i =1

As, la funcin de verosimilitud esta representada por la funcin anterior pero


tratando a p y q como parmetros desconocidos.
(ii)

Derive los estimador mximo verosmil de p y q

Respuesta:
Aplicando logaritmo natural a la expresin encontrada en la parte (i) obtenemos la
log-likelihood a optimizar con respecto a p y q:

l = ln L = n1 ln( p ) + n2 ln(q ) + (n n1 n2 ) ln(1 p q )


Tomando derivadas parciales con respecto a p y q:

l n1 n n1 n2
=
p p (1 p q )
l n2 n n1 n2
=
p q (1 p q )
Haciendo ambas ecuaciones iguales a cero (condiciones de primer orden) y
resolviendo se obtienen los estimadores MV de p y q:

n1 n n1 n2
=0

p (1 p q )
n2 n n1 n2
( 2)

=0
q (1 p q )
(1)

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

De (1):

n1 (1 p q) p(n n1 n2 ) = 0
n1 n1 p n1q np + n1 p + n2 p = 0
n1 n1q np + n2 p = 0 (3)
Adicionalmente restando (2) de (1):

n1 n2
=0
p q
n
q = 2 p ( 4)
n1
Reemplazando (4) en (3):

n1 n1

n2
p np + n2 p = 0
n1

n1 np = 0
p MV =

n1
n

Y reemplazado la ltima expresin en (4):

q MV =

n2
n

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

IV. Ejercicios prcticos (70 puntos)

Ejercicio 1 (20 puntos): Suponga que Ud. es el secretario de estudios de la FEN y


esta interesado en evaluar el impacto de distintos profesores sobre el rendimiento de
los alumnos. Especficamente se debe concentrar en un ramo, por ejemplo,
Econometra y plantear una metodologa que le permita evaluar en forma
cientficamente correcta el efecto profesor sobre el rendimiento de los alumnos en
esta asignatura. Sea especifico en como lo hara: datos, variables, mtodo de
estimacin, etc; que problemas puede enfrentar, es decir, que puede amenazar la
validez interna y/o externa de sus resultados.
Respuesta:
La mejor forma cientfica de evaluar el efecto del profesor sobre el rendimiento de
los alumnos es disear un experimento donde los alumnos sean asignados
aleatoriamente a un profesor u otro. Supongamos que especficamente estamos
interesados en evaluar el desempeo del profesor 1, por lo cual se asignarn
aleatoriamente cierta cantidad de alumnos a este profesor, los que sern parte del
grupo de tratamiento, y los restantes alumnos que fueron asignados al otro profesor
representan el grupo de control. La variable de resultado es el promedio del curso.
Es importante para que los resultados de ambos grupos sean comparables y midan
exactamente el efecto del profesor las evaluaciones, clases y ayudantes tienen que
ser exactamente iguales, de esta forma la nica fuente de variacin es como el
profesor explica la materia a sus alumnos.
De esta forma, para estimar el efecto del profesor 1 sobre el rendimiento de los
alumnos se debe definir la siguiente variable binaria:

1 si es alumno del profesor 1


T =
0 si es alumno del profesor 2
Y se debe estimar entonces el siguiente modelo de regresin:

Pi = 0 + 1Ti + X i + ui
Donde 1 mide el efecto causal del profesor 1 sobre el promedio de los alumnos (P),
adems se deben incluir otras variables explicativas que permita limpiar por
cualquier cosa que haya afectado la aleatoriedad completa del experimento. La
comparacin de la estimacin del efecto causal sin otros regresores y con otros
regresores ayuda a ver si existieron estas amenazas en el diseo experimental.
Potenciales amenazas a la validez interna de los resultados:
-

Que los alumnos no sean asignados 100% en forma aleatoria sino por
rendimiento
7

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Fallas en seguir el protocolo de tratamiento: pueden existir alumnos


que quieran tomar con profesor 1 o 2 y hagan valer su prioridad para
que se les sea concedido el profesor que deseen. O que se cambien de
seccin despus de la asignacin.
Atricin: Alumnos que abandonan el curso, ya sea del grupo de control
o tratamiento, por bajo rendimiento, carga acadmica o problemas
mdicos. Si la atricin no es aleatoria generar sesgo en la muestra
resultante al final del experimento.
Efecto experimental: si se le indica a los alumnos que estn siendo
sometidos a un experimento, estos consiente o inconscientemente
tendern a cambiar su comportamiento.
Muestras pequeas: El mximo nmero con que podr contar cada
curso es 60 alumnos, un tamao muestral bastante reducido que
incluso puede ser menor si menos alumnos toman el ramo en el
semestre.

Potenciales amenazas a la validez externa de los resultados:


-

Muestra no representativa: se tiene que elegir un semestre que


corresponda al de la malla de los alumnos, no puede ser semestre de
verano, ni el semestre donde toma la gente que repite el curso.

Ejercicio 2 (50 puntos): El siguiente cuadro muestra la estimacin de una modelo


de retorno a la educacin para las mujeres en la fuerza de trabajo. Donde la variable
dependiente es el logaritmo del salario por hora, el que ha sido regresionado contra
los aos de escolaridad (educ), la experiencia (exper), experiencia al cuadrado
(expersq), ingreso familiar excluyendo su salario en miles de pesos (nwifeinc), la
edad (age), nmero de hijos menores de 6 aos (kidslt6), y nmero de hijos entre 6
y 18 aos (kidsge6).
Source |
SS
df
MS
-------------+-----------------------------Model | 36.6476796
7
5.2353828
Residual | 186.679761
420 .444475622
-------------+-----------------------------Total | 223.327441
427 .523015084

Number of obs
F( 7,
420)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

428
11.78
0.0000

.66669

-----------------------------------------------------------------------------lwage |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------educ |
.0998844
.0150975
.0702084
.1295604
exper |
.0407097
.0133723
.0144249
.0669946
expersq | -.0007473
.0004018
-1.86
0.064
-.0015371
.0000424
nwifeinc |
.0056942
.0033195
1.72
0.087
-.0008307
.0122192
age | -.0035204
.0054145
-0.65
0.516
-.0141633
.0071225
kidslt6 | -.0558725
.0886034
-0.63
0.529
-.2300339
.1182889
kidsge6 | -.0176484
.027891
-0.63
0.527
-.0724718
.0371749
_cons | -.3579972
.3182963
-1.12
0.261
-.9836494
.2676551
------------------------------------------------------------------------------

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Con respecto a esta estimacin:


(i)

Complete la informacin faltante (5 puntos)

El R2 del modelo representa la proporcin de la varianza de la variable


dependiente que es explicada por la varianza de las variables explicativas, de
esta forma corresponde a la razn entre la suma al cuadrado (SS) del modelo y
la suma al cuadrado total:

SSM 36.6476796
=
= 0.16409842
SST
223.327441
SSR /(n k )
0.44447562/420
R 2 = 1
= 1
= 0.15016672
SST /(n 1)
0.52301508/427
0.0998844
t educ =
= 6.6159563
0.0150975
0.0407097
t expr =
= 3.0443304
0.0133723
R2 =

(ii)

Qu puede decir sobre la bondad de ajuste del modelo? (5 puntos)

Con respecto a la bondad de ajuste del modelo, tanto el R-cuadrado como el Rcuadrado ajustado indican que las variables explicativas del modelo explican slo
un 15% del comportamiento de la variable dependiente, lo que es relativamente
bajo pero no despreciable.
(iii)

Qu puede decir sobre la significancia del retorno a la educacin? (5


puntos)

Comparando el estadstico calculado (6.62) con el valor de tabla se rechaza la


hiptesis nula de que el coeficiente sea igual a cero. Lo mismo se puede concluir
al observar que el cero no esta incluido en el intervalo de confianza. De esta
forma los aos de escolaridad es una variable estadsticamente significativa para
explicar el logaritmo del salario de las mujeres.
(iv)

Qu problemas presenta la estimacin anterior? (5 puntos)

La estimacin anterior presenta sesgo de seleccin, ya que slo se esta utilizando


a las mujeres que trabajan en la estimacin no tenemos antecedentes de
ingresos de las mujeres que no participan en el mercado del trabajo, esto hace
que la distribucin de la variable dependiente este truncada.

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

La siguiente tabla muestra una estimacin alternativa del mismo modelo.


Heckman selection model
(regression model with sample selection)

Log likelihood = -883.8828

Number of obs
Censored obs
Uncensored obs

=
=
=

753
325
428

Wald chi2(7)
Prob > chi2

=
=

75.37
0.0000

-----------------------------------------------------------------------------|
Coef.
Std. Err.
z
P>|z|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lwage
|
educ |
.1066795
.0208209
5.12
0.000
.0658713
.1474876
exper |
.0406657
.0132436
3.07
0.002
.0147088
.0666226
expersq | -.0007457
.0003979
-1.87
0.061
-.0015255
.0000341
nwifeinc |
.0047293
.0038863
1.22
0.224
-.0028877
.0123463
age | -.0049886
.0062221
-0.80
0.423
-.0171837
.0072064
kidslt6 | -.0974594
.1250796
-0.78
0.436
-.3426109
.1476921
kidsge6 | -.0191121
.0278513
-0.69
0.493
-.0736996
.0354754
_cons |
-.40472
.3311825
-1.22
0.222
-1.053826
.2443857
-------------+---------------------------------------------------------------select
|
educ |
.1568112
.0240434
6.52
0.000
.109687
.2039355
nwifeinc | -.0209167
.0045791
-4.57
0.000
-.0298915
-.0119418
age |
-.034533
.007576
-4.56
0.000
-.0493817
-.0196843
kidslt6 | -.8921331
.1144159
-7.80
0.000
-1.116384
-.6678821
kidsge6 | -.0385341
.0404704
-0.95
0.341
-.1178545
.0407864
_cons |
.4155959
.4726033
0.88
0.379
-.5106895
1.341881
-------------+---------------------------------------------------------------/athrho |
.121872
.2608112
0.47
0.640
-.3893085
.6330525
/lnsigma | -.4109284
.0383022
-10.73
0.000
-.4859993
-.3358574
-------------+---------------------------------------------------------------rho |
.1212722
.2569754
-.3707639
.5601505
sigma |
.6630344
.0253957
.6150822
.714725
lambda |
.0804076
.1717962
-.2563066
.4171219
-----------------------------------------------------------------------------LR test of indep. eqns. (rho = 0):
chi2(1) =
0.17
Prob > chi2 = 0.6777
------------------------------------------------------------------------------

Al respecto se le pide que conteste las siguientes preguntas:


(v)

De que manera esta estimacin soluciona el problema mencionado en la


parte (iv)?. Explique tericamente. (15 puntos)

Lo que hace la estimacin es estimar el modelo original pero corrigiendo por el


problema de truncamiento de la variable dependiente, sabemos que cuando la
variable esta truncada la media de la variable cambia agregndole el inverso de
mill evaluado en el punto de truncamiento. En los modelos de sesgo de seleccin
o truncamiento incidental el inverso de mill no se evalua en un punto fijo sino que
en una set de variables explicativas por sus respectivos coeficientes que son los
que determinan la probabilidad de estar o no truncado.
La ecuacin que se estima y que corrige el problema de sesgo de seleccin es la
siguiente:
10

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

E[Yi | X i , Z i , S = 1] = X i + ( Z i )
Donde S es la variable indicador de seleccin, cuya probabilidad de que sea igual
a uno es estimada utilizando las variables Z, y son los coeficientes de esta
estimacin. La variable () es el IMR que corrige el problema de truncamiento
pero no basado en un umbral fijo, sino con las variables que determinan la
probabilidad de seleccin. El no incorporar la variable lambda o inverso de mill
equivale a omitir una variable relevante por lo que los parmetros sern
sesgados en la medida que exista una correlacin importante entre la variable
omitida y las variables incluidas en la estimacin y en la medida que la variable
omitida sea realmente relevante (o sea significativa).
En la tabla anterior veamos que la educacin, ingreso familiar, edad y nmero de
hijos menores de 6 aos son importantes para explicar la probabilidad de que la
mujer trabaje o no.
(vi)

Por qu cambia la estimacin del retorno a la educacin?esta siendo sub


o sobre estimado?porque? (10 puntos)

Vemos que el retorno a la educacin cambia marginalmente entre una estimacin


y otra, en la primera estimacin el coeficiente estaba siendo subestimado
indicando que la correlacin entre el inverso de mill y educacin es negativa. Esto
se debe a que a mayor aos de escolaridad la probabilidad de trabajar aumenta
(tal como lo muestra la estimacin anterior), y con esto disminuye la probabilidad
de estar truncado.
(vii)

con cual de las dos estimaciones se quedara Ud.? (5 puntos)

Ya habamos mencionado que no se ven diferencias significativas en el retorno


educacin sin corregir por que la muestra esta truncada y corrigiendo. Adems el
test de hiptesis sobre el coeficiente rho, indica que no se puede rechazar que
este sea igual a cero, es decir, el inverso de mill no es estadsticamente
significativo, indicando que el problema de sesgo de seleccin no era tan grave.
Por lo tanto, me debera quedar con la estimacin MCO que es la ms eficiente y
la mejor considerando que el problema se sesgo de seleccin no es relevante.

11

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ


DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Pauta Examen Final


Econometra I
Profesor: Tomas Rau Binder
Ayudante: Victor Nahuelpan
23 de enero
Tiempo Total: 180 Minutos.
Puntaje Total: 150 puntos.

1.

Comente las siguientes afirmaciones. Diga si


estas son verdaderas, falsas o inciertas y justifique su respuesta. (30 puntos en
total, 5 puntos c/u, m
aximo 5 renglones)

a) La presencia de error de medida produce que el estimador MCO sea sesgago e inconsistente.
R. Incierto: si el error de medida es en la variable dependiente, este solo producira errores est
andar
mas elevados, pero el estimador MCO seguira siendo insesgado y consistente. Por otra parte, si el
error de medida es en las variables independientes, efectivamente, el estimador MCO sera sesgado e
inconsistente.
b) La multicolinealidad implica que necesariamente aumente la probabilidad de cometer error de tipo II.
R. Verdadero. Si existe multicolinealidad (no exacta, si la multicolinealidad es exacta el estimador
MCO no existe) los errores est
andar seran muy elevados, con lo cual, los estadsticos seran peque
nos
(por ejemplo el estadstico t o F) y tenderemos a no rechazar la hipotesis nula, aun cuando esta sea
falsa. Por definicion, el error tipo II es el que se comete cuando uno no rechaza la hipotesis nula cuando
ella es falsa, luego estaremos mas expuestos a este tipo de error.
c) Dado que el estimador de MCG es MELI, siempre deberamos usar este metodo en lugar de MCO.
R. Incierto. Si bien es cierto que el estimador MCG es MELI ante perturbaciones no esfericas, no es
menos cierto que el estimador MCO tambien es MELI si se cumplen los supuestos del Teorema de
Gauss-Markov. En el caso de perturbaciones no esfericas, la matriz es generalmente desconocida,
luego es posible estimar usando MCF en lugar de MCG. En consencuencia, el comente solo es verdedaro
en el caso que es conocida y es diferente a la matriz de identidad. En todos los dem
as casos es falso.
d) La estimaci
on por el metodo de variables instrumentales es muy u
til para los casos en que el residuo
est
a correlacionado con las variables independientes.
R. Vedadero. El metodo sirve para esos casos, puesto que se viola el supuesto de que las variables
independientes y el residuo no esten correlacionadas. Un ejemplo que vimos en clases es cuando hay error
de medida en las variables dependientes. Esto bajo el supuesto de que tenemos buenos instrumentos,
que esten correlacionados con la variables independientes y no correlacionados con el residuo.
1

e) El metodo de Cochrane-Orcutt sirve para obtener un estimador eficiente cuando estamos en presencia
de autocorrelaci
on.
R. Incierto. Es verdadero si la Autocorrelaci
on es de primer orden, es decir, el proceso del error sigue
un proceso AR(1). Es falso o incierto si la autocorrelaci
on es de mayor orden.
f) El criterio de informaci
on bayesiano (BIC) es mayor al criterio de Akaike (AIC) cuando n > 3.
R. Verdadero. De acuerdo a las f
ormulas que vimos en clases, la u
nica diferencia entre el criterio BIC
y AIC es la manera en que penalizan la saturacion del modelo (la perdida de grados de libertad).
Mientras el criterio AIC suma k/n el criterio BIC suma ln(n) k/n. Luego, si n > 3, tenemos que
BIC AIC = ln(n) 1 > 0.

2.

Problema de Desarrollo (50 puntos)

Considere el siguiente modelo de regresion lineal:


y = 0 + 1 x1 + 2 x2 + u
donde u satisface todos los supuestos vistos en clases.
a) Suponga que Ud. no dispone de informacion para la variable x2 y posee una muestra aleatoria simple
para x1 e y. De que manera afecta al estimador MCO de 1 si Ud. omite la variable x2 del modelo
de regresion lineal? (5 puntos)
R. La omisi
on de una variable relevante, implica que el estimador MCO sera sesgado. La direcci
on del
sesgo dependera del signo del par
ametro de la variable omitida (2 ) y del signo de la covarianza de la
variable omitida (x2 ) y con aquella que est
a en el modelo (x1 ). Si 2 o cov(x1 , x2 ) = 0, la omision de
la variable x2 no sesga la estimaci
on de 1 .
b) Suponga ahora que Ud. consigue informacion para la variable x2 pero es advertido que esta fue medida
con error. De que manera afecta al estimador MCO de 2 si Ud. estima el modelo con la informacion
disponible? (5 puntos)
R. El error de medida siempre produce un sesgo de atenuacion (hacia abajo) en la variable que se
midi
o con error. Luego este caso no est
a excento de dicho problema.
c) Suponga que Ud. finalmente consigue una muestra aleatoria simple para las variables y, x1 y x2 donde
se le garantiza que no sufren de problemas de medicion, la cual est
a dada en el cuadro 1.
Cuadro 1: Datos
y x1 x2
2
2
0
-2 -1
2
1
0
0
-1 -1 -2

Evalue la matriz X X. Que puede decir acerca de la relacion entre x1 y x2 ? Como cambia su respuesta
en a)? (5 puntos)

R. La matriz X X es diagonal y est


a dada por:

4 0
X X = 0 6
0 0

0
0
8

Esto implica que las variables son ortogonales entre ellas, luego el producto punto entre x1 y x2 es cero
y tambien lo es su covarianza. La respuesta en a) cambia puesto que omitir x2 no produce problemas
en la estimaci
on de 1
d) Obtenga el estimador MCO de 0 , 1 y 2 (10 puntos)
R. La estimaci
on MCO entrega los siguientes valores:

0
0
= 1 = 7/6
2
1/4
e) Calcule los errores est
andar y el R2 , Que puede decir acerca de la calidad de los datos? (10 puntos)
R. Los errores est
andar son los siguientes:

SE(0 )
0,577
= SE(1 ) = 0,471
SE()
0,408
SE(2 )

y el R2 = 0,866. A la luz de los errores est


andar, notamos que los test-t son en general bajos (de
hecho ninguna variable es significativa al 5 % si vemos los valores crticos en el Cuadro 1) y el R2 es
relativamente alto, esto sugiere un potencial problema de multicolinealidad, pero debemos hacer una
inspeccion mas formal para determinarlo.
f) Obtenga el n
umero de condicion (condition number ) y discuta si estamos en presencia de multicolinealidad. Ayuda: recuerde que los valores propios de una matriz A, corresponde a las races de la siguiente
ecuaci
on |A I| = 0. (15 puntos)
p
R. La matriz que debemos calcular es S (X X)S donde el elemento si,j = 1/ xi xj donde xi es el
vector columna que contiene todas las observaciones para la variable xi . Luego, una simple inspeccion
nos muestra que S (X X)S = I, es decir la matriz de identidad. Los valores
propios de una matriz
p
identidad son iguales a 1. Luego el n
umero de condicion es igual a = max /min = 1 < 25, y de
acuerdo a este criterio no habra multicolinealidad.

3.

Problemas de An
alisis

Problema I (40 puntos)


Keynes postul
o que la propension marginal a consumir (P M C = Ct /Yt ) est
a acotada entre 0 y 1. El
tambien postul
o que la propension media a consumir (P M EC = Ct /Yt ) disminuye a medida que el ingreso
disponible aumenta.

a) Especifique la funci
on lineal de consumo Keynesiana. Muestre que el supuesto de que la PMEC decrece
con el ingreso implica que el itercepto es positivo. (5 puntos)
R. La funci
on de consumo Keynesiana se puede escribir como una relacion lineal entre el consumo y
el ingreso disponible.
Ct = 0 + 1 Yt
Se puede ver que
P M EC =

Ct
0
=
+ 1
Yt
Yt

Luego para que P M EC sea decreciente a medida que aumenta Yt , 0 tiene que ser positivo. Si este es
igual a 0, la PMEC es constante. Si este fuera negativo, la P M EC sera creciente.
b) Usando datos per c
apita anuales, la estimaci
on de la funci
on de consumo para Estados Unidos fue la
siguiente para el perodo 1929-1938:

981,35 + 0,735Y , R2 = 0,98


(158,65) (0,038)

Puede Ud. rechazar la hip


otesis nula que la pendiente es mayor que cero? y menor que uno? Testee
la hipotesis que el intercepto es igual a cero. (10 puntos)
R. Asumiendo que los supuestos vistos en clases se cumplen, el estadstico t para PMC es -6.97, luego
no se rechaza la hip
otesis nula H0 : 1 1 ante la alternativa H0 : 1 > 1 al 5 %. Note que es un test
a una cola donde la zona de rechazo est
a en la cola derecha con unvalor crtico aproximadod e 1.895 y
entonces t = 6,97 < 1,895.
Para la hip
otesis nula H0 : 1 > 0 y H1 : 1 0 tenemos que el estadstico t=19.34 y el valor crtico
es -1.895 (la zona de rechazo est
a en la cola izquierda). Luego, t = 19,34 > 1,895 con lo cual no se
rechaza la hip
otesos nula.
Finalmente, la hip
otesis nula H0 : 0 = 0 con la alternativa Ha : 0 6= 0 se rechaza puesto que t=6.18
el cual es mayor que el valor crtico 2.365.
c) Dada la identidad del producto para una economa cerrada
Yt = Ct + It + Gt
muestre por que los economistas notaron una implicancia de poltica muy importante del hecho que la
PMEC disminuya en el tiempo (debido a que el producto crece). (10 puntos)
R. Si dividimos la identidad por Yt tenemos que,
1=

Ct
It
Gt
+
+
Yt
Yt
Yt

luego, si la P M EC decrece para mantener la igualdad debe crecer el gasto p


ublico o la inversi
on
respecto al producto. El candidato mas probable era el gasto p
ublico, lo cual es b
asicamente una
poltica fiscal expansiva.
4

d) Simon Kuznets, que gan


o el premio Nobel de economa, junt
o datos sobre gasto en consumo e ingreso
desde 1869 y 1938 y encontr
o que la PMEC era relativamente constante en el tiempo. Para reconciliar
este hecho con los resultados de la regresion, Milton Friedman, tambien premio Nobel. formulo su
hipotesis del ingreso permanente. En esencia Friedman postul
o que tanto el consumo como el ingreso
son medidos con error.
Ct = Ct + vt , Yt = Yt + wt
donde Ct y Yt son el consumo e ingreso permanente respectivamente y vt y wt son los errores de
medida que fueron llamados consumo e ingreso transitorios respectivamente. Friedman pensaba que los
componentes transitorios eran solo errores aleatorios, no correlacionados con las terminos permanentes.
Considere que el consumo e ingreso permanente est
an relacionados de la siguiente manera:
Ct = k Yt
as la PMC y PMEC son iguales y ademas constantes en el tiempo. Por u
ltimo, asuma que el consumo
e ingreso transitorio (vt y wt ) son errores independientes. Muestre que si estimamos la regresion con
los datos observados (Ct e Yt ) la PMC estar
a sesgada hacia abajo y el intercepto sera mayor que cero,
incluso en muestras grandes. Para simplificar el analisis asuma que Ct e Yt son independientes. (15
puntos)
R. Recuerde que en presencia de error de medida en la variable independiente tenemos que

plim1
donde SY2 = plim n1
tenemos que,

Pn

i=1

1
1+

2
SY

Yi2 . Luego, en este caso 1 = k y por lo tanto 1 < k. Para el intercepto

plim0

= C 1 Y
= C + v 1 Y 1 w
= 0 + 1 Y 1 Y 1 w + v
= 0 + (1 1 )Y 1 w + v
= 0 + (1 plim1 )Y
2
= 0 + 1 2 w 2 Y
w + SY

Luego, plim0 > 0 .

Problema II (30 puntos)


Sir Francis Galton (1822-1911), un antropologo y primo de Charles Darwin, cre
o el termino Regresi
on a
la mediocridad en estatura hereditaria, Galton comparo la altura de los hijos con la de sus padres, usando
una muestra de 930 hijos y 205 parejas. En esencia, el encontro que padres altos (bajos) tienen altos (bajos)
hijos, pero que los ni
nos no seran tan altos (bajos) como sus padres, en promedio. Luego, habra lo que
conocemos como regresion a la media, o como Galton se refirio, regresion a la mediocridad. Este resultado
es una falacia si se intenta inferir este comportamiento a lo largo del tiempo. Si fuera verdad, la varianza de
la altura en humanos hubiese disminuido de generaci
on en generaci
on y ese no es el caso.
5

a) Para investigar acerca este resultado Ud. junta datos de estudiantes universitarios y sus padres y estima
la siguiente relaci
on:

Ae

0,5 + 0,7 Ap , R2 = 0,45, n = 1000


(0,7) (0,32)

donde Ae es la altura del estudiante medida en centimetros y Ap es la altura del padre del estudiante.
Los valores entre parentesis son los errores est
andar corregidos por heterocedasticidad. Haga un grafico
con esta lnea de regresion junto con una lnea de 45 grados y explique por que el resultado encontrado
arriba sugiere regresi
on a la media. (10 puntos)
R. Graficando la recta tenemos que

El resultado sugiere regresion a la media puesto que los hijos de padres bajos seran mas altos que sus
padres y los hijos de padres altos seran mas bajos que sus padres. Si esto sucede de generaci
on en
generaci
on, tenemos que la altura de las personas converger
a a un valor medio.
b) Investigando la literatura medica Ud. encuentra que la altura depende, en una proporcion importantsima, de un gen llamado phog y de factores ambientales. Suponga la altura del hijo(a) est
a determinada
por el padre y que padre e hijo(a) tienen exactamente el mismo gen el cual no cambia en el tiempo y
que la altura es medida con error de la siguiente manera:
Xi,h = f (Xi ) + vi,h , y Xi,p = f (Xi ) + ui,p
donde Xi,h es la medida de la altura del hijo h que tiene un gen Xi y los factores ambientales est
an
dades por vi,h para el hijo y ui,p para el padre. La estatura medida del padre est
a dada por Xi,p .
Considere que los factores ambientales son independientes el uno del otro y ademas son independientes
del gen. Combinando las dos ecuaciones, encuentre una funci
on de regresion poblacional y discuta su
relacion con la falacia de Galton. (10 puntos)
6

R. Restando las dos ecuaciones tenemos la siguiente funci


on de regresion poblacional:
Xi,h = Xi,p + (vi,h vi,p )
claramente esta funci
on no se condice con la falacia de Galton puesto que el intercepto es igual a 0
y la pendiente es igual a 1, por lo tanto seg
un esta especificaci
on no habra regresion a la media.
c) Como testeara las dos restricciones implicitas en la funci
on de regresion poblacional encontrada en
b)? A la luz de lo que encontr
o en sus estimaciones en a?, como testeara si estas restricciones se
cumplen o no? (10 puntos)
R. las restricciones son que e intercepto sea igual a cero y la pendiente igual a uno. Para testear las dos
restricciones habra que hacer un test conjunto como el test de Wald o un test F. Con lo encontrado en
b) y solo con la informaci
on que tenemos de b), la u
nica manera de testear esas hipotesis separadamente
mediantes test-t. Los valores de los test-t son para el intercepto t = 0,71 y para la pendiente t = 0,93,
luego no se rechaza ninguna de las dos hipotesis. Esto no nos ayuda mucho, puesto que como se dijo
anteriormente la u
nica manera de testear este modelo correctamente es haciendolo con un test de
hipotesis conjunta.

Cuadro 2: Valores Crticos para una distribuci


on t-Student
n-k
1
2
3
4
5
6
7

90 %
3.078
1.886
1.638
1.533
1.476
1.44
1.415

95 %
6.314
2.92
2.353
2.132
2.015
1.943
1.895

97.50 %
12.71
4.303
3.182
2.776
2.571
2.447
2.365

99 %
31.82
6.965
4.541
3.747
3.365
3.143
2.998

99.50 %
63.66
9.925
5.841
4.604
4.032
3.707
3.499

AYUDANTAS

Ayudanta de Econometra
17 de Junio 2004
Heterocedasticidad y Autocorrelacin
Profesores: Javiera Vasquez y Andres Otero
1. Considere el siguiente modelo:
Yi = +

1
Y = 3
5

0
1 0

= 0.5 0

0.2
2

a) Calcule MCO y MCG


b) Calcule Var( MCO ) y Var( MCG )
c) Calcule la Var( MCO ) que resultara de un modelo sin heterocedasticidad.
d) Cul estimador es ms eficiente?
2. Considere ahora N=50 en las siguientes estimaciones calculadas a partir de los residuos
de mnimos cuadrados ordinarios.
e 2t = a 0 + a1et21 + a 2 et2 2 + vt
e 2t = c 0 + c1 x t21 + c 2 x t + wt

R 2 = 0 .5
R 2 = 0 .6

e t = b0 + b1 xt + b2 et 1 + b3 et 2 + vt
e t = b0 + b1et 1 + wt

R 2 = 0 .9

R 2 = 0 .4

a) Evale la existencia de autocorrelacin de orden 2 utilizando un test asinttico


b) Evale la existencia de heterocedasticidad utilizando un test F de bondad de ajuste.
3. Considere la siguiente informacin para responder las siguientes preguntas.
3
2

Y = 2.75

1
0

1
2

X = 2 dnde el modelo a estimar es yi = xi + u i

5
1

con i = 1,2, K 5 .

3.1) Si u i ~ N (0, i 2 )

3.1.1) Muestre cual es la variable dependiente e independiente que debe utilizar


para calcular MCO y MCG .
3.1.2) Muestre cuanto vale

3.2) Si con la informacin del apartado 3.1) Usted obtuvo los siguientes
resultados MCO = 0.5 , MCG = 1.22 , Var( MCG ) = 0.3 y

j
1 L + 1 e e [x ' x
2

j =1

3.2.1) Evale si

t = j +1

t t j

t j

+ xt j ' xt = 0.5

= 0.5 asumiendo que existe heterocedasticidad del tipo

u i ~ N (0, i 2 ) con i = 1,2, K 5

3.2.2) Evale si = 1 asumiendo que el problema no es el sealado en 3.1, sino


que existe autocorrelacin.

4. Considere el modelo:
yt = + t

t = u t - u t -1

u ~ N(0,5)

4
Si y = 5 , obtenga el estimador de
3
5. Considere el siguiente MRL donde se cumplen todos los supuestos de MCO.
Yi = X i + u i
4
1
3
2

donde Y =
y X =
6
3


1
0
Sin embargo, se presume que puede existir heterocedasticidad.
a) Cul es el usual estimador de la varianza de en una estimacin de MCO?
b) Cul es la matriz de varianza y covarianzas de White?
c) Realice un test de White para probar la existencia de heterocedasticidad.

d) Realice un test de Lagrange Multiplier para testear autocorrelacin (con un rezago),


cul es la hiptesis alternativa para este caso en particular? Para este apartado usa en
vez de la informacin original, los siguientes vectores:
4
1
3
2


Y = 6 y X = 3
1
0


6
3
6. Considere la siguiente estimacin entre el retorno de las acciones de Microsoft y el
retorno de mercado medido por el retorno asociado al ndice de Dow Jones.
Dependent Variable: RMICROSOFT
Method: Least Squares
Included observations: 150 after adjusting endpoints
Variable

Coefficie Std. Error t-Statistic


nt

Prob.

C
RDOW JONES

0.003845 0.002445 1.572531


0.941777 0.110496 8.523149

0.1167
0.0000

150
0.0028 0.015
0.7679 0.0012
ei2 xi ' xi =
( X ' X ) 1 =

5.6914
0.0004
i =1

0.8718 0.0007
j 150

et et j xt x't j + xt j x't =

0.0003
L + 1 t = j +1
j =1

150

150

et et 1
1
150

2
t 1

= 0.25

2
t

148

= 0.052

a) Evale la existencia de autocorrelacin de orden 1.


b) Basndose en la conclusin obtenida en a), evale la hiptesis nula de que el retorno de
Microsoft es igual al retorno del mercado.

Resolucion Problema 5 y 6
Ayudanta Econometra 17 de Junio
Profesores Javiera Vasquez y Andres Otero
Preparado por Javier Fernandez

Problema 5:
A) El estimador de la varianza de es
2 (X 0 X)1 , para lo cual necesitamos
y luego con este, los e (para estimar
obtener el ,
2 ), por lo tanto:
28
= (X 0 X)1 X 0 Y =
= 2,
14
Con lo que

Y =

2
4
6
0

,e
=

2
1
0
1

4+1+0+1
e0 e
2
=
= 2,
,
=

nk
41

2
1
Vd
ar(mco ) =
=
14
7

B) La matriz de varianzas y covarianzas de White (S0 ) esta definida de la


siguiente forma:
n
1X
S0 =
e2 x~i 0 x~i
n i=1
Donde x~i es un vector fila correspondiente a la iesima observacion, por lo tanto:
1
S0 = [4 (1)2 + 1 (2)2 + 0 (3)2 + 1 (0)2 ] = 2
4

C) Para realizar un test de White necesitamos primero estimar por MCO


(que ya fue hecho en partes anteriores) y luego correr una regresion entre el
error estimado al cuadrado de la regresion MCO y todas las combinaciones posibles de X (notar que los regresores de esta regresion son todos combinaciones
de variables o variables al cuadrado), sin olvidar la constante, pues usaremos
el R2 de la regresion. En este caso, como la matriz X tiene solo una columna,
el regresor es X 2 , con lo cual, si Y = e2 y Z es una matriz que posee una
columna de unos, y otra con X 2 , la regresion entre Y y Z en desviaciones de

media resulta como sigue:

Y Y =

2,5
0,5
1,5
0,5

,Z Z =

2,5
0,5
5,5
3,5

13

, =

49

Con los resultados anteriores se puede obtener el R2 de la regresion, para


realizar el test de White:
0 Z 0 M0 Z
R2 =
=
Y 0 M0 Y

13
49

i2

49

= 0,3832

TW hite = n R2 = 4 0,3832 = 1,5328


Lo que se compara con 3.84, que es el T critico proveniente de una 2 con
p 1 grados de libertad, donde p es el numero de parametros de la regresion
auxiliar; dado lo anterior, no se rechaza la hipotesis nula de este test, que es
de Homocedasticidad.
D) En este caso, lo que hace el test de Breusch-Godfrey (LM) es estimar
por MCO, y luego correr una regresion con el error estimado resultante dependiendo de una constante (pues se usa el R2 ), las variables X, y rezagos del
error. Luego el test es n R2 y debe distribuirse bajo la nula como una 2p ,
donde p es el numero de rezagos del error incluidos en la regresion.

Y =

4
3
6
1
6

, X =

1
2
3
0
3

46
, =
= 2, e =

23

2
1
0
1
0

Ahora se corre una regresion entre:

e =

1
0
1
0

y Z =

1
2
2
1 3 1
1
0
0
1
3 1

Al hacerlo en desviaciones de media, el y el R2 resultan como sigue:


"

0,018
0,345

y R2 =

0 Z 0 M0 Z
= 0,67
Y 0 M0 Y

Con lo cual el test de Breusch-Godfrey toma la siguiente forma:


Tbg = n R2 = 4 0,67 = 2,68
El resultado anterior nos lleva a no rechazar la hipotesis nula (ausencia de autocorrelacion de hasta orden p), pues el T critico es 3.84. La hipotesis alternativa
de este test es la existencia de autocorrelacion de orden p, donde p, como ya se
dijo, es el numero de rezagos del error que se incluyen en la regresion auxiliar.
La hipotesis alternativa de este test es la existencia de autocorrelacion de al
menos orden p, dado que no se verificaron ordenes superiores.
2

Problema 6:
A) La autocorrelacion de orden 1 puede ser testeada con el test de Durbin
Watson,1 que es de la forma 2(1), en este caso disponemos de una estimacion
de ,2 que es:
P150

i=1 et et1
2
i=1 et1

P150

= 0,25, con lo cual el test queda: DW = 2(1 0,25) = 1,5

(1)

lo anterior pudiese sugerir autocorrelacion positiva, y al comparar el DW con


la zona critica3 (provenientes de alg
un libro, Greene por ejemplo) se aprecia
que es estadstico cae en la zona de autocorrelacion positiva, lo que entrega
evidencia estadstica a favor de la existencia de autocorrelacion de orden 1, y
solo de orden 1, ya que este test no entrega ning
un tipo de conclusion acerca
de ordenes superiores de autocorrelacion.
B) En este caso, para realizar inferencia lo correcto es usar la matriz de
Newey West al calcular el proxy a la matriz de varianzas y covarianzas, pues
hay evidencia de autocorrelacion de al menos orden 1, y como no conocemos
el patron exacto, esto es lo adecuado.
La hipotesis conjunta que se pide evaluar es C = 0 y RDOW JON ES = 1,
pues esta es equivalente con que el retorno de Microsoft es igual al retorno del
mercado.
El estadstico adecuado es un test F para hipotesis conjuntas, que depende de
la normalidad del error, o un test asintotico de hipotesis conjuntas, como el
test de Wald, que requiere de una muestra grande. Dado el contexto, y todo lo
anterior, lo mas adecuado pareciera ser usar el test de Wald, (pues no estamos
seguros de la normalidad del error, disponemos de un n grande, y ademas
debemos usar un estimador asintotico de 2 (X 0 X)) cuya expresion es como
sigue:
h
i0 h
i1 h
i
TW = RM CO q RV (M CO )R0
RM CO q
(2)
Donde V (M CO ) es la correcta matriz de varianzas y covarianzas de M CO , y
en este caso particular, dado la presuncion de autocorrelacion, esta es de la
siguiente manera:
V (M CO ) = (X 0 X)1 S (X 0 X)1
(3)
"

0,0028 0,015
5,6914

#"

1
150

"

0,7679 0,0012
0,0004

"

0,8718 0,0007
0,0003

"

0
1

## "

0,0028 0,015
5,6914
(4)

y [RM CO q] es de la forma:
"

1 0
0 1

#"

0,003845
0,941777

(5)

Recordar que se puede usar solo si la estimacion no incluye a la variable dependiente


rezagada.
2
El par
ametro proviene de la relacion et = et1 + , donde es un ruido blanco.
3
En este caso, se uso una zona critica para un n = 150, y un K = 1, hay que recordar
que este K no incluye a la constante; as es como la zona critica que nos interesa, que es
la del lado izquierdo, esta entre 1.611 y 1.637.

El calculo del estadstico queda propuesto, al igual que la conclusion, la cual


se obtiene al comparar el 2calc con un 2(2) de tabla.

Departamento de Economa

Universidad de Chile

Econometra I
o 2005
Oton
Ayudanta No 8
Profesores: Andres Otero y Javiera Vasquez
Ayudantes: Rodrigo Bravo y Roberto Jaramillo

Comentes
Comente las siguientes afirmaciones. Utilice matematicas y graficos si lo cree pertinente.
1. Siempre podemos utilizar para testear hipotesis los test t y F.
Respuesta: Falso, ya que es necesario que se cumpla que el error este normalmente distribuido.
Esto es porque cualquier funci
on lineal de variables normalmente distribuidas estar
a tambien normalmente distribuida, lo que es equivalente a decir que si u est
a normalmente distribuida, los
tambien lo estar
an.
2. Una funci
on de distribuci
on normal se caracteriza porque su simetra es cero, y su kurtosis es
indefinida.
Respuesta: Falso. Es correcto que la funci
on de distribuci
on normal tiene simetra igual a cero,
pero su coeficiente de kurtosis (es decir, el ancho de las colas de la distribuci
on) es igual a 3.
3. Si los errores del modelo de regresi
on lineal no tienen distribucion normal, a pesar de que los
estimadores MCO ya no son MELI, siguen siendo insesgados.
Respuesta: El comente es falso ya que el resultado de que los estimadores por MCO son MELI
no requiere que los errores se distribuyan normal. En efecto tal propiedad requiere que los errores
cumplan la siguiente condici
on: E(ui ) = 0 i, V ar(ui ) = i2 I y Cov(ui , uj ) = 0 6= j, es decir,
que los errores ui iid sean independientes e identicamente distribuidos.
4. Es mejor predecir un valor puntual de y 0 que el valor esperado E(y 0 /x0 ), ya que uno hace lo
primero con mayor precisi
on.
Respuesta: Falso. La varianza del error de predicci
on al predecir un valor puntual de y 0 es mayor
0
0
que al predecir E(y /x ), por lo tanto lo primero es menos preciso.

Ejercicios
1. Encontrar la varianza del error de prediccion e = E(y 0 ) X 0 (al predecir el valor de E(y 0 )), y
compararla con la varianza que se obtiene al predecir un valor puntual de y 0
Respuesta:
= x0 (X 0 X)1 X 0 u
e = E(y 0 ) Y 0 = x0 x0 = x0 ( )
e2 = E[
e e0 ] = E[x0 (X 0 X)1 X 0 uu0 X(X 0 X)1 x00 ]
e2 = x0 (X 0 X)1 X 0 (u2 )X(X 0 X)1 x00 ]
e2 = u2 [x0 (X 0 X)1 X 0 X(X 0 X)1 x00 ]
1

Departamento de Economa

Universidad de Chile

e2 = u2 [x0 (X 0 X)1 x00 ]

+ u0 . Por
Al calcular un valor puntual de y 0 , el error de predicci
on es e0 = y 0 y0 = x0 ( )
lo tanto, calculando su varianza:
+ u0 )(x0 ( )
+ u0 )0 ]
e2 = E[
e e0 ] = E[(x0 ( )

0 x00 + x0 ( )u
00 + (x0 ( ))
0 u0 + u0 u00 ]
e2 = E[x0 ( )(
)

0 x00 ] + E[u0 u00 ]


e2 = E[x0 ( )(
)
e2 = u2 [x0 (X 0 X)1 x00 ] + u2
2. Suponga que con datos de 2 pases (Uganda y Suiza) tomados anualmente durante 10 a
nos, usted
obtiene la siguiente estimaci
on:
Crecimiento = RecursosN aturales + HDI + u
Con
= 0, 01, = 0, 01, 2 = 0, 09. Ademas:
(X 0 X)1 =


1, 0
0, 2

0, 2
0, 1

Suponga que usted se entera de que el proximo a


no Uganda tendra 2 unidades de RecursosN aturales
y 0 de HDI, mientras que Suiza tendra 0 de RecursosN aturales y 2 de HDI.
Cual es su predicci
on para el crecimiento de ambos pases el proximo a
no?
Cual es su certeza de la afirmaci
on anterior?
Respuesta: El modelo que usaremos para calcular la predicci
on es el siguiente:
y =
RN + HDI
Por lo tanto, la predicci
on para el crecimiento de y de Uganda es:
y0 = x0


2



 0, 01
0
= 0, 02
0, 01

Ahora hay que calcular el valor del estadstico t, para ver si el valor es estadsticamente significativo. Pero para calcular el estadstico t, a
un nos falta conocer la varianza de la predicci
on de y.
Recordar que estamos calculando la varianza del error de predicci
on cuando se quiere conocer un
valor puntual (para cada pas). Calculando para Uganda se obtiene:

Departamento de Economa

Universidad de Chile

e2 = u2 0 [1 + x0 (X 0 X)1 x00 ]

e2 = 0,09[1 + 2
e2


0

1
0,2

  
0,2
2
]

0,1
0

 
 2
0,4
]
0


= 0,09[1 + 2

e2 = 0,45
Calculando el intervalo de confianza:
yt+1 y0
< t1/2,nk ] = 1
P r[t/2,nk < p
V ar(e2 )
Los grados de libertad son 10-2=8. Adem
as asumimos un grado de significancia de 0.05. Por lo
tanto el estadstico t es igual a 2.306 (dos colas).
Esto implica que:
P r[2,306 <

yt+1 0,02

< 2,306] = 0,95


0,45

P r[1,5269 < yt+1 < 1,5669] = 0,95


Siguiendo los mismos pasos anteriores para Suiza, obtenemos que el crecimiento (predicci
on) es:

0



 0, 01
2
= 0, 02
0, 01

Para calcular el estadstico t, es necesario calcular nuevamente la varianza del error de predicci
on,
ya que los datos de la matriz x0 cambiaron.
e2 = u2 0 [1 + x0 (X 0 X)1 x00 ]
e2


= 0,09[1 + 0

e2


2


= 0,09[1 + 0,4

1
0,2

  
0,2
0

]
0,1
2

 
 0
0,2
]
2

e2 = 0,09[1 + 0,4]
e2 = 0,126
Ya que se tiene la varianza del error de predicci
on, ahora podemos calcular el intervalo de confianza
de la predicci
on del crecimeinto de Suiza.
Calculando el intervalo de confianza:
3

Departamento de Economa

Universidad de Chile

yt+1 y0
P r[t/2,nk < p
< t1/2,nk ] = 1
V ar(e2 )
Los grados de libertad son 10-2=8. Adem
as asumimos un grado de significancia de 0.05. Por lo
tanto el estadstico t es igual a 2.306 (dos colas).
Esto implica que:
P r[2,306 <

yt+1 0,02

< 2,306] = 0,95


0,126

P r[0,7986 < yt+1 < 0,8386] = 0,95


El nivel de certeza que utilizamos para calcular los intervalos de confianza fue del 95 por ciento.
3. La Subseccretara de electricidad y combustibles esta interesada en conocer la relacion que existe
entre consumo de energa electrica (y) y el consumo de gas natural (x). Con este fin, encarga
a la Subdirecci
on General de Estudios la especificacion de un modelo econometrico entre estas
variables y su estimaci
on a partir de las series de datos disponibles en la subsecretara. Suponga
que usted trabaja como tecnico en la citada subdireccion y es el encargado de realizar el informe
solicitado. Para ello dispone de la siguiente informacion elaborada por su ayudante a partir de los
datos originales:
n = 35
P
(yi y)2 = 12,15

P
P x = 17,22
xy = 37,1022

x2 = 10,92
2
R = 0,7462

y = 85

Es significativo el coeficiente del consumo de gas natural en la explicacion del consumo de energa?
Respuesta: Primero es necesario calcular el valor del
P
P P
n xy x y
P 2
P
=
n x ( x)2
35 37,1022 17,22 85
=
35 10,92 (17,22)2
165,123
=
85,6716
= 1,9274
Ahora calculando la varianza del coeficiente:
2
= P u
V ar()
(xi x
)2

Sin embargo a
un nos falta conocer el valor de u2 . Este valor lo podemos obtener del R2
R2 = 1

SR
ST

SR = ST (1 R2 )
4

Departamento de Economa

Universidad de Chile

SR = u
0 u
= 12,15(1 0,7462) = 3,08367

u2 =
u2 =

u
0 u

nk

3,08367
= 0,09345
33

Por lo tanto el estadstico t es igual a :


1,9274 0
t=
= 6,305
0,09345
En una tabla T, evaluando con 33 grados de libertad y con un = 0,05, el t calculado es igual a
(usamos el de 30 GL porque no est
a disponible el de 33:
t0,975,30 = 2,042
Por lo tanto existe suficiente evidencia para decir que el coeficiente es estadsticamente significativo, con un 95 por ciento de confianza.

Econometra I
FACEA, Universidad de Chile

Demostracin

Matriz P cuando estamos en presencia de slo Heterocedasticidad:


Recordemos que para aplicar Mnimos Cuadros Generalizados (MCG) debemos
hacer una descomposicin espectral de la matriz :
Descomposicin Espectral de una Matriz:1
= CC 0
donde C es la matriz de vectores caractersticos, y una matriz diagonal cuyos
elementos en la diagonal son los valores propios asociados a cada vector propio
de la matriz C.
Valores propios:
Los valores propios de la matriz se obtienen resolviendo el siguiente sistema de
ecuaciones:
| I| = 0
donde es el valor propio e I una matriz identidad con las misma dimensin de .
Vectores propios:
Cada vector propio (c) tiene dimensin n 1, y debe satisfacer la siguiente
ecuacin:
( I)c = 0
Adems debe satisfacer que c0 c=1.
Finalmente utilizando esta descomposicin, el estimador MCG defina la matriz
P = C1/2 para transformar el modelo a un modelo con matriz de varianzas y
covarianzas escalar o esfrica de los errores.
EJEMPLO: Veamos como sera la matriz P cuando tenemos slo Heterocedasticidad en el error, adems asumamos un caso sumamente sencillo donde slo
tenemos dos observaciones i=1,2.
En este caso la matriz es2 :

1
2

12 0
0 22

Greene. Anlisis Econometrico, pgs. 30-33.


Recuerde que se puede definir indistintamente reescalando por 2 o no

Econometra I
FACEA, Universidad de Chile

Demostracin

Obtengamos los valores propios de para construir la matriz :


2

1 0
0

0 22 0 = 0
2

1
0
=0

0
2
(12 )(22 ) = 0
12 22 12 22 + 2 = 0
12 22 (12 + 22 ) + 2 = 0
p
(12 + 22 ) (12 + 22 )2 412 22
=
2 p
2
2
( + 2 ) (12 22 )2
= 1
2
(12 + 22 ) (12 22 )
=
2
1 = 12
2 = 22
De esta forma la matriz es:

12 0
0 22

Ahora calculemos los vectores propios, recuerde que cada valor propio tiene asociado un vector propio. Comencemos con el vector propio de 1 . Este debe cumplir
las siguientes ecuaciones:
2

1 1
0
c1
(1)
=0
0
22 1
c2
c0 c = 1 c21 + c22 = 1

(2)

De (1) obtenemos que c2 (22 12 ) = 0, lo que implica que c2 = 0. Utilizando (2)


podemos obtener c1 = 1. De esta forma el vector propio asociado a 1 es:

1
0
De igual forma podemos calcular el vector propio asociado al segundo valor propio
(2 ), el que debe cumplir con las siguientes ecuaciones:

2
c1
0
1 2
=0
(3)
c2
0
22 2
c0 c = 1 c21 + c22 = 1
2

(4)

Econometra I
FACEA, Universidad de Chile

Demostracin

De (3) obtenemos que c1 (12 22 ) = 0, lo que implica que c1 = 0. Utilizando (4)


podemos obtener c2 = 1. De esta forma el vector propio asociado a 1 es:

0
1
De esta forma, la matriz C de vectores propios es simplemente una identidad:

1 0
C=
0 1
Luego la matriz P es:

P = C

1/2

1 0
0 1

1
1

0
1
2

1
1

1
2

De lo cual se obtiene una gran conclusin, cuando estoy slo en presencia de


Heterocedasticidad, para trasformar mi modelo en uno Homocedstico, debo dividir cada observacin de mi variable dependiente y variables explicativas por la
desviacin estndar de su error. Es decir, dividir (yi , xi ) por i .

Departamento de Economa

Universidad de Chile

Econometra I
o 2005
Oton
n
Multicolinealidad y Error de Medicio
Profesores: Andres Otero y Javiera Vasquez
Ayudantes: Jose Manuel Castellon y Roberto Jaramillo

1.

Comentes
Comente las siguientes afirmaciones. Utilice matematicas y graficos si lo cree pertinente.

1. El error de medici
on no genera ning
un problema cuando este se encuentra en la variable independiente. Sin embargo, si este se encuetra en la variable dependiente, el estimador MCO deja de ser
MELI.
Respuesta: Falso. El error de medici
on cuando se encuentra en la variable dependiente no genera
problemas que provoquen que el estimador MCO deje de ser MELI, ya que no se ha roto el supuesto
de que cov(x, u) = 0. Sin embargo, cuando el error de medici
on se encuentra en la variable
independiente, el estimador MCO deja de ser MELI.
2. La multicolinealidad es un problema grave, que siempre hay que eliminar.
Respuesta: No necesariamente. La multicolinealidad es problema que afecta muchos elementos en
la estimaci
on de los modelos. Sin embargo, esta es propia del modelo que se est
a analizando, por
lo que si esta se trata de eliminar, se corre el riesgo de estar cambiando el modelo en s.
3. Cuando los datos que estamos analizando tienen multicolinealidad, el estimador MCO no puede
calcular el valor de los par
ametros, porque la varianza de los coeficientes estimados es casi cero.
Respuesta: No siempre. Cuando la multicolinealidad es exacta, no se pueden calcular los par
ametros
por MCO, ya que det((X 0 X)1 ) no est
a definido. Sin embargo, cuando no es exacta, s se pueden
calcular los par
ametros por MCO, pero estos tienen una serie de problemas.
4. Una de las formas m
as f
aciles de identificar la multicolinealidad es cuando vemos que el modelo que
estamos estimando tiene un R2 bajo, pero todos los coeficientes son estadsticamente significativos.
Respuesta: Falso, porque es al reves. Una de las form
as m
as f
aciles de detectar la multicolinealidad,
es cuando se tiene un R2 , pero los p
ar
ametros no son estadsticamente significativos.

2.

Ejercicios

1. Considerar el siguiente modelo:


Yi = Xi + ui
a) Demostrar que la covarianza entre el termino de error del modelo y la variable X es igual a
cero si es que la variable X es medida correctamente, pero la variable Y es medida con error.
Respuesta: Para el siguiente modelo:
Yi = Xi + ui
Cuando la variable dependiente est
a medida con error:

(1)

Departamento de Economa

Universidad de Chile

Yi = Yi + i

(2)

Reemplazando (2) en (1):


Yi + i = Xi + ui
Yi = Xi + ui + i
Con = ui + i
Yi = Xi + i
Para sacar la covarianza, sabemos que Cov(X, i ) = E(X i )

E(X i )

=
=
=
=

E(X (ui i ))
E(Xui + Xi )
E(Xui ) + E(Xi )
0

b) Obtener una expresi


on para la covarianza entre el termino de error y la variable X, suponiendo
que el error de medici
on de Y es directamente proporcional a X.
Respuesta:
Si el error de medici
on de Y es proporcional a X equivale a decir que:
Yi
i

= Yi + i
= Xi + i

Siguiendo que Cov(Xi , i ) = E(Xi i )

E(Xi i )

=
=
=
=
=
6=

E(X (ui i ))
E(Xi (ui X i ))
E(Xi ui X 2 Xi )
E(Xi ui ) E(X 2 ) E(Xi )
E(Xi2 )
0

Por lo tanto MCO deja de ser MELI.


2. Considerar el siguiente modelo:

Yi = 1 + 2 Xi + 3 Zi + ui

(3)

Sera igual que se tenga que Xi + Zi = 8 que 2 + 3 = 8 para obtener los parametros estimados?
2

Departamento de Economa

Universidad de Chile

Respuesta:
Para ver los efectos de estas equivalencias, las reemplazaremos para observar los resultados que
tienen sobre la estimaci
on MCO. Reemplazando Zi = 8 Xi en (3) resulta:

Yi

= 1 + 2 Xi + 3 (8 Xi ) + ui
= 1 + 2 Xi + 83 3 Xi + ui
= 1 + 83 + Xi (2 3 ) + ui

Utilizando 4 = 1 + 83 y 2 3 = 5 queda:

Yi = 4 + 5 Xi + ui

(4)

En (4) el problema es que se genera es que al momento de estimar el modelo, encontraramos


los valores de 4 y 5 , volviendose imposible encontrar los valores originales (antes de la trans 1 , beta
2 y beta
3 . Esto se debe a que el modelo sin la transformaci
formaci
on) de beta
on tena
multicolinealidad, que provoca alguns de los par
ametros no puedan ser estimados.
Ahora utilizando 3 = 8 2 y reemplazando en (3) resulta:

Yi

= 1 + 2 Xi + (8 2 )Zi + ui

Por lo que no afectara nuestra estimaci


on, ya que 3 = 8 2 , y al encontrar los par
ametros no
generara los problemas que aparecan con la primera transformaci
on.
3. Suponga que usted tiene que estimar el siguiente modelo en desviacion con respecto a la media:
yi = 1 x1,i + 2 x2,i + ui
con i = 1, ..., 102
De la cual se obtienen los siguientes resultados:
P 2
P
P
P 2
x1 x2 =
x2 x1 = 8, V ar(1 ) = V ar(2 ) = 0,7,
1 = 0,5, 2 = 0,4,
x1 =
x2 = 10,
Cov(x1 , x2 ) = Cov(x2 , x1 ) = 0,56, V ar(y) = 25,2
a) Realice los test de significancia para cada uno de los parametros.
b) Determine el n
umero de condicion de la matriz X, para ver la presencia de colinealidad entre
las variables explicativas.
Respuesta:
a) Para realizar los test de significancia de los par
ametros utilizamos un estadstico t, que se
compara con el valor de tabla de un valor tnk , en que n k = 102 2 = 100 al 95 % de
confianza con dos colas. El valor del estadstico es 1.9840.
Para 1 :
1

t= q

V ar(1 )
3

0,5
=
= 0,59
0,7

Departamento de Economa

Universidad de Chile

Como t100,95 % = 1,9840, por lo que el par


ametro no es estadsticamente significativo.

Para 2 :
2

t= q

V ar(2 )

0,4
=
= 0,48
0,7

Como t100,95 % = 1,9840, por lo que el par


ametro tampoco es estadsticamente significativo.
b) El n
umero de condici
q on de la matriz X se obtiene calculando el valor de Belsley, que se
AX
calcula como = M
, en que son los valores propios de la matriz S(X 0 X)1 S. S es
M IN
una matriz de n n diagonal, en que su diagonal est
a formada por

Px

S=

..
.
0

2
1

...

..

..
.

.
...

P1 x

2
n

P1x

nn

Para este ejercicio, el valor de S est


a dado por:
1
10

S=

!
(5)

1
10

Adem
as la matriz (X 0 X)1 es igual a :

(X 0 X)1 =

 P 2
P x1
x2 x1

 
P
10
2
Px1 x
=
x22
8


8
10

(6)

Por lo que la matriz B = S(X 0 X)1 S utilizando (5) y (6) queda 1 :

B = S(X X)


S=

1
4/5
4/5
1


(7)

Ahora hay que calcular el o los valores propios de B, lo que se hace a continuaci
on:

|B I| = 0


1
4/5
1 0
|

| = 0
4/5
1
0 1


1 4/5
|
| = 0
4/5 1


Calculando el valor anterior (determinante) queda:


(1 )2 (4/5)2 = 0
1 Recomendable

comprobar, para ejercitar la parte matem


atica

(8)

Departamento de Economa

Universidad de Chile

De (8) obtenemos los valores propios 1 = 1/5 y 2 = 9/5 y reemplazando estos valores en
el ndice de Belsley queda:

r
=

M AX
=
M IN

9/5
=3
1/5

Como el ndice es menor que 25, no estamos en presencia de multicolinealidad.

Departamento de Economa

Universidad de Chile

Econometra I
Primavera 2005
Ayudanta Extra - 05-08-05
Profesores: J. V
asquez-F. Tagle, R. Montero, E. Melo
Ayudante: Roberto Jaramillo 1

1.

Ejercicios

1. Derive los estimadores MCO a partir de un modelo con una variable explicativa.
a) Que variaciones puede obtener de este modelo? Nota: Encuentre los estimadores cuando el
modelo tiene s
olo constante, s
olo pendiente, y ambas.
Respuesta:
Para todos los modelos que se definan, lo que se busca es minimizar las suma de los errores
al cuadrado.
1) Utilizando este criterio en un modelo con pendiente y constante:
yi
ui
n
X

u2i

= 0 + 1 xi + ui
= yi 0 1 xi
n
X
=
(yi 0 1 xi )2

i=1

i=1

Minimizando la suma de los errores al cuadrado:

M IN0 ,1

n
X

u2i

(1)

=0

(2)

=0

(3)

i=1
Pn
2
i=1 ui

0
Pn

i=1

u2i

Trabajando con (2)


Pn

u2i

(yi 0 1 xi )

(yi 0 1 xi )

i=1

0
2

n
X
i=1
n
X
i=1

n
X

yi n0 1

i=1

n
X

xi

i=1

0 = y 1 x

1 rojarami@facea.uchile.cl

Departamento de Economa

Universidad de Chile

Usando ahora (3)


Pn

u2i

(yi 0 1 xi )xi

(yi 0 1 xi )xi

i=1

1
2

n
X
i=1
n
X
i=1

n
X

xi yi 0

n
X

i=1

n
X

xi 1

i=1

x2i

i=1

Reemplazando el estimador de 0 en la u
ltima expresi
on resulta:
n
X

n
X

xi yi (

i=1
Pn
i=1 yi

i=1
n
X
i=1

Pn
xi yi

xi yi (
y 1 x
)

i=1

xi
n

i=1

yi

x2i

Pn
( i=1 xi )2

+ 1
1
x2i
n
i=1

Pn

i=1

xi

n
1 =

i=1
n
X

xi 1
xi 1

i=1

n
X

xi yi

yi
ui
n
X

u2i

n
X

i=1

i=1

Minimizando la suma de los errores al cuadrado:

n
X

n
X

u2i
i=1
Pn
2
i=1 ui

M IN0

0
(yi 0 )

i=1
n
X

yi n0

i=1

0 = y
2

xi

n
X

i=1
i=1
n
n
X
X
n
x2i (
xi )2
i=1
i=1

= 0 + ui
= yi 0
n
X
=
(yi 0 )2

i=1

i=1
n
X
i=1
n
X

2) Ahora usando un modelo que s


olo tiene constante:

n
X

x2i

n
Pn

n
X

yi

Departamento de Economa

Universidad de Chile

3) Y con un modelo s
olo con la pendiente:
yi
ui
n
X

u2i

= 1 xi + ui
= yi 1 xi
n
X
=
(yi 1 xi )2

i=1

i=1

Minimizando:

M IN1

n
X

u2i

i=1

n
X

Pn

i=1

u2i

1 xi

(yi 1 xi )xi

i=1
n
X

xi yi 1

i=1

n
X

x2i

i=1
n
X

xi yi

1 =

i=1
n
X

x2i

i=1

b) Explique que diferencias puede inferir entre estos modelos, con respecto a sus propiedades.
Respuesta:
En el caso de un modelo sin constante, resulta:

n
X
i=1

(yi 1 xi )xi
| {z }

ui
n
X

ui xi

i=1

Sin embargo no garantiza que la suma de los errores sea igual a cero.
Viendo el caso de un modelo s
olo con constante:

n
X
i=1

(yi 0 )
| {z }

ui

n
X

ui

i=1

En este caso no garantiza que el error no este correlacionado con los datos, en caso de que
estos se esten omitiendo.
Estas dos condiciones se encuentran al mismo tiempo cuando se utiliza un modelo con constante y pendiente.
3

Departamento de Economa

Universidad de Chile

c) Son estos estimadores insesgados?


Respuesta: Propuesto en la ayudanta.
2. Suponga que usted, tras haber buscado en las paginas del curso Econometra I en los distintos
semestres, encontr
o una base de datos con una muestra de las notas del primer control (PC) y la
nota final (NF).
PC
2.2
7.0
3.2
4.0
3.1

NF
2.2
6.2
3.6
4.2
4.6

a) Estime por MCO el valor de los parametros del siguiente modelo:

yi

= 0 + 1 xi + ui

(4)

Respuesta: Utilizaremos los estimadores cuando el modelo tiene pendiente y constante encontrados en el ejercicio 1:
0

= y 1 x

n
n
n
X
X
X
n
xi yi
xi
yi

i=1

i=1
i=1
n
X
x2i (
xi )2
i=1
i=1

n
X

Los elementos para encontrar los estimadores, que se sacan de la tabla son:
n
n
X
X
xi = 19,5
x2i = 89,69
i=1

n
X
i=1

i=1

xi yi = 90,82

n
X

yi = 20,8

i=1

Reemplazando estos valores en el estimador de 1 :

5 90,82 19,5 20,8


5 89,69 19,52

0,71

0
0
0

= y 1 x

= 20,8/5 0,71 19,5/5

Ahora reemplazando en 0 :

1,391

(5)

(6)

Departamento de Economa

Universidad de Chile

b) Que puede decir del valor de los parametros?


El modelo indica que existe una relaci
on positiva entre la nota que el alumno se saque en el
primer control, con respecto a la nota final que obtendr
a en el ramo. Esta relaci
on dice que
si la nota en el primer control aumenta un punto, la nota final lo har
a en 0.71 puntos.
c) Que problemas se pueden presentar al tener una muestra tan reducida como esta?
Lo primero es que los datos pueden estar sesgados, ya que la muestra obtenida puede no ser
representativa de los datos de la poblaci
on (error muestral).
d ) Calcule ahora los valores de los parametros para los siguientes modelos:

yi
yi

= 0 + ui
= 1 xi + ui

(7)
(8)

Dan los mismos par


ametros? Por que?
Utilizando los estimadores que encontramos en el primer ejercicio, sabemos que para un
modelo s
olo con constante 0 = y; y para un modelo s
olo con la pendiente, el estimador de
n
i=1 xi yi

0 =
. Reemplazando
n
x2

P
P

i=1

En el caso del primer modelo (s


olo constante):
0
0

= y
= 20,8/5

4,16

Ahora en en caso de que el modelo tenga s


olo pendiente:

Pn
xi yi
Pi=1
n
2
i=1 xi

0
0

90,82/89,69

1,01

Los par
ametros no son iguales por lo explicado en la parte b) del ejercicio 1, ya que los modelos
no pueden asegurar las propiedades que se nombran en ese apartado.
3. La Subsecretara de electricidad y combustibles esta interesada en conocer la relacion que existe
entre consumo de energa electrica (y) y el consumo de gas natural (x). Con este fin, encarga
a la Subdirecci
on General de Estudios la especificacion de un modelo econometrico entre estas
variables y su estimaci
on a partir de las series de datos disponibles en la subsecretara. Suponga
que usted trabaja como tecnico en la citada subdireccion y es el encargado de realizar el informe
solicitado. Para ello dispone de la siguiente informacion elaborada por su ayudante a partir de los
datos originales:
n
X

n = 35
n
X
i=1

xi = 17,22

i=1

(yi y) = 12,15

n
X

n
X

x2i = 10,92

i=1

xi yi = 37,1022

i=1

n
X
i=1

yi = 85

Departamento de Economa

Universidad de Chile

Encuentre los valores de los par


ametros si define el modelo de la siguiente manera:

yi

= 0 + 1 xi + ui

(9)

Respuesta: Como el modelo est


a definido con pendiente y constante podemos, al igual como se ha
definido en los ejercicios anteriores, podemos utilizar los siguentes estimadores de los par
ametros:

= y 1 x

n
n
n
X
X
X
n
xi yi
xi
yi

i=1

i=1
i=1
n
X
x2i (
xi )2
i=1
i=1

n
X

Reemplazando en el estimador de 1 :
35 37,1022 17,22 85
35 10,92 17,22 2

= 1,93

0
0
0

= y 1 x

= 85/35 + 1,93 17,22/35

Ahora reemplazando en 0 :

3,38

Podemos decir que como la pendiente de la recta de regresion es negativa, al aumentar el consumo
de energa electrica, disminuye el consumo de gas natural; y viceversa.

2.

Comentes
Comente las siguientes afirmaciones.

1. La estimaci
on por MCO adem
as de garantizar que la recta de regresion pasa por las medias
muestrales de las variables, tambien garantiza que no estan relacionados el error y el valor predicho
de la variable dependiente.
2. Si la varianza de un estimador es igual a su Error Cuadratico Medio (ECM), podemos decir que
el estimador es insesgado.
3. En el modelo de regresi
on lineal de una variable explicativa, si al variable independiente no vara,
entonces el estimador de 2 ser
a igual al verdadero valor poblacional de 2 .
4. A un investigador no le conviene utilizar un parametro sesgado.
5. Cuando la varianza de las variables explicativas es alta, el estimador por MCO de la pendiente del
modelo es menos preciso.
6

Departamento de Economa

3.

Universidad de Chile

Propuestos

1. Encuentre al menos dos formas diferentes de expresar el calculo de los parametros por MCO,
cuando el modelo tiene s
olo una variable explicativa. Ayuda: puede encontrar dos formas distintas
encontrando las expresiones en desviaciones con respecto a la media, y otra forma es desarrollando
esta u
ltima expresi
on.
2. Para el ejercicio 1, analice las propiedades de los estimadores encontrados (insesgamiento, eficiencia, menor ECM, consistencia)
3. Suponga que encontr
o una base de datos, pero ahora no sabe su procedencia. Lo u
nico que sabe
es que Y es la variable dependiente, y X es la variable explicativa.
X
-8
-1
0
4
2

Y
0
1
3
5
4

Realice los mismos puntos que se le pedan en el ejercicio 2

Departamento de Economa

Universidad de Chile

Econometra I
Primavera 2005
Ayudanta Extra - 02-09-05
Profesores: J. V
asquez-F. Tagle, R. Montero, E. Melo
Ayudante: Roberto Jaramillo

1.

Comentes

1. Un amigo suyo le comenta que en un modelo de regresion lineal, en el peor de los casos los residuos
explican un cero % la variabilidad del termino dependiente. Que opina usted?
Respuesta: Si los residuos explican en un cero % la variabilidad del modelo, significa que el total
est
a siendo explicado por las variables explicativas, lo que en teora muestra un modelo que bien
ajustado. Sin embargo, un R2 alto puede no ser el mejor de los casos, ya que se pueden presentar
problemas de inclusi
on de variables irrelevantes, multicolinealidad, pocos datos (R2 = 1 cuando
hay s
olo dos datos), o que el modelo no incluya la constante.
2. La ventaja que tiene el test F, es que con una sola hipotesis me permite hacer todos los test de
significancia de Student al mismo tiempo.
Respuesta: El test F permite testear al mismo tiempo un conjunto de hip
otesis. Al testear la
significancia estadstica de un par
ametro, estamos realizando un test individual para cada uno de
los par
ametros, lo que sera distinto al testear que todos no son estadsticamente significativos al
mismo tiempo (Conjuntos distintos). Por esto el comente sera falso.
3. En una prueba de hip
otesis cualquiera, la zona de rechazo nunca cambia al cambiar la hipotesis
nula.
Respuesta: Falso. Para ver si es que cambia la zona de rechazo de una hip
otesis, hay que ver si
cambia el estadstico de tabla. El comente sera falso, ya que en el caso de un estadstico F al
cambiar la cantidad de hip
otesis nulas, el estadstico F de tabla va cambiando.
4. La ventaja que tiene el test t de Student es que puedo utilizarlo sin importar la distribucion del
error, suponiendo que tenemos una muestra finita.
Respuesta: Para utilizar los Test t y F es necesario que el error este destribuido en forma normal.
Si esto no sucede, no podramos conocer la distribuci
on de estos estadsticos.

2.

Ejercicios

1. Encuentre la expresi
on para la suma total al cuadrado cuando el modelo de regresion no incluye
un termino constante.

y
yy
y0 y
y0 y
0

=
=
=
=

y + u

0
y y + y 0 u

0
(
y+u
) y + (
y+u
)0 u

0
0
0
y y + u
y + y u
+
u0 u

|{z} |{z}
0

n
X
i=1

yi2

n
X
i=1

yi 2 +

n
X
i=1

ui 2

(1)

Departamento de Economa

Universidad de Chile

Descomponiendo la Suma Total y la Suma Explicada:

ST

n
X

(yi y)2

i=1

ST

n
X

yi2 n
y2

i=1
n
X

yi2

= ST + n
y2

(2)

i=1

SE

n
X

(
yi y)2

i=1

SE

n
X

yi2 ny2

i=1
n
X

yi2

= SE + ny2

(3)

i=1

Reemplazando 2 y 3 en 1 queda:

ST + n
y

= SE + ny2 +

n
X

ui 2

i=1

| {z }
SR

ST

= SE + SR + n(y2 y2 )

2. Demuestre que el coeficiente R2 es siempre mayor o igual al R2 .


SR
ST

R2

SR
ST

1 R2

(4)

SR n 1
R2 = 1

ST n k

(5)

Reemplazando 4 en 5 queda:
R2

1 R2

n1
nk
n1
(1 R2 )
nk
1 (1 R2 )

k = 1 R2 = R2
k > 1 1 R2 > 1 R2 R2 < R2
2

Departamento de Economa

Universidad de Chile

3. Tras haber tenido alg


un tiempo de ocio, usted ha encontrado una base de datos que tiene una
muestra representativa de las notas del ramo Econometra N. En esta se encuentran las notas
de los controles 2 y 3, y tambien la nota de la primera solemne. A usted le interesara saber como
afecto el rendimiento de los controles 2 y 3 en la solemne, as que utilizando lo datos, realice los
siguientes puntos:
Nota C2
2.2
5.1
5.1
2.2
3.9
3.8

Nota C3
3.7
5.1
3.4
1.9
3.4
2.8

Nota Sol
3
4
4.7
2.6
5
5.2

a) Establezca un modelo que le permita solucionar lo planteado.


Respuesta:
Nota Solemne = y
Nota Control 2= x1
Nota Control 3= x2
yi = 0 + 1 x1,i + 2 x2,i
b) Estime por MCO el valor de los parametros del modelo.
Respuesta:
M CO = (X 0 X)1 X 0 Y
En desviaci
on con respecto a la media
X 0X
X 0 X 1
X 0Y
M CO


8,32 4,13
4,13 5,72


1
5,72 4,13
=
30,53 4,13 8,32


4,84
=
1,24


0,75
=
0,36
=

Para rescatar el valor de la constante:


0
0

= y x
1 1 x
2 2
= 2,51

c) Analice la significancia estadstica de todos los parametros. Para esto encuentre los valores
de los estadsticos, con su respectivo P-value.
Es necesario encontrar el valor de las varianzas de los estimadores:

Departamento de Economa

Universidad de Chile

V ar()

= u2 i (X 0 X)1
Pn
2i
i=1 u
=
nk

u2 i

u2 i

V ar()

V ar()

2,56
= 0,85
3 

0,85
5,72 4,13
=
30,53 4,13 8,32


0,16 0,12
=
0,12 0,23

ti

t1

t2

0
q i
V ar(i )
0,75 0

= 1,875
0,16
0,36 0

= 0,75
0,23

P valuei
P value1
P value2

= 2(1 P r)
= 0,15
= 0,51

El t de tabla es: t95 %,GL=3 = 3,18


Por lo tanto existe suficiente evidencia para afirmar que las pendientes no son estadisticamente significativas, con un 95 % de confianza.
d ) Compruebe que la suma de los aportes marginales de los controles 2 y 3 resulta 1.
Respuesta:
H0 : 1 + 2 = 1

1 + 2 1

tH0

tH0

= 1,58

V ar(1 ) + V ar(2 ) + 2Cov(1 , 2 )

El t de tabla es: t95 %,GL=3 = 3,18


Por lo tanto existe suficiente evidencia para afirmar que las pendientes suman uno, con un
95 % de confianza.
e) Testee que el par
ametro del control 2 es 0.3 y el del parametro del control 3 es 0.4

Departamento de Economa

Universidad de Chile

q
nk

= 2
= 3


1 0
R =
0 1


0,75
=
0,36
 
0,3
r =
0,4
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
Fq,nk

u
0 u
nk

Fq,nk

2,16/2
= 1,27
0,85

El F de tabla con un 95 % de confianza es 9.55, por lo que existe suficiente evidencia para no
rechazar la hip
otesis nula con un 95 % de confianza
f ) Encuentre que porcentaje de la variabilidad se explica por los datos. Tambien realice alg
un
ajuste a este coeficiente en caso de encontrarlo necesario.
Para encontrar ese porcentaje, hay que revisar el R2

R2

ST

ST

6,01

1
n
X

(yi y)2 =

i=1

SR =

n
X

SR
ST
n
X

yi2 n
y2

i=1

ui 2 = 2,56

i=1

R2

2,56
= 0,57
6,01

Las variables independientes explican el modelo en un 57 %. Sin embargo, no estamos tomando


en cuenta el problema de los grados de libertad (son muy pocos datos para la cantidad de
par
ametros), por lo que utilizamos el R2 para corregir esto:
n1
R2 = 1 (1 R2 )
= 0,28
nk
g) Que nos dicen los datos que ha obtenido?
Tarea...

Pauta Comente Extra:


Pregunta: mientras mayor es la varianza muestral y menor es la varianza de las variables
explicativas, ms preciso es el estimador MCO.
Respuesta: el comente es falso, si bien, mientras mayor es el tamao muestral (n)
contamos con mayor informacin para estimar los parmetros y la muestra se acerca
ms a la poblacin, lo que hace que nuestra estimacin sea ms precisa, necesitamos
que la varianza de las variables explicativas sea la mayor posible para poder estimar el
impacto que tiene un cambio marginal en la variable explicativa sobre la variables
dependientes, mientras ms variada sea X contamos con una amplia gama de valores
que nos permiten identificar en forma ms precisa su impacto sobre Y. En un modelo
simple tenemos que la varianza del estimador MCO, tiene la siguiente forma:
V ( ) =

(X

X )2

Multiplicando y dividiendo por el tamao muestral:


V ( ) =

2
nV ( X )

Podemos observar que mientras mayor es el tamao muestral menor es la varianza del
estimador MCO (ms preciso), y mientras mayor es la varianza de las variables
explicativas menor es la varianza del estimador (ms preciso).

Departamento de Economa

Universidad de Chile

Econometra I
o 2006
Oton
Ayudanta Extra 25/04/06
Profesores: Claudia Sanhueza, Javiera Vasquez.
Ayudante: Roberto Jaramillo Moya1
Nota: Esta pauta ha sido publicada a modo de referencia. No ha sido revisada, por lo que es un muy
buen ejercicio para el estudio buscar incongruencias.

1.

Ejercicios

1. Para la siguiente base de datos:


Nota C2
2.2
5.1
5.1
2.2
3.9
3.8

Nota C3
3.7
5.1
3.4
1.9
3.4
2.8

Nota Sol
3
4
4.7
2.6
5
5.2

Para esta muestra, que fue obtenida del curso Econometra I de alg
un semestre del pasado, responda las siguientes preguntas:
a) Encuentre los estimadores de los parametros y su correspondiente matriz de varianzas y
covarianzas.
RESPUESTA
Al trabajar con los datos en desviaci
on con respecto a la media:


X 0X

8,32
4,13

X 0 X 1

1
30,53

X 0Y

M CO

2,51

u
2i

2,56

n
X

5,72
4,13

4,84
1,24

4,13
5,72

4,13
8,32

0,75
0,36

i=1

La matriz de varianzas y covarianzas est


a conformada por:
Es necesario encontrar el valor de las varianzas de los estimadores:
1 rojarami@facea.uchile.cl

Departamento de Economa

Universidad de Chile

V ar()

u2 i

u2 i

V ar()

u2 i (X 0 X)1
Pn

u
2i
nk
i=1

2,56
= 0,85
3

0,85
5,72
30,53 4,13

V ar()

0,12
0,23

0,16
0,12

4,13
8,32

b) Calcule el ajuste del modelo.


RESPUESTA

SR =

n
X

R2

ST

ST

6,01

SR
ST

n
X

n
X

i=1

i=1

(yi y)2 =

yi2 n
y2

ui 2 = 2,56

i=1

R2

2,56
= 0,57
6,01

Las variables independientes explican el modelo en un 57 %. Sin embargo, no estamos tomando en


cuenta el problema de los grados de libertad (son muy pocos datos para la cantidad de par
ametros),
por lo que utilizamos el R2 para corregir esto:
n1
R2 = 1 (1 R2 )
= 0,28
nk

c) Son significativos los par


ametros que acompa
nan a las variables indepedientes, a nivel individual y global?
RESPUESTA

ti

t1

t2

i 0

V ar(i )
0,75 0

= 1,875
0,16
0,36 0

= 0,75
0,23

Departamento de Economa

Universidad de Chile

P valuei

2(1 P r)

P value1

0,15

P value2

0,51

El t de tabla es: t95 %,GL=3 = 3,18


Por lo tanto existe suficiente evidencia para afirmar que las pendientes no son estadisticamente
significativas, con un 95 % de confianza.
Para hacer un test de significancia global, podemos utilizar la siguiente f
ormula:

R2 /(k 1)
F(k1,nk)
(1 R2 )/(n k)
0,57/(3 1)
= 1,99
(1 0,57)/(6 3)

El valor F crtico es de 9.55 para un 95 % , por lo que existe suficiente evidencia para afirmar que
los par
ametros no seran significativos en forma global con un 95 % de confianza.

d ) Testee que la suma de las pendientes 1 y 2 es igual a uno.


RESPUESTA
H0 : 1 + 2 = 1

tH 0

tH 0

1 + 2 1

V ar(1 ) + V ar(2 ) + 2Cov(1 , 2 )


1,58

El t de tabla es: t95 %,GL=3 = 3,18


Por lo tanto existe suficiente evidencia para afirmar que las pendientes suman uno, con un 95 % de
confianza.

e) Testee que el par


ametro del control 2 es 0.3 y el parametro del control 3 es 0.4
RESPUESTA
q

nk

Fq,nk

Fq,nk

2
3

1
0

0
1

0,75
0,36

0,3
0,4

[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q


u
0 u

nk

2,16/2
= 1,27
0,85

Departamento de Economa

Universidad de Chile

El F de tabla con un 95 % de confianza es 9.55, por lo que existe suficiente evidencia para no rechazar
la hip
otesis nula con un 95 % de confianza

f ) Si un alumno se sac
o un 3.6 en el control 2 y un 4.3 en el control 3, haga una prediccion del
valor puntual de esta.
RESPUESTA
y

2,51 + 0,75 3,6 + (0,36) 4,3

3,7

Para la varianza del error de predicci


on:

V ar(
e)

=
=

V ar(
e)

u2 (1 + x0 (X 0 X)1 x00 ))
1 
3,6
0,85(1 +
30,53
3,64

4,3

5,72
4,13



4,13
8,32

El intervalo queda:

3,7 3,18

3,64 y 0
2,37 y 0

3,7 + 3,18
9,78

3,64

3,6
)
4,3

Departamento de Economa

Universidad de Chile

Econometra I
o 2006
Oton
Ayudanta 16-6-6
Profesoras: Javiera Vasquez y Claudia Sanhueza
Ayudantes: Juan Carlos Caro, Javier Fernandez, Nicolas Grau, Roberto Jaramillo 1 , Roque Montero

1.

Comentes

1. Un estadstico Durbin-Watson de 4 muestra inequvocamente una autocorrelacion positiva.


2. Si existe Heterocedasticidad en los errores, el estimador Mnimos Cuadrados Ordinarios sera sesgado, sin embargo, cuando existe autocorrelacion en los errores no se produce sesgo en los parametros
estimados.
3. La utilizacion de la matriz de White permite corregir el problema de heterocedasticidad sin saber
a priori la especificacion de esta.

2.

Ejercicios

1. Considere el siguiente modelo:


yt = C(1) + C(2)xt + C(3)yt1 + ut

Testee la existencia de autocorrelacion en los errores.


RESPUESTA
Como el modelo incluye la variable dependiente rezagada, no se puede utilizar el estadstico Durbin-Watson.
Se tiene que utilizar el test h-Durbin:
1 rojarami@facea.uchile.cl

Departamento de Economa

Universidad de Chile

h = (1

DW
)
2

n
2 N (0, 1)
1 n

2
2
Con la informaci
on anterior: DW = 1,572226, n = 28 y

= (0,143427)

s
1,572226
28
(1
)
N (0, 1)
2
1 28(0,143427)2
1,738115749

El estadstico t, en un test de dos colas, es de 1.96, por lo que no podramos rechazar la hip
otesis nula de
no autocorrelaci
on.

2. Dado el siguiente modelo

yt
ut

=
=

0 + 1 xt + ut
ut1 + t

donde t iid N (0, 2 ). Ademas dispone de las siguientes observaciones:


t
yt
xt

1
22
4

2
26
6

3
32
10

4
34
12

5
40
14

6
46
16

7
46
20

8
50
22

Obtenga una estimacion eficiente de los parametros 0 y 1 , sabiendo que = 0,5.


RESPUESTA
Para estimar eficiente el modelo debemos utilizar el metodo de Mnimos Cuadrados Generalizados, que
consiste en transformar el modelo original de forma tal que el error este libre de autocorrelaci
on, como
en este caso el error sigue un procedimiento AR(1) se debe transformar de la siguiente forma la variable
dependiente y explicativa del modelo:

yt = yt 0,5yt1
xt = xt 0,5xt1
De esta forma, se tienen los siguientes datos transformados:
t
1
2
3
4
5
6
7
8
Suma

yt
22
26
32
34
40
46
46
50

xt
4
6
10
12
14
16
20
22

yt

xt

x y

x2

15
19
18
23
26
23
27
151

4
7
7
8
9
12
12
59

60
133
126
184
234
276
324
1337

16
49
49
64
81
144
144
547

Departamento de Economa

Universidad de Chile

El estimador MCG consiste en estimar por MCO el modelo transformado:

yt = 0 (1 ) + 1 xt + t
As, el estimador MCG de los par
ametros es:

 
P8

7
t=2 xt
P
=
8
2

59
t=2 xt
t=2 xt
 

 P8
151
y
P8 t=2 t =
1337
t=2 xt yt


X X
X Y

=
=

P8


M CG

M CG


=

10,67
1,29

7
59

59
547

1 

151
1337

59
547

3. Considere el modelo: yt = xt + ut , donde E(ut ) = 0, V (ut ) = k(xt )2 y Cov(ut , us ) = 0 6= s.


Ademas dispone de 5 observaciones de la variable dependiente y de la variable explicativa:
yt
2
3
10
1
3

xt
1
2
4
1
1

Encuentre el estimador eficiente de y de su varianza.


RESPUESTA
Este modelo no tiene problemas de autocorrelaci
on, pero si de heterocedasticidad, ya que la varianza del
error cambia para para observaci
on t. De esta forma, el estimador eficiente es el de MCG que consiste en
transformar el modelo original dividiendo cada observaci
on de la variable dependiente y explicativas por la
desviaci
on est
andar del error asociado a esta observaci
on, una vez transformado el modelo se estima por
MCO. La variables yt y xt transformadas son:

yt

xt

yt
yt
yt

= p
=
t
xt k
k 2 x2t
xt
xt
1
= p
=
2
2
t
k
k xt

El metodo eficiente de MCG consiste en estimar por MCO el modelo: yt = xt +ut , donde ut viid (0, 2 ):

Departamento de Economa

Universidad de Chile

M CG

Pn
yt xt
Pi=1
n
2
i=1 xt

Pn

=
=
M CG
V (M CG )

=
=
=

V (M CG )

yt
k xt k
1
2

i=1 ( k )
Pn yt
t=1 xt

n
2/1 + 3/2 + 10/4 + 1/1 + 3/1
5
2
0

(X X )1
1
Pn
1
2

(
t=1 k )
2k
2k
=
n
10

Departamento de Economa

Universidad de Chile

Econometra I
Primavera 2006
Profesores: Jose Miguel Benavente, Rodrigo Montero.
Ayudantes: Javier Fern
andez, Andrea Gutierrez, Roberto Jaramillo, Roque Montero.
Ayudanta 05-09-06

1.

Ejercicios

1. Tras haber tenido alg


un tiempo de ocio, usted ha encontrado una base de datos que tiene una
muestra representativa de las notas del ramo Econometra N. En esta se encuentran las notas
de los controles 2 y 3, y tambien la nota de la primera solemne. A usted le interesara saber como
afecto el rendimiento de los controles 2 y 3 en la solemne, as que utilizando lo datos, realice los
siguientes puntos:
Nota C2
2.2
5.1
5.1
2.2
3.9
3.8

Nota C3
3.7
5.1
3.4
1.9
3.4
2.8

Nota Sol
3
4
4.7
2.6
5
5.2

a) Establezca un modelo que le permita solucionar lo planteado.


RESPUESTA
yi = 0 + 1 x1 + 2 x2
con
yi
x1
x2

=
=
=

Nota Solemne
Nota Control 2
Nota Control 3

b) Estime por MCO el valor de los parametros del modelo.


RESPUESTA
Trabajando con el modelo en desvos con respecto a la media:

X 0X

8,32
4,13

X 0 X 1

1
30,53

M CO

2,51

u
2i

2,56

n
X

5,72
4,13

4,84
1,24

XY

0,75
0,36

i=1

4,13
5,72

4,13
8,32

Departamento de Economa

Universidad de Chile

2
c) Obtenga los coeficientes R2 y R
RESPUESTA
R2

=
=
=

SR
ST

P u2
P(y
y)2
Pi u2
1 P 2
y n
y2
1

2
R

0,55

n1
nk
61
1 (1 0,55)
63
0,25
1 (1 R2 )

=
=
=

d ) Analice la significancia estadstica de todos los parametros. Para esto encuentre los valores
de los estadsticos, con su respectivo P-value.
Es necesario encontrar el valor de las varianzas de los estimadores:

V ar()

u2 i

u2 i

V ar()

V ar()

= u2 i (X 0 X)1
Pn
2i
i=1 u
=
nk

2,56
= 0,85
3 

0,85
5,72 4,13
=
30,53 4,13 8,32


0,16 0,12
=
0,12 0,23

ti

t1

t2

0
q i
V ar(i )
0,75 0

= 1,875
0,16
0,36 0

= 0,75
0,23

P valuei
P value1
P value2
2

= 2(1 P r)
= 0,15
= 0,51

Departamento de Economa

Universidad de Chile

El t de tabla es: t95 %,GL=3 = 3,18


Por lo tanto existe suficiente evidencia para afirmar que las pendientes no son estadisticamente significativas, con un 95 % de confianza.
e) Compruebe que la suma de los aportes marginales de los controles 2 y 3 resulta 1.
Respuesta:
H0 : 1 + 2 = 1

1 + 2 1

tH0

tH0

= 1,58

V ar(1 ) + V ar(2 ) + 2Cov(1 , 2 )

El t de tabla es: t95 %,GL=3 = 3,18


Por lo tanto existe suficiente evidencia para afirmar que las pendientes suman uno, con un
95 % de confianza.
f ) Testee que el par
ametro del control 2 es 0.3 y el del parametro del control 3 es 0.4

q
nk

= 2
= 3


1 0
R =
0 1


0,75

=
0,36
 
0,3
r =
0,4
[(R r)0 [R(X 0 X)1 R0 ]1 (R r)]/q
Fq,nk
u
0 u

nk

Fq,nk

2,16/2
= 1,27
0,85

El F de tabla con un 95 % de confianza es 9.55, por lo que existe suficiente evidencia para no
rechazar la hip
otesis nula con un 95 % de confianza

Departamento de Economa

Universidad de Chile

Econometra I
Primavera 2006
Ayudanta Extra - 17-10-06
Profesores: Jose Miguel Benavente, Rodrigo Montero
Ayudantes: Javier Fern
andez, Andrea Gutierrez, Roberto Jaramillo, Roque Montero

1.

Comentes

1. El planteamiento de un modelo ANOVA tiene la ventaja de que genera un error tipo 1 menor que
hacer varios test t al mismo tiempo.
RESPUESTA
Falso, ya que la cantidad de test son distintos. Para ver la diferencia entre tres grupos, con ANOVA se
plantean dos test de sinificancia, y con una comparaci
on de medias 3, lo que genera que cada test en forma
indiviual sea distinto. Como al hacer un test de significancia individual en ANOVA incluye m
as efectos
al mismo tiempo (comparaci
on con m
as medias), entonces la probabilidad de que el test se rechace es m
as
alta, con lo que el comente sera falso.

2.

Ejercicios

1. En el siguiente modelo de regresi


on:

Yi = 1 + 2 Di + ui

(1)

Donde Y representa el salario por hora, y D es la variable dicot


omica, que toma el valor 1 si es un
titulado universitario y 0 si es titulado de educaci
on media. Utilizando las f
ormulas del estimador
MCO, demuestre que 1 = Ym y 2 = Yu Ym , donde el subndice m significa con educacion
media y u titulado universitario.
RESPUESTA

Planteando el modelo, la matriz X de variables explicativas queda i


X!X

X!X

X!X

(X ! X)1

(X ! X)1

(X ! X)1

i!
i D
D!

!
i! D
ii
!
!
Di DD

n nu
nu nu

1
nu
nu

nu
n
nu n n2u

1
nu
nu

nu
n
nu nm

1/nm
1/nm
1/nm n/(nu nm )

(2)

(3)

Departamento de Economa

Universidad de Chile

X!Y

X!Y

X!Y

i!
! Y
D
!
iY
D! Y

P
P yi
D=1 yi

(4)

(X ! X)1 X ! Y
P

1/nm
1/nm
P yi
1/nm n/(nu nm )
D=1 yi
" P Y P
#
Y
i

"

"

"

"

Yi

nm

D=0
nm

Yi

Yi

D=0 Yi
P nm
D=1 Yi
nm

Ym +

D=1
nm

Y
Pm

D=1
nm

Y
Pm

(6)

D=1

nm P
n
Yi
+ nuD=1
nm
P

D=0
nm

(5)

Yi nm
nu

Ym
P
Yi

Ym + D=1
nu

Ym
Yu Ym

Yi

D=1

Yi

nu nm

( nnu 1)

(7)
(8)
(9)
(10)
(11)
(12)

2. Si tenemos el siguiente modelo que puede ser subdividido en dos grupos:

Grupo 1
Grupo 2

=
=

Yi = N + 1 Xi + u1,i
Yi = C + 1 Xi + u2,i

(13)
(14)

Una forma de estimar este modelo es:

Yi = 0 + N hi + C di + 1 Xi + ui

(15)

Donde hi = 1 si pertenece al grupo 1, y 0 si no. Adem


as di = 1 hi . Est
an de acuerdo con el
modelo propuesto?
RESPUESTA
No, debido a que la matriz de datos que se forma es:

X = i hi di

X = i hi 1 hi

Xi

Xi

(16)
(17)

Departamento de Economa

Universidad de Chile

Y en este caso la columna de unos se puede formar con la suma de la columna 2 y la columna 3, por
lo que tendramos una columna LD, y la matriz seria singular y no calculable bajo MCO (Trampa de las
Dummies).

3. De acuerdo a un estudio de un respetado profesor de esta facultad, en que se vean las diferencias de
sueldos entre egresados de las distintas menciones, se han encontrado las siguientes conclusiones:
a) Existe la idea de que los egresados de Economa de esta facultad, al salir recien de la carrera,
ganan m
as que los egresados de Administraci
on de la misma facultad. Como planteara el
modelo y lo testeara?
RESPUESTA
El modelo se puede plantear de la siguiente forma:
yi = 0 + 1 di + ui

(18)

En que di toma el valor 1 si es egresado de Economa y 0 si es de Administraci


on. En el caso que
quisieramos testear que los valores son distintos, s
olo hay que hacer un test de significancia de 1 :

t = 1 . Sin embargo, si lo que queremos testear es que un estudiante de Economa recien egresado
1

gana m
as que un estudiante de Administraci
on, entonces lo que hay que buscar es que el par
ametro
andose esto en un test de una cola, que se plantea igual que el
1 sea mayor que cero, transform
anterior, pero lo que cambia es la zona de rechazo, que ahora s
olo se encuentra a la izquierda de la
curva de la tabla t-student.

b) A pesar de esto, se ha encontrado que los egresados de Administraci


on de esta facultad, a
medida que pasa el tiempo, incluso pueden llegar a ganar m
as que los egresados de economa.
Como puede afirmar esto?
RESPUESTA
Se puede afirmar cuando se agrega una variable explicativa, que es el tiempo de haber egresado, y
que la pendiente sea distinta para cada menci
on. El modelo por plantear es el siguiente:
yi = 0 + 1 di + 2 t + 3 tdi + ui

(19)

En que 3 es la diferencia de pendiente entre las distintas menciones. Si testeamos la significancia


de 3 , veramos si la diferencia es significativa. Sin embargo, lo que se plantea es que en el futuro
un egresado de Administraci
on pueda ganar m
as, por lo que adem
as debemos testear si 3 es menor
que cero. Para esto nuevamente tendramos que hacer un test de una cola, pero la zona de rechazo
estara a la derecha del test.

c) A pesar de no haber sido includo en el estudio, tambien existe la creencia de que los recien
egresados de la universidad que es competencia directa, pero no tan prestigiosa, obtienen
salarios distintos. Plantee el modelo.
RESPUESTA
Descartando la diferencia entre menciones, podemos plantear el modelo de la siguiente forma:
yi = 0 + 1 chi + 2 tcati + ui

(20)

omicaque toma el valor 1 si el egresado es de la Universidad de Chile,


En que chi es una variable dicot
y 0 si no; cati toma le valor 1 si pertenece a la Universidad no tan prestigiosa, y 0 si no; y tambi
en
si tenemos los datos de otras universidades, la media de estas va a estar determinada por 0 .

Universidad de Chile

Facultad de Economa y Negocios

Ayudanta Extra 03/11/2006


Econometra I
Profesores: Rodrigo Montero, Jos Miguel Benavente
Ayudantes: Roberto Jaramillo, Roque Montero, Javier Fernndez, Andrea
Gutirrez

Repaso de conceptos
1. Omisin de variable relevante e inclusin de variable irrelevante
2. Heterocedasticidad

Comentes
1. La omisin de variables relevantes produce subestimacin en
los parmetros estimados por MCO.
Falso, es cierto que el estimador MCO siempre ser sesgado en
presencia de variables irrelevantes omitidas:
E ( 1 ) 1

Cov( X 1 , X 2 )
2
Var ( X 1 )

Sesgo

Por lo tanto el signo del sesgo depender del signo de 2 y la


covarianza entre X1 y X2. Existen tres casos posibles:

2 positivo y covarianza positiva => sesgo positivo


2 positivo y covarianza negativa => sesgo negativo
2 negativo y covarianza positiva => sesgo negativo

2. En presencia de heterocedasticidad la mejor forma de estimar


los parmetros de inters es mediante una transformacin del
modelo original, que consiste en dividir cada observacin de
la variable dependiente y explicativas ( yi , xi ) por la desviacin
estndar del error asociado
Si no conocemos la matriz la eficiencia del estimador MCGF
depender de la calidad de la estimacin del patrn de heterocedasticidad.
Si esta estimacin es muy mala, por ejemplo no estamos seguros del patrn
heterocedstico, podemos estar agregando ms problemas al modelo. Por lo
tanto, en algunos escenarios es mejor utilizar el estimador consistente de
White.

Universidad de Chile

Facultad de Economa y Negocios

3. La omisin de una variable irrelevante es una fuente de


heterocedasticidad.
Falso. Efectivamente cuando omitimos una variable relevante en la
especificacin, dicha variable quedar parcialmente recogida en el
comportamiento de las perturbaciones aleatorias (error), pudiendo
introducir en estas su variacin no necesariamente fija. No obstante al
tratarse de una variable irrelevante esta no debiera afectar al modelo, y
por lo tanto, su efecto no debera ser recogido por el trmino error.
4. Si hay heterocedasticidad, las pruebas convencionales t y F
son invalidas.
Verdadero, con perturbaciones no esfricas existe una alta
probabilidad de que cometamos errores, puesto que con heterocedasticidad
los estimadores MCO sern ineficientes (varianzas ms grandes). Esto
podra traer como consecuencia que no rechacemos la hiptesis nula, cuando
la deberamos rechazar, o en otras palabras, digamos que una variable no es
significante cuando si lo es.

Ejercicios
1. Como sabemos, la demanda por un bien depende de muchas
variables, entre ellas el ingreso y precio del bien. Un
economista est estimando la demanda por un producto X,
para lo cual ha propuesto el siguiente modelo:

Q b0 P b1Y b2 e
a) Linealice el modelo y obtenga las elasticidades precio e
ingreso.

Q b0 P b1 Y b2 e
ln Q ln b0 b1 ln P b2 ln Y
ln Q b1 ln P b2 ln Y
Donde = ln b0
Por definicin:

Universidad de Chile

Q,P

Q,P

Facultad de Economa y Negocios

Q
%Q
Q ln Q

b1
% P P
ln P
P
Q
Q ln Q
%Q

b2
%Y Y
ln Y
Y

b) De sus conocimientos microeconmicos Qu problema


podra detectar en el modelo? qu consecuencias implicara y
en qu sentido? cmo lo solucionara?
Como sabemos la demanda por un bien tambin depende del precio de
sus sustitutos, por lo que podramos estar omitiendo una variable
relevante para el modelo, lo que implicara sesgo en los parmetros.
Luego, agregando Ps a la estimacin, el modelo verdadero es el
siguiente:

Q b0 P b1 Y b2 Ps b3 e
ln Q ln b0 b1 ln P b2 ln Y b3 ln Ps
ln Q b1 ln P b2 ln Y b3 ln Ps
Entonces los parmetros estarn sesgados:

Intuitivamente:

E (b1 ) b1 b3

COV (ln P, ln Ps )
Var (ln P)

E (b2 ) b2 b3

COV (ln Y , ln Ps )
Var (ln Y )

cuando

el Ps aumenta, el Y real disminuye


COV (ln Y , ln Ps ) 0 , y cuando el Ps aumenta, aumenta la demanda por Q,
aumentando P COV (ln P, ln Ps ) 0 .
Entonces, como b es la elasticidad cruzada b 0 , el sesgo de b ser
3

positivo, y el sesgo de b2 ser negativo.

E (b1 ) Q , P

E (b2 ) Q ,Y

Universidad de Chile

Facultad de Economa y Negocios

2. Considere el siguiente modelo de regresin clsico:


y x' ut

ut ~ N (0, )

La estructura de I es la siguiente:

a
I e
d

e
b
f

d
f
c

a) Cul o cules supuestos del modelo de regresin clsico no se


cumpliran en este caso particular? Cmo se le llama a este o estos
problemas?
Se violan los supuestos:

Varianza del error constante => Heterocedasticidad


Covarianza de los errores igual a 0 => Autocorrelacin

b) Demuestre que el estimador MCO de


modelo son insesgados.

los coeficientes de este

c) La varianza de los estimadores de este modelo, es insesgada?


No, ante presencia de heterocedasticidad y autocorrelacin la
varianza de los estimadores est sesgada.
d) Cmo se denomina el estimador MELI para los coeficientes de
este modelo de regresin, suponiendo que los valores para a; b; c; d
y f son conocidos?
Si los valores de la matriz I son conocidos el estimador MELI es
Mnimos Cuadrados Generalizados (MCG)
e) Derive rigurosamente el estimador MELI que corresponde a la
respuesta en (d), utilizando la notacin matricial. (ayuda: 1 P' P )

Universidad de Chile

Facultad de Economa y Negocios

Minimizando la suma de los errores al cuadrado

3. Una empresa de autobuses desea estimar la demanda de billetes


(Yt) en funcin de la variable constante, del precio de los mismos
(X2t) y de la calidad del servicio, evaluada a travs de los gastos que
la empresa realiza para la mejora del mismo (X3t). Se dispone de 50
datos ordenados en forma creciente segn la variable X3t y de la
estimacin MCO de las siguientes ecuaciones:

Las tres primeras ecuaciones se estimaron con los 50 datos; la


cuarta se estimo con los 20 datos iniciales y la quinta con los 20
datos finales. Supondremos validas las aproximaciones asintticas.
a) Contraste el supuesto de homoscedasticidad en el modelo
estimado en la ecuacin (1) con el contraste de White.
De los datos entregados nR2 = 50*0,053 = 2,65 este lo debo comparar
con una 502 6 27,575 como es menor concluimos que no existe evidencia
suficiente para demostrar heterocedasticidad a un 95% de confiabilidad.
b) Contraste el supuesto de homoscedasticidad en el modelo
estimado en la ecuacin (1) con el contraste de Goldfeld-Quandt,
eliminando las 10 observaciones centrales.

Universidad de Chile

Facultad de Economa y Negocios

u1 ' u1 / n1 k
u21 / u22 204/150= 1,36 lo comparo con una F17,17=?
u 2 u 2 / n2 k
(disculpen, pero no encontr la tabla) por lo tanto no existe evidencia
suficiente para demostrar heterocedasticidad.

4. Suponga que se tiene el siguiente modelo


Explique detalladamente cuales son las consecuencias sobre MCO
cuando es aplicado a este modelo Cmo estimara este modelo?
Que estimador utilizara? De que depender la eficiencia de su
estimacin?. Plantee una expresin para el estimador ptimo de y

2
.

Este modelo presenta heterocedasticidad por lo que las estimaciones por


MCO son ineficientes. El patrn que sigue la heterocedasticidad depende del
valor esperado de la variable dependiente y t , es decir E ( yt ) X t . Dado que
es desconocido no podemos aplicar el estimador MCG. Sin embargo,
podemos aplicar MCGF y el estimador Mximo Verosimilutud (MV). La
aplicacin del primero requiere una estimacin en dos etapas, ya que es
necesario obtener para aplicar el mtodo. De esta forma se puede estimar
el modelo por MCO ignorando la heterocedasticidad y luego usar esta
estimacin para normalizar las variables y aplicar MCGF. Este mtodo ser
menos eficiente que MV debido a que este ltimo estimar en conjunto todos
los parmetros involucrados.

Universidad de Chile

Facultad de Economa y Negocios

Universidad de Chile

Facultad de Economa y Negocios

También podría gustarte