Está en la página 1de 377

Universidad de Chile Facultad de Economa & Negocios

ECONOMETRIA 1

Recopilacin de Pruebas Anteriores


(Desde Primavera 2004, Hasta Otoo 2008)
-Jmaggior-

CONTROLES 1

Econometra I Profesores: J.M. Benavente, A. Otero y J. Vsquez. Primavera 2004 Control 1

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible

Pregunta 1: (30 puntos) En un modelo de regresin lineal la pendiente que se obtiene a partir de la muestra disponible es siempre igual a la pendiente verdadera (poblacional) que relaciona las variables.

.................................................................................................................... .................................................................................................................... .................................................................................................................... .................................................................................................................... .................................................................................................................... .................................................................................................................... .................................................................................................................... ....................................................................................................................


Pregunta 2: Ud. dispone de los siguientes datos, donde Y es la variable dependiente y X la variable explicativa. Complete la siguiente tabla con la informacin requerida:

Y X 2 1 -2 0 1 4 3 1 1 ....... 2 .......

Y ....... ....... ....... .......

u ....... ....... ....... .......

Econometra I Profesora: Javiera Vsquez. Verano 2005 Pauta Control 1 Pregunta 1: (30 puntos) Mientras mayor es el tamao de la muestra que disponemos, ms se aproxima un estimador a su valor poblacional. Comente. Si bien cuando el tamao de muestra aumenta, esta cada vez se parece ms a la poblacin, un estimador para que en el lmite sea igual al valor poblacional tiene que cumplir con la propiedad de consistencia. Recordar que un estimador es simplemente una frmula o mtodo que nos dice como aproximar un parmetro poblacional a travs de una muestra, existen estimadores consistentes y otros que no lo son, a pesar que la muestra sea innito un estimador puede ser distinto a su valor verdadero, en este caso es inconsistente. Pregunta 2: Suponga que la variable aleatoria yi esta compuesta por la suma de un componente jo y uno aleatorio: yi = xi +
f ijo

ui
aleatorio

para

i = 1, ..., N

donde xi es una variable determinstica (ja), es un parmetro que mide la inuencia de x sobre y y ui es una variable aleatoria que se distribuye Normal N (0, 2 ). Determine las propiedades del siguiente estimador de : = y x R: = y = x
1 N 1 N N i=1 yi N i=1 xi

donde y =

1 N

yi
i=1

x=

1 N

xi
i=1

N i=1 yi N i=1 xi

(1)

Reemplazando yi = xi + ui (expresin poblacional) en (1): = = =


N i=1 (xi + N i=1 xi N =1 ui + i N i=1 xi N i=1 ui N i=1 xi

ui )

N i=1 N i=1

xi xi

N i=1 N i=1

ui xi

(2) (3) (4)

Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3): ] = E [ = + 1


N i=1 E [ui ] N i=1 xi

Utilizando la propiedad de operador lineal de la Esperanza, y el supuesto que ui tiene esperanza igual a cero, el estimador propuesto es insesgado. (20 PUNTOS) Ahora calculemos su varianza: ) = V ( = = = = ) = V ( (30 PUNTOS) El Error cuadrtico medio (ECM) se este estimador es igual a la varianza, ya que es un estimador insesgado: ) = ECM ( ) = ECM ( (10 PUNTOS) Por ltimo, el estimador es consistente ya que es insesgado es muestras pequeas (10 PUNTOS). Adems se puede demostrar que: ) = l m V ( n 2 (
N i=1

E [ ]]2 E [

]2 E [ E 1 ( (
N i=1 N i=1 N i=1

utilizando ui xi E
i=1 N 2

(4) 1
N 2

(
N

N i=1

xi )2

E
i=1

ui

xi )2 xi )2
2

u2 i + N (N 1)ui uj E [u2 i ] +N (N 1) E [ui uj ]

1
N i=1

i=1

n (
N i=1

xi )2

) + [sesgo]2 V (
0

n 2 (
N i=1

xi )2

xi )2

l m

n2 2 n(
N i=1

xi )2

= l m

2 n n

1
N i=1

xi

y por lo tanto, es consistente.

2 1 2 n n (x) 1 2 l m =0 2 n (x) n l m
0

m.s p o

) = plim(

Econometra I Profesores: Andrs Otero Javiera Vsquez. Otoo 2005 Control 1 Pregunta 1: (30 puntos) El nico problema de no incluir un trmino constante en el Modelo de Regresin Lineal, es que no se garantiza que la recta de regresin pase por las medias o equivalentemente que la suma de los errores estimados sea igual a cero. Comente. Falso, si bien el no incluir un trmino constante en el modelo de regresin lineal tiene el problema de no garantizar que la recta de regresin pase por las medias ni que la suma de los errores estimados sea igual a cero, este no es el nico problema. El no incluir el trmino constante genera sesgo en la estimacin de la pendiente al obligar a que la recta pase por el origen, tal como se muestra en el siguiente grco:

. .sin.constante con constante . . .. . . . . . .. . . . .. . . . . . . . .


Sesgo en la estimacin de la pendiente, provocado por la estimacin de un modelo de regresin lineal sin constante

Pregunta 2: (70 puntos) Ud. dispone de los siguientes datos, donde Y es la variable dependiente y X la variable explicativa. Complete la siguiente tabla con la informacin requerida:
Y 12 2 5 1 Suma Promedio 1 2 5 1.7 2.2 X 2 1 3 0 1.5 Y Y 7 -3 0 4 X X 0.5 -0.5 1.5 -1.5 (Y Y )(X X ) 3.5 1.5 0 6 11 (X X )2 0.25 0.25 2.25 2.25 5 Y 6.1 3.9 8.3 1.7 5 u 5.9 -1.9 -3.3 -0.7 0

2 =

n i=1 (Y Y )(X n 2 i=1 (X X )

X)

11 = 2,2 5

1 = Y 2 X = 5 2,2 1,5 = 1,7

Econometra I Profesores: Emerson Melo Rodrigo Montero Javiera Vsquez

Primavera 2005 Pauta Control 1 Rut: .......................................

Ud. Dispone de 40 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: Usted es gerente de costos de una prestigiosa empresa multinacional, y el gerente general, al cual todos llaman muy cariosamente Pato, lo llama a su ocina, y le plantea el siguiente problema: ...existe la necesidad de justicar frente al directorio el esquema de remuneraciones que se aplica en la empresa. Como usted es alguien preparado, que ha estudiado en la Universidad de Chile, necesito que me muestre cual es el premio que la empresa entrega a sus trabajadores por cada ao de estudio que tienen (aos de escolaridad). La siguiente tabla presenta la informacin de que usted dispone:

Aos de escolaridad (S ) 0 3 5 7 10 12 17 17 17

Salario (W ) 150000 170000 185000 190000 215000 250000 550000 650000 800000

Nmero de trabajadores 10 5 4 8 9 10 5 4 5

Usted decide hacer un informe al respecto, y para ello debe dar respuesta a las siguientes interrogantes. NOTA: trabaje todos los clculos con DOS decimales. 1. Plantee el modelo a estimar, deniendo claramente cada una de las variables involucradas. (3 puntos) Respuesta: Se debe estimar el siguiente modelo: Wi = + Si + i donde Wi corresponde al salario del trabajador i, Si corresponde a los aos de escolaridad del trabajador i, y i representa el trminos de error, bien comportado. Los parmetros a estimar vienen dados por y . Por lo tanto, el modelo plantea a priori una relacin lineal y directa entre los aos de escolaridad y el salario de la persona. 1

2. Escriba y graque la funcin objetivo. Ayuda: para gracar la funcin objetivo asuma que slo existe un parmetro que debe ser estimado. (4 puntos) Respuesta: La funcin objetivo a minimizar es:
N N

m n Gracamente:

, i=1

2 n i = m

, i=1

i )2 (Wi S

Funcin objetivo

Solucin

3. Cules son las estimaciones MCO de los parmetros poblacionales y ? (6 puntos) Respuesta: =
N i=1 si wi N 2 i=1 si

59941583, 33 = 28804, 45 2080, 98

S = 306583, 33 (28804, 45 8, 98) = 47823, 34 =W donde si y wi representan los aos de escolaridad y el salario en desvos respecto de la media. 4. Demuestre matemticamente y numricamente que la suma de los errores estimados es igual a cero. (4 puntos) Respuesta: La funcin objetivo a minimizar es:
N N

m n Derivando con respecto a :


N i=1 (Wi

, i=1

2 n i = m

, i=1

i )2 (Wi S

i )2 S i) = 0 = 2 (Wi S i=1
N

Por lo tanto:

N i=1

i) = 0 (Wi S

i = 0
i=1

Numericamente:
60

i = (10 102176, 66) + (5 35763, 30)


i=1

+(4 6845, 60) + (8 59454, 50) + (9 120867, 86) +(10 143476, 76) + (5 12500, 98) + (4 112500, 98) +(5 262500, 98) = 0 5. Considere la siguiente transformacin de los salarios: W = ln(W ) donde ln() corresponde al logaritmo natual. Estime nuevamente el modelo, pero utilizando como variable dependiente W en lugar de W . Qu representa el coeciente estimado para la pendiente? Demuestre. (Ayuda: recuerde el concepto de semi-elasticidad) (9 puntos) Respuesta: El modelo a estimar sera el siguiente: Wi = + Si + i Los estimadores MCO son: =
N i=1 si wi N 2 i=1 si

174, 07 = 0, 08 2080, 98

S = 12, 46 (0, 08 8, 98) = 11, 71 =W


donde si y wi representan los aos de escolaridad y el logaritmo del salario en desvos ) representa el porcentaje de incremento respecto de la media. El coeciente estimado ( en el salario por un ao adicional de escolaridad. Matemticamente:

ln(Wi ) 1 = dWi = Si Wi 6. Recuerde que Pato quiere conocer el premio salarial que la empresa entrega a sus trabajadores por cada ao de escolaridad. Cul sera? Ayuda: utilice el resultado encontrado en (5). (4 puntos). Respuesta: Por cada ao adicional de escolaridad el trabajador recibe un premio de 8 % en su salario.

Verano 2005-2006

Econometra I

Profesor : Jaime Ruiz-Tagle V. Ayudante : Roberto Jaramillo M.


Control 1 - Pauta de Correccin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.
Pregunta 1 (30 puntos)

Considere la especicacin estocstica de la Funcin de Regresin Poblacional


Yi = E [Yi |Xi ] + ui ,

donde la la Funcin de Regresin Poblacional considerando 2 variables y una relacin lineal es:
E [Yi |Xi ] = 0 + 1 Xi .

(a) Explique cul es el supuesto detrs de la Funcin de Regresin Poblacional.

El supuesto esencial detrs de la Funcin de Regresin Poblacional es que se asume que se puede representar correctamente, en valor esperado (en promedio), a la variable dependiente a travs de una funcin lineal de las variables explicativas. Se llama funcin poblacional porque se asume que se dispone del total de los datos de la economa.
(b) Explique algebraicamente por qu la media condicional de ui es igual a cero (E [ui |Xi ] = 0).

Se tiene
Yi E [Yi |Xi ] E [Yi |Xi ] E [ui |Xi ] = = = = E [Yi |Xi ] + ui E [E [Yi |Xi ]|Xi ] + ui E [Yi |Xi ] + E [ui |Xi ] 0.

Dada la ley del valor esperado iterado (E [E [A|B ]|B ] = E [A|B ]).
Pregunta 2 (30 puntos)

(a) Explique la diferencia entre causalidad econmica y correlacin estadstica.

La principal diferencia que existe entre causalidad econmica y correlacin estadstica es que la primera es una relacin de causa-efecto en un sentido econmico. En cambio, la correlacin estadstica es simplemente una observacin estadstica que indica un grado de relacin lineal. La correlacin estadstica no necesariamente implica que una variable correlacionada con otra se comporte de una forma cuando la variable con la que tiene la correlacin cambie, no hay necesariamente una causalidad. En el ejemplo dado en clases, existe un grado de relacin entre la calidad de un vino y el clima, pero no se puede decir que el clima est provocado por la calidad del vino.

(b) Explique la diferencia entre la representacin estocstica de la Funcin de Regresin Muestral y representacin estocstica de la Funcin de Regresin Poblacional.

La diferencia est en la cantidad de datos disponibles para la regresin. En la representacin estocstica de la Funcin de Regresin Poblacional, tal como lo dice su nombre, se dispone de los datos que corresponden a la poblacin, que representan el total de datos. En cambio, la Funcin de Regresin Muestralal ser Muestral est utilizando un subconjunto de la poblacin, lo que nos puede llevar a conclusiones distintas por las ucuaciones entre las distintas muestras, tratando esta ltima de estimar a la Funcin de Regresin Poblacional con los datos disponibles en la muestra. El trmino de error en la funcin poblacional corresponde al error generado por tratar de explicar la variable dependiente a travs de una especicacin funcional en particular, mientras que en la funcin muestral el trmino de error recoge adems el error de estimacin de los parmetros.

Econometra I Profesoras: Claudia Sanhueza Javiera Vsquez. Otoo 2006 Pauta Control 1 converge, entonces este estimador es consistente. Pregunta 1: (30 puntos) Si un estimador Comente. Esto no es necesariamente cierto, ya que el estimador puede converger a un valor distinto del valor poblacional del parmetro. Slo si el estimador converge al verdadero valor del parmetro (poblacional) este estimador es consistente. Pregunta 2: (70 puntos) Suponga que la variable aleatoria yi esta compuesta por la suma de un componente jo y uno aleatorio: yi = xi +
f ijo

ui
aleatorio

para i = 1, ..., N

donde xi es una variable determinstica (ja), es un parmetro que mide la inuencia de x sobre y y ui es una variable aleatoria independiente e idnticamente distribuida Normal N (0, 2 ). Determine si el siguiente estimador de es insesgado, calcule su varianza y determine si es consistente: = y x R: = y = x
1 N 1 N N i=1 yi N i=1 xi

donde y =

1 N

yi
i=1

x=

1 N

xi
i=1

N i=1 yi N i=1 xi

(1)

Reemplazando yi = xi + ui (expresin poblacional) en (1): = = =


N i=1 (xi + N i=1 xi N =1 ui + i N i=1 xi N i=1 ui N i=1 xi

ui )

N i=1 N i=1

xi xi

N i=1 N i=1

ui xi

(2) (3) (4)

Ahora para ver si el estimador es insesgado, tomemos valor esperado a (3): ] = E [ = + 1


N i=1 E [ui ] N i=1 xi

Utilizando la propiedad de operador lineal de la Esperanza, y el supuesto que ui tiene esperanza igual a cero, el estimador propuesto es insesgado. (20 PUNTOS) Ahora calculemos su varianza: ) = V ( = = = = ) = V ( (30 PUNTOS) El Error cuadrtico medio (ECM) se este estimador es igual a la varianza, ya que es un estimador insesgado: ) = ECM ( ) = ECM ( ) + [sesgo]2 V (
0

E [ ]]2 E [

]2 E [ E 1 ( (
N i=1 N i=1 N i=1

utilizando ui xi E
i=1 N 2

(4) 1
N 2

(
N

N i=1

xi )2

E
i=1

ui

xi )2 xi )2
2

u2 i + N (N 1)ui uj E [u2 i ] +N (N 1) E [ui uj ]

1
N i=1

i=1

n (
N i=1

xi )2

n 2 (
N i=1

xi )2

Para demostrar que es consistente, en el lmite el error cuadrtico medio (o varianza) debe ser igual a cero, de esta forma el estimador converge en media cuadrtica a su verdadero valor, y es estimador se dice consistente:
n

) = l m V (

n 2 (
N i=1

xi )2

l m

n2 2 n(
N i=1

xi )2

= l m

2 n n

1
N i=1

xi

y por lo tanto, es consistente. (20 PUNTOS)

2 1 2 n n (x) 1 2 l m =0 2 (x) n n l m
0

m.s p o

) = plim(

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Control 1

Semestre: Primavera 2006 Profesores: Jos Miguel Benavente, Rodrigo Montero Tiempo de duracin: 20 minutos No hay preguntas de ningn tipo para los ayudantes. Comente (6 puntos) En el contexto del modelo de regresin lineal de dos variables (Yi = + Xi + i ) el signo de estar determinado por el signo del coeciente de correlacin entre X e Y. Respuesta. El coeciente de correlacin entre X e Y se dene como: = Cov (X, Y ) X Y

donde X y Y representan las desviaciones estndar de X e Y , respectivamente. Por lo tanto: y2 donde la letra en minsculas indica que la variable se encuentra en desvos respecto a la media. Por lo tanto: = y2 x2 = xy x2

Es decir, el signo del estimador de va a depender del signo del coeciente de correlacin entre X e Y . Por lo tanto, el comente es verdadero. Problema (14 puntos) Considere el siguiente modelo: Yi = + Xi + i 1

donde i es independiente e identicamente distribuido con media 0 y varianza 2 . La variable X tiene las siguientes realizaciones: X1 = 1, X2 = 2, X3 = 3, X4 = 4, X5 = 5 y X6 = 6. Un econometrista estima la pendiente de esta relacin mediante la siguiente expresin: = 1 (Y6 + Y5 Y2 Y1 ) 8 1. Muestre que este estimador es insesgado. Respuesta. Reemplazando: = 1 (X6 + X5 X2 X1 + 6 + 5 2 1 ) 8 Reemplazando por los valores de X : = 1 (8 + 6 + 5 2 1 ) = + 1 (6 + 5 2 1 ) 8 8 Aplicando esperanza se llega a: ) = E ( Por lo tanto, este estimador es insesgado. 2. Derive su varianza y determine la eciencia relativa de este estimador respecto al estimador de mnimos cuadrados ordinarios. Respuesta. Se sabe que: = + 1 (6 + 5 2 1 ) 8 Aplicando varianza:
2 ) = 1 V ar(6 + 5 2 1 ) = V ar( 64 16

Por otro lado: V ar( M CO ) = 2 2 2 = x2 35

Por lo tanto, la eciencia relativa de este estimador viene dada por: ) V ar( 35 = >1 V ar( M CO ) 32 ES decir, este estimador es menos eciente que el estimador de mnimos cuadrados ordinarios.

Econometr a I
Semestre Primavera 2007 Control 1
Pauta Desarrollo Profesores: Jos e Miguel Benavente, Rodrigo Montero P. Ayudantes: Rodrigo Bravo C., Felipe R os B., Loreto Silva V. Puntaje Total: 100 pts. 1. (50 Pts.) Considere el modelo de regresi on lineal Y = X + con regresores determin sticos y errores id entica e independientemente distribuidos pero con primero momento igual a a, (i M CO ) = 2 (X X )1 y por ende el iid(a, 2 ), i). Entonces si a es distinto de cero entonces V ar( estimador deja de ser eciente. Respuesta: Falso por los dos motivos siguientes: M CO ) sigue siendo 2 (X X )1 ya que el supuesto en el enunciado Si E (u) = a, entonces V ar( 2 no altera el hecho que var(u) = u I. M CO ya no es insesgado y por ende no podemos hablar de Si E (u) = a, el estimador eciencia. Ya que es una propiedad que se aplica s olo a los estimadores insesgados. 2. (50 Pts.) Demuestre que en un modelo de regresi on lineal m ultiple con k regresores, el estimador insesgado de la varianza del error es: = Respuesta: Primero, el vector de residuos estimados puede escribirse en funci on de los residuos poblacionales de la siguiente forma: u = Mu Donde M = In X (X X )1 X , matriz de dimensi on nx n idempotente y que satisface M X = 0. Entonces: E ( uu ) = E (u M M u) = E (u M u), dada las caracter sticas de la matriz M. Como u M u es un escalar entonces E (u M u) = E [T r(u M u)]. Al cambiar el orden de las matrices queda:
2 In ] = E (u M u) = E [T r(u M u) = E [tr(M u u)] = T r[E (M u u)] = T r[M E (u u)] = T r[M u 2 2 1 2 u T r(M ) = u [T r(In) T r[X (X X ) X ]] = u (n k ) 2 (n k ) para que la suma de los errores al cuadrado sea un Por lo tanto como E (u M u) = u 2 estimador insesgado de u debemos dividir por (n k ). 2 u i 2 E ( i=1 u i 2 ) (n k )u 2 E ( ) = = = u nk nk nk n i=1 n

u i 2 nk

n i=1

1)

Comentes a) Cuando hay variables omitidas en la regresin, que son determinantes de la variable dependiente, entonces el estimador MCO de la variable incluida siempre estar sesgado. b) El teorema de Gauss-Markov prueba que, con errores homocedsticos, el estimador OLS es insesgado. 2 c) Una de las condiciones importantes de Gauss-Markov es var(ui|X1,, Xn) = u ,0<

u2 < for i = 1,, n,.


d) Cuando los errores son heterocedsticos OLS es insesgado y eficientes, a menos que haya autocorrelacin. e) Discuta intuitivamente la frmula para el F estadstico para testaer las restricciones 2 2 1 t1 + t2 2 t1 ,t 2 t1t 1 = 0 y 2 = 0 : F = . 2 2 1 t1 ,t2
Answer: For the case when there is no correlation between the two explanatory variables, the formula reduces to a simple average of the squared t-statistics, i.e., F =

1 2 2 ( t1 + t2 ) . 2

The F2, distribution is the distribution of a random variable with a chi-squared distribution with 2 degrees of freedom, divided by 2. Equivalently, the F2, distribution is the distribution of the average of 2 squared standard normal random variables. Because the t-statistics are uncorrelated by assumption, they are independent standard normal random variables under the null hypothesis. If either are nonzero (or both), then either t1 or t2 or both will be large. This leads to a large F-statistic, and hence a rejection of the null hypothesis.

1 or 2

2)

Preguntas Largas

2.1) Considere el modelo Yi = 1 X i + ui , donde ui = cX i2 ei y todos los X y e son i.i.d. y distribuidos N(0,1). a) Pruebe si son satisfechos cada uno de los supuestos extendidos del modelo de regresin mltiple b) Ser el estimador OLS de 1 eficiente? c) Cmo estimara 1 por WLS?
Consider the model Yi = distributed N(0,1). (a)

1 X i + ui , where ui = cX i2 ei

and all of the Xs and es are i.i.d. and

Which of the Extended Least Squares Assumptions are satisfied here? Prove your assertions.

Answer: The extended least squares assumptions are: 1. E(cXiei|Xi) = 0 (conditional mean zero) this holds here since the Xs and es are i.i.d; 2. (Xi, Yi), i = 1,, n are independent and identically distributed (i.i.d.) draws from their joint distribution - this applies here; 3. (Xi, ui) have nonzero finite fourth moments this follows from the normal distribution, which has moments of all orders. 4. 5. var(ui|Xi) = u (homoskedasticity) this fails since var(ui|Xi) = X i ; and The conditional distribution of ui given Xi is normal (normal errors) this holds since X i , ui is perfectly normal, so to speak.
2 4

(b)

Would an OLS estimator of

be efficient here?

Answer: Since the model is heteroskedastic, WLS offers efficiency gains. (c) How would you estimate 1 by WLS? Answer: You would weight each observation by 1/ X i , i.e., regress Yi / X i on 1/ X i .
2 2

2.2) Se tienen datos de 104 pases para determinar cuales son los determinantes de las diferencias entre calidad de vida (medido por nivel de inreso percpita) en el mundo. Recuerde de su curso de Maroeconoma que el modelo de crecimiento neoclsico sugiere que el nivel de producto por trabajador (ingreso per cpita) estn determinados, entre otros, por la tasa de ahorro y el crecimiento de la poblacin. Para testear este modelo se corre la siguiente regresin: = 0.339 12.894 n + 1.397 sK RelPersInc R2=0.621, SER = 0.177 donde RelPersInc es PIB por trabajador relativo a US, n es el crecimiento de la poblacin promedio, 1980-1990, y sK es la tasa de inversin promedio como porcentaje del PIB de 1960 a1990 (recuerde inversin=ahorro). a) Interprete los resultados. Son los signos esperados? Explique. b) Recuerdas que tambin el capital humano important para determinar las diferencias en estndar de vida de un pas. Por eso agregas datos adicional es de aos de educacin promedio para 1985 (Educ) a la regersin. Los nuevos resultados son: = 0.046 5.869 n + 0.738 sK + 0.055 Educ RelPersInc 2 R =0.775, SER = 0.1377 Cmo afecta los resultados anteriores?

c) Chequeando los resultados te das cuenta que ahora hay 86 observaciones, ya que los datos de Educ no estn disponibles para todos los pases. Tienes que modificar alguna de tus conclusiones en (b)? d) Brazil tiene los siguientes valores: RelPersInc = 0.30, n = 0.021, sK = 0.169, Educ = 3.5. T ecuacin sobre estima o sub estima el PIB percpita de Brazil? Qu pasara si Brazil logra duplicar su nivel educacional?

You have collected data for 104 countries to address the difficult questions of the determinants for differences in the standard of living among the countries of the world. You recall from your macroeconomics lectures that the neoclassical growth model suggests that output per worker (per capita income) levels are determined by, among others, the saving rate and population growth rate. To test the predictions of this growth model, you run the following regression:

= 0.339 12.894 n + 1.397 sK , R2=0.621, SER = 0.177 RelPersInc


where RelPersInc is GDP per worker relative to the United States, n is the average population growth rate, 1980-1990, and sK is the average investment share of GDP from 1960 to1990 (remember investment equals saving). (a) Interpret the results. Do the signs correspond to what you expected them to be? Explain. Answer: The Solow growth model predicts higher productivity with higher saving rates and lower population growth. The signs therefore correspond to prior expectations. A 10 percent point increase in the saving rate results in a roughly 14 percent increase in per capita income relative to the United States. Lowering the population growth rate by 1 percent results in a 13 percent higher per capita income relative to the United States. It is best not to interpret the intercept. The regression explains approximately 62 percent of the variation in per capita income among the 104 countries of the world. (b) You remember that human capital in addition to physical capital also plays a role in determining the standard of living of a country. You therefore collect additional data on the average educational attainment in years for 1985, and add this variable (Educ) to the above regression. This results in the modified regression output:

= 0.046 5.869 n + 0.738 sK + 0.055 Educ, R2=0.775, SER = 0.1377 RelPersInc


How has the inclusion of Educ affected your previous results? Answer: The coefficient on the population growth rate is roughly half of what it was originally, while the coefficient on the saving rate has approximately doubled. The regression R2 has increased significantly. (c) Upon checking the regression output, you realize that there are only 86 observations, since data for Educ is not available for all 104 countries in your sample. Do you have to modify some of your statements in (d)?

Answer: When comparing results, you should ensure that the sample is identical, since comparisons are not valid otherwise. (d) Brazil has the following values in your sample: RelPersInc = 0.30, n = 0.021, sK = 0.169, Educ = 3.5. Does your equation overpredict or underpredict the relative GDP per worker? What would happen to this result if Brazil managed to double the average educational attainment? Answer: The predicted value for Brazil is 0.240. Hence the regression underpredicts Brazils per capita income. Increasing Educ to 7.0 would result in a predicted per capita income of 0.43, which is a substantial increase from both its current actual position and the previously predicted value.

2.3) Una sub-muestra de la encuesta de CASEN 2003 tiene los siguientes datos de salarios por hora individuales, edad y gnero. Leste en las noticias que por cada peso que gana un hombre la mujer gana 0,7 pesos. Para testear est hiptesis, primero regresionas ingresos en una variable binaria que toma el valor 1 si es mujer y 0 si es hombre, y una constante. Estos son los resultados:

a) Desarrolle un test de diferencias de medias e indique si las diferencias entre los salarios de hombres y mujeres son estadsticamente significativas. Justique su eleccin de un test de una o dos colas. Es esta evidencia de discriminacin en contra de la mujer? Por qu? Es probable que los errores se distribuyan normalmente en este caso? Si no, presenta esto un problema para hacer el test? b) Decides incluir como control la edad (en aos). Los resultados son los siguientes:

Testee la significancia de edad y gnero. Por qu crees que la edad juega un rol en la determinacin de los salarios.

2.3)

A subsample from the Current Population Survey is taken, on weekly earnings of individuals, their age, and their gender. You have read in the news that women make 70 cents to the $1 that men earn. To test this hypothesis, you first regress earnings on a constant and a binary variable, which takes on a value of 1 for females and is 0 otherwise. The results were:

= 570.70 - 170.72 Female, R2=0.084, SER = 282.12. Earn


(9.44) (13.52) (a) Perform a difference in means test and indicate whether or not the difference in the mean salaries is significantly different. Justify your choice of a one-sided or two-sided alternative test. Are these results evidence enough to argue that there is discrimination against females? Why or why not? Is it likely that the errors are normally distributed in this case? If not, does that present a problem to your test? Answer: The t-statistic is -12.63, while the critical value is 1.64. The difference is therefore statistically significant. A one-sided alternative was chosen since the claim is that females make less than males. This represents little evidence of discrimination, since attributes of males and females have not been included. Given that earnings distributions are not normally distributed, the errors will also not be distributed

normally, and assuming that they are, results in problematic inference.

(b)

Test for the significance of the age and gender coefficients. Why do you think that age plays a role in earnings determination? Answer: The t-statistics are 9.36 for the age coefficient, and -13.00 for the gender coefficient. Both of these values are greater than the (absolute) critical value from the standard normal distribution (1.64). Hence you can reject the null hypothesis that these coefficients are zero. Age proxies on the job training. A better proxy that has been used frequently in the past is the Mincer experience variable (Age-Education-6). Obviously this is a better proxy for some subsample of individuals than for others.

2.4)
n

Demuestre que aunque el estimar MCO en el modelo de regersin lienal simple,es

= 1

X Y nXY
i =1 n i i 2 i

X
i =1

. Si minimizamos la suma de los cuadrados de los residuos en el

nX

modelo de regresin lineal mltiple Yi = 0 + 1 X 1i + 2 X 2 i + ui , los estimadores MCO no = son 1

X 1iYi nX 1Y
i =1 n

X
i =1

2 1i

nX

= y 2

X
i =1 n i =1

2i i 2 2i

Y nX 2Y , a menos que nX 2
2

2 1

X
i =1

2i

X 1i = 0 .

For the simple linear regression model of Chapter 4, Yi = 0 + 1 X i + ui , the OLS estimator for the

=Y X , and = intercept was 0 1 1

X Y nXY
i =1 n i i 2 i

X
i =1

. Intuitively, the OLS estimators for the

nX

=Y X X regression model Yi = 0 + 1 X 1i + 2 X 2 i + ui might be 0 1 1 2 2


= , 1

X
i =1 n i =1

1i i 2 1i

Y nX 1Y nX
2 1

= and 2

X
i =1 n i =1

2i i 2 2i

Y nX 2Y
. By minimizing the prediction mistakes of the

nX 2

regression model with two explanatory variables, show that this cannot be the case. Answer: To minimize the sum of squared prediction mistakes

(Y b
i =1 i

b1 X 1i b2 X 2 i )2

you need to take the following three derivatives with respect to b0 , b1 and b2 . This results in

b0

(Yi b0 b1 X 1i b2 X 2i )2 = 2 (Yi b0 b1 X 1i b2 X 2i )
i =1 i =1

n n 2 ( Y b b X b X ) 2 (Yi b0 b1 X 1i b2 X 2 i ) X 1i = i 0 1 1i 2 2i b1 i =1 i =1 n n (Yi b0 b1 X 1i b2 X 2 i ) 2 = 2 (Yi b0 b1 X 1i b2 X 2 i ) X 2 i b2 i =1 i =1

The OLS estimators are those for which the derivatives are zero. Hence we get

X X ) = 0; =Y X X 2 (Yi 0 1 1i 2 2i 0 1 1 2 2
i =1 n 2 X X ) X = 0; Y X = 2 (Yi i 1i 0 nX 1 + 2i 1i 0 1 1i 2 1 X 1i + 2 X 2i X 1i i =1 n i =1 n i =1 i =1 n n n

2 X X ) X = 0; Y X = 2 (Yi i 2i 0 nX 2 + 2i 2i 0 1 1i 2 2 X 2 i + 1 X 2 i X 1i i =1 i =1 i =1 i =1

=Y X X . It is clear that the first of these three expressions results in 0 1 1 2 2


However, the second (third) expression involves terms in X 2 i ( X 1i ), hence the

= formula cannot be simplified to 1

X 1iYi nX 1Y
i =1 n

X
i =1 n

2 1i

nX

= ( 2

X
i =1 n i =1

2i i 2 2i

Y nX 2Y
)

2 1

nX 2

unless special conditions hold (such as

X
i =1

2i

X 1i = 0 ).

Control #1 Econometr a I
Profesores: Tom as Rau y Javiera V asquez Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda 26 de marzo, 2008
Tiempo Total: 30 Minutos.

1.

Comentes (10 puntos, 5 c/u)

1) La recta de regresi on poblacional es igual a la funci on de regresi on poblacional. (beautiful mind) R. Depende. En general es falso. En particular, si las variables aleatorias tienen una distribuci on normal bivariada, la esperanza condicional, i.e. la funci on de regresi on poblacional es una funci on lineal de X y por lo tanto es una recta de regresi on poblacional. En ese caso es verdadero. 2) La representaci on estoc astica de la funci on de regresi on poblacional implica que E (u|X ) = 0. Por otra parte, la ley de las esperanzas iteradas implica que E (u) = 0. Esto es conveniente puesto que el error poblacional es cero, en promedio. R. Verdadero. La representaci on est ocastica de la funci on de regresi on poblacional implica que E (u|X ) = 0 puesto que asume que Y = E (Y |X ) + u. Al tomar esperanza condicional a los dos lados de la ecuaci on tenemos que E (u|X ) = 0. Tambi en es cierto que la LEI implica que E (u) = 0 puesto que E [E (u|X )] = E (u) y E [E (0|X )] = 0. Adem as de conveniente es una condici on que impone la representaci on estoc astica (si E (u|X ) = 0 veremos m as adelante que MCO no ser a insesgado ni consistente).

2.

Problema (20 puntos)

Suponga que Ud. dispone de datos agragegados del Simce para colegios de dos comunas de Santiago: Puente Alto y Recoleta, las cuales ser an indexadas por los ndices p y r respectivamente. Los puntajes 2 2 = 100 y Sr = 72. Por u ltimo, promedios fueron Y p = 270 y Y r = 260 con varianzas muestrales dadas por Sp los tama nos muestrales logrados fueron de np = 10 y nr = 12. A pesar de la importante diferencia de 10 puntos, personeros de la comuna de Recoleta insisten que la media en esa comuna ser a m as alta que en Puente Alto. Para ayudar a esclarecer esa diferencia, realice un test de diferencia de medias de la siguiente hip otesis nula: H0 : p < r ante la alternativa H1 : p r . Asuma que las muestras son aleatorias simples y utilice un nivel de signicancia de = 5 % y luego = 1 %. Qu e puede inferir de los resultados de las pruebas de hip otesis? R. Simplemente, t= YpYr
2 /n + S 2 /n Sp p r r

10 = 2,5 4

adem as, t5 %,20 = 1,725 y t1 %,20 = 2,528. Por lo tanto, t > t5 %,20 lo cual implica que se rechaza la hip otesis nula que la media de Recoleta es mayor que la de Puente Alto a un 5 % de signicancia. Por otro lado, t < t1 %,20 , con lo cual no se rechaza la hip otesis nula a un 1 % de signicancia. Luego, dado que la signicancia es la probabilidad de cometer error de tipo I, vemos que se rechaza facilmente para estandares convencionales (5 %) pero si somos un poco m as exigentes (o aversos al riesgo de cometer dicho error) no rechazamos la hip otesis nula. Dado el tama no muestral y las propiedades asint oticas de los estimadores, es sensato usar un nivel de signicancia de 5 % y asumir que existe un 5 % de probabilidad de cometer error de tipo I e igualmente rechazar la hip otesis nula. Cuadro 1: Valores Cr ticos para una distribuci on t-Student
n-k 1 2 3 4 5 . . 20 21 22 23 90 % 3.078 1.886 1.638 1.533 1.476 95 % 6.314 2.92 2.353 2.132 2.015 97.50 % 12.71 4.303 3.182 2.776 2.571 99 % 31.82 6.965 4.541 3.747 3.365 99.50 % 63.66 9.925 5.841 4.604 4.032

1.325 1.323 1.321 1.319

1.725 1.721 1.717 1.714

2.086 2.080 2.074 2.069

2.528 2.518 2.508 2.500

2.845 2.831 2.819 2.807

CONTROLES 2

..

. .

Profesores+

Econometria 1 - . J.M. U.enavenle, A. Otero y J. Vsquez. - PRIMAVkA 2 0 0 4 . ., C ONTROL 2

.I_

.,

<

c Nor11brc: Rut:

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..* .. .......................................... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ._.. . . .

control, no puede hacer consultas a los ayudantes, no puedo tener nada m& que l&piz en su escritorio, si contesta con l&piz mina no tiene derecho a reclamo. Contestar ~610 en el espacio disponible Pregunta 1: (30 puntos) En el modelo de regresibn lineal de una variable explicativa si la variable independiente -Y no rara, entonces el estimador ,/$ ser igual al verdadero valor pobla-

.................................................................................................................... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..*..................................... Pregunta 2: (70 puntos) En un modelo de regresin lineal con k variables explicativas, Y = X/~+U. Demuestre que el estimador mnimos cuadrados ordinarios cumple con la condicin de minimizar la suma de errores al cuadrado. .$M, =

N\J j& c (hYn) )JJM.= . YY

CQQ

Econometra I Profesora: Javiera Vsquez. Verano 2005 Control 2

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) En el contexto de un Modelo de Regresin Lineal (MRL), la recta de regresin pasa por los valores promedios de la variable dependiente. Comente. Este se cumple siempre que el modelo de regresin incluya un trmino constante, es la constante justamente quien cumple el rol de asegurar que el promedio muestral del valor estimado de Y se iguale con el promedio muestral de los valores observados de Y . Si el modelo incluye trmino constante por condicin de primer orden se cumple que ui = 0, y que el valor estimado de 1 = Y 2 X , de lo que deduce inmediatamente que la recta de regresin la constante (1 ) es 1 + 2 X . Por lo tanto, esta armacin es verdadera slo pasa por los valores promedio: Y = si estamos hablando de un modelo que incluye trmino constante. Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresin Lineal Simple: Yi = 1 + 2 Xi + ui para i = 1, ..., N

Adems posee la siguiente informacin muestral de X e Y: Y X 2 0 5 10 6 18 7 20

a. Obtenga el estimador Mnimos Cuadrados Ordinarios de 1 y 2 . 2 , pero en un modelo sin constante. Cmo cambia con respecto al obtenido en b. Determine a.? c. Cales son las consecuencias de no incorporar el trmino constante en la especicacin? R: a. Los estimadores MCO de 1 y 2 son: 1 2 2 X = Y =
4 i=1 (Xi X ) (Yi 4 2 i=1 (Xi X )

Y)

Utilizando la informacin muestral entregada tenemos: 1

Promedio Suma De esta forma,

Y 2 5 6 7 5

X 0 10 18 20 12

Y Y -3 0 1 2

X X -12 -2 6 8

(Y Y )(X X ) 36 0 6 16 58

(X X )2 144 4 36 64 248

2 1

= =

58 = 0,233870968 248 5 0,233870968 12 = 2,193548387

Tambin se puede obtener los estimadores de 1 y 2 utilizando la forma matricial del estimador MCO: = (X X )1 X Y utilizando la informacin disponible: = (40 puntos) b. El estimador MCO de 2 es un modelo sin constante (Y = 2 X + u) es1 : 2 =
4 i=1 Xi Yi 4 2 i=1 Xi 1

1 2

4 48 48 824

20 298

2,193548387 0,233870968

Como el modelo no incluye constante, este estimador NO queda expresado en desvos con respecto a la media. Utilizando la informacin disponible: Y 2 5 6 7 5 X 0 10 18 20 12 Y X 0 50 108 140 298
4

X2 0 100 324 400 824

Promedio Suma
1 Este

2 : se obtiene de minimizar la suma de los errores al cuadrado con respecto a m n 2 ) SE ( = 2


4 i=1 4 2 i=1

2 Xi )2 (Yi

CP O :

2 Xi )(Xi ) = 0 2 (Yi 2 X 2 ) = 0 (Xi Yi + i 2 =


4 i=1 Xi Yi 4 2 i=1 Xi

i=1

Por lo tanto, = 0,361650485 2 Como podemos apreciar el valor estimado para 2 , es mayor que el en caso donde se incluye la constante, esto porque al ser positiva la constante y omitirla se genera un sesgo hacia arriba del parmetro de pendiente. Esto se puede apreciar grcamente en la siguiente gura, que dibuja las recta de regresin estimadas de un modelo con y sin constante:

Modelo con constante Modelo sin constante

Al ser la constante positiva (cuando la estimamos), si la obligamos a ser cero (estimacin si constante), la pendiente de la recta de regresin aumenta para lograr minimizar la suma de los errores al cuadrado. (20 puntos) c. Las consecuencias de estimar un modelo sin constante son: Sesgo en el parmetro de pendiente (se omite una variable, la constante) No se garantiza que
n i=1

u i = 0

No se garantiza que la recta de regresin pase por los valores promedios de las variables observadas, no se garantiza que el promedio estimado de la variable dependiente sea igual al promedio observado de dicha variable. (10 puntos)

Econometra I Profesores: A. Otero y J. Vsquez. Primavera 2004 Pauta Control 2 Pregunta 1: (30 puntos) En un modelo de regresin lineal simple: Yi = 1 + 2 Xi + ui , mientras menor es la varianza de los errores estimados y mientras mayor es la varianza muestral de la variable explicativa, el estimador MCO de 2 es menos preciso. Comente. Recordemos que la varianza del estimador MCO de 2 es: 2 ) = V ar( 2 = n 2 i=1 (Xi X )
n n

2 2 = n 2 n V ar(X ) i=1 (Xi X )

donde V ar(X ) es el estimador muestral de la varianza de X . De esta forma, a medida que 2 y el estiaumenta la varianza de X y disminuye la varianza de u , disminuye la varianza de mador es ms preciso. Con lo cual el comente es falso. Pregunta 2: (70 puntos) Demuestre que en un modelo de regresin lineal mltiple con k regresores, el estimador insesgado de la varianza del error es: 2 = u 2 i nk
n i=1

Primero, el vector de residuos estimados puede escribirse en funcin de los residuos poblacionales de la siguiente forma: u = Mu Donde M = In X (X X )1 X , matriz de dimensin nxn idempotente y que satisface M X = 0 E ( uu ) = E (u M M u) = E (u M u), por las caractersticas de la matriz M. Como u M u es un escalar E (u M u) = E [T r(u M u)] Recordemos que la traza es un operador lineal y antes de introducir la esperanza podemos, por propiedades de la traza, cambiar el orden de las matrices.
2 E (u M u) = E [T r(u M u) = E [tr(M uu )] = T r[E (M uu )] = T r[M E (uu )] = T r[M u In ] = 2 2 1 2 u T r(M ) = u [T r(In ) T r[X (X X ) X ])] = u (n k ) 2 Por lo tanto como E ( uu ) = u (n k ) para que la suma de los errores al cuadrado sea un 2 estimador insesgado de u debemos dividir por (n k ). 2 u = u u nk 2 E ( u )= E ( uu ) nk

2 (nk)u nk

2 = u

Econometra I Profesores: Emerson Melo Rodrigo Montero Javiera Vsquez

Primavera 2005 Pauta Control 2 Pregunta 1: (30 puntos) Si un estimador es insesgado, signica que no existe error de estimacin. Comente. Falso, al tratar de aproximar un parmetro poblacional a partir de una muestra siempre existe un error de estimacin, es inevitable debido a las uctuaciones muestrales (Ver Figura). Lo que sucede si es el estimador es insesgado es que este error de estimacin en promedio es igual a cero y por lo tanto, en valor esperado el estimador es igual a su valor poblacional.

Figura 5: Rectas de Regresin muestral y poblacional

Pregunta 2: (70 puntos) Sea el siguiente modelo de regresin lineal mltiple: Yi = 1 + 2 X2i + 3 X3i + ui Ud. dispone de la siguiente informacin sobre este modelo: 10 10 5 30 X X = 10 56 63 X Y = 77 5 63 115 56 a) (30 puntos) Encuentre la matriz (XX) y (XY) del modelo en desvos con respecto a la media. Las matrices (XX) y (XY) del modelo original tienen la siguiente forma generalizada: n X2i X3i Yi 2 X2i X2 X2i X3i X Y = Yi X2i XX= i 2 X3i X2i X3i X3 Yi X3i i

y las matrices (XX) y (XY) del modelo en desvos con respecto a la media tiene la siguiente forma generalizada: XX= (X2i X2 )2 (X2i X2 )(X3i X3 ) (X2i X2 )(X3i X3 ) (X3i X3 )2 XY = (X2i X2 )(Yi Y ) (X3i X3 )(Yi Y )

Debemos determinar los valores al interior de estas ltimas matrices a partir de la informacin entregada: Y X2 X3 (X2i X2 )2 (X3i X3 )2 = = = = = Yi 30 = =3 n 10 X2i 10 = =1 n 10 X3i 5 = = 0,5 n 10 2 2 X2 i n X2 = 56 10 1 = 46
2 2 X3 i n X3 = 115 10 (0,5) = 112,5 2

(X2i X2 )(X3i X3 ) = (X3i X3 )(X2i X2 ) = (X2i X2 )(Yi Y ) = (X3i X3 )(Yi Y ) = 68

X2i X3i nX2 X3 = 63 10 1 (0,5) = 68

X2i Yi nX2 Y = 77 10 1 3 = 47 X3i Yi nX3 Y = 56 10 (0,5) 3 = 71

Con estos valores podemos computar ambas matrices: XX= 46 68 68 112,5 XY = 47 71

b) (30 puntos) Encuentre los estimadores MCO de 2 y 3 = 2 3 = = = 2 3 = 46 68 68 112,5 1 5175 4624 1 459,5 70 551 0,834 0,127
1

47 71 68 46 47 71

112,5 68

c) (10 puntos) Recupere el estimador MCO de 1 1 1 2 X2 3 X3 = Y = 3 0,834 1 0,127 (0,5) = 2,23

Verano 2005-2006

Econometra I
: :

Profesor Ayudante

Jaime Ruiz-Tagle V. Roberto Jaramillo M.

Control 2 - Pauta de Correccin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.
Pregunta 1 (30 puntos)
(a) Explique verbalmente en qu consiste el mtodo de Mnimos Cuadrados Ordinarios.

El mtodo MCO busca escoger los coecientes de regresin de tal manera que la funcin de regresin muestral sea lo ms cercana a la funcin de regresin poblacional, lo que esquivale a decir que trata de que los errores sean lo menor posible. Sin embargo, si tomamos slo la minimizacin de la suma de los errores, puede darse que estos se compensen entre ellos, dando que este valor sea muy bajo, pero que el modelo estimado no sea bueno. Para solucionar este problema, se minimiza la suma de los errores al cuadrado, lo que entrega una mayor ponderacin a los errores ms grandes.

(b) Enumere y explique 4 de los 9 supuestos detrs del mtodo de Mnimos Cuadrados Ordinarios.

(4 puntos cada uno, la explicacin est en los apuntes). 1. 2. 3. 4. 5. 6. El modelo de regresin es lineal Los valores de X son jos El valor medio del error ui es igual a cero Homocedasticidad de ui No existe autocorrelacin entre los errores La convarianza entre ui y Xi es cero
1

7. El nmero de observaciones n debe ser mayor que el nmero de parmetros por estimar 8. Variabilidad en los valores de X 9. El modelo de regresin est correctamente especicado
Pregunta 2 (30 puntos)
(a) Explique en qu consiste el sesgo en la estimacin de un parmetro.

El sesgo en un parmetro corresponde a la diferencia entre el valor esperado del estimador del parmetro y el valor verdadero del parmetro. Por lo tanto, esta ] . Si este es insesgado, entonces E [ ] = . medida se conoce como E [

(b) Considere un modelo de 2 variables explicativas como

Yi = 0 + 1 Xi + ui . 1 =

(1)

Muestre detalladamente que el estimador de Mnimos Cuadrados Ordinarios (MCO) de


i i 2 i

Py x Px

es insesgado. (Recuerde que

, xi = Xi X

donde

es la media

aritmtica de

Xi ).

Primero hay que obtener la especicacin de este modelo cuando se dene en desvos con respecto a la media. Para esto, podemos obtener la media de (1)
Yi = 0 + 1 Xi + ui Yi = Yi = n 0 + 0 + n 1 Xi + 1 Xi + n ui ui n
=0

= 0 + 1 X Y

(2)

Ahora restndole a (1) lo obtenido en (2)


= 1 (Xi X ) + ui Yi Y yi = 1 xi + ui

(3)

de donde se obtiene el estimador de MCO para 1 . Remplazamos en la frmula el valor obtenido en (3):

1 =

yi xi x2 i xi (1 xi + ui ) = x2 i x i ui x2 i + = 1 2 xi x2 i xi ui = 1 + x2 i

(4)

Ahora aplicando valor esperado a (4):


xi ui x2 i x i ui = E [1 ] + E x2 i
=0

1 ] = E 1 + E [

= 1 + 1 ] = 1 E [ 1 es insesgado. Lo que signica que

E (xi ui ) x2 i
(5)

Universidad de Chile Facultad de Economia y Negocios Econometra I Otoo 2006 Pauta Control 2 Profesoras: Claudia Sanhueza y Javiera Vsquez. Pregunta 1: (70 puntos) Un modelo de regresion multiple incluye dos regresores: yi = 0 + 1 x1i + 2 x2i + i . En este modelo se cumplen todos los supuestos clasicos vistos en clases y ademas se cumple que la E (x1i x2i ) = 12 . Suponga que un investigador estima el modelo sin considerar u omitiendo b , el estimador MCO de , un estimador insesgado?. la variable x2i . Es 1 1 Demuestre su respuesta. Ayuda: El modelo que estima este investigador tiene un error estocastico ui = 2 x2i + i . (10 puntos) Usando la ayuda. El modelo que estima el investigador es entonces: yi = 0 + 1 x1i + ui , donde ui = 2 x2i + i b1 expresado en desvios c/r a la media es: (10 puntos) Por lo tanto Xn (x1i ! x1 ) (yi ! y) i=1 b = Xn 1 (x1i ! x1 )2
i=1

(10 puntos) Para ver si este estimador insesgado tomemos esperanza: ! Xn # (x1i ! x1 ) (yi ! y ) i=1 b $ = E" E Xn 1 (x1i ! x1 )2 ! Xn i=1 # (x1i ! x1 ) [ 1 (x1i ! x1 ) + (ui ! u)] i=1 $ = E" Xn 2 (x1i ! x1 ) i=1 ! Xn # Xn 2 1 (x1i ! x1 ) + (x1i ! x1 ) (ui ! u) i=1 i=1 $ = E" Xn (x1i ! x1 )2 i=1 ! # Xn (x1i ! x1 ) (ui ! u) i=1 $ = E " 1 + Xn (x1i ! x1 )2
i=1

(20 puntos) Pero ui = 2 x2i + i , en desvios c/r a la media es ui ! u = 2 (x2i ! x2 ) + i , ya que = 0, entonces: ! # Xn (x1i ! x1 ) (ui ! u) i=1 b $ E = E " 1 + Xn 1 (x1i ! x1 )2 i=1 ! # Xn (x1i ! x1 ) [ 2 (x2i ! x2 ) + i ] i=1 $ = E " 1 + Xn (x1i ! x1 )2 i=1 ! # Xn Xn (x1i ! x1 ) (x2i ! x2 ) (x1i ! x1 ) i i=1 i=1 $ = E " 1 + 2 + X Xn n (x1i ! x1 )2 (x1i ! x1 )2
i=1 i=1

(10 puntos) Asumiendo los supestos clasicos del modelo original se cumplen y tenemos una muestra sucientemente grande: b " + E 1 1 2 12 V ar (x1 )
a

12 +0 V ar (x1 )

= 1 + 2

Pregunta 2: (30 puntos) Un R2 y R alto no signica que no existe sesgo de variables omitida. Comente.
2

b1 el estimador del modelo que omite la variable (10 puntos) Por lo tanto x2 cuando esta esta correlacionada con x1 , es sesgado. (Esto no tienen puntos: b1 es insesgado). Notar que si 12 = 0 entonces
2

(10 puntos) El R2 y R nos dice si las variables explicativas includias en el modelo "explican" la variable dependiente, las variables explicativas, son entonces buenos predictores de la variable dependiente. (20 puntos) Sin embargo, puedo estar incluyendo variables no relevantes desde el punto de vista teorico, o estar no observando variables que esten correlacionadas con algunas de las variables explicativas, e igual tener un alto R2 2 y R . O sea, puedo estar estimando parametros sesgados y tener un alto R2 y 2 2 R . Un sesgo de variable omitida puede darse con cualquier nivel de R2 y R .

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Control 2

Semestre: Primavera 2006 Profesores: Jos Miguel Benavente, Rodrigo Montero Tiempo de duracin: 20 minutos No hay preguntas de ningn tipo para los ayudantes

Comente (6 puntos) Mientras ms variables independientes se incluyan en el modelo, ms precisas sern las estimaciones, pues se utilizar una mayor cantidad de informacin. Respuesta. Falso. A medida que se incorporan ms regresores en la estimacin se va perdiendo precisin en las estimacin. Esta situacin se aprecia claramente en el diagrama de Ballentine Venn, que muestr cmo al incorporar regresores adicionales acarrea una prdida de informacin para hacer la estimacin (rea roja). Tericamente sera posible que no se produjera esta prdida si es que el regresor adicional es completamente ortogonal a los ya incorporados. A modo de ejemplo, considere el siguiente modelo: Yi = 1 + 2 X2i + 3 X3i + i 2 viene dada por: La varianza para 2 ) = V ar( 2 2 x2 2 (1 r23 )

donde r23 corresponde al coeciente de correlacin entre X2 y X3 (la variable en minsculas indica que se encuentra en desviacin respecto a su media). Por lo tanto, al aumentar la correlacin entre ambas variables, la varianza del estimador crece. 1

Ejercicio (14 puntos) Considere el siguiente modelo expresado en desvos respecto a la media: yi = 2 x2i + 3 x3i + i Se tiene adems, la siguiente informacin: y2 = 493 3 x2 2 = 30 x3 y = 20 x2 3 = 3 x2 x3 = 0

x2 y = 30

1. Calcule los estimadores para 2 y 3 (8 puntos) Respuesta. Como las variables X2 y X3 son ortogonales ( x2 x3 = 0),

entonces, cada estimador se obtiene igual que en el caso del modelo de regresin lineal de dos variables: 2 = 3 = x2 y 30 = =1 2 x2 30 x3 y 20 = 2 x3 3

2. Calcule el R2 del modelo estimado (6 puntos) Respuesta. Se sabe que: 2 x2i + 3 x3i + yi = i Elevando al cuadrado y aplicando sumatoria:
2 yi =

2 x2i + 3 x3i + ( i )2

Dado que las variables independientes son ortogonales a los errores estimados, y adems, para este caso son ortogonales entre s, entonces: 1= Es decir: R2 = 1 2 2 2 x2 2i + 3 2 yi x2 3i + 2 i 2 yi x2 3i 490 493

2 2 i 2 = 2 yi 2

2 x2 2i + 3 2 yi

Departamento de Econom a

Universidad de Chile

Econometr a I Control 2
5 de septiembre, Primavera 2007 Miguel Benavente y Rodrigo Montero Profesores: Jose Ayudantes: Rodrigo Bravo,Felipe R os, Loreto Silva

1. Respecto al coeciente de determinacion R2 (33 puntos) : a. Def nalo (9 puntos). Medida de bondad de ajuste que indica qu e parte de la variabilidad de las y (variable dependiente) es explicada por la variabilidad de las x (variables independientes) R2 = ESS T SS (1)

b. Qu e se necesita para que este se pueda interpretar? (8 puntos) Se necesita que el modelo a estimar posea una constante, as , el coeciente de determinaci on se encontrar a entre 0 y 1. Si no incluye constante, se sale de aquel rango y pierde sentido la interpretaci on c. Explique las desventajas que presenta (8 puntos) La principal desventaja es que R2 siempre aumentar a o al menos se mantendr a igual al aumentar el numero de regresores. Se puede llegar, entonces, a altos R2 con regresores que practicamente no explican el modelo d. Qu e otro indicador alternativo pudiera utilizarse, y por qu e ser a m as conveniente? (8 puntos) Un indicador alternativo, dado lo anterior, es el R2 ajustado, el cual castiga la inclusion de una variable poco relevante para el modelo, considerando los grados de liberdad restantes por sumar variables explicativas. Con esto, la medida de bondad del ajuste incluso puede disminuir 2. Comente en no m as de 10 l neas la siguiente aseveraci on: Para que el estimador de m nimos cuadrados ordinarios sea MELI, se necesita que los errores tengan una distribuci on N (0, 2 )(33puntos) Falso. Basandonos en la Clase 6, para que un estimador de minimos cuadrados ordinarios sea MELI, este debe ser Insesgado, un modelo lineal, y el mejor en el sentido de que cualquier otro estimador con estas caracter sticas tendr a una varianza mayor. Si bien es cierto que es importante que la esperanza de los errores sea cero tanto para estimar MCO como para el insesgamiento, esta no es una propiedad exclusiva de la distribuci on normal. Lo mismo ocurre para la homocedasticidad. Ambas cosas pueden ocurrir sin distribuirse normalmente. Incluso, estas dos caracteristicas son supuestos del metodo MCO, donde, en ningun supuesto se indica normalidad en los errores. 3. Suponga el siguiente modelo (34 puntos): yi = 0 + 1 xi + i 2 = 1 N(0, 2 )

xx = =

1 2 0,5 1

2 6

Testee que cada par ametro individualmente es cero. En qu e caso se aceptar a o rechazar a la hip otesis nula? 1

Departamento de Econom a

Universidad de Chile

Plantear hipotesis: H0 : 0 = 0 H0 : 1 = 0 0 = 0 1 = 0

Para encontrar la V ar( ), debemos invertir la matriz XX y luego, multiplicarla por 2 V ar( ) 2 (X X )1 V ar( ) = 2 (X X )1 1 = 1( ) 64 = 1 3 1 1 1 2

6 2 2 1

Por lo tanto, tenemos: V ar(0 ) = 3 V ar(1 ) =


1 2

con lo cual podemos hacer los test t: t0 =


0 ,5 3

tnk

1 tnk t1 = 1
2

La hip otesis nula se rechazar a cuando ttabla < tcalculado

Pauta Control #2 Econometr a I


Profesores: Tom as Rau y Javiera V asquez Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda 9 de abril, 2008
Tiempo Total: 30 Minutos.

1.

Comentes (10 puntos, 5 c/u)

1) En el modelo de k variables, el estimador MCO existe si, y s olo si, la matriz X tiene inversa. (5 puntos) R. Falso. En el caso general n > k s olo se requiere que (X X )1 exista y no que X tenga inversa (recuerde que s olo las matrices cuadradas pueden tener inversa y Xnk ), luego en general el comente es falso. Ahora, si k = n la matriz X es cuadrada y se requiere que (X X )1 = X 1 (X )1 y por lo tanto necesitamos que X tenga inversa. S olo en este caso particular el comente ser a verdadero. 2) El modelo de regresi on en desviaciones con respecto a la media no es muy u til puesto que no podemos estimar el intercepto. (5 puntos) 1 + 2 Xi + u R. Falso, siempre se puede recuperar el intercepto. Por ejemplo, si la RRP es Yi = i , la RRP en desviaci on con respecto a la media es yi = 2 xi + u y podemos estimar 2 . Pero el intercepto 2 X . 1 = Y siempre se puede recuerar de la siguiente manera:

2.

Problema (20 puntos)

Sea el modelo de regresi on de dos variables: yi = 1 + 2 xi + ui , donde yi es la variable dependiente, xi es la variable independiente, 1 , 2 son los par ametros a estimar y ui es el error poblacional con media cero y varianza desconocida 2 (suponga que se cumplen todos los supuestos vistos en clases). Suponga que Ud. tiene una muestra aleatoria simple de yi , xi de tama no n. i) Usando c alculo, obtenga el estimador MCO de 2 . (10 puntos) R. Como vimos en la clase 5, si escribimos el modelo en desviaci on con respecto a la media el problema es m as sencillo: 2 ) = m n SE (
2

2 xi )2 (yi

y las condiciones de primer orden est an dadas por 2 ) SE ( = 2 1 2 xi )xi = 0 2(yi

luego 2 = yi xi x2 i

ii) Obtenga la varianza de 2 y, sin necesidad de demostrar matem aticamente, explique qu e ocurre si n = 2. (10 puntos) R. La varianza se puede obtener f acilmente de la expresi on que encontramos en (i) (ver clase 5) 2 2 )2 = E E ( luego
2 2 ) = var( x2 i

xi ui x2 i

Si n = 2 tenemos que no se puede hacer inferencia en este caso puesto que no existe estimador de 2 (recuerde que 2 = u 2 /(n 2)).

CONTROLES 3

Econometra I Profesora: Javiera Vsquez. Verano 2005 Control 3

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) Es mejor predecir un valor puntual de y 0 que el valor esperado E (y 0 /x0 ), ya que uno hace lo primero con mayor precisin. Comente. Falso, al tratar de predecir un valor puntal de y (y 0 ), el error de prediccin esta compuesto de dos trminos, uno asociado a las diferencias entre el estimador de los parmetros y el valor ) + u. poblacional de ellos y otro correspondiente al error intrnseco de y , es decir: e = x0 ( Sin embargo, cuando se predice simplemente el valor promedio condicional de y , se elimina del error de prediccin, el error asociado a la desviacin de una observacin particular de y de su ). La valor promedio condicional, es decir, el error de prediccin en este caso es: e = x0 ( 2 0 1 0 varianza del error de prediccin en el primer caso es: [1 + x (X X ) x ], y en el segundo caso es simplemente: 2 x0 (X X )1 x0 . Por lo tanto, la prediccin en el primer caso es menos precisa que en el segundo. Pregunta 2: (70 puntos) Con la informacin disponible sobre producto bruto real(Y), dias laborales (L) y capital (K) para el sector agricola de Taiwan (1958-1972), se estima un modelo de regresin lineal con las variables en logaritmos, de la siguiente forma: ln(y ) = 0 + 1 ln(L) + 2 ln(k ) + u A continuacin se presenta la estimacin realizada en Eviews:
Dependent Variable: LY Method: Least Squares Date: 12/31/04 Time: 13:57 Sample: 1958 1972 Included observations: 15 LY=C(1)+C(2)*LL+C(3)*LK Coefficient C(1) C(2) C(3) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood -3.338455 1.498767 0.489858 Std. Error 2.449508 0.539803 0.102043 t-Statistic -1.362908 2.776509 4.800487 Prob. 0.1979 0.0168 0.0004 10.09653 0.207914 -2.170875 -2.029265 0.891083

0.074810 0.067158 19.28156

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

donde: - S.D dependent var (sy ) es la desviacin estndar de la variable dependiente, la que se construye de la siguiente forma: sy =
N i=1 (yi

y )2 N 1
u2 i N k ).

- S.E. of regression es el error estndar de la regresin ( =

- Sum squared resid corresponde a la suma de los errores al cuadrado. Adems se estima el siguiente modelo restringido: ln(y ) = 0 + ln(L) + ln(k ) + u
Dependent Variable: LY Method: Least Squares Date: 12/31/04 Time: 13:58 Sample: 1958 1972 Included observations: 15 LY=C(1)+LL+LK Coefficient C(1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood -5.673589 0.539520 0.539520 0.141088 0.278681 8.608959 Std. Error 0.036429 t-Statistic -155.7450 Prob. 0.0000 10.09653 0.207914 -1.014528 -0.967325 0.250752

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

a) Testee la hiptesis de que todas las pendientes son igual a cero. Recordemos que el Test-F de signicancia global del modelo o que todas las pendientes son igual a cero, se puede escribir en funcin del R2 de la siguiente forma: F = R2 /(k 1) Fk1,nk (1 R2 )/(n k )

En el tabla de regresin no se presenta la informacin del R2 , por lo tanto se debe construir. Como el modelo incluye constante: R2 = 1 RSS T SS

La suma de los errores al cuadrado (RSS) se puede obtener directamente de la tabla (Sum squared resid), el valor es de 0.067158. 2

La suma total de cuadrados se puede obtener de la desviacin estndar de la variable dependiente (S.D dependent var) reportada en la tabla: sy
N i=1 (yi N

N i=1 (yi

y )2 = 0,207914 N 1

y )2 15 1 (yi y )2

= 0,207914 = (0,207914)2 14 = 0,60519524

i=1 N

(yi y )2
i=1

De esta forma, el R2 es: R2 = 1 0,067158 = 0,889030 0,60519524

El estadstico F calculado para la hiptesis nula de que todas las pendientes son igual a cero es: F = 0,889030/2 = 48,06885 (1 0,889030)/12

Si lo comparamos con el valor F de tabla a un 95 % de conanza con 2 grados de libertad en el numerador y 12 grados de libertad en el denominador, que es igual a 3.89, la conclusin es que se rechaza la hiptesis nula de que las pendientes del modelo son iguales a cero. b) Testee la Hiptesis de que las pendientes suman uno. Se puede construir un test-t con la informacin de las desviacin estndar de los parmetros y la informacin de covarianza entre los parmetros: tc tc = = = 2 + 3 1 2 ) + V ar( 3 ) + 2Cov ( 2 , 3 ) V ar( 1,498767 + 0,489858 1 (0,539803)2 + (0,102043)2 + 2 (0,038427) 0,988625 = 2,08445441 0,47428478 t12

Si lo comparamos con el valor de tabla de la distribucin t a un 95 % de conanza y con 12 grados de libertad, que es igual a 2.179, se concluye que no se puede rechazar la hiptesis nula de que las pendientes sumen uno. Tambin se puede calcular el cuadrado del estadstico t, el que corresponde al estadstico F , y se debe comparar con un valor de tabla a un 95 % de conanza con un grado de libertad en el numerador y 12 grados de libertad en el denominador, el que es igual a 4.75. Como el cuadrado del estadstico t calculado es 4.34495017, se concluye exactamente o mismo, no se puede rechazar la nula de que las pendientes sumen uno. 3

c) Construya un intervalo de conanza para 1 y 2 . La forma general del intervalo de conanza es: i t1/2,nk P i ) i i + t1/2,nk V ar( i ) = 1 V ar(

a un 95 % de conanza, t0,975,12 = 2,179. De esta forma, el intervalo de conanza de 1 es: P [1,498767 2,179 0,539803 1 1,498767 + 2,179 0,539803] = 0,95 P [0,32253626 1 2,67499774] = 0,95 Por otra parte, el intervalo de conanza de 2 es: P [0,489858 2,179 0,102043 2 0,489858 + 2,179 0,102043] = 0,95 P [0,2675063 2 0,7122097] = 0,95

Econometra I Profesores: A. Otero y J. Vsquez. Otoo 2005 Pauta Control 3 Pregunta 1: (30 puntos) En una prueba de hiptesis cualquiera, la zona de rechazo nunca cambia al cambiar la hiptesis nula. Comente. = r para ver si rechazamos o Falso, cuando hacemos un test de hiptesis de la forma H0 : R no la hiptesis nula debemos comparar el valor calculado del estadstico con el valor de tabla de una distribucin F con q grados de libertad en el numerador y n k grados de libertad en el denominador. Si bien el valor de tabla de la distribucin F no cambia con r (los valores que testeamos bajo la hiptesis nula) si cambia con el nmero de hiptesis que estemos testeando (q ). Pregunta 2: (70 puntos) Suponga el siguiente Modelo de Regresin Lineal Simple: Yi = 1 + 2 Xi + ui para i = 1, ..., N

Adems posee la siguiente informacin muestral de X e Y: Y X 4 0 10 20 12 36 14 40

a. Obtenga el estimador Mnimos Cuadrados Ordinarios de 1 y 2 . = 1 2 = 4 96 96 3296


1

40 1192

4,3871 0,233870968

1 = 4,5 y 2 = 0,5. b. Testee la hiptesis nula conjunta de que 1 = 4,5, 1 = 0,5, utilizamos el siguiente estadstico F: Para testear H0 : r) [R(X X )1 R ]1 (R r)]/q [(R F(q,nk) u u /(n k ) lo que se puede reescibir de la siguiente forma: r) [RV ar( )R ]1 (R r)]/q F(q,nk) [(R donde: r = R ) = 2 (X X )1 = 1,74 V ar( 2 4,3871 4,5 0,233870968 0,5 0,83 0,024 0,024 0,001 = = 0,1129 0,2661 y

0,724 0,021 0,021 0,0009


1

De esta forma, el valor calculado del estadstico F es: Fc = = 0,1129 0,1129 0,2661 0,2661 0,724 0,021 0,021 0,0009 0,1129 0,2661 0,1129 0,2661 /2 /2 = 137,32

4,59 110,22 110,22 3784,29 1

El valor de tabla de una distribucin F con dos grados de libertad en el numerador y dos grados de libertad en el denominador es 19, con lo cual se rechaza la hiptesis nula. 2 , pero en un modelo sin constante. Cmo cambia con respecto al obtenido en c. Determine a.? El estimador MCO de 2 es un modelo sin constante (Y = 2 X + u) es1 : 2 =
4 i=1 Xi Yi 4 2 i=1 Xi

Como el modelo no incluye constante, este estimador NO queda expresado en desvos con respecto a la media. Utilizando la informacin disponible: Y 4 10 12 14 Promedio Suma Por lo tanto, = 0,36165049 2 Como podemos apreciar el valor estimado para 2 , es mayor que el en caso donde se incluye la constante, esto porque al ser positiva la constante y omitirla se genera un sesgo hacia arriba del parmetro de pendiente. Esto se puede apreciar grcamente en la siguiente gura, que dibuja las recta de regresin estimadas de un modelo con y sin constante:
1 Este

X 0 20 36 40 12

Y X 0 200 432 560 1192

X2 0 400 1296 1600 3296

2 : se obtiene de minimizar la suma de los errores al cuadrado con respecto a


4

m n 2 ) SE ( = 2
4 i=1 4

2 i=1

2 Xi )2 (Yi

CP O :

2 Xi )(Xi ) = 0 2 (Yi 2 X 2 ) = 0 (Xi Yi + i 2 =


4 i=1 Xi Yi 4 2 i=1 Xi

i=1

Modelo con constante Modelo sin constante

Al ser la constante positiva (cuando la estimamos), si la obligamos a ser cero (estimacin si constante), la pendiente de la recta de regresin aumenta para lograr minimizar la suma de los errores al cuadrado.

Econometra I Profesores: Emerson Melo Rodrigo Montero Javiera Vsquez

Primavera 2005 Control 3 Rut: .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1:(30 puntos) El mtodo de mnimos cuadrados descansa fuertemente en el supuesto = (X X )1 X Y se obtiene de Normalidad del trmino de error. Luego el estimador M.C.O, solo bajo errores normales. Falso. El supuesto de Normalidad lo necesitamos para conocer la distribucin de los estimadores = (X X )1 X Y resulta y de esta forma poder derivar los test t y F. Por otra parte la formula simplemente de plantear el problema de optimizacin de mnimos cuadrados, el cual no depende del supuesto de Normalidad de los errores. Pregunta 2: (70 puntos) Sea el siguiente modelo de regresin lineal mltiple: Yi = 0 + 1 X1i + 2 X2i + 3 X3i + ui Los errores tienen el siguiente comportamiento u N (0, 2 I ). Usted dispone de la siguiente informacin sobre los parmetros estimados de este modelo. 0,02 2, 5 ) = 0,45 0,35 = 1, 2 ( V 0,5 0,21 0,01 0,85 0,2 0,25 0,09 0,5 0,02 Donde el tamao muestral es de N=150 a) (30 puntos)Plantee matricialmente el estadstico asociado a la hipotess1 : H0 : 0 = 1 1 + 2 = 2 3 = 1 ,5 Sabemos que dado que tenemos ms de una restriccin lineal, el estadstico que corresponde es una F con la forma: r) [RV ar( )R ]1 (R r) F(q,nk) (R
1 Slo

deje el estadistico expresado, no es necesario realizar el calculo.

Luego las matrices involucradas son: 1 0 R= 0 1 0 0

0 1 0

0 1 0 y r= 2 1 1, 5

Luego a partir de los datos del enunciado se puede construir el test F, ya que planteamos las matrices que estn involucradas en el conjunto de restricciones lineales. b) (30 puntos) Ahora testee la siguiente hiptesis.(Ind: Asuma un valor de tabla de 1.96 que corresponde a un 95 % de conanza. ) H0 : 1 + 2 = 0,5

Con los datos del problema puede rechazar la hiptesis nula? Como aqu solo tenemos una restriccin lineal, es posible usar un test t.2 A partir de lo anterior tenemos: tc = 1 + 2 0, 5 1 + 2 ) ( V = 1 + 2 0, 5 1 ) + V 2 ) + 2Cov ( 1 , 2 ) ( ( V

Reemplazando los datos del enunciado, se obtiene: tc = 1, 2 + 0, 85 0, 5 = 1, 76 0, 35+, 01 + 2 0, 21

Usando la indicacin del enunciado, no es posible rechazar la hipotesis nula. c) (10 puntos) Seale las diferencias que existen en los procedimientos de las partes a) y b). La diferencia es que con el test F podemos plantear mas de una hiptesis lineal ( en la parte a) planteamos 3 restricciones), mientras que con el test t podemos trabajar solamente con una restriccin lineal. Ademas en ambos casos tenemos distribuciones estadsticas distintas.

2 Recordar

que en ese caso el test F corresponde a un test al cuadrado.

Verano 2005-2006

Econometra I
: :

Profesor Ayudante

Jaime Ruiz-Tagle V. Roberto Jaramillo M.

Control 3 - Pauta de Correccin

Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no tiene derecho a reclamo.

Pregunta 1 (30 puntos)


(a) En un modelo de regresin con Ordinarios (MCO) es

k variables, el estimador de Mnimos Cuadrados = (X X )1 X y . Muestre que la varianza de es: = 2 (X X )1 . u

La varianza de

est dada por:

) = E [( E [ ]) ( E [ ]) ] V ar( ) ( ) ]. = E [(
Dado que

= (X X )1 X y = (X X )1 X (X + u) = + (X X )1 X u,
se obtiene

) = V ar( = = = =

E [((X X )1 X u) ((X X )1 X u) ] E [(X X )1 X uu X (X X )1 ] (X X )1 X E [uu ]X (X X )1 (X X )1 X 2 In X (X X )1 2 (X X )1 .

Notar que esto se cumple porque

no est correlacionado con los errores y porque

los errores no presentan autocorrelacin y son homcedsticos.

(b) Explique por qu el estimador insesgado de la varianza de los errores es

2 u =

u u . nk

El estimador natural de las varianza de los errores es


2 u =

u u = n

n ui i=1 (

u )2 u

n i=1

u 2 i

. k
parmetros

Sin embargo, para obtener los valores de de libertad menores (n

es necesario estimar

1 , . . . , k ), de modo que la precisin de la estimacin es menor al ser los grados ( k)


en vez de

n.

De este modo, al corregir por lo grados

de libertad, se obtiene el estimador insesgado de la varianza.

Pregunta 2 (30 puntos)


(a) Explique qu signica que un estimador sea MELI.

Un estimador es MELI si es que es el Mejor Estimador Lineal Insesgado.

(b) Explique por qu el estimador de MCO es MELI.

El estimador de MCO es MELI porque es un estimador Lineal (el modelo es

y = X + u),

es insesgado porque

] = E [

(dado el supuesto de independencia

de las variables explicativas y de que el error se asume con media cero), y tiene varianza mnima (es eciente porque no hay otro estimador lineal insesgado con menor varianza).

(c) Explique el Teorema de Gauss-Markov.

El Teorema de Gauss-Markov postula que el estimador de MCO es MELI.

Econometra I Profesoras: Claudia Sanhueza Javiera Vsquez. Otoo 2006 Control 3

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) Es imposible que en el siguiente modelo Y = 0 + 1 X1 + 2 X2 + u, 1 y 2 sean individualmente no signicativos, pero que el test F de signicancia los parmetros global del modelo nos diga que este es signicativo. Comente. Falso. Hay dos posible argumentos. Respuesta 1: Es posible que los test de signicancia individual de 1 y 2 nos digan que estos no son signicativos individualmente. Sin embargo, esto no quiere decir que en conjunto sean es-tadsticamente no signicativos. Lo anterior podra darse por la covarianza existente entre los coecientes estimados. En efecto, es posible que el rea roja sea signicativa, y la covarianza existente entre ambos coecientes sea tal que en conjunto logren explicar la variabilidad de la variable dependiente. (Ver grco)

Y
amarillo

azul rojo caf

verde

naranjo

Respuesta 2: El test t asociado a la signicancia de un parametro est en funcin de la varianze de cada parmetro.: 1

tcalculado =

i V ar i

En general rechazamos la hipotesis nula de no signicancia (H0 :i = 0 ), si la V ar i es muy alta. Esto hace que el test t calculado sea bajo y por lo tanto caigamos en la zona de no rechazo. En cambio el test F de la signicancia conjunta de los parmetros (H0 :i = 0, i ) es una funcin la matriz de varianza y covarianza de todos los parmetros estimados:
1

calculado

R r

RV ar R

R r

En este caso y V ar es el vector de parametros y la matriz de var y cov de dichos parametros estimados. Por lo tanto, el test F toma en cuenta las covarianzas entre los parametros. En particular, en un modelo con dos variables explicativas y constante el test F tendra la forma de: F calculado = 0 1 0 0 = 2 3 0 1 0 0 1 0 0 1 0 1 0 0 0 1 1 2 3 V 1 Cov 2 , 1 Cov 3 , 1 1 2 3 V 2 Cov 3 , 2 0 0 Cov 1 , 2 V 2 Cov 3 , 2 0 0 1 2 3 Cov 1 , 3 Cov 2 , 3 V 3 0 0 1 0 0 1 1

Cov 2 , 3 V 3

2 2 2 V 2 22 3 Cov 2 , 3 + 3 V 3

V 2 V 3 Cov 2 , 3

Por lo tanto, si la covarianza entre los parametros es tal que contrarresta el efecto de las varianzas altas de los parametros podemos tener un test F sucientemente alto para rechazar la H0 de no signicancia conjunta (H0 :i = 0, i ), y por ende el modelo explica la varianza total 2

de la variable dependiente. A pesar de que no podamos rechazar las H0 de no signicancia de cada uno de los parametros del modelo (H0 :i = 0 ). Pregunta 2: (70 puntos) Una pequea tienda de comestibles observa que el precio de las naranjas vara mucho durante el ao. Fuera de temporada el precio llega a los $60 por unidad, y dentro de la temporada los precios varan entre $10, $20 y $30 por unidad. A continuacin se presentan los datos para seis semanas con las cantidades de naranjas vendidas (y ) y el precio (x): Naranjas Vendidas y (cientos) 6 4 5 4 3 2 Precio por naranja x (pesos) 10 20 30 40 50 60

Suponiendo que la demanda por naranjas viene dada por la siguiente ecuacin: y = + x + u estime los parmetros de esta ecuacin. Calcule un intervalo de conanza al 90 % para la cantidad de naranjas que se venden en la semana 7, si el precio es de $25 por unidad en esta semana. Nota:
1 u2 i = 1,77 y (X X )

0,87 0,02

0,02 0,0006

Respuesta: El estimador MCO de se obtiene de la siguiente forma: = Y 6 4 5 4 3 2 24 4 X 10 20 30 40 50 60 210 35 (Xi X )(Yi Y ) (Xi X )2 (X X ) -25 -15 -5 5 15 25 (Y Y )(X X ) -50 0 -5 0 -15 -50 -120 -20 (X X )2 625 225 25 25 225 625 1750 291.7

Suma Promedio

(Y Y ) 2 0 1 0 -1 -2 -

= =

120 = 0,068571429 1750 = 6,4 Y X

Ahora si se espera que en la semana 7 el precio de las naranjas sea $25 por unidad, la demanda esperada (prediccin puntual) es: y 0 = 6,4 0,068571429 25 = 4,685714286 3

El intervalo de conanza de la prediccin es: P r[y 0 t0,95,4 donde t0,95,4 = 2,132 V ar(e0 ) y 0 y 0 + t0,95,4 V ar(e0 )] = 90 %

Ahora debemos calcular la varianza del error de prediccin:


2 V ar(e0 ) = (1 + x0 (X X )1 x 0 ) 2

= = =

x0 (X X )1 x 0 V ar(e0 )

u2 1,77 i = = 0,4425 nk 4 0,87 0,02 1 25 0,02 0,0006 0,4425(1 + 0,245) = 0,5509125

1 25

= 0,245

Entonces el intervalo de conanza de la prediccin es: P r[4,685714286 2,132 0,5509125 y 0 4,685714286 + 2,132 0,5509125] = 90 % P r[3,10326969 y 0 6,268158882] = 90 %

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Control 3

Semestre: Primavera 2006 Profesores: Jos Miguel Benavente, Rodrigo Montero Tiempo de duracin: 20 minutos No hay preguntas de ningn tipo para los ayudantes

Comente (6 puntos) La signicancia global del modelo depende de la signicancia individual de las variables independientes incluidas. Respuesta. Falso. Es posible que, aun cuando los coecientes estimados no sean individualmente signicativos, s lo sean en conjunto. Lo anterior podra darse en el caso que la covarianza de los regresores sea capaz de explicar la variabilidad de la variable dependiente. Como existe un alto grado de correlacin entre las variables independientes del modelo (es decir, un alto grado de multicolinealidad), entonces, al menos una de estas variables tiene una inuencia signicativa sobre la variable dependiente, pero no se puede establecer cual. Por otro lado, al existir un alto grado de multicolinedlidad, es muy probable que los coecientes, a nivel individual, no sean estadsticamente signicativos. Recuerde que: ) = var( 2 (X X )1 Si existe un alto grado de colinealidad entre las variables independientes del modelo, el determinante de (X X ) tiende a cero, por lo que se obtienen varianzas gigantes.

Ejercicio (14 puntos) Con la informacin proporcionada por una muestra de 5 datos, se ha estimado el siguiente modelo (mnimos cuadrados ordinarios): Yi = 4 + 2, 5X1i 1, 5X2i El R2 del modelo es de 0,95 y informacin: (X X )1
2 yi = 28. Se cuenta adems con la siguiente

26, 7 4, 5 8 = 4, 5 1 1, 5 8 1, 5 2, 5

0 , 1 y 2 al 95 % (asuma un t Construya un intervalo de conanza para crtico igual a 1,96). Son los coecientes estadsticamente signicativos? Respuesta. Se sabe que: ) = var( 2 (X X )1 Adems (es importante corregir por la prdida en grados de libertad, ya que la muestra es pequea): 2 = Por otro lado, se sabe que: R2 = 1 Es decir: e2 i = 1, 4 Por lo tanto: 2 = Finalmente: 26, 7 4, 5 8 18, 69 3, 15 5, 6 var( ) = 0, 7 4, 5 1 1, 5 = 3, 15 0, 7 1, 05 8 1, 5 2, 5 5, 6 1, 05 1, 75 2 1, 4 = 0, 7 2 e2 i = 0, 95 2 yi e2 i nk

Los intervalos de conanza vienen dados por (4 puntos por cada uno): P (4 1, 96 18, 69 < 0 < 4 + 1, 96 18, 69) = 0, 95 P (4, 47 < 0 < 12, 47) = 0, 95

P (2, 5 1, 96 0, 7 < 1 < 2, 5 + 1, 96 0, 7) = 0, 95 P (0, 86 < 1 < 4, 13) = 0, 95

P (1, 5 1, 96 1, 75 < 2 < 1, 5 + 1, 96 1, 75) = 0, 95 P (4, 09 < 2 < 1, 09) = 0, 95 1 es estadsticamente signicativo (2 puntos). Es decir, slo

Econometra Facultad de Economa y Negocios Universidad de Chile Pauta Control 3

Semestre: Primavera 2007 Profesores: Jos Miguel Benavente, Rodrigo Montero Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros Tiempo de duracin: 40 minutos No hay preguntas de ningn tipo para los ayudantes Est permitido utilizar calculadora

Una compaa telefnica est desarrollando un nuevo plan de contrato, para lo cual necesita ver cmo se relaciona la cantidad de minutos hablados durante un mes con la edad de la persona. En particular, ellos disponen de la siguiente informacin: i 1 2 3 4 5 6 7 8 9 Por lo tanto: Ei2 = 5135 Ei = 209 Mi = 791 Ei Mi = 19686 Edad (E ) Minutos (M ) 14 65 16 54 18 55 22 70 26 77 27 90 27 110 29 120 30 150

Luego, el modelo a estimar es el siguiente: Mi = + Ei + ui Donde u cumple con los supuestos convencionales que se hacen sobre el trmino de error. (NOTA: en caso de ser necesario trabaje con tres decimales) IMPORTANTE: esta pauta de correccin ha sido confeccionada considerando TODOS los decimales en los clculos respectivos. 1

1. Obtenga los estimadores MCO de y . (10 puntos) Respuesta. Se sabe que: Por lo tanto: = 9 209 209 5135
1

= (X X )1 X Y =

n Ei

Ei Ei2

Mi Ei Mi

791 19686

20, 75335 4, 678374

2. Estime la varianza de u ( 2 ). (10 puntos) Respuesta. Se sabe que: s2 = 2 = e 2 2412, 43054 i = = 344, 63293 nk 7

3. Inuye la edad de las personas en la cantidad de minutos que hablan por celular? (Ayuda: Utilice 2,3 para el valor crtico de la distribucin t). (10 puntos) Respuesta. Se debe analizar la signicancia estadstica del coeciente es). Para ello se necesita estimar, en primer lugar, la varianza del timado ( estimador MCO: ) = s2 (X X )1 = 344, 63293 V ar( 9 209 209 5135
1

En este caso, solo interesa el elemento 2x2 de la matriz, por lo tanto: ) = 1, 2240317 V ar( As: = 1, 1063597 Luego, el test t se calcula como sigue: t = 4, 678374 = = 4, 2286193 1, 1063597

Este valor es mayor al t crtico sugerido (2,3), por lo tanto, se rechaza la hiptesis nula, y el coeciente estimado es estadsticamente signicativo.

4. Realice una prediccin condicional de minutos a hablar para una persona que tiene 26 aos de edad, y luego construya un intervalo de conanza al 95 % para dicha prediccin (Ayuda: Utilice 2,3 para el valor crtico de la distribucin t). (10 puntos) Respuesta. La prediccin es: = 20, 75335 + 4, 678374(26) = 100, 88437 M Por otro lado, se sabe que: t P (M Adems: V ar(eo ) = s2 (1 + xo (X X )1 xo ) Luego: V ar(e ) = 344, 63293 (1 + 1 26 Luego: P (100, 88437 2, 3(14, 6821519) 100, 88437 + 2, 3(14, 6821519)) = 1 P (67, 115421 134, 65332) = 1
o

+ t V ar(eo ) M

V ar(eo )) = 1

9 209 209 5135

1 26

= 215, 565586

Control #3 Econometr a I
Profesores: Tom as Rau y Javiera V asquez Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sepulveda 23 de abril, 2008
Tiempo Total: 30 Minutos.

1.

Comentes (10 puntos, 5 c/u)


R. Falso. Un R2 alto no necesariamente indica que la estimaci on es buena, esto puede deberse a un modelo saturado con muchas variables y que articialemente aumentan la bondad de ajuste (esto puede ser chequado viendo el R2 ajsutado). Tambi en existen modelos matem aticamente equivalentes pero econometricamente distintos, unos con elevado R2 y otros con bajo R2 (ejemplo visto en clases).

1) Un alto R2 es garant a de que la estimaci on del modelo de regresi on lineal es buena.

2) El teorema de Gauss-Markov establece que dentro de la clase de estimadores insesgados el estimador MCO es el m as eciente. R. Falso/Depende. El teorema de Gauss-Markov establece que dentro de la clase de estimadores LINEALMENTE insesgados el estimador MCO es el m as eciente, bajo ciertos supuestos. Pueden existir estimadores no lineales e insesgados con menor varianza que el estimador de MCO.

2.

Problema (20 puntos)


Sea el siguiente modelo de regresi on lineal y = 0 + 1 x1 + 2 x2 + 3 x3 +

donde se cumplen los supuestos usuales vistos en clases. a) Describa c omo testear a la siguiente hip otesis Ha : 3 1 2 3 = 8 Escriba explicitamente el estad stico a usar, su distribuci on bajo la hip otesis nula, y cu ando rechaza o no rechaza la hip otesis nula. R. Aqui hay dos alternativas: hacer un simple test-t o un test F mediante R = r (caso 3). La primera es trivial, 1 2 3 + 8 3 t= tnk 1 ) + 4V ar( 3 ) 12Cov ( 1 , 3 ) 9V ar( 1 H0 : 3 1 2 3 = 8

que sigue una distribuci on t-student con n k grados de libertad. Como la hip otesis es a dos colas y la distribuci on t es sim etrica debemos comparar el estad stico con el valor tabla t/2,nk , donde es el nivel de signicancia del test (probabilidad de cometer error tipo I). Se rechaza la hip otesis nula si |t| > t/2,nk . La otra alternativa es, r) [R(X X )1 R ]1 (R r)]/q [(R r) [ r)]/q F(q,nk) [(R 2 R(X X )1 R ]1 (R u u /(n k )

(1)

donde R = [0, 3, 0, 2], r = 8 y q = 1. Luego el estad stico sigue una distribuci on F con (1,n-k) grados de libertad y se rechaza el test si el estad stico es mayor al valor cr tico F(1 ,nk) . 0 = 1, 1 = 2, 2 = 2,5, 3 = 1, n=1000 b) Suponga que 3 0 2 (X X )1 = 0 0 y 0 4 0 3 0 0 9 0 0 3 0 9

Realice el test descrito en a) con un nivel de signicancia del 5 % y diga si rechaza o no la hip otesis 5% nula. Recuerde que t2,5 %,996 = 1,96 y que F1 = 3 , 84 ,996 R. El test t es simplemente t= 1 2 3 + 8 3 = 12 =2 36 + 36 36

1 ) + 4V ar( 3 ) 12Cov ( 1 , 3 ) 9V ar(

con lo cual tenemos que se rechaza la hip otesis nula puesto que t2,5 %,996 = 1,96 La otra manera requiere un poco m as de algebra. Dado que q = 1 podemos reemplazarlo y calculemos la expresi on en corchetes a la menos 1, es decir la varianza de R = 0 3 0 2 0 0 3 3 0 0 9 2

2 R(X X )1 R

3 0 0 0

= = luego,

0 6 36

0 9

0 3 0 2

0 4 0 3

0 0 9 0

5% Luego el estad stico es mayor a F1 otesis nula. ,996 = 3,84 y se rechaza la hip

r) [ r)]/q = (12)(36)1 12/1 = (12)2 /36 = 4 [(R 2 R(X X )1 R ]1 (R

CONTROLES 4

Econometra I Profesores: J.M. Benavente, A. Otero y J. Vsquez. Primavera 2004 Control 4

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) En un modelo de regresin lineal simple donde tanto la variable dependiente como explicativa estn en logaritmos, el parmetro estimado representa una elasticidad. Comente. Verdadero, cuando tenemos un modelo de regresin simple: ln(yi ) = + ln(xi ) + ui , donde ambas variables (dependiente y explicativa) estan el logaritmos, el parmetro que representa el impacto marginal de ln(x) sobre ln(y) representa la elacticidad de y a x. ln(y ) Veamos esto con ms detalle, = ln (x) , recordando que la dervivada de una variable en loga(x) ln(y ) y 1 rimo es ln = x x, tenemos que = ln x (x) = y por denicin corresponde la elasticidad de y a x. x x

, lo que es implica =

%y %x ,

lo que

Pregunta 2: (70 puntos) Existe presuncin que los egresados de Administracin de la carrera de Ingeniera Comercial tienen un mayor salario que aquellos egresados de Economa. (a) Plantee un modelo que permita testear esta hiptesis. Explique explcitamente como lo testeara. R: Suponiendo que disponemos datos de los alumnos egresados de Ingeniera Comercial, podramos estimar el siguiente modelo: Wi = 0 + 1 D1i + ui donde Wi es el logaritmo natural del salario y D1i es una variable dummy que toma el valor 1 si la persona i egreso de administracin y 0 si egreso de economa (tambin se puede denir D2i que tome el valor 1 si la persona i egreso de economa y 0 si egreso de administracin e incluir esta en el modelo, o incluir ambas dummies en el modelo y omitir la constante). De esta forma: E [Wi /Administracion] E [Wi /Economia] = = 0 + 1 0

1 positivo y estadsticamente signiPara comprobar esta hiptesis se requiere un parmetro

1 = 0: cativo. Explcitamente esto se testea mediante un test-t con H0 : t= 1 1 ) ( V tnk

(b) Plantee un modelo que adems permita testear que dicha diferencia entre menciones no es igual entre universidades (Considere slo las dos universidades ms importante del pas: Universidad de Chile y Universidad Catlica). Explique explcitamente como lo testeara. Para testear esto adems se debe incorporar una variable dummy que llamaremos D3 , que tome el valor 1 si la persona i egreso de la Universidad de Chile y 0 si egreso de la Universidad Catlica, de esta forma el modelo que nos permite testear esto es: Wi = 0 + 1 D1i + 2 D3i + 3 D1i D3i + ui De esta forma: E [Wi /Administracion E [Wi /Economia E [Wi /Administracion E [Wi /Economia en en en U. de Chile] = Chile] = U. Catolica] = U. Catolica] = 0 + 1 + 2 + 3 0 + 2 0 + 1 0

en U. de

Para testear se debe utilizar un test F para la hiptesis conjunta: H0 : 1 2 3 R = 0 = 0 = 0 = r

H0 : donde R=[031 I3 ] y r=031 . El estadstico F es:

r) [R(X X )1 R ]1 (R r)]/q [(R F(q,nk) u u /(n k )

Econometra I Profesora: Javiera Vsquez. Verano 2005 Control 4

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) Bajo el supuesto de normalidad del trmino de error, el estimador Mximo Verosmil (MV) y el de Mnimos Cuadrados Ordinarios (MCO) son exactamente iguales. Comente. Efectivamente bajo el supuesto de normalidad del trmino de error, el estimador Mximo Ve) coincide con el estimador rosmil de los parmetros asociados a las variables explicativas ( MCO. Pero el estimador de la varianza del error ( 2 ) diere, el estimador Mximo Verosmil de este parmetro es un estimador sesgado, igual a la suma de los errores estimados al cuadrado dividido por el tamao de muestra. De esta forma, el comente es FALSO. Pregunta 2: (70 puntos) Suponga que Ud. quiere estimar la siguiente funcin de produccin Cobb-Douglas: Y = AL K eu para lo cual dispone datos de producto (Y), capital (K) y trabajo (L) de 10 pases latinoamericanos. a) Plantee una ecuacin de regresin estimable por MCO. R: Como la funcin de produccin Cobb-Douglas es una funcin no lineal es variables, para que sea estimable por MCO se debe linealizar, lo que se hace aplicando logaritmo a esta funcin, quedando el siguiente modelo logartmico: ln(Y ) = ln(A) + ln(L) + ln(K ) + u
0 1 2

ln(Y ) = 0 + 1 ln(L) + 2 ln(K ) + u donde 1 =


ln(Y ) ln(L)

(1) con respecto del producto

al factor trabajo, y con respecto al factor Capital.

%Y %L = Y,L corresponde a la elasticidad del producto ln(Y ) %Y 2 = ln (K ) = %K = Y,K corresponde a la elasticidad

b) Especique un modelo que le permita testear que para cualquier nivel de Capital(K) y Trabajo (L), pases grandes tienen en promedio un producto mayor que pases pequeos. Adems plantee explcitamente un test de hiptesis para ver la signicancia estadstica de esta diferencia. R: Para testear esta hiptesis primero debemos denir la siguiente variable dummy: D1 = 1 0 Pas grande Pas pequeo

Un modelo que nos permita testear que para cualquier nivel de capital y trabajo los pases grandes producen en promedio ms que los pequeos, requiere introducir esta variable dummy (D1 ) en el modelo de la ecuacin (1): ln(Y ) = 0 + 1 ln(L) + 2 ln(K ) + 3 D1 + u De esta forma: E(ln(Y)|pas grande, K, L)=0 + 3 + 1 ln(L) + 2 ln(K ). E(ln(Y)|pas pequeo, K, L)=0 + 1 ln(L) + 2 ln(K ). El parmetro 3 es quien mide esta diferencia en el promedio del producto par cualquier nivel jo de K y L, por lo tanto, para testear si esta diferencia es estadsticamente signicativa, se debe testear la hiptesis de que 3 es estadsticamente signicativo, ms especcamente se debe realizar el siguiente test de hiptesis: H0 : H1 : la que se realiza mediante un test-t: t= 3 3 ) V ( tnk 3 = 0 3 = 0 (2)

c) Especique un modelo que le permite testear adems de las diferencias en promedio de la parte b), que la elasticidad del producto con respecto al trabajo diere entre pases grandes y pequeos. Nuevamente plantee explcitamente un test de hiptesis para ver la signicancia estadstica de esta diferencia. R: Para testear diferencias en la elasticidad del producto con respecto al trabajo, deberamos incorporar otra variable ms al modelo antes descrito (ecuacin (2)), correspondiente a una variable interactiva, la multiplicacin de la dummy y el logaritmo del trabajo, de la siguiente forma: ln(Y ) = 0 + 1 ln(L) + 2 ln(K ) + 3 D1 + 4 D1 ln(L) + u 2 (3)

De forma tal que, E(ln(Y)|pas grande, K, L)=0 + 3 + 1 ln(L) + 4 ln(L) + 2 ln(K ). E(ln(Y)|pas pequeo, K, L)=0 + 1 ln(L) + 2 ln(K ). Y as, la elasticidad del producto con respecto al trabajo para cada grupo es: E(ln(Y)|pas grande, K, L)/ ln(L) =1 + 4 E(ln(Y)|pas pequeo, K, L)/ =1 La diferencia en elasticidad del producto con respecto a trabajo entre los pases grandes y pequeos estar determinada por el parmetro 4 , para ver si la diferencia es estadsticamente signicativa se debe realizar el siguiente test: H0 : H1 : la que se realiza mediante un test-t: t= 4 4 ) V ( tnk 4 = 0 4 = 0

Econometra I Profesores: A. Otero y J. Vsquez. Otoo 2005 Pauta Control 4 Pregunta 1: (30 puntos) Uno de los supuestos utilizados para derivar el estimador MCO asuma que las variables independientes eran determinsticas. Si levantamos este supuesto el estimador MCO sigue siendo insesgado pero ya no es el mejor estimador lineal e insesgado. Comente. Falso, cuando tenemos regresores estocsticos tenemos que la media y varianza condicional |X ] = y V [ |X ] = 2 (X X )1 , as en trminos condicionales el del estimador MCO son: E [ estimador es MELI (insesgado y de mnima varianza). Los momentos incondicionales del esti] = y V [ ] = 2 E [(X X )1 ], si bien el estimador es insesgado la varianza slo mador son: E [ se puede obtener en trminos de media de las variables explicativas. Sin embargo, como el estimador es MELI para cada valor de X (condicional) tambin lo ser para los valores medios de X. Pregunta 2: (70 puntos) Considere la siguiente variable aleatoria yt distribuida exponencialmente con parmetro 0 . Su funcin de densidad est dada por: f (yt ; 0 ) =
yt 1 e 0 0

yt > 0; 0 > 0

Plantee la funcin de verosimulitud asociada a esta funcin de densidad exponencial (20 puntos). La funcin de densidad conjunta para las T observaciones se obtiene a travs de la pitatoria de la densidad de cada observacin:
T

f (y; 0 ) =
t=1

f (yt ; 0 ) = 1 0
T

yt 1 e 0 t=1 0 T t=1

e 0

yt

Ahora la funcin de verosimilitud corresponde algebraicamente a la misma expresin anterior, slo que tericamente la incgnita es el parmetro y se asume como dada la muestra de tamao T de la variable y : L(0 ; y) = 1 0
T

e 0

T t=1

yt

Aplicando logaritmo natural a la expresin anterior, obtenemos la log-likelihood: l(0 ; y) = T ln(0 ) 1 0


T

yt
t=1

Encuentre las condiciones de primer orden asociadas a la estimacin por maxima verosimilitud de 0 (20 puntos). 1

Para obtener la condicin de primer orden derivamos la log-likelihood con respecto a 0 e igualamos a cero: 1 l T = + 0 2
T

yt = 0
t=1

Encuentre el estimador mxima verosimilitud de 0 ( 30 puntos). , se obtiene al despejar de la condiEl estimador mximo verosmil de 0 denominado cin de primer orden: T 1 + 2 1 2
T

yt
t=1 T

= 0 = T
T t=1

yt
t=1

yt

Verano 2005-2006

Econometra I
: :

Profesor Ayudante

Jaime Ruiz-Tagle V. Roberto Jaramillo M.

Control 4 - Pauta de Correcin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no tiene derecho a reclamo.
Pregunta 1 (30 puntos)
Una variable aleatoria

x sigue una distribucin exponencial si es que tiene la siguiente


1

funcin de densidad (pdf):

f (x) =
donde

exp

para para

x>0 x0
es

> 0

es el parmetro de la distribucin. Usando el mtodo de Mxima

Verosimilitud, muestre que el estimador mximo verosmil de promedio muestral

Px
n

, donde

es el tamao muestral. Esto es, muestre que el estimador mximo verosmil de

es el

x .

Dada la funcin de densidad, la funcin de verosimilitud ser


n

L(xi , ) =
i=1

1 exp

xi

exp

xi ,

y el logaritmo de la funcin de verosimilitud ser


ln L(xi , ) = n ln() 1 xi .

Tomando derviada con respecto a al parmetro para maximizar la funcin se obtiene


ln L(xi , ) 1 xi = n + 2 .

Finalmente, igualando a cero obtenemos


= xi =x . n

Pregunta 2 (30 puntos)


Explique en qu consiste cada uno de los 3 test de hiptesis usados en inferencia bajo Mxima Verosimilitud. Haga una comparacin crtica de los test, estableciendo sus ventajas y desventajas.

Los 3 tests usados en inferencia bajo Mxima Verosimilitud son: el test LR (Likelihood Ratio - Razn de Verosimilitud), el test de Wald y el test LM (Lagrange Multiplier Multiplicador de Lagrange). Los estadsticos de cada uno de los tests son los siguientes:

LR = 2 ln L(, ) ln L(, ) r) [R(X X )1 R ](R r) (R 2 a LM = n R2 2 q W =

2 q 2 q
a

y y donde corresponden a los estimadores del modelo no restringido, son los 2 estimadores del modelo restringido, y el R corresponde a aquel de la regresin auxiliar de u sobre X , donde u son los residuos del modelo restringido y X es la matriz de todas las variables explicativas. Finalmente, q corresponde al nmero de restricciones involucradas.

Asintticamente los 3 tests son equivalentes en el sentido que el estadstico asociado a cada uno de ellos sigue una distribucin Chi-cuadrado. Dada la naturaleza asinttica de los test, deben ser aplicados con mucho cuidado en muestras relativamente pequeas, en las cuales se debiera prefererir tests como el F o el t. Una ventaja importante de estos tests es que permiten testear restricciones no lineales. En el test LR, si la restriccin reduce signicativamente la funcin de verosimilitud, entonces el test rechaza la hiptesis nula de las restricciones. Por lo tanto, el LR test requiere la estimacin del modelo no restringido y del modelo restringido. Sin embargo, la construccin del estadstico LR es extremadamente simple, requiriendo simple resta. Todos los paquetes econmetricos entregan el valor la funcin de verosimilitud. El test de Wald involucra slo la estimacin del modelo no restringido, y analiza las implicancias de las restricciones. La construccin del estadstico W involucra manejo matricial, hacindolo ms demandante. El test LM analiza la pendiente de la funcin de verosimilitud y nalmente slo requiere la estimacin del modelo restringido. La construccin del estadstico requiere una regresin auxiliar.
2

Usualmente, el modelo original y el tipo de restricciones determinarn cul test es ms sencillo de aplicar. En algunos casos el modelo no restringido puede ser tan complejo que el test LM se hace ms conveniente. En otros casos, las restricciones pueden generar un mayor costo de estimacin del modelo restringido, haciendo que el test de Wald sea ms conveniente.

Econometra I Profesoras: Javiera Vsquez. Otoo 2006 Control 4 Nombre: Rut: .......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) En un modelo que busca explicar que en promedio los hombres ganan ms que las mujeres, para cualquier nivel de escolaridad, da lo mismo incluir una dummy en la regresin que estimar dos modelos separados, uno para los hombres y otro para las mujeres. Comente. Efectivamente en trminos de especicacin, es lo mismo plantear un modelo que capture la diferencia por gnero mediante una variable dummy, que estimar separadamente un modelo de ecuacin de mincer, uno para los hombres y otro para las mujeres. Sin embargo, en trminos de eciencia no es lo mismo. Al separar los modelos el tamao muestral utilizado es ms pequeo (en cada uno de ellos) que al estimar un solo modelo, por lo que la primera metodologa es menos eciente. Pregunta 2: (70 puntos) Plantee un modelo que le permita testear que la demanda por helados en verano es diferente a la demanda promedio en invierno, y que la reaccin ante un cambio en el precio diere en estas dos estaciones. Sea explcito en como testeara esto. Para esta pregunta vamos a dar dos alternativas de respuesta, una 100 % buena y una regular (pero aceptable): Respuesta 1: Denamos las siguientes Dummies: d 1i = 1 verano 0 d2i = 1 0 invierno (1)

Entonces el modelo que nos permite testear lo planteado en el enunciado es el siguiente: Qi = + 1 Pi + 2 d1i + 3 d2i + 4 Pi d1i + 5 Pi d2i + ui As, E [Qi |verano, Pi ] = + 1 Pi + 2 + 4 Pi E [Qi |invierno, Pi ] = + 1 Pi + 3 + 5 Pi Entonces debemos realizar los siguientes test de hiptesis: H0 : H0 : 2 = 3 4 = 5

Si se cumplen las hiptesis nulas se comprueba que no existe diferencia estadstica en la demanda por helados entre invierno y verano. Respuesta 2: Denamos la siguiente dummy: d 1i = Se plantea el siguiente modelo: Qi = + 1 Pi + 2 d1i + 3 Pi d1i + ui As, E [Qi |verano, Pi ] E [Qi |invierno, Pi ] = = + 1 Pi + 2 + 3 Pi + 1 Pi 1 0 verano invierno (2)

Entonces debemos realizar los siguientes test de hiptesis: H0 : H0 : 2 = 0 3 = 0

Si se cumplen las hiptesis nulas se comprueba que no existe diferencia estadstica en la demanda por helados entre invierno y verano.

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Control 4

Semestre: Primavera 2006 Profesores: Jos Miguel Benavente, Rodrigo Montero Tiempo de duracin: 20 minutos No hay preguntas de ningn tipo para los ayudantes

Comente (6 puntos) El supuesto de independencia (de las observaciones) es crucial para implementar el estimador de mxima verosimilitud (MV).

Respuesta. Falso. Es slo un supuesto, el cual podra no cumplirse, al menos, por dos motivos: (i) el rezago de la variable dependiente (Yt1 ) aparece como regresor, (ii) los erroes se encuentran autocorrelacionados. Si el supuesto de independencia no se cumpliera, an es posible implementar el estimador de mxima verosimilitud, para lo cual existen dos alternativas: (1) utilizar una funcin de distribucin multivariada, o (2) realizar una transformacin del modelo.

Ejercicio (14 puntos) Considere el siguiente modelo (expresado en trminos matriciales): Y = X + u Asumiendo que ui N (0, 2 ) derive los estimadores de mxima verosimilitud para y 2 . Recuerde que en este contexto: f (ui ) = 1 2 2 1 e

u2 i 2 2

Respuesta. Asumiendo que las realizaciones del trmino de error son independientes, la densidad conjunta se escribe de la siguiente manera: f (u1 , u2 , ..., un ; 2 ) = f (u1 ) f (u2 ) f (un ) = n i=1 f (ui ) Dado el supuesto de normalidad, entonces: f (u1 , u2 , ..., un ; ) =
2

n i=1

1 2 2

u2 i 2 2

= n i=1

1 2 2

u 2 2

La densidad multivariada para Y condicional en X viene dada por la siguiente expresin: f (Y |X ) = f (u) u Y

donde |u/Y | es el valor absoluto del determinante formado por la matriz de derivadas parciales (nxn) de los elementos de u con respecto a los elementos de Y . En este caso, esta matriz es la matriz identidad. De esta forma, la funcin de verosimilitud para Y viene dada por: f (Y1 , Y2 , ..., Yn ; X, 2 , ) = 1 e (2 2 )n/2

(Y X ) (Y X ) 2 2

Luego, para obtener los estimadores de mxima verosimilitud se aplica logaritmo a la expresin anterior y se deriva respecto a y 2 : n (Y X ) (Y X ) n m ax ln(2 ) ln( 2 ) 2 2 2 2 Luego: 1 ln(L) ) = 0 = 2 X (Y X ln(L) n 1 ) (Y X ) = 2 + 4 (Y X 2 2 2 Resolviendo: M V = (X X )1 X Y y:
2 M V =

) (Y X ) (Y X n 2

Econometra Facultad de Economa y Negocios Universidad de Chile Pauta Control 4

Semestre: Primavera 2007 Profesores: Jos Miguel Benavente, Rodrigo Montero Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros Tiempo de duracin: 40 minutos No hay preguntas de ningn tipo para los ayudantes Est permitido utilizar calculadora

Se ha utilizado un modelo lineal para explicar los gastos de construccin de un nuevo almacn (Gi ) en funcin del tamao del mismo (Ai ). Para ello se dispona de los siguientes datos referentes a diez almacenes: Ai = 10 A2 i = 76 Gi = 80 Ai Gi = 154

Si se sabe que la calidad promedio de los materiales utilizados (Ci ) es una variable relevante para explicar los gastos de construccin, qu consecuencias tendr la omisin de dicha variable en el modelo? Considere la siguiente informacin adicional: Ci = 15 Ci2 = 102 Ai Ci = 84 Ci Gi = 200

Ayuda: Recuerde que la inversa de una matriz A viene dada por la siguiente expresin (todos estos pasos llevan puntaje): A 1 = 1 adj (A) |A|

donde |A| corresponde al determinante de la matriz A, y adj (A) es la adjunta de A, que corresponde a la matriz traspuesta de cofactores de A. En el caso de una matriz de 3x3, la matriz de cofactores viene dada por: C11 C12 C13 C21 C22 C23 C31 C32 C33 donde Cij = (1)i+j Mij , y Mij es el determinante de la submatriz de 2x2 que se obtiene de eliminar la la i y la columna j de la matriz A. 1

Respuesta. Se sabe que el omitir una variable relevante tiene dos efectos: (i) estimacin sesgada de los verdaderos parmetros poblacionales, (ii) estimacin sesgada de las varianzas de los estimadores de mnimos cuadrados ordinarios. Por lo tanto, al estimar el modelo omitiendo la calidad promedio de los materiales se obtendrn estimaciones sesgadas, y esto es lo que se muestra a continuacin. Si se estima el modelo: Gi = 0 + 1 Ai + ui entonces: M CO = Por lo tanto: M CO = Finalmente: M CO = 0 1 = 10 10 10 76
1

0 1

N Ai

Ai A2 i

Gi Ai G i

80 154 0 1

1 660 6, 878 1, 121

76 10 10 10

80 154

Sin embargo, el verdadero modelo es el siguiente: Gi = 0 + 1 Ai + 2 Ci + ui As, el estimador de mnimos cuadrados ordinarios viene dado por: 1 Gi 0 N Ai Ci Ai Ci Ai Gi 1 = Ai A2 M CO = i 2 Ci Ai Ci Ci2 Ci Gi Por lo tanto: M CO 1 80 0 10 10 15 1 = 10 76 84 154 = 200 2 15 84 102

Se sabe que la inversa de una matriz viene dada por: A 1 = 1 adj (A) |A|

El determinante de la matriz de 3x3 que se debe invertir es 4860. Luego, falta determinar la matriz de cofactores. As: C11 = (1)1+1 76 84 = 696 84 102 2

C12 = (1)1+2 C13 = (1)1+3 C21 = (1)2+1 C22 = (1)2+2 C23 = (1)2+3 C31 = (1)3+1 C32 = (1)3+2 C33 = (1)3+3 La matriz adjunta (traspuesta de la manera: 696 240 300 Por lo tanto: M CO

10 84 = 240 15 102 10 76 = 300 15 84 10 15 = 240 84 102 10 15 = 795 15 102 10 10 = 690 15 84 10 15 = 300 76 84 10 15 = 690 10 84 10 10 = 660 10 76

matriz de cofactores) queda de la siguiente 240 300 795 690 690 660

696 240 300 80 6, 716 0 1 240 795 690 154 = 0, 746 1 = = 4860 300 690 660 200 0, 358 2

El sesgo de los estimadores de MCO viene dado por: 0 ) = E ( 0 ) sesgo( 0 = 6, 878 6, 716 = 0, 162 1 ) = E ( 1 ) sesgo( 1 = 1, 211 0, 746 = 0, 465 De esta manera, al omitir la calidad promedio de los materiales se estaran sobrestimando los verdaderos parmetros poblacionales.

Pauta Control N4 Econometra I Profesores: Toms Rau y Javiera Vsquez Ayudantes: Roberto Gillmore, Eugenio Rojas, y Jorge Seplveda 23 de Mayo de 2008 1. Si Ud. posee la siguiente funcin de produccin Cobb-Douglas:
ui Yi = AL i Ki e

donde: Yi: produccin de la empresa i Li: cantidad de trabajadores en la empresa i Ki: capital fijo de la empresa i. a) Por qu razn el modelo anterior no es estimable por MCO? (5 ptos) La funcin Cobb-Douglas no es estimable tal cual se plantea, ya que la variable dependiente (Y) depende en forma no lineal de los parmetros del modelo. b) Menciones dos alternativas para que este modelo pueda ser estimado (10 ptos) 1- Se puede estimar por Mxima Verosimilud 2- Se puede linealizar el modelo aplicando logaritmo natural y estimar por MCO:
ln Yi = ln( A) + ln Li + ln K i + u i 1 2 3

c) En el modelo estimable por MCO, Qu variable agregara para testear que el producto promedio en las empresas del sector servicios es mayor que en los otros sectores econmicos?. Explique como testeara esta hiptesis. (15 ptos) Se debe definir una variable Dummy que tome valor 1 si la empresa pertenece al sector econmico servicios, y 0 si es que la empresa 1 empresa i pertenece a servicios Di = 0 en otro caso Luego incluyendo esta Dummy en el modelo: ln Yi = + ln Li + ln K i + Di + u i Se estima que producto promedio (en logaritmo) condicional en trabajo y capital es:

E[ln Y | ln L, ln K , D ] = + ln L + ln K + D
De esta forma el producto promedio (en logaritmo) de las empresas del sector servicios es:

E[ln Y | ln L, ln K , D] = + ln L + ln K +
Y de los otros sectores econmicos:

E[ln Y | ln L, ln K , D] = + ln L + ln K
Luego para testear si existe una diferencia significativa, se debe realizar un test t sobre la hiptesis nula de que es igual a cero. Si se rechaza la hiptesis nula la diferencia en el producto promedio de este sector con respecto a los restantes es estadsticamente significativa. d) A partir del modelo anterior, Qu variable agregara para testear que la productividad marginal del trabajo es mayor en el sector servicios que en otros sectores econmicos? (15 ptos) Para testear esta hiptesis se debera agregar al modelo anterior, una variable interactiva del lnL con la Dummy antes definida: ln Yi = + ln Li + ln K i + Di + ln Li Di + u i As el valor esperado condicional del producto (en logaritmos) en este caso es:

E[ln Y | ln L, ln K , D] = + ln L + ln K + D + ln L D
Entonces la elasticidad del producto con respecto al trabajo:
E[ln Y | ln L, ln K , D] = + D ln L

As, la elasticidad del sector servicios:


E[ln Y | ln L, ln K , D ] = + ln L

Y la de los otros sectores:


E[ln Y | ln L, ln K , D ] = ln L

2. Con respecto al siguiente modelo:

ln wi = + 1 Ei + 2 D2i Ei + 3 D3i Ei + ui
Donde: Wi: salario de la persona i. Ei: aos de escolaridad de la persona i. D2i: variable dummy que toma valor 1 si la persona i tiene entre 8 y 11 aos de escolaridad (incluido los entremos). D3i: variable dummy que toma valor 1 si la persona i 12 aos de escolaridad o ms. a) Qu representan los coeficientes 1, 2 y 3? (15 ptos) Derivando el valor esperado del logaritmo del salario con respecto a los aos de escolaridad, se obtiene el retorno a la educacin:

E[ln wi | E , D2 , D3 ] = 1 + 2 D2 i + 3 D3i E
Para la gente que tiene menos de ocho aos de escolaridad, el retorno a la educacin es:

E[ln wi | E , D2 , D3 ] = 1 E
Para las personas que tienen 8 aos y ms de escolaridad pero menos de 12 aos de escolaridad, el retorno a la educacin es:

E[ln wi | E , D2 , D3 ] = 1 + 2 E
Y finalmente, para las personas que tienen 12 aos de escolaridad o ms, el retorno a la ecuacin que resulta del modelo es:

E[ln wi | E , D2 , D3 ] = 1 + 3 E
De esta forma, 1 representa el retorno a la educacin de las personas con menos de 8 aos de educacin (bsica incompleta), el coeficiente 2 representa el aumento en retorno a la educacin de las personas que tienen entre 8 y 11 aos de educacin (incluido los extremos) comparado con la gente con menos de 8 aos de escolaridad, y el coeficiente 3 representa el aumento en retorno a la educacin de las personas que

tienen 12 aos o ms de educacin comparado con la gente con menos de 8 aos de escolaridad. b) Si 1=0.05, 2=0.09 y 3=0.13. Realice un grfico de la relacin estimada entre logaritmo del salario y los aos de educacin. Qu representa este grfico?. (15 ptos) Grafico Retorno a la educacin

CONTROLES 5

Econometra I Profesores: J.M. Benavente, A. Otero y J. Vsquez. Primavera 2004 Pauta Control 5 Pregunta 1: (30 puntos) La omisin de una variable relevante siempre subestima el verdadero valor del y su varianza. Comente. Falso, la omisin de una variable relevante siempre produce sesgo en los parmetros a menos que la correlacin entre la variable omitida y las explicativas incluidas sea cero, sin embargo, la direccin del sesgo no es siempre negativa, el signo del sesgo depende de dos cosas: la correlacin entre la variable omitida y las variables explicativas incluidas y el valor del parmetro que tendra asociado la variable omitida (valor poblacional). Para un modelo sencillo con una variable (x1 ,x2 ) explicativa (x1 ) y una variable omitida (x2 ) se mostr en clases que el sesgo es: cov V (x1 ) 2 . Por otra parte, siempre al omitir una variable relevante, la varianza de los parmetros estimada a partir del modelo incorrecto es menor que la del modelo verdadero que incluye la variable omitida. Pregunta 2: (70 puntos) Suponga que un amigo de usted esta interesado en estimar el retorno a la educacin. Para esto ha estimado los siguientes dos modelos. Modelo 1: Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Expe2i + 6 Dzonai + 7 Dpatroni + ui Modelo 2: Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Expe2i + 6 Dzonai + ui En donde Wi corresponde al logaritmo natural del salario del individuo i , Dsexoi es una variable dicotmica que toma el valor de 1 si el individuo i es hombre, Esci corresponde a laos aos de educacin del individuo i, Expei y Expe2i corresponden a los aos de experiencia y experiencia al cuadrado del individuo i respectivamente, Dzonai es una variable dicotmica que toma el valor de 1 si el individuo vive en una zona urbana y 0 sino, y Dpatroni es una variable dicotmica que toma el valor de 1 si el individuo es trabajador por cuenta propia. En base a los resultados de los modelos calcule los criterios de informacin de Akaike y Schwarz y aconseje a su amigo sobre cual modelo debe considerar.

Modelo 1:
Dependent Variable: LNW Method: Least Squares Date: 10/27/04 Time: 00:15 Included observations: 40191 LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6) *DZONA+C(7)*DPATRON Coefficient C(1) C(2) C(3) C(4) C(5) C(6) C(7) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 9.931645 0.389195 0.117759 0.018930 -0.000160 0.188917 0.359617 0.368769 0.368674 0.674479 18280.58 -41197.25 Std. Error 0.022411 0.010563 0.001023 0.000957 1.38E-05 0.007530 0.007515 t-Statistic 443.1514 36.84418 115.1189 19.79067 -11.59811 25.08913 47.85069 Prob. 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 11.91058 0.848871 ? ? 1.705727

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Modelo 2:
Dependent Variable: LNW Method: Least Squares Date: 10/27/04 Time: 00:24 Included observations: 40191 LNW=C(1)+C(2)*DSEXO+C(3)*ESC+C(4)*EXPE+C(5)*EXPE2+C(6) *DZONA Coefficient C(1) C(2) C(3) C(4) C(5) C(6) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 9.938190 0.389363 0.120470 0.021630 -0.000151 0.176372 0.332801 0.332718 0.693420 19322.21 -42310.86 Std. Error 0.023040 0.010860 0.001050 0.000982 1.42E-05 0.007737 t-Statistic 431.3386 35.85326 114.7276 22.03435 -10.65890 22.79717 Prob. 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 11.91058 0.848871 ? ? 1.739436

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

AIC BIC n 40191 40191

= = k 7 6

2lnL k + n n 2lnL ln(n) k + n n lnL -41197.25 -42310.86 AIC 2.05025 2.10564 BIC 2.0519 2.10707

Modelo I Modelo II

De acuerdo a ambos criterios se recomienda escoger el primer modelo, ya que este minimiza ambos criterios de informacin. 2

Econometra I Profesora: Javiera Vsquez. Verano 2005 Pauta Control 5 Pregunta 1: (30 puntos) El estimador de White me permite solucionar el problema de ineciencia en el estimador MCO cuando los errores son Heterocedsticos. Comente. Falso, el estimador de White slo me permite estimar en forma consistente la matriz de varianzas y covarianzas de los parmetros en presencia de Heterocedasticidad estimador por MCO. El estimador MCO siempre ser ineciente, el estimador eciente en este contexto es el de Mnimos Cuadrados Generalizados. Por lo tanto, White me permite estimar consistentemente la matriz de varianzas ty covarianzas del estimador MCO (que es ineciente) para realizar la inferencia en forma correcta, utilizando esta matriz. Pregunta 2: (70 puntos) Suponga el siguiente modelo de regresin lineal:
n1

Y = X + u
nkk1

n1

Este modelo puede ser particionado de la siguiente forma:


n1

Y = X1 1 + X2 2 + u
nk1 k1 1 nk2 k2 1

n1

donde k1 + k2 = k

a) Obtenga el estimador MCO del subconjunto de parmetros 1 . R: El el modelo particionado de la siguiente forma: Y = X1 1 + X2 2 + u = X Y , se puede escribir de la siguiente forma: El sistema de ecuaciones normales (X X ) X1 X1 X2 X1 o alternativamente: 1 + (X X2 ) 2 = X Y (X1 X1 ) 1 1 (X2 X1 )1 + (X2 X2 )2 = X2 Y De (2) obtengo: 2 = X (Y X1 1 ) (X2 X2 ) 2 1 2 = (X X2 ) X (Y X1 1 ) 2 2 Reemplazando (3) en (1): X1 Y X1 Y 1 + X X2 (X X2 )1 X (Y X1 1 ) = (X1 X1 ) 1 2 2 1 + X X2 (X X2 )1 X Y (X X1 ) 1 + X X2 (X X2 )1 X X1 1 ) = (X1 X1 ) 1 2 2 1 1 2 2 1 (1) (2) X1 X2 X2 X2 1 2 = X1 Y X2 Y

(3)

Agrupando trminos, se tiene: 1 X1 [I P2 ]Y = X1 [I P2 ]X1


M2 M2

(4)

donde P2 = X2 (X2 X2 )1 X2 es la matriz de proyeccin, y M2 = I P2 es una matriz simtrica e idempotente. De (4) podemos despejar el estimador MCO del subconjunto de parmetros 1 : 1 = (X M2 X1 )1 X M2 Y 1 1 b) Obtenga la matriz de varianzas y covarianzas del subconjunto de parmetros 1 . R: Utilizando (5): 1 1 = (X1 M2 X1 )1 X1 M2 (X1 1 + X2 2 + u) = (X1 M2 X1 )1 X1 M2 X1 1 + (X1 M2 X1 )1 X1 M2 X2 2 + (X1 M2 X1 )1 X1 M2 u
0

(5)

1 = 1 ) = E (

1 + (X1 M2 X1 ) 1

X1 M2 u

La varianza del subconjunto de parmetros 1 entonces es: 1 ) V ( = = = = = 1 1 )( 1 1 ) ] E [( E [(X1 M2 X1 )1 X1 M2 uu M2 X1 (X1 M2 X1 )1 ] (X1 M2 X1 )1 X1 M2 E [uu ]M2 X1 (X1 M2 X1 )1 (X1 M2 X1 )1 X1 M2 2 IM2 X1 (X1 M2 X1 )1 2 (X1 M2 X1 )1 X1 M2 X1 (X1 M2 X1 )1

1 ) V (

= 2 (X1 M2 X1 )1

Econometra I Profesores: A. Otero y J. Vsquez. Otoo 2005 Pauta Control 5 Pregunta 1: (30 puntos) La omisin de variables relevantes produce subestimacin en los parmetros estimados por Mnimos Cuadrados Ordinarios. Comente. Falso, es correcto que el estimador MCO ser sesgado en presencia de variables relevantes 1 ] = 1 + (X X1 )1 X X2 2 lo que en un modelo sencillo de dos omitidas, tenemos que E [ 1 1 1 ] = 1 + Cov(X1 ,X2 ) 2 . Pero el signo variables (una incluida y la otra omitida) se reduce a E [ V (X1 ) del sesgo depende de dos cosas: del signo de 2 y de la covarianza entre X1 y X2 . Existen tres casos posibles: 1. 2 positivo y Cov (X1 , X2 ) positiva, lo cual genera un sesgo hacia arriba o sobreestimacin. 2. 2 positivo y Cov (X1 , X2 ) negativa, lo cual genera un sesgo hacia abajo o subestimacin. 3. 2 negativo y Cov (X1 , X2 ) positiva, lo cual genera un sesgo hacia abajo o subestimacin. Pregunta 2: (70 puntos) Demuestre que los criterios de informacin de Akaike (AIC) y Schwarz (BIC): AIC BIC = = lnL k +2 n n lnL k 2 + ln(n) n n 2

Se puedes escribir aproximadamente de la siguiente forma, bajo el supuesto de normalidad en el trmino de error en el modelo de regresin lineal Y = X + u: AIC BIC = = ln( 2 ) + 2 k n k n

ln( 2 ) + ln(n)

Si los errores en el modelo Y = X + u se distribuyen normal con media cero y varianza 2 , tenemos que: Y N (X, 2 ) Ahora debemos encontrar el logaritmo de la funcin de verosimilitud y reemplazarla en ambos criterios de informacin. La funcin de densidad (o verosimilitud) individual es: f (yi ; Xi , , 2 ) = L(, 2 ; yi , Xi ) = = 1 1 2 2 1 2 2 e
(yi Xi )2 2 2 u2 i

e 2 2

De esta forma, la verosimilitud conjunta es: L(, 2 ; Y, X ) = = 1 2 2 1 2 2


n

e
n

(yi Xi )2 n i=1 2 2

n 2 i=1 ui 2 2

Finalmente el logaritmo de la verosimilitud es: lnL(, 2 ; Y, X ) = n n ln(2 ) ln( 2 ) 2 2


n 2 i=1 ui 2 2

, la que se puede evaluar en los estimadores ( 2 ): lnL(, 2 ; Y, X ) = Recordemos que 2 =


n i=1

n n ln(2 ) ln( 2 ) 2 2

n 2 i i=1 u 2 2

u 2 i

, reemplazando en la expresin anterior:

lnL =

n n n 2 ln(2 ) ln( 2 ) 2 2 2 2 n n n 2 lnL = ln(2 ) ln( ) 2 2 2 n 2 lnL = ln(2 ) + ln( )+1 2

Por lo tanto, el logaritmo de la verosimilitud (lnL) es aproximadamente igual a: lnL = n ln( 2 ) 2

Reemplazando esta ltima expresin en las formulas originales de los criterios de informacin de Akaike y Schwarz, se demuestra lo planteado.

Econometra I
Profesores: Emerson Melo Rodrigo Montero Jaime Ruiz-Tagle / Javiera Vsquez
Primavera 2005 Control 5 - Pauta de Correccin

Rut:

.......................................

Instrucciones
Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no tiene derecho a reclamo. Debe contestar slo en el espacio disponible.

Pregunta 1 (50 puntos)

Considere el siguiente modelo:


yi = 0 + 1 x1i + ui

donde yi es la variable a explicar, x1i es la nica variable explicativa, ui es el trmino de error y i = 1, . . . , n. Asuma que se cumplen todos los supuestos del Modelo de regresin Lineal Clsico, y que los errores tienen un distribucin normal ui N (, 2 ). muestre que el estimador mximo verosmil pasa por los puntos medios de los datos soM V + M V x M V y M V son bre yi y xi . Esto es, muestre que se cumple y = 1 , donde 0 1 0 1 los estimadores de mxima verosimilitud de 0 y 1 respectivamente.

Utilizando las condiciones de primer orden de la maximizacin de verosimilitud ,

Para ello, recuerde que la funcin normal para una variable centrada en su media (es decir, con media igual a cero) se escribe como:
1 x2 f (x) = exp 2 . 2 2

Solucin

normal es:

La funcin de verosimilitud conjunta para errores i.i.d. con distribucin


L= u2 1 exp i2 . 2 2 i=1 1 u2 exp i2 2 2
n n

Luego, el logaritmo de la funcin de verosimilitud conjunta es:


n

ln(L) =
i=1

ln

n = n ln( ) ln(2 ) + 2

i=1

u2 i 2 2

Dado que ui = yi 0 1 x1i , la funcin a maximizar es


ln(L) = n ln( ) n ln(2 ) + 2
n

i=1

(yi 0 1 x1i )2 2 2

De la condicin de primer orden de maximizacin al derivar con respecto al parmetro 0 , imponiendo que la solucin corresponde a la los estimadores de mxima verosimilitud M V ) se obtiene: M V y ( 0 1
n

2
i=1

M V M V x1i ) (yi 0 1 2 2
n

= 0

M V M V x1i ) = 0 (yi 0 1
i=1 n n

M V + M V yi = n 0 1
i=1 n i=1 yi

M V + M V = 0 1

x1i i=1 n i=1 x1i n

M V + M V x y = 1 . 0 1

Pregunta 2 (50 puntos)

Explique en qu consiste cada uno de los 3 test de hiptesis usados en inferencia bajo Mxima Verosimilitud. Haga una comparacin crtica de los test, estableciendo sus ventajas y desventajas.

Los 3 tests usados en inferencia bajo Mxima Verosimilitud son: el test LR (Likelihood Ratio - Razn de Verosimilitud), el test de Wald y el test LM (Lagrange Multiplier - Multiplicador de Lagrange).
Solucin

Los estadsticos de cada uno de los tests son los siguientes:

LR = 2 ln L(, ) ln L(, ) W LM =

2 q 2 q
a

r) [R(X X )1 R ](R r) (R 2 a 2 2 = nR q

y y donde corresponden a los estimadores del modelo no restringido, son los 2 estimadores del modelo restringido, y el R corresponde a aquel de la regresin auxiliar de u sobre X , donde u son los residuos del modelo restringido y X es la matriz de todas las variables explicativas. Finalmente, q corresponde al nmero de restricciones involucradas.

Asintticamente los 3 tests son equivalentes en el sentido que el estadstico asociado a cada uno de ellos sigue una distribucin Chi-cuadrado. Dada la naturaleza asinttica de los test, deben ser aplicados con mucho cuidado en muestras relativamente pequeas, en las cuales se debiera prefererir tests como el F o el t. Una ventaja importante de estos tests es que permiten testear restricciones no lineales. En el test LR, si la restriccin reduce signicativamente la funcin de verosimilitud, entonces el test rechaza la hiptesis nula de las restricciones. Por lo tanto, el LR test requiere la estimacin del modelo no restringido y del modelo restringido. Sin embargo, la construccin del estadstico LR es extremadamente simple, requiriendo simple resta. Todos los paquetes econmetricos entregan el valor la funcin de verosimilitud. 3

El test de Wald involucra slo la estimacin del modelo no restringido, y analiza las implicancias de las restricciones. La construccin del estadstico W involucra manejo matricial, hacindolo ms demandante. El test LM analiza la pendiente de la funcin de verosimilitud y nalmente slo requiere la estimacin del modelo restringido. La construccin del estadstico requiere una regresin auxiliar. Usualmente, el modelo original y el tipo de restricciones determinarn cul test es ms sencillo de aplicar. En algunos casos el modelo no restringido puede ser tan complejo que el test LM se hace ms conveniente. En otros casos, las restricciones pueden generar un mayor costo de estimacin del modelo restringido, haciendo que el test de Wald sea ms conveniente.

Verano 2005-2006

Econometra I

Profesor : Jaime Ruiz-Tagle V. Ayudante : Roberto Jaramillo M.


Control 5 - Pauta de Correcin

Instrucciones

Ud. Dispone de 30 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no tiene derecho a reclamo.
Pregunta 1 (30 puntos)

Los criterios de informacin de Akaike (AIC) y Schwartz (BIC) se denen como:


2 ln(L) k + n n ln(n) 2 ln(L) +k , BIC = n n AIC =

donde L es la funcin de verosimilutud conjunta, k el nmero de regresores y n es el nmero de observaciones incluidas en el modelo. (a) (15 puntos) Para qu sirven estos criterios de informacin? Explique las consideraciones que hay que tener al utilizarlos.

Los criterios de informacin de Akaike y Schwartz se utilizan para seleccionar el mejor modelo entre modelo anidados. Modelos anidados se reere a modelos que estn contenidos como un caso especial de otro. Los criterios de informacin se basan en el valor maximizado del logaritmo de la funcin de verosimilitud para cada uno de los modelos. Las consideraciones que hay que tener son: que los modelos a comparar sean efectivamente anidados y que el nmero de observaciones en utilizado en la estimacin de cada uno de los modelos sea el mismo.

(b) (15 puntos) Explique intuitivamente por qu se busca minimizar (segn esta denicin) los criterios de informacin.

Sabemos que el logaritmo de la funcin de verosimilitud es siempre negativo dado que la funcin de verosimilitud es una multpiplicacin de probabilidades (el logaritmo de un argumento menor que 1 y mayor que cero es siempre negativo), y que al estimar los parmetros del modelo por Mxima Verosimilitud se busc maximizar dicho valor. Por
1

lo tanto, dado que para calcular el valor del ndice se usa el valor del logaritmo de la funcin de verosimilitud, sabemos que ambos ndices, Akaike y Schwartz, son positivos. Un valor de ln L ms cercano a cero indicar un mejor ajuste, de modo que el ndice ser minimizado para obtener el modelo ptimo.
Pregunta 2 (30 puntos)

(a) (10 puntos) Si se omite una variable relevante en la estimacin de un modelo se produce un sesgo. Cul la estimacin que est sesgada? De qu depende el signo del sesgo?

Al omitir una variable relevante del modelo se producir un sesgo en la estimacin de los parmetros de todas las variables del modelo. El signo del sesgo depende de la relacin existente entre la variable omitida y el resto de las variables y del signo del parmetro de la variable omitida en el modelo verdadero. Adems, se producir un sesgo en la estimacin la varianza de los estimadores de los parmetros. En particular, se subestimar la varianza de los estimadores. Finalmente se sobreestimar la varianza de los errores.

(b) (10 puntos) Explique en qu consiste la heterocedasticidad y por qu podra surgir en la estimacin de un modelo economtrico. Adems, explique las consecuencias en la estimacin e interpretacin de los resultados del modelo.

La heterocedasticidad corresponde a la existencia de errores cuyas varianzas no son iguales, rompiendo con el supuesto de que los errores son homocedsticos con varian2 = 2 i. La heterocedasticidad podra surgir en un modelo economtrico porque za i u podra ocurrir que sea ms fcil predecir (el modelo es mejor) para cierto tipo de observaciones. Por ejemplo, en un contexto de una estimacin de salarios, podra ser ms fcil predecir para aquellos con baja educacin y ms difcil para aquellos con alta educacin. Ello resulta en errores de estimacin del modelo con varianzas ms altas para aquellos con alta educacin. La presencia de heterocedasticidad, al afectar solamente la varianza de los errores, no genera sesgo en la estimacin de los parmetros del modelo. No obstante, s se produce un sesgo en la estimacin de las varianzas de los parmetros. En particular, se obtienen varianzas ms grandes (el estimador de Mnimos Cuadrados Ordinarios deja de ser MELI). Por esto, y dado que los tests de inferencia se construyen basados en las varianzas de los estimadores, se obtendr que los tests de hiptesis se invalidan, por lo que la interpretacin de los resultados de la estimacin del modelo se hace incierta.

(c) (10 puntos) Explique en qu consiste y para qu sirve el mtodo de estimacin de Mnimos Cuadrados Generalizados Factibles (MCGF). [Nota: No es necesaria una demostracin matricial, pero el uso de expresiones algebraicas puede contribuir a una explicacin ms clara].

Cuando estamos en presencia de heterocedasticidad, se puede estimar correctamente las


2

varianzas si se conoce la estructura de la matriz de covarianzas y aplicando el mtodo de Mnimos Cuadrados Generalizados (MCG). No obstante, cuando no se conoce la estructura de la matriz de covarianzas, no se puede aplicar MCG, pero s se puede aplicar Mnimos Cuadrados Generalizados Factibles (MCGF). El mtodo de MCGF (White, 1980) utiliza la se realiza en 2 etapas. En la primera etapa se estima el modelo por MCO. En la segunda etapa, con la informacin contenida en la matriz de covarianzas de los residuos, se corrige la matriz de covarianzas inicial para tener una estimacin consistente. La matriz de covarianzas del estimador de MCO viene dada por:
|X ) = (X X )1 (X 2 X )(X X )1 V ar( u 1 1 2 = n(X X ) ( u X X )(X X )1 n
1 2 Se desconoce la matriz . Luego el mtodo de MCGF propone estimar n u X X como

= 1 n

u 2 i xi xi .
i=1

Finalmente, la matriz de covarianzas corregida resulta


|X ) = n(X X )1 ( X X )1 . V ar(

Universidad de Chile Facultad de Economia y Negocios CONTROL 5 Econometr a I Oto no 2006

Profesoras: Javiera Vasquez y Claudia Sanhueza. Nombre:........................................................................................................... Rut:........................................................................................................... 1. Dado el modelo de regresi on: y i = + ui Donde E (ui ) = 0 y V (ui ) = x2 i . Encuentre el estimador MELI de . Respuesta Dada la heterocedasticidad presente en el error, el metodo mas eciente de estimaci on es MCG, ya que se conoce la matriz de varianzas y covarianzas del error:
=

0 0 x2 1 0 0 x2 2 . . . .. 0 . 0 0 0 x2 n

1 x2 1

0 1 , = . . .

1 x2 2 .. . 0 0 0

0 0

1 x2 n

Como el modelo incluye solo una variable explicativa, la constante, la matriz X es un vector de unos y por lo tanto:

1 x2 1

(X 1 X ) =

1 1

0 . . . 0

1 x2 2 .. . 0 0 0

1 x2 n

0 1 0 . . . 0 1

1 2 i=1 xi

1 x2 1

0
1 x2 2

X Y =

1 1

0 . . . 0

... 0

0 y1 0 . = . . 0 y n 1

x2 n

yi 2 i=1 xi

Con lo cual es estimador MCG queda:


1 1 1 yi T i=1 x2 i T 1 i=1 x2 i

M CG = (X X ) X Y =

2. La omisi on de una variable relevante siempre sobrestima el verdadero valor del par ametro y su varianza. Respuesta Falso, no siempre se sobrestima, la omisi on de una variable relevante siempre produce sesgo en los par ametros a menos que la correlaci on entre la variable omitida y las explicativas incluidas sea cero, y el signo del sesgo depende de dos cosas: la correlaci on entre la variable omitida y las variables explicativas incluidas y el valor del par ametro asociado la variable omitida (valor poblacional). Para un modelo sencillo con una variable explicativa (x1) y una variable omitida (x2) el sesgo es: cov (x1 ,x2 ) 2 , donde se aprecia claramente lo anterior. Con respecto a la var(x1 ) varianza, el sesgo de esta no es claro, pues no podemos estimar 2 de manera correcta.

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Control 5

Semestre: Primavera 2006 Profesores: Jos Miguel Benavente, Rodrigo Montero Tiempo de duracin: 20 minutos No hay preguntas de ningn tipo para los ayudantes Comente (6 puntos) Los modelos no lineales no pueden ser estimados por mnimos cuadrados ordinarios (MCO). Respuesta. Falso. Existen modelos no lineales que son linealizables, y por ende, son susceptibles de ser estimados a travs del mtodo de mnimos cuadrados ordinarios. Un ejemplo de estos modelos lo constituye la funcin Cobb-Douglas. En este caso particular, la linealizacin se efecta a travs de una transformacin logartmica. No obstante lo anterior, hay modelos que no son linealizables, y por lo tanto, no pueden ser estimador por MCO. En este escenario existen dos alternativas de estimacin: (i) mnimos cuadrados no lineales, (ii) mxima verosimilitud. En ambos casos ser necesario utilizar mtodos numricos para obtener la solucin.

Ejercicio (14 puntos) Se tiene una muestra de 20 trabajadores, de los cuales slo 6 utilizan un computador en su lugar de trabajo. El salario promedio de aquellos que no utilizan un computador es de $280.000, mientras que la remuneracin (promedio) de aquellos que s utilizan uno es de $300.000.

1. Especique el modelo que puede ser estimado para cuanticar el retorno al uso del computador en el lugar de trabajo. Para ello considere la inclusin de dos variables dummies. (3 puntos) Respuesta. El modelo tiene la siguiente forma:

Yi = 1 D1i + 2 D2i + ui donde Yi es el salario del trabajador, D1i es una variable dummy que toma el valor uno si la persona no utiliza un computador en su lugar de trabajo, y cero si no, D2i es una variable dummy que toma el valor uno si la persona utiliza un computador en su lugar de trabajo, y cero si no, y nalmente, ui es un trmino de error bien comportado. 2. Encuentre los estimadores MCO del modelo anterior. (6 puntos) Respuesta. En trminos matriciales, el modelo puede escribirse de la siguiente forma: Y = X + u donde:

d11

d21

d12 d22 = (D1 D2 ) X= . . . . . . d1n d1n y: 1 = 2 Luego: = (X X )1 X Y = D1 D1 D1 D2 1 D1 Y D2 Y (1)

D2 D1 D2 D2

Finalmente: 1 1 N1 0 = 2 0 N2

d1i Yi d2i Yi

1 Y 2 Y

280,000 300,000

(2)

3. Encuentre la matriz de varianzas y covarianzas. (3 puntos) Respuesta. La estimacin para la matriz de varianzas y covarianzas viene dada por la siguiente expresin: ) = var( 2 (X X )1 Dado que no se conocen los salarios individuales, no es posible estimar 2 . Por lo tanto: ) = var( 2 N1 0 0 N2 1 =
2 14

0
2 6

4. Especique nuevamente el modelo pero ahora incluya slo una variable dummy, y deje como categora base a aquellos que no utilizan un computador en su lugar de trabajo. Cmo se relacionan los coecientes de este modelo con aquellos denidos en la parte (1)? (2 puntos) Respuesta. El modelo a estimar sera el siguiente: Yi = 0 + 1 D2i + ei Por lo tanto, se cumple lo siguiente: 0 = 1 1 = 2 1

Econometra Facultad de Economa y Negocios Universidad de Chile Pauta Control 5

Semestre: Primavera 2007 Profesores: Jos Miguel Benavente, Rodrigo Montero Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros Tiempo de duracin: 40 minutos No hay preguntas de ningn tipo para los ayudantes Est permitido utilizar calculadora

Considere dos muestras de datos para estimar el siguiente modelo: Yi = 0 + 1 Xi + ui . La primera de ellas (muestra I) contiene la siguiente informacin: XX= 50 300 300 2100 Y X = 300 2000 Y Y = 2100

Por su parte, la segunda muestra (muestra II) presenta las siguientes caractersticas: XX= 50 300 300 2100 Y X = 300 2200 Y Y = 2800

As, se dispone en total de 100 datos, pero que han sido agrupados en dos muestras. En base a esta informacin responda lo siguiente: 1. Calcule los estimadores de mnimos cuadrados ordinarios (MCO) de las dos muestras por separado. (30 puntos) Respuesta. Para la muestra I se tiene lo siguiente: M CO = Para la muestra II: M CO = 0 1 = 50 300 300 2100
1

0 1

50 300 300 2100

300 2000

2 2/3

300 2200

2 4/3

2. Estime la varianza de los residuos de MCO ( 2 ) para cada una de las mues X Y ) (30 puntos) tras. (Ayuda: recuerde que: u u =Y Y Respuesta. Para la muestra I: X Y = 2100 2 2/3 u u =Y Y Luego: I 2 = Para la muestra II: X Y = 2800 2 4/3 u u =Y Y Luego: 1400/3 = 9, 722 48 3. Aplique el test de Goldfeld y Quandt para evaluar la presencia de heteroscedasticidad en los residuos de ambas muestras. Utilice un valor crtico para la distribucin F igual a 1,61. (Ayuda: recuerde que el numerador de este test corresponde a la muestra que tiene asociada una mayor varianza en los residuos) (30 puntos) Respuesta. La hiptesis nula de este test es la presencia de errores homoscedsticos. El test es el siguiente:
2 II = 2 u II II u II /NII = u I u I /NI I 2 que se distribuye F con NII y NI grados de libertad en el numerador y denominador, respectivamente, ya que el numerador del test corresponde a la varianza estimada de los residuos de la muestra que tiene asociada la mayor varianza. Por lo tanto: 9, 722 = 2, 8 GQ = 3, 472 valor que es mayor al F crtico de tabla (1,61), por lo que se rechaza la hiptesis nula de errores homoscedsticos.

300 2000

500 3

500/3 = 3, 472 48 300 2200 = 1400 3

GQ =

4. Cules seran las consecuencias para la estimacin de MCO el rechazar la hiptesis nula planteada por el test de Goldfeld y Quandt? (10 puntos) Respuesta. Frente a la presencia de errores heteroscedsticos, el estimador MCO es insesgado y consistente, sin embargo, ya no es el ms eciente. En este contexto habra que aplicar el mtodo de mnimos cuadrados generalizados (MCG) si es que se quisiera estimar utilizando las dos muestras en conjunto. 2

Departamento de Econom a

Universidad de Chile

STA300

Econometr a I
Profesores: Tom as Rau y Javiera V asquez. Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sep ulveda. o 2008, Pauta Control 5 Oton

1. Suponga el siguiente modelo con una variables explicativa x1 m as una constante:

y = + x1 + u De esta forma la matriz X es de la siguiente forma:

X=

1 1 1 . . . 1

x11 x12 x13 . . . x1n

Muestre que el estimador de obtenido a trav es de la regresi on particionada equivale al estimador del modelo original en desv os con respecto a la media. Respuesta y = X + u Donde X = [i x1 ]

Donde i es un vector de dimensi on n de unos. El estimador particionado de es = (x M x1 )1 (x M y ) 1 1 Donde M = I i(i i)1 i Es f acil ver que i i = n y que ii = Lo anterior implica:
1 n 1 n 1 n 1 n 1 n

1 1 . . . 1

1 1 . . . 1

.. .

1 1 1 1 nn

i(i i)1 i = . . .

. . .

.. .

1 n 1 n 1 n 1 n


nn

1 n

Por lo tanto la matriz M corresponde a la matriz de desviaciones con respecto a la media. 1

Departamento de Econom a

Universidad de Chile

2. La omisi on de variables relevantes siempre sobreestima el verdadero valor del par ametro y su varianza. Comente. Respuesta Falso, la omisi on de variables relevantes no genera problemas de eciencia, al contrario, la varianza es menor, pero s genera problemas de sesgo, el cual depende de dos cosas: i) La covarianza entre la variable omitida y la inclu da. ii) Signo del par ametro poblacional de la variable omitida. Vemos que se estar a sobreestimando si ambos son positivos o negativos y subestimando si es que existe diferencia en el signo de estos elementos.

CONTROLES 6

Econometra I Profesores: J.M. Benavente, A. Otero y J. Vsquez. Primavera 2004 Control 6

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos)Si existe Heterocedasticidad en los errores, el estimador Mnimos Cuadrados Ordinarios ser sesgado, sin embargo, cuando existe autocorrelacin en los errores no se produce sesgo en los parmetros estimados. (Comente). Falso, ambos problemas Heterocedasticidad y Autocorrelacin no generan problemas en la propiedad de insesgamiento de los parmetros estimados por MCO, ya que el supuesto de que E (u) = 0 no se ha quebrado. Ambos problemas generan problemas de eciencia en la estimacin por MCO. Pregunta 2: (70 puntos)
2 2 Dado el modelo de regresin yi = + i , donde E (i ) = 0, V (i ) = xi .

(a) Encuentre el estimador MELI de . El estimador eciente de es el estimador MCG el patrn de Heterocedasticidad. 0 0 x2 1 0 x2 0 2 = . . . ... . . . . . . 0 0 x2 n (ya que conozco la matriz o (1)

De esta forma 1 es:


1

1 x2 1

0 . . . 0

0 1 x2 2 . ... . . 0

0 0 . . .
1 x2 n

(2)

Adems como nuestro modelo incluye como variable explicativa slo la constante, nuestra matriz X es: 1 1 X= . (3) . . 1 De esta forma: X X=
1

1 1

1 x2 1

0 . . . 0

0 1 x2 2 . ... . . 0

0 0 . . .
1 x2 n

1 1 . . . 1

=
T

t=1

1 x2 t

(4)

X Y =
1

1 1

1 x2 1

0 . . . 0

0 1 x2 2 . ... . . 0

0 0 . . .
1 x2 n

y1 y2 . . . yT

=
T

t=1

yt x2 t

(5)

M CG = (X X ) (X Y ) = (b) Encuentre el estimador de la varianza de . El estimador de la varianza de es:


2 ( (X 1 X )1 = V M CG ) = 2

T yt t=1 x2 t T 1 t=1 x2 t

T 1 t=1 x2 t

Econometra I Profesores: A. Otero y J. Vsquez. Otoo 2005 Pauta Control 6 Pregunta 1: (30 puntos) El estimador consistente de Newey and West es el ms eciente dentro de los estimadores lineales cuando existe autocorrelacin. Falso, cuando tenemos problemas de autocorrelacin el estimador MCO deja de ser eciente, su varianza es igual a 2 (X X )1 X X (X X )1 > 2 (X X )1 . El estimador de Newey and West nos permite estimar consistentemente esta varianza, la cual sigue siendo ineciente. Pregunta 2: (70 puntos) Considere el Modelo: yt = xt +ut , donde E (ut ) = 0, V (ut ) = k (xt )2 y Cov (ut , us ) = 0 t = s. Adems dispone de 5 observaciones de la variable dependiente y de la variable explicativa: yt 2 3 10 1 3 xt 1 2 4 1 1

Encuentre el estimador eciente de y de su varianza. Este modelo no tiene problemas de autocorrelacin, pero si de heterocedasticidad, ya que la varianza del error cambia para para observacin t. De esta forma, el estimador eciente es el de MCG que consiste en transformar el modelo original dividiendo cada observacin de la variable dependiente y explicativas por la desviacin estndar del error asociado a esta observacin, una vez transformado el modelo se estima por MCO. La variables yt y xt transformadas son:
yt

= =

x t (10 puntos)

yt = t xt = t

yt xt k xt 1 = 2 2 k k xt yt k 2 x2 t =

El mtodo eciente de MCG consiste en estimar por MCO el modelo: yt = x t + ut , don2 de u t (0, ): iid

M CG

T t=1 yt xt T 2 t=1 (xt ) T yt t=1 xt k T t=1 1 2 k

1 k

1 k 2

= M CG =

T yt t=1 xt T 2 k

T yt t=1 xt

Reemplazando los valores de las 5 observaciones que se dispone: M CG = = (40 puntos) La varianza del estimador MCG es: M CG ) = 2 (X 1 X )1 V ( Por lo tanto: M CG ) = V ( = 1 k 2k = T 10
T 2 k 2 2 1

3 2

10 4

1 1

3 1

5 2 + 1, 5 + 2, 5 + 1 + 3 10 = =2 5 5

M CG ) = (X X )1 V (

1
T 2 t=1 (xt )

1
T t=1 1 k 2

= M CG ) = V ( (20 puntos)

Econometra Facultad de Ciencias Econmicas y Administrativas Universidad de Chile


Control 6

Semestre: Primavera 2005 Profesores: Emerson Melo, Rodrigo Montero y Jaime Ruiz-Tagle Rut: .......................................

Tiempo de duracin: 30 minutos No hay preguntas de ningn tipo para los ayudantes.

Un investigador quiere estimar la siguiente relacin: Si = + SiP + i (1)

donde Si representa los aos de escolaridad del individuo i, SiP representan los aos de escolaridad (promedio) de los padres del individuo i, y i es un trmino de error bien comportado. En otras palabras, se est modelando el impacto que tiene la escolaridad de los padres sobre los niveles de escolaridad de sus hijos. Sin embargo, este investigador ha olvidado incluir la habilidad de los hijos como un determinante clave de su escolaridad. En realidad, la verdadera relacin existente entre la escolaridad de los hijos y la de sus padres debera ser estimada a travs de la siguiente ecuacin: Si = + SiP + Hi + i (2)

1. Demuestre que al estimar a partir de la ecuacin (1) se incurre en un sesgo. 1

Respuesta. El estimador de mnimos cuadrados ordinarios (MCO) de viene dado por: =


N P i=1 si si N P 2 i=1 (si )

donde la variable en minsculas denota que se encuentra en desviacin respecto de su media. Por otro lado, la ecuacin (2) en desvos respecto de la media viene dada por: si = sP i + hi + i Reemplazando si en la frmula de la estimacin de MCO, se tiene lo siguiente: = nalmente: =+
N i=1 P sP i (si + hi + i ) N P 2 i=1 (si ) N P i=1 si hi N P 2 i=1 (si ) N P i=1 si i N P 2 i=1 (si )

Aplicando esperanza a la expresin anterior: ) = + Cov (Si , Hi ) E ( V ar(SiP ) Por lo tanto, al estimar a travs de (1) se incurre en un sesgo, el cual viene dado por: ) = Cov (Si , Hi ) E ( V ar(SiP ) 2. De qu depende el sesgo de la estimacin? Respuesta. Como puede apreciarse del resultado anterior, el sesgo depende de dos elementos: a ) ( ) El efecto que tiene la variable omitida, habilidad, sobre la variable dependiente del modelo (escolaridad) b ) (Cov (SiP , Hi ) La relacin que existe entre la variable omitida, habilidad, y la variable explicativa incluida en la estimacin del modelo (escolaridad de los padres) 2
P P

3. Es posible especular respecto de la direccin de este sesgo? Respuesta. Por supuesto que s. En primer lugar, es muy posible que el efecto que tiene la habilidad sobre la escolaridad de las personas sea positivo ( ), ya que personas ms hbiles debieran alcanzar, en promedio, mayores niveles educativos. Por otro lado, es tambin bastante probable que padres con mayor escolaridad tengan a su vez hijos con mayor habilidad (hay un mayor estmulo, y adems, es probable que exista una correlacin positiva entre habilidades intergeneracionales). Por lo tanto, es muy probable que el estimador MCO est sesgado hacia arriba. 4. Suponga que dispone de los siguientes datos:
Escolaridad (S ) 0 2 4 7 9 11 16 17 21 Escolaridad de los padres (S P ) 1 1 5 3 12 12 14 9 20 Habilidad (H ) 2 2 3 5 4 7 9 10 10

Si usted omite la variable habilidad en su estimacin, cul es el coeciente estimado para ? Respuesta. El estimador MCO viene dado por: =
N P i=1 si si N P 2 i=1 (si )

Cov (Si , SiP ) 41, 95 = = 0, 9808 P 42, 77 V ar(Si )

5. Si ahora incluyera la variable habilidad en la estimacin, cmo esperara usted que fuera el coeciente estimado para ? Justique (5 puntos) Respuesta. De acuerdo a lo sealado en (3) lo ms probable es que el estimador est sesgado hacia arriba, por lo que se esperara que la nueva 3

estimacin arrojara un coeciente menor que el encontrado anteriormente. Para poder justicar esto con la informacin que se dispone habra que asumir que el efecto que tiene la habilidad sobre la escolaridad de las personas es positivo ( > 0), supuesto que no es fuerte. Por otro lado, habra que pronunciarse respecto de la relacin existente entre la habilidad (H ) y la escolaridad de los padres (SiP ). Sin embargo, esto es posible de saber a partir de los datos. En efecto: Cov (SiP , Hi ) = 41, 95 Con estos dos elementos, se concluye que el sesgo de la estimacin sera postivo.

Econometra I Profesoras: Claudia Sanhueza Javiera Vsquez. Otoo 2006 Control 6

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) La existencia de una tendencia creciente en la variable dependiente que no es considerada en modelo implica una sobrestimacin del verdadero valor del parmetro. Comente. La mayora de las variables econmicas tienen una tendencia, generalmente creciente. Si el conjunto de variables explicativas no explican adecuadamente este comportamiento, entonces el trmino de error incorporar dicha tendencia, lo que conduce a la existencia de autocorrelacin positiva. Con rachas de residuos por sobre la media y luego bajo la media.

X Modelo verdadero XX X Modelo X XX X estimado X X X X XX X X X X X X X X

Autocorrelacin producida por una tendencia

Pregunta 2: (70 puntos) Suponga el siguiente modelo de regresin: yt = xt + ut con t=1,2 y 3 (slo 3 observaciones), adems ut sigue un proceso autorregresivo de segundo orden AR(2): ut = 0,1ut1 + 0,5ut2 + t Encuentre la matriz de varianzas y covarianzas del error. Disponemos de 3 observaciones, por lo tanto la matriz de varianzas y covarianzas del error sera de la siguiente forma: 2 12 13 E [uu ] = 2 = 21 2 23 31 32 2 1

De esta forma, necesitamos computar la varianza homocedstica del error, y dos covarianzas: 1 , que es la covarianza entre dos trminos de error distanciados u periodo y 2 que es la covarianza entre dos errores distanciados dos periodos. El trmino de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2: ut = 1 ut1 + 2 ut2 + t Primero computamos la varianza del error ( ): 2 = E [u2 t] = 2 = 2 2 = =
2 2 2 E [2 1 ut1 + 21 2 ut1 ut2 + 2 ut2 + 21 ut1 t + 22 ut2 t + t ] 2 2 2 2 2 1 + 2 + 21 2 1 + 2 2 21 2 2 0,1 0,5 + = + 1 1 2 2 1 2 1 2 1 (0,1)2 (0,5)2 1 (0,1)2 (0,5)2 1 2 1 2 2 0,1 1 + (1) 0,64 0,64 2

1 = 0,1,

2 = 0,5

Ahora calculemos la covarianza de primer orden (errores distanciados un periodo (1 ): 1 1 Reemplazando (2) en (1): 2 1 0,02 0,64 2 = = = 0,1 2 0,2 2 + 0,64 0,64 2 0,64 2 0,62 = = = E [ut ut1 ] = E [(1 ut1 + 2 ut2 + t )ut1 ] 1 2 + 2 1 1 0,1 2 2 = = 0 , 2 2 1 2 0,5

(2)

2 Reemplazando (3) en (2): 1 =

(3)

0,2 2 0,62

(4)

Por ltimo, calculemos la covarianza de segundo orden: 2 2 2 = = = = E [ut ut2 ] = E [(1 ut1 + 2 ut2 + t )ut2 ] 1 1 + 2 2 0,2 2 2 0,1 + 0, 5 0,62 0,62 0,52 2 0,62

(5)

Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error: 2 0,2 0,52 2 2 1 0,2 0,52 0,62 0,62 0,62 2 0, 2 2 0, 2 2 2 = 0, 2 1 0,2 E [uu ] = 0,62 0,62 0,62 0 , 62 2 0,52 0,2 1 0,52 0,2 2 2 0,62 0,62 0,62

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Control 6

Semestre: Primavera 2006 Profesores: Jos Miguel Benavente, Rodrigo Montero Tiempo de duracin: 20 minutos No hay preguntas de ningn tipo para los ayudantes Comente (6 puntos) En un proceso autoregresivo de primer orden, la estimacin (MCO) de la pendiente ser inconsistente. Respuesta. Falso. En un proceso AR(1), la pendiente se estima de la siguiente manera (suponga que la ecuacin a estimar incluye un intercepto): = Aplicando esperanza: ) = + E E (
T t=2 yt1 ut T 2 t=2 yt1 T t=2 yt yt1 T 2 t=2 yt1

=+

T t=2 yt1 ut T 2 t=2 yt1

El insesgamiento se cumplir en la medida que el segundo trmino del lado derecho sea cero. Es posible demostrar que el sesgo es igual a -(1 + 3 )/T . Por lo tanto, el sesgo desaparece a medida que crece T , es decir, el estimador de MCO es consistente.

Ejercicio (14 puntos) Considere el siguiente modelo: Yi = + Xi + ui 1

Existen sospechas de que la varianza del trmino de error para las primeras 22
2 2 observaciones (1 ) no es la misma que para las restantes 32 observaciones (2 ).

De hecho, para las primeras 22 observaciones (aquellas con los Xi ms bajos), los datos producen los siguientes resultados (expresados en desviaciones respecto a la media): xy = 100, x2 = 10 y y 2 = 1040. Para el siguiente grupo de xy = 216, x2 = 16 y y 2 = 3156.

observaciones (32), los resultados son:

En base a esta informacin responda lo siguiente: 1. Realice un test de Goldfeld-Quandt al 5 % para determinar si las varianzas son las mismas para ambos grupos de observaciones. (Ayuda: (1) Para implementar el test no debe omitir observaciones. Trabaje directamente con ambos grupos de datos; (2) Asuma que el F crtico es de 2,04.) (8 puntos) Respuesta. El modelo, en desvos respecto a la media es el siguiente: yi = xi + ui Por lo tanto, la suma de cuadrados de la regresin (ESS) es igual a 2 x2 i. De esta manera, para el primer grupo de observaciones se tiene lo siguiente: ESS1 = 2 x2 i = xy x2
2

x2 i = 1000

Por lo tanto, la suma de los errores al cuadrado (RSS1 ) es: RSS1 = y 2 ESS1 = 40

Para el segundo grupo de observaciones se tiene lo siguiente: ESS2 = 2 x2 i = xy x2


2

x2 i = 2916

Por lo tanto, la suma de los errores al cuadrado (RSS2 ) es: RSS2 = y 2 ESS2 = 240 2

Luego, es estadstico de Goldfeld-Quandt es el siguiente: u 2 u2 Fm,m u 1 u1 con m = (22 + 32 0)/2 2 = 25. Por lo tanto, dado que: 240 = 6 > 2, 04 40 se rechaza la hiptesis nula de homoscedasticidad. 2. Asumiendo que la varianza del trmino de error diere en ambos grupos
2 2 (1 = 2 ), cmo obtendra el estimador de mnimos cuadrados factibles

M CF )? (6 puntos) ( Respuesta. De acuerdo a lo encontrado en el apartado anterior, las varianzas de ambos grupos efectivamente dieren. Para estimar por MCF se requiere contar con una estimacin para la matriz de varianzas y covarianzas. Para el primer grupo se tiene lo siguiente:
2 1 =

40 u1 u1 = =2 n1 k 20

Y para el segundo grupo:


2 2 =

u2 u 2 240 = =8 n2 k 30

Por lo tanto: 1 2 2 = 1 4 2 Una opcin entonces es corregir los datos del primer modelo, de manera de hacer homogneas las varianzas. Para ello, se debe premultiplicar por la matriz P . Se sabe que: P P = 1

Dado que es una matriz diagonal con 1/4 en su diagonal, entonces, se cumple lo siguiente: 2 0 0 0 2 0 . . . .. . . . . . . . 0 0 2 Luego: Y = + X + u donde Y = 2Y , y as respectivamente para las otras variables. Por lo tanto, para el primer grupo de observaciones, ahora se tiene que x2 = 40. El estimador MCF de ser: = 400 + 216 = 11 40 + 16 3. Cmo se estimara la varianza del estimador de mnimos cuadrados ordiM CO ), si la varianza del trmino de error diere entre los dos narios, V ar( perodos? (6 puntos) M CO viene dada por la Respuesta. La estimacin de la varianza de beta siguiente expresin: ) = (X X )1 X W X (X X )1 var(beta donde la matriz W es una diagonal con 22 dos (2s), seguidos de 32 ochos (8s). Por lo tanto: )= var(beta 1 1 (2 10 + 8 16) = 0, 22 (10 + 16) (10 + 16) xy = 400 y

2 0

4 0

0 . . . 0

2 0 0 = . . . .. . . . . . . . 0 2 0

4 0 . . .. . . . . . 0 4

Econometra I Profesores: J.M. Benavente, A. Otero y J. Vsquez. Primavera 2004 Control 7

Nombre: Rut:

.......................................................................................... .......................................

Ud. Dispone de 30 minutos para resolver este control, no puede hacer consultas a los ayudantes, no puede usar calculadora, no puedo tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible Pregunta 1: (30 puntos) Si existe Heterocedasticidad en los errores, el estimador Mnimos Cuadrados Ordinarios ser insesgado, sin embargo, cuando existe autocorrelacin en los errores se produce sesgo en los parmetros estimados. (Comente). Falso, ambos problemas Heterocedasticidad y Autocorrelacin no generan problemas en la propiedad de insesgamiento de los parmetros estimados por MCO, ya que el supuesto de que E (u) = 0 no se ha quebrado. Ambos problemas generan problemas de eciencia en la estimacin por MCO. Pregunta 2: (70 puntos) Suponga que en el siguiente modelo de regresin: yt = xt + ut con t=1,2,3 (slo 3 observaciones en la muestra), ut sigue un proceso autorregresivo de segundo orden AR(2): ut = 0,1ut1 + 0,5ut2 + t Encuentre la matriz de varianzas y covarianzas del error (u). Disponemos de 3 observaciones, por lo tanto la matriz de varianzas y covarianzas del error sera de la siguiente forma: 2 12 13 E [uu ] = 2 = 21 2 23 31 32 2 De esta forma, necesitamos computar la varianza homocedstica del error, y dos covarianzas: 1 , que es la covarianza entre dos trminos de error distanciados u periodo y 2 que es la covarianza entre dos errores distanciados dos periodos. El trmino de error se acuerdo al enunciado sigue un proceso autoregresivo de orden 2: ut = 1 ut1 + 2 ut2 + t 1 = 0,1, 2 = 0,5

Primero computamos la varianza del error ( 2 ): 2 = E [u2 t] = 2 = 2 2 = =


2 2 2 E [2 1 ut1 + 21 2 ut1 ut2 + 2 ut2 + 21 ut1 t + 22 ut2 t + t ] 2 2 2 2 2 1 + 2 + 21 2 1 + 2 2 21 2 2 0,1 0,5 + = + 1 1 2 2 1 2 1 2 1 (0,1)2 (0,5)2 1 (0,1)2 (0,5)2 1 2 1 2 2 0,1 1 + (1) 0,64 0,64

Ahora calculemos la covarianza de primer orden (errores distanciados un periodo (1 ): 1 1 Reemplazando (2) en (1): 2 1 0,02 0,64 2 = = = 0,1 2 0,2 2 + 0,64 0,64 2 0,64 2 0,62 = = = E [ut ut1 ] = E [(1 ut1 + 2 ut2 + t )ut1 ] 1 2 + 2 1 1 0,1 2 = 0 , 2 2 2 = 1 2 0,5

(2)

2 Reemplazando (3) en (2): 1 =

(3)

0,2 2 0,62

(4)

Por ltimo, calculemos la covarianza de segundo orden: 2 2 2 = = = = E [ut ut2 ] = E [(1 ut1 + 2 ut2 + t )ut2 ] 1 1 + 2 2 0,2 2 2 0,1 + 0, 5 0,62 0,62 0,52 2 0,62

(5)

Utilizando (3), (4) y (5) podemos computar la matriz de varianzas y covarianzas del error: 2 0,2 0,52 2 2 1 0,2 0,52 0 , 62 0 , 62 0 , 62 2 0, 2 2 0, 2 2 2 = 0, 2 1 0,2 E [uu ] = 0,62 0,62 0,62 0 ,62 2 0 , 52 0 , 2 1 0,52 0 , 2 2 2 0,62 0,62 0,62

Econometra I Profesora: Javiera Vsquez. Verano 2005 Pauta Control Recuperativo Pregunta 1: (30 puntos) Si la variable dependiente se encuentra medida con error, el estimador MCO subestima el valor poblacional de los parmetros. Sin embargo, si la(s) variable(s) explicativa(s) esta(n) medida(s) con error, el estimador MCO sobreestima el valor poblacional de los parmetros. Comente. Falso, si slo la variable dependiente esta medida con error, los supuestos para que MCO sea insesgado no se ven afectados. Sin embargo, si la variable explicativa esta medida con error, se rompe el supuesto cov (ut , xt ) = 0, el estimador MCO es sesgado hacia el origen, siempre subestima el verdadero valor del parmetro. Pregunta 2: (70 puntos) Dado el siguiente modelo: yt = 0 + 1 xt + ut ut = ut1 + t
2 donde t N (0, ). Adems dispone de las siguientes observaciones: iid

t yt xt

1 22 4

2 26 6

3 32 10

4 34 12

5 40 14

6 46 16

7 46 20

8 50 22

Obtenga una estimacin eciente de los parmetros 0 y 1 , sabiendo que = 0,5. R: Para estimar eciente el modelo debemos utilizar el mtodo de Mnimos Cuadrados Generalizados, que consiste en transformar el modelo original de forma tal que el error este libre de autocorrelacin, como en este caso el error sigue un procedimiento AR(1) se debe transformar de la siguiente forma la variable dependiente y explicativa del modelo:
yt = yt 0,5yt1 xt = xt 0,5xt1

De esta forma, se tienen los siguientes datos transformados: t 1 2 3 4 5 6 7 8 Suma yt 22 26 32 34 40 46 46 50 xt 4 6 10 12 14 16 20 22


yt

x t 4 7 7 8 9 12 12 59

x y 60 133 126 184 234 276 324 1337

x2 16 49 49 64 81 144 144 547

15 19 18 23 26 23 27 151 1

El estimador MCG consiste en estimar por MCO el modelo transformado:


yt = 0 (1 ) +1 x t + t

As, el estimador MCG de los parmetros es: M CG = (X X )1 X Y n


8 t=2 8 t=2 xt = 8 2 t=2 xt 8 t=2 yt 8 t=2 yt xt

X X =

x t

7 59 59 547 = 151 1337

X Y =

M CG M CG

= =

7 59

59 547

151 1337

10,67241379 1,293103448

Debemos recuperar 0 de la siguiente forma: 0 0 = = = 0 (1 ) (1 ) 10,67241379 = 21,34482759 0,5

De esta forma, los estimadores ecientes de 0 y 1 son 1.29 y 21.35, respectivamente.

SOLEMNES

Solemne Econometra I Profesores: J.M. Benavente, A. Otero y J. Vsquez. Primavera 2004

Nombre: Rut:

........................................................................................... .......................................

Ud. Dispone de 120 minutos para resolver la Solemne, no puede hacer consultas a los ayudantes, slo lpiz y calculadora sobre su escritorio, si contesta con lpiz mina no tiene derecho a reclamo. Contestar slo en el espacio disponible.

I. Comentes: De los siguientes 7 comentes Ud. debe elegir solo 4 de ellos. Cada comente tiene 10 puntos asignados. Comente 1: En el modelo de regresin lineal siempre se cumple que la Repuesta: Falso, esto slo se cumple cuando el modelo incluye constante.Recordemos la CPO = X Y , donde el primer elemento de este vector de dimensin Kx1 es: de MCO: X X 1 2 x2 ... (1 + 2 x2 + ... + y (y u = 0. Si el k xk ) = k xk ) = 0 trmino constante no se incluye, esta primera CPO no existe. Recuerde que la constante =Y , si sta no se incluye no se ajusta la regresin de manera tal que se cumpla que Y garantiza tal igualdad, como tampoco que u = 0.
n i i=1 u

= 0.

Comente 2: Suponga que la variable dependiente, pero no la independiente, esta expresada en desvos con respecto a la media. Qu implicancias tiene esto sobre el posible sesgo de la estimacin por MCO? Repuesta: en un modelo del tipo y = + x + u. Pero No hay implicacias en el insesgamiento de al estar y en devios respecto a su media, el modelo puede ser expresado de la siguiente manera: y = + x + u, donde la constante que estimemos no ser la misma que en un modelo donde y no est en desvios con respecto a su media, est nueva constante ser tal que ajuste la nueva escala de y (en desvios con respecto a la media) de manera que y =y . Por lo tanto la constante ser sesgada.

NO ESCRIBIR EN ESTA PGINA PORQUE NO SE VA A CORREGIR

Comente 3: Los Experimentos de Montecarlo no son un ejercicio muy til, porque debemos conocer los verdaderos valores de los parmetros. Repuesta:

Falso, son un ejercicio muy til. Por lo dems, no se requiere el conocimiento de los verdaderos parmetros, ya que en este tipo de ejercicios uno es el "Dios", por lo tanto, uno determina cmo se generan las y , yo s exactamente cual es su estructura y yo genero la muestra de variables dependientes. Luego esto me permite ver el comportamiento de los parmetros estimados, cuando, por ejemplo, se invalida algn supuesto de MCO, ya que conozco (yo lo impuse) los verdaderos parmetros.

Comente 4: Si estimo un modelo de regresin donde las ingresos son la variable dependiente y la escolaridad la variable explicativa, debera obtener el mismo valor para el parmetro si es que estimo un modelo de regresin donde la escolaridad es la variable dependiente y los ingresos la variable explicativa, ya que el anlisis de regresin mide simplemente la relacin estadstica entre las variables. Repuesta: Falso, en un anlisis de correlacin da lo mismo la causalidad, en tal caso ambas variables son tratadas en forma simtrica. Sin embargo, en el anlisis de regresin se estudia el valor de Y (dependiente) condicional al valor de X (explicativa). Para una estimacin , no hay razones para pensar que un ao adicional de educacin del tipo y = + x tiene el mismo impacto sobre el ingreso promedio, que el que tiene un peso adicional de mide el impacto de un aumento unitario de ingreso sobre el promedio de educacin. x sobre el promedio de y .

NO ESCRIBIR EN ESTA PGINA PORQUE NO SE VA A CORREGIR

Comente 5: Si el tamao de la muestra aumenta, el R2 debe disminuir.

Repuesta: El comente es verdadero ya que el R2 no tiene correccin por los grados de libertad. Una regresin con N variables explicativas ajustan perfectamente a la muestra de N observaciones. A medida que el nmero de observaciones aumenta el ajuste se deteriora ya que el perfecto ajuste de las N primeras observaciones tienen una inuencia cada vez menor en el ajuste de toda la muestra. Por ejemplo, dado el modelo: y = + x + u con dos observaciones el ajuste es perfecto (una recta que une los dos puntos), si aumento a tres el nmero de observaciones el ajuste (medido por el R2 ) va disminuyendo.

Comente 6: Si los errores del modelo de regresin lineal no tienen distribucin normal, a pesar de que los estimadores MCO ya no son MELI, siguen siendo insesgados.

Repuesta: El comente es falso ya que el resultado de que los estimadores por MCO son MELI no requiere que los errores se distribuyan normal. En efecto tal propiedad requiere que los errores cumplan la siguiente condicin: E (ui ) = 0 i, V ar(ui ) = 2 I i y Cov (ui uj ) = 0 i = j , es decir, que los errores ui iid sean independientes e idnticamente distribuidos.

Comente 7: El coeciente de determinacin (R2 ) siempre es positivo y menor a uno. Comente

Repuesta: La no negatividad del R2 , tal como la expresin ST = SE + SR, son vlidas cuando existe trmino constante en el modelo. Cuando no se incluye constante el R2 puede tomar cualquier valor, siempre menor o igual a uno, pero incluyendo todos los reales negativos.

II. Preguntas Tericas: De las siguientes 3 preguntas Ud. debe elegir slo 2 de ellas. Cada pregunta tiene 20 puntos asignados. Pregunta 1: Considere el siguiente modelo de regresin lineal: Yi = 1 + ui , E (ui ) = 0,
2 E (u2 i ) = u

E (ui uj ) = 0 i = j

. Encuentre la esperanza, varianza y (i) Derive el estimador MCO de 1 y llmelo error cuadrtico medio de este estimador. (ii) Considere el siguientes estimador alternativo de 1 : = nY n+1

donde n es el tamao de la muestra y Y el promedio muestral de Y . Encuentre la esperanza, varianza y error cuadrtico medio de este otro estimador. ) elegira Ud. y bajo que criterio?. (iii) Cal de estos dos estimadores ( Respuesta Pregunta 1:

(i) Yi = 1 + ui , tengo slo una variable explicativa, la cual es igual a 1. 1 . x = i donde i = . . 1 1 . = (X X )1 X Y X X = 1 . . . 1 . = n 1 = n (escalar) i=1 . 1 y1 . yi n XY = 1 . . . 1 . = i=1 yi (escalar), = n = y . yn y 1 i ) = E E (yi ) = 1 E (1 +ui ) = 1 1 = n1 = 1 (insesgado) E ( =
n n n n n

) = E ( E ( ))2 V ar(

1 ) = 1 V ar( ) = ECM ( ) como E (

Continuacin Respuesta Pregunta 1: ) = E ( E ( ))2 = E V ar( =E E(


n1 n ui )2 yi n ui n

1
2

=E
( ui )2 n2

(1 +ui ) n

+ =

ui n

1 )2 =

=E

=E

como ui

son iid

E (ui
nE (u2 i) n2

ya que E (ui uj ) = 0
2 u n

) = V ar( (8 puntos) = (ii)


nY n+1

) = ECM (

yi yi ) = E = n+1 E ( n+1 = es sesgado 1 1 = n1 1 = 1 n+1 n+1

n n n+1

1 n+1

E (yi ) =

n n+1 1

) = E V ar(

yi n+1

como ui son iid E ( ) = V ar(

n n+1 1 ui )2

=E

1 n+1 E (ui )2

(yi 1 )

=E

1 n+1

ui

1 E( (n+1)2

ui )2

2 (puesto que E (u u ) = 0 i = j ) = nu i j

n 2 (n+1)2 u yi n+1

) = E ECM ( 21

=E

yi n1 1 n+1

=E

1 n+1

+
2

ui n+1

1 E( (n+1)2

ui

2) = ui + 1

1 2 (nu (n+1)2

2) = + 1

n 2 + (n + 1)2 u
varianza

1 n+1
sesgo2

(8 puntos) (iii) Si interesa el insesgamiento como nico criterio elegira MCO. Sin embargo, si se n , ya que V ar( ) = elige el estimador ms eciente debera elegir 2 < (n+1)2 u 2 2 u ). Si elegimos por error cuadrtico medio, tengo que para n < 2 u = V ar( 2
n

) < ECM ( ). se cumple que ECM ( (4 puntos)

1 2u

2 en un modelo de regresin Pregunta 2: Demuestre que el estimador insesgado de u lineal con k variables explicativas es: 2 u =

u u nk

Respuesta Pregunta 2: Primero, el vector de residuos estimados puede escribirse en funcin de los residuos poblacionales de la siguiente forma: u = Mu Donde M = In X (X X )X , matriz de dimensin nxn idempotente y que satisface MX = 0 E ( uu ) = E (u M M u) = E (u M u), por las caractersticas de la matriz M. Como u M u es un escalar E (u M u) = E [T r(u M u)] Recordemos que la traza es un operador lineal y antes de introducir la esperanza podemos, por propiedades de la traza, cambiar el orden de las matrices.
2I ] = E (u M u) = E [T r(u M u) = E [tr(M uu )] = T r[E (M uu )] = T r[M E (uu )] = T r[M u n 2 2 2 u T r(M ) = u [T r(In ) T r[X (X X )X ])] = u (n k ) 2 (n k ) para que la suma de los errores al cuadrado Por lo tanto como E ( uu ) = u 2 debemos dividir por (n k ). sea un estimador insesgado de u 2 = u u u nk 2) = E ( u E ( uu ) nk

2 (nk)u nk

2 = u

(20 puntos)

Continuacin Respuesta Pregunta 2:

Pregunta 3: En un modelo de regresin Y = X + u, encuentre la varianza del error de prediccin cuando se predice el valor esperado de la variable dependiente. Respuesta Pregunta 3: Si se quiere predecir E (Y ) y no un valor puntual de Y, se dene el error de prediccin de la siguiente forma: = X0 X0 = X0 ( ) e 0 = E (Y0 ) E (Y0 ) = E (Y0 ) X0 es MELI E ( ) = Si se cumplen todos los supuestos bajo los cuales E ( e0 ) = 0 .

V ar( e0 ) = E [( e0 E ( e0 ))( e0 E ( e0 )) ] = E ( e0 e 0 ) = E (X0 ( )( ) X0 ) )( ) X = X0 E ( 0 ) = X0 V ar(X 0


2 X (X X )1 X V ar( e0 ) = u 0 0

(20 puntos)

Continuacin Respuesta Pregunta 3:

III. Ejercicio Prctico: La siguiente pregunta es obligatoria. Esta pregunta tiene 40 puntos asignados. Considere el siguiente modelo de regresin lineal con 3 variables: yi = 1 + 2 x2,i + 3 x3,i + ui se dispone de la siguiente informacin: 33 0 0 132 X X = 0 40 20 X Y = 24 0 20 60 92 (i) Cual es el tamao de la muestra?. (ii) Calcular la ecuacin de regresin. (iii) Contraste la hiptesis de que las dos pendientes suman uno. (iv) Calcular la prediccin para yf , dado x2,f = 4 y x3,f = 2. Obtener un intervalo de conanza al 95 % para dicha prediccin, donde f denota predicho. Respuesta Ejercicio Prctico: (i) Como X X = n x2 x3 x2 x2 2 x2 x3 x3 x2 x3 x2 3 y XY = y yx2 yx3

n 2 yi = 678 i=1

(yi Y )2 = 150
i=1

el tamao de la muestar es 33. (4 puntos)

(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectos calculamos las medias de las variables: 2 = X2 = 0 X 3 = X3 = 0 Y = y = 132 = 4 X n n n 33 2 ) = X2 ; 3 ) = X3 (X2 X (X3 X 2 )(Y Y ) = (Y Y )X2 = Y X2 Y (X2 X X2 = Anlogamente 3 )(Y Y ) = (X3 X Y X3

Y X2

Por lo tanto, las submatrices de X X y X Y estn en desviaciones con respecto a la media. De esta forma, el modelo en desvos se expresa mediante las siguientes matrices: XX= 40 20 20 60 y XY = 24 92

Continuacin Respuesta Ejercicio Prctico: (X X )1 =


1 2400400

60 20 20 40

0,03 0,01 0,01 0,02 24 92 = 0,2 1,6

= (X X )1 X Y =

0,03 0,01 0,01 0,02

el parmetro constante se recupera de la siguiente forma: 1 = Y 2 X 3 X 2 3 = Y =4 1 = 4 2 = 0,2 3 = 1,6 = 4 0,2X2 + 1,6X3 La recta de regresin queda: Y (12 puntos) (iii) H0 : 2 + 3 = 1 t=
2 + 3 1 u 2 nk 2 )+V ar( 3 )+2Cov ( 2 , 3 ) V ar(

t333=30

2 (X X )1 = V ar( ) = u

(Y X ) (Y X ) = Y Y 2 X Y + X X u = Y X 132 X Y = 4 0,2 1,6 24 = 670,4 Como Y Y = y 2 = 678 92 33 0 0 4 X X = 4 0,2 1,6 0 40 20 0,2 = 670,4 y adems 0 20 60 1,6
2 = u u = 678 2 670,4 + 670,4 = 7,6 u 7,6 30

0,25

V ar( ) = 0,25

0,03 0,01 0,01 0,02 =


2

0,0076 0,0025 0,0025 0,0051

t=

0,2+1,61 0,0076+0,005120,0025

0,4 0,0076

Al 5 % de signicancia: t 0,05 ,30 = t1 0,05 ,30 = t0,975,30 = 2,042 como tc = 4,59 > 2,042 = ttabla se rechazaH0 : 2 + 3 = 1 (12 puntos)
2

Continuacin Respuesta Ejercicio Prctico: = 4 0,2 (4) + 1,6 + (2) = 8 f = Xf (iv) Y Intervalo de conanza: f t0,975,30 P r(Y (e0 ) < Yf < Y f + t0,975,30 V ar
2 + 2 (e0 ) = V ar u u 1 33

(e0 )) = 0,95 V ar

1 4 2

0 0

0 0 1 0,03 0,01 4 0,01 0,02 2

= 0,25 + 0,25 0,75 = 0,44 P r(6,65 < Yf < 9,35) = 0,95 (12 puntos)

(e0 ) = 0,66 V ar

Econometra I Profesora: Javiera Vsquez. Verano 2005 Pauta Solemne Comente 1: (10 puntos) En un modelo de regresin lineal simple (Yi = 1 + 2 Xi + ui ), si 2 ser igual al valor poblacional del la variable independiente no vara, el estimador MCO parmetro (2 ). = El estimador de 2 es un modelo de regresin simple es:
(Xi X )(Yi Y ) , (Xi X )2

si X (variable

independiente) no vara entonces cada observacin Xi es igual a X , y por lo tanto, el estimador MCO no esta denido. Recuerde que el estimador MCO requiere que las X s varen (Supuesto 8). De esta forma, el comente es falso. Comente 2: (10 puntos) El estimador MCO es el Mejor Estimador Lineal Insesgado, bajo el supuesto de normalidad del trmino de error. El Teorema de Gauss-Markov demuestre que MCO es el Mejor Estimador Lineal Insesgado (MELI), bajo los supuestos de independencia e idntica distribucin del trmino de error, independiente de cual sea esa distribucin. De esta forma, el comente es falso ya que para que MCO cumpla con la propiedad MELI se requiere solamente errores i.i.d. Comente 3: (10 puntos) El anlisis de regresin estudia el grado de asociacin lineal entre dos variable aleatorias. Falso, el anlisis de regresin si bien hace un estudio de dependencia entre dos variables, este se hace entre una variable aleatoria (variable dependiente) y una variable ja (variable independiente) y adems no se ve el grado de asociacin lineal entre ellas, sino se trata de predecir el valor esperado de la variable dependiente condicional a la variable independiente. Lo que se menciona en el comente es el anlisis de correlacin, algo completamente diferente al anlisis de regresin. Comente 4: (10 puntos) Si en el lmite la varianza de un estimador tiende a cero a medida que el tamao de la muestra crece, entonces dicho estimador es consistente. converge en media cuadrtica a su valor poblacional , este estimador es Si un estimador consistente. Para que converger en media cuadrtica, se tiene que cumplir que en el limite el ]2 = 0. Slo si el estimador es insesgado error cuadrtico medio es cero, es decir, l mn E [ convergencia en media cuadrtica es equivalente a decir que en el lmite la varianza tienda a cero. Entonces el comente es Falso, esto se cumple SOLO si el estimador es insesgado.

Pregunta 1: (15 puntos) Encuentre la expresin para la suma total al cuadrado cuando el modelo de regresin no incluye un trmino constante. Respuesta Pregunta 1: Recordemos que la variable y puede ser expresada en funcin de su valor estimado y del error estimado: y=y +u (1)

Si premultiplicamos la expresin anterior por y , tenemos (ojo, NO hemos expresado el modelo en desvos): yy=yy +y u Reemplazando (1) en (2), y utilizando la condicin de ortogonalidad entre las X y u : y y = ( y+u ) y + ( y+u ) u yy=y y + u y +y u + uu
0 N N 0 N

(2)

(3) (4)

Yi2 =
i=1 i=1

i2 + Y
i=1

u 2 i

(5)

La suma total de los cuadrados (ST), la suma total explicada (SE) y la suma total de los residuos (SR), se denen de la siguiente forma:
N N

ST SE SR

=
i=1 N

(Yi Y ) =
i=1 N

Yi2

NY
i=1 2 N

Yi2 = ST + N Y i2 = SE + N Y Y
i=1

(6) (7) (8)

=
i=1 N

i Y )2 = (Y
i=1

i N Y Y

=
i=1

u 2 i

Utilizando (6), (7) y (8) en (5):


2 + SR ST + N Y = SE + N Y 2

ST = SE + SR + N

Y2 Y

Esta expresin diere de la vista en clases por el ltimo trmino, pero si el modelo incluyese constante se garantiza que el promedio observado de la variable dependiente es igual al promedio estimado para esta variable, con lo cual el ltimo trmino es igual a cero, y se tiene la expresin tpica de descomposicin de varianza.

Pregunta 2: (15 puntos) Demuestre que el R2 siempre es mayor o igual que el R . Respuesta Pregunta 2:

R2 = 1

u u Y MY

(9)

2 = 1 R

u u /(n k ) Y M Y /(n 1)

(10)

Lo que se puede expresar alternativamente como: u u Y MY u /(n k ) 2) = u (1 R Y M Y /(n 1) (1 R2 ) = Si k=1, de la expresin (12) tenemos que: 2) = (1 R R2 = u u /(n 1) u u = = (1 R2 ) Y M Y /(n 1) Y MY 2 R
(n1) (nk)

(11) (12)

Por otro lado, si k>1 tenemos que

> 1:

2) = (1 R

(n 1) u u /(n k ) u u = Y M Y /(n 1) Y M Y (n k )
(1R2 ) >1

2 ) = (1 R2 ) (> 1) (1 R 2 ) > (1 R2 ) (1 R 2 < R2 R

Pregunta 3: (40 puntos) Considere el siguiente modelo de regresin lineal con 3 variables: yi = 1 + 2 x2,i + 3 x3,i + ui se dispone de la siguiente informacin: 33 0 0 132 X X = 0 40 20 X Y = 24 0 20 60 92 (i) (5 puntos) Cual es el tamao de la muestra?. (ii) (15 puntos) Calcular la ecuacin de regresin. (iii) (10 puntos) Vea si los parmetros son estadsticamente signicativos. (iv) (10 puntos) Contraste la hiptesis de que las dos pendientes suman uno. Respuesta Pregunta 3: (i) Como X X = n x2 x3 x2 x2 2 x2 x3 x3 x2 x3 x2 3 y XY = y yx2 yx3

n 2 yi i=1

= 678
i=1

(yi Y )2 = 150

el tamao de la muestra es 33. (5 puntos)

(ii) Podemos expresar el modelo en desvios con respecto a la media, para estos efectos calculamos las medias de las variables: X2 = X2 = 0 X3 = n (X2 X 2 ) = (Y Y )X2 = X3 =0 n X2 ; Y = y 132 = =4 n 33 (X3 X 3 ) = X3 X2 = Y X2

(X2 X 2 )(Y Y ) =

Y X2 Y

Anlogamente

3 )(Y Y ) = (X3 X

Y X3

Por lo tanto, las submatrices de X X y X Y estn en desviaciones con respecto a la media. De esta forma, el modelo en desvos se expresa mediante las siguientes matrices: XX= 40 20 20 60 y XY = 24 92

Continuacin Respuesta Pregunta 3: (X X )1 = 1 2400 400 60 20 0,03 0,01 20 40 0,01 0,02 = 0,03 0,01 0,01 0,02 24 92 0,2 1,6

= (X X )1 X Y =

El parmetro constante se recupera de la siguiente forma: 1 = Y 2 X 3 X 2 3 = Y =4 1 = 4 2 = 0,2 3 = 1,6

= 4 0,2X2 + 1,6X3 La recta de regresin queda: Y (15 puntos) (iii)


2 V ar( ) = u (X X )1 =

u 2 nk

(Y X ) (Y X ) = Y Y 2 X Y + X X u = Y X Como Y Y = y adems X X = 4 0,2 1,6 33 0 0 0 40 20 0 4 20 0,2 = 670,4 60 1,6 7,6 0,25 30 0 0,00253333 0,0050666667 y 2 = 678 X Y = 4 0,2 1,6 132 24 = 670,4 92

2 u u = 678 2 670,4 + 670,4 = 7,6 u =

33 0 ) = 0,25 0 40 V ar( 0 20

1 0 0,0076767677 0 20 = 0 0,0076 60 0 0,00253333

1 : Test de signicancia de

tc =

4 = 45,653155 t30 0,0076767677 5

si compramos el valor calculado para nuestro estadstico (tc ) con el tt de tabla a un 5 % de signicancia y con 30 grados de libertad, que es 2.042. La conclusin es que se rechaza 1 = 0, y el parmetro de constante resulta ser estadsticamente signicativo. la H0 : 2 : Test de signicancia de

0,2 = 2,2941573 t30 tc = 0,0076 Si lo comparamos con el valor de tabla de la distribucin t (-2.042), el estadstico calculado es menor al de tabla (o mayor en valor absoluto), de esta forma se rechaza la hiptesis 2 es igual a cero, y el parmetro resulta ser estadsticamente signicativo. nula de que 3 : Test de signicancia de

tc =

1,6 = 22,478059 t30 0,0050666667

Si lo comparamos con el valor de tabla de la distribucin t (2.042), el estadstico calculado 3 es igual a cero, es mayor al de tabla, de esta forma, se rechaza la hiptesis nula de que y el parmetro resulta ser estadsticamente signicativo. (10 puntos).

(iv) H0 : 2 + 3 = 1 t= 2 + 3 1 2 ) + V ar( 3 ) + 2Cov ( 2 , 3 ) V ar( t30

t=

0,2 + 1,6 1 0,4 = 0,0076 + 0,0051 2 0,0025 0,0076

Al 5 % de signicancia: t0,975,30 = 2,042 tc = 4,59 > 2,042 = ttabla se rechaza H0 : 2 + 3 = 1

(10 puntos)

Econometra I Profesora: Andrs Otero Javiera Vsquez. Otoo 2005 Pauta Solemne

Parte I: Comentes (30 puntos) (Contestar slo en las lneas disponible)


Pregunta 1: (5 puntos) Si el coeciente de correlacin en valor absoluto esta entre 0 y 1, el parmetro de pendiente en un modelo de regresin lineal simple tambin lo estar. Comente. Respuesta: El coeciente de correlacin y el coeciente de regresin son conceptualmente distintos, el primero mide la asociacin lineal entre dos variables y el segundo la inuencia de una variable independiente X sobre el valor promedio de Y. Adems, se puede demostrar algebraicamente que: = xy
[0,1] 2 yi

x2 i

Por lo tanto, aunque el coeciente de correlacin este entre 0 y 1, va a depender de la escala de las variables del modelo. Pregunta 2: (5 puntos) El teorema de Gauss Markov dice que el estimador Mnimos Cuadrados Ordinarios es el estimador con menor error cuadrtico medio entre todos los estimadores lineales e insesgados. Comente. ) = V AR( ) + sesgo2 . Por lo tanto, aplicando la propiedad Respuesta: Verdadero, ECM ( de insesgamiento de MCO tendremos que el ECM es igual a la varianza del estimador. De esta forma el teorema de Gauss Markov nos dice que el estimador MCO es el estimador ms eciente (menor varianza y por ende menor ECM) entre todos los estimadores lineales e INSESGADOS. Pregunta 3: (5 puntos) Si el p-value asociado a cierta hiptesis nula es 0, no puedo rechazar la hiptesis nula. Respuesta: Falso, el p-value mide el nivel de signicancia asociado al t-calculado de cierta hiptesis nula. Si este toma el valor de 0, signica que rechazo la hiptesis nula a un 0 % de signicancia (cometiendo 0 % de error de tipo I). Pregunta 4: (5 puntos) El estimador de Mxima Verosimilitud es equivalente al estimador de Mnimos cuadrados Ordinarios. Comente. Respuesta: Falso, slo bajo el supuesto de normalidad en el trmino de error, el estimador MCO y MV de coincidirn. Sin embargo, el estimador de la varianza del error no coincide ya que el estimador de MV de 2 es sesgado.
2 M CO =

2 2 = M V = nk 1

2 n

Pregunta 5: (5 puntos) En un modelo de regresin lineal que busca explicar el salario promedio utilizando como variable explicativa la educacin, se obtiene la siguiente estimacin muestral: Salario=40000+15000*Educacin. Interprete. Respuesta: Este modelo estima un impacto marginal de la educacin sobre el salario de 15000, es decir, un ao adicional de educacin gener un icremento de 15000 en el salario promedio. Adems, se estima que una persona sin educacin obtiene un salario promedio de 40000. Pregunta 6: (5 puntos) En un modelo de regresin lineal: Yi = 0 + 1 X1 + 2 X2 + u, se determina el siguiente intervalo de conanza para 2 , P r[1,3956 < 2 < 2,8974] = 95 %, que 2 y sobre la hiptesis nula de que 2 es puede concluir sobre la signicancia del parmetro igual a 3.5. Respuesta: La signicancia de un parmetro o el testeo de una hiptesis en particular se puede realizar utilizando un intervalo de conanza. Testeando la hiptesis nula de signicancia 2 = 0, podemos ver que 0 cae en la zona de no rechazo, con lo cual se puede concluir que H0 : 2 = 3,5, podemos ver que 3.5 cae fuera de la zona de el parmetro es signicativo. Para H0 : 2 = 3,5. conanza determinada por el intervalo de conanza, por lo tanto se rechaza que

Parte II: Ejercicios Cortos (30 puntos) (Contestar slo en el espacio disponible)

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 1: Suponga que para estimar el modelo Yt = + Xt + ut se dispone de las siguientes observaciones: t= Xt 1 1 2 2 3 3 4 4 5 5 6 6

y se propone utilizar el estimador = 1 8 (Y6 + Y5 Y2 Y1 ). Determine si el estimador es insesgado, calcule su varianza muestral y comprela con la del estimador MCO. Respuesta : Reemplazando Y6 , Y5 , Y2 e Y1 por su expresin poblacional tenemos que: = 1 [ + X6 + u6 + + X5 + u5 X2 u2 X1 u1 ] 8

Luego reemplazando X6 , X5 , X2 y X1 por sus valores observados, tenemos lo siguiente: 1 [ + 6 + u6 + + 5 + u5 2 u2 1 u1 ] 8 1 = [8 + u6 + u5 u2 u1 ] 8 [u6 + u5 u2 u1 ] = + 8 =

(1) (2)

Si los errores cumplen con los supuestos tradicionales de tener media 0, varianza 2 y ser independientes entre ellos, se puede demostrar al tomar valor esperado a la expresin (2) que es insesgado. (5 puntos). Ahora la varianza de se obtiene de la siguiente forma: V [ ] = Reemplazando (2) en (3): V [ ] = V [ ] = V [ ] = V [ ] = V [ ] = E [u6 + u5 u2 u1 ] 8 2 E [u6 ] + E [u5 ]2 + E [u2 ]2 + E [u1 ]2 64 2 + 2 + 2 + 2 64 4 2 64 2 16 3
2

E [ E ( )]2 = E [ ]2

(3)

dado supuesto

de independencia

(5 puntos) ) de este modelo es conocida e igual a: Por otra parte, la varianza del estimador MCO ( ] = 2 (X X )1 = V [
6

2
6 i=1 (Xi

X )2
6 i=1 2 6 X , donde Xi 2 6 i=1 2 = 91. Xi

2 Tenemos que X = 21 i=1 (Xi X ) = 6 = 3,5, adems 6 2 De esta forma, i=1 (Xi X ) =91 6 12,25 = 17,5

Por lo tanto:
2 ] = V [ 17,5

El estimador MCO tiene menor varianza que el estimado . (5 puntos) Ejercicio 2: Demuestre que en un modelo de regresin simple: Y = 1 + 2 Xi + ui , la raz cuadrada del R2 ( R2 ), es igual al coeciente de correlacin entre X e Y . Respuesta: El R2 se dene como: R2 = 2 X M0 X2 2 2 Y M0 Y

En un modelo de regresin simple como el que se plantea, donde solo hay una variable explicativa ms el trmino constante, el R2 se puede reescribir de la siguiente forma: R2 = 2 2
n 2 i=1 (Xi X ) n 2 i=1 (Yi Y )

Aplicando raz cuadrada a la expresin anterior: 2 R2 =


n i=1 (Xi n i=1 (Yi

X )2 Y )2

(4)

El estimador MCO de 2 en este modelo de regresin simple se dene como: 2 =


n i=1 (Yi Y )(Xi n 2 i=1 (Xi X )

X)

(5)

Reemplazando (5) en (6) y reduciendo trminos: R2 =


n i=1 (Yi Y )(Xi n 2 i=1 (Xi X ) n i=1 (Yi n i=1 (Xi

X)

n i=1 (Xi n i=1 (Yi

X )2 Y )2 = xy

(6)

R2 =

Y )(Xi X )
n i=1 (Yi

X )2

Y )2

(15 puntos) 4

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 3: Con la informacin disponible de Homecenter entre los aos 1994 y 2004 sobre Nmero de Tiendas (N ) y tamao de la tienda (T AM ), se quiere estimar el valor promedio del ingreso total en millones de dlares (IN GT ). Se estima el siguiente modelo de regresin lineal: IN GT = 0 + 1 N + 2 T AM + u A continuacin se presenta la estimacin realizada en Eviews:
Dependent Variable: INGT Method: Least Squares Date: 04/15/05 Time: 15:59 Sample: 1994 2004 Included observations: 11 INGT=C(1)+C(2)*N+C(3)*TAM Coefficient C(1) C(2) C(3) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 8085.608 51.42006 -125.7441 Std. Error 3035.113 3.656119 39.65131 t-Statistic 2.664022 -3.171246 Prob. 0.0286 0.0132 4196.545 3933.725 14.30968 14.41820 0.812131

276.5529 611852.2 -75.70325

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

donde: - S.D dependent var (sy ) es la desviacin estndar de la variable dependiente, la que se construye de la siguiente forma: sy =
N i=1 (yi

y )2 N 1
u2 i N k ).

- S.E. of regression es el error estndar de la regresin ( =

- Sum squared resid corresponde a la suma de los errores al cuadrado. Con esta informacin se le pide a Ud. que interprete el modelo, testee la signicancia individual de cada uno de los parmetros y testee la signicancia global del modelo.

Respuesta:

t tt nk = t8 (95 %) = 2,306

De la informacin de la tabla tenemos que c(1) y c(3) caen en la zona de rechazo si testeamos la hiptesis nula que los parmetros son iguales a cero. Por lo tanto, la constante y el tamao de la empresa son variables signicativas para explicar el ingreso total.
Probabilidad

Se Rechaza (2,5%))

No se Rechaza

Se Rechaza (2,5%)

t=-2.306

t)=2.306

tc=-3.17

tc=2.66

Para ver la signicancia del nmero de tiendas debemos calcular el test t asociado a esta hiptesis nula. tc = 1 0 1 ) ( V = 51,42 = 14,06 3,66

1 = 0, ya que tc > tt = 2,306. Por lo tanto, el parmetro es Con lo cual se rechaza H0 de que signicativo. Para ver la signicancia global del modelo se puede utilizar la siguiente denicin del estadstico de Fischer: Fq,nk =
R2 k1 (1R2 ) nk

Fk1,nk uu (Yi Y )2

R2 =

ESS RSS R2 = 1 =1 T SS T SS

Sy =

(Yi Y )2 = 3933,725 n1 u u = 276,5529 nk 6

(Yi Y )2 = 154741923,76

Sy =

u 2 = 611852,052

R2 = 1

611852,05 = 0,996 154741923,76

Fc =

0,996 2 10,996 8

996

t F2 ,8 = 5,32

Por lo tanto, se rechaza la hiptesis de que todas las pendientes del modelo son iguales a cero. El modelo es globalmente signicativo. Ejercicio 4: Sea la matriz X X asociado al siguiente modelo de regresin lineal: Y = 0 + 1 X1 + 2 X2 + u 5 X X = 20 20 20 90 71 20 71 96 42 X Y = 186 150

Se le pide que exprese ambas matrices en desvos con respecto a la media y obtenga el estimador mnimos cuadrados ordinarios de 0 , 1 y 2 . Respuesta: (Xi X i )2 = (Xi X i )(Xj X j ) = (X1 X 1 )2 (Xi )2 nX
2

(Xi Xj ) nX i X j (X1 X 1 )(X2 X 2 ) (X2 X 2 )2


20 5

X Xdes =

Del enunciado se pueden extraer los siguientes datos: n = 5; X 1 = 2 2 X1 = 90 y X2 = 96; X2 X3 = 71

= 4; X 2 =

20 5

= 4;

2 x2 1 = 90 5(4) = 10;

2 x2 2 = 96 5(4) = 16;

x2 x3 = 71 5 4 4 = 9

Donde las variables en minsculas representan desviaciones con respecto a la media. 7

X Xdes =

10 9 9 16

X Ydes =

(Yi Y i )(X1 X 1 ) (Yi Y i )(X2 X 2 ) Yi Xi nY i X i

Adems,

(Yi Y i )(Xi X i ) =

yx1 = 18;

yx2 = 18

X Ydes =

18 18

10 9

9 16

18 18

1 79

16 9 9 10

18 18

1,5949 0,2278

1 = 1,5949, 2 = 0,2278 y 0 = Y 1 X 1 2 X 2 = 8,4 1,5949 4+0,2278 4 = De esta forma, 2,93.

Parte III: Ejercicio Obligatorio (60 puntos) (Contestar slo en el espacio


disponible) Suponga que esta interesado en estimar el ingreso de una tienda, para lo cual dispone de 90 datos sobre: ingreso total en millones de pesos (ingt), el nmero de competidores en el mercado (nc), el gasto en publicidad en millones de pesos (gp) y el nmero de vendedores (nv ). Ud. debe estimar el siguiente modelo de regresin lineal: ingt = 0 + 1 nc + 2 gp + 3 nv + u donde las matrices (X X )1 y X Y vienen 5 3 3 6 1 (X X ) = 2 2 0 4
2 y adems u = 0 ,5 y 90 i=1 (Yi

dadas por: 2 0 2 4 4 3 3 4

3 2 XY = 1 2

Y )2 = 80

(i) (6 puntos) Interprete el modelo, Que signos esperara Ud. de para los parmetros de este modelo? Se espera que el nivel de ingresos de esta tienda, dependa negativamente del nmero de competidores, positivamente del gato en publicidad y positivamente del nmero de vendedores. De esta forma, podramos esperar un signo negativo para 1 y positivo para 2 y 3 . (ii) (8 puntos) Encuentre el estimador MCO de los parmetros de este modelo. = (X X )1 X Y , utilizando la informacin El estimador MCO del vector de parmetros disponible: 0 1 = 2 3 11 7 12 3 5 3 2 0 3 6 2 4 2 2 4 3 0 3 2 4 3 1 4 2

0 , 1 , 2 y 3 . (iii) (8 puntos) Testee la signicancia estadstica de Para ver la signicancia individual de cada uno de los parmetros del modelo se utiliza el siguiente estadstico t: tc = i i ) V ar( asociado a la hipotesis i = 0 nula H0 :

Para realizar los test primero necesitamos computar la matriz de varianzas y de los parmetros: 5 3 2 0 2,5 1,5 1 3 6 2 4 3 1 2 1 ] = = V ar[ ( X X ) = 0 ,5 2 2 4 3 2 0 4 3 4

covarianzas 0 2 1,5 2

Para todas las hiptesis nulas se utiliza el mismo valor de tabla de la distribucin tstudent: tt = t86,95 % 1,99. 0 : Test de signicancia de 11 tc = = 6,96 2,5 0 sea igual a cero, con lo cual el parmetro resulta Se rechaza la hiptesis nula de que ser estadsticamente signicativo. 1 : Test de signicancia de 7 tc = = 4,04 3 1 sea igual a cero, con lo cual el parmetro resulta Se rechaza la hiptesis nula de que ser estadsticamente signicativo. 2 : Test de signicancia de 12 tc = = 8,46 2 2 sea igual a cero, con lo cual el parmetro resulta Se rechaza la hiptesis nula de que ser estadsticamente signicativo. 3 : Test de signicancia de 3 tc = = 2,12 2 3 sea igual a cero, con lo cual el parmetro resulta Se rechaza la hiptesis nula de que ser estadsticamente signicativo.

(iv) (8 puntos) Qu factor es ms importante en determinar el los ingresos?. Como consultor, que recomendara? El gasto en publicidad y el nmero de vendedores tienen un impacto positivo sobre el nivel de ingresos, por el orden de magnitud parece ser ms importante el gasto en publicidad, un milln adicional en gasto en publicidad aumenta en 12 millones el ingreso, por otra parte un aumento en 4 vendedores lograra el mismo aumento en los ingresos totales, habra que ver que resulta ms rentable aumentar en 1 milln el gasto en publicidad o o contratar 4 trabajadores ms. 10

(v) (8 puntos) Determine la Bondad de Ajuste del modelo, a travs del R2 y R .

R2

= =

1 1

u u Y M0 Y

n 2 i i=1 u n 2 i=1 (Yi Y )


n

=1 i De la informacin que se entrega sabemos que 2 = i86 = 0,5, por lo tanto i=1 u 2 i = 2 86 0,5 = 43. Adems se nos entrega la informacin de que (Yi Y ) = 80. Reemplazando:

u 2

R2 = 1
2

43 = 0,4625 80

Para obtener el R utilizamos la siguiente denicin y luego reemplazando los valores correspondientes: R R
2

= 1 = 1

n 2 i /(n k ) i=1 u n ( Y Y )2 /(n i=1 i

1)

43/86 0,5 89 =1 = 0,44375 80/89 80

(vi) (8 puntos) Testee la hiptesis de que todos los coecientes a excepcin de la constante son cero. Bajo esta hiptesis nula el estadstico F calculado se puede escribir de la siguiente forma: Fc = R2 /(k 1) (1 R2 )/(n k )

Reemplazando por lo valores correspondientes: Fc = 0,4625/3 0,154 = = 24.6 0,5375/86 0,00625

El valor de tabla del estadstico F a un 5 % de signicancia y con 3 grados de libertad en el numerador y 86 en el denominador es aproximadamente 2.7, con lo cual se rechaza la hiptesis nula de que todos los parmetros del modelo a excepcin del de la constante sean igual a cero, es decir, el modelo es globalmente signicativo. (vii) (8 puntos) Construya un intervalo de conanza para 1 , 2 , 3 y 2 . Los intervalos de conanza para los parmetros 1 , 2 y 3 se construyen de la siguiente forma: i t0,975,86 Pr i ) < i < i + t0,975,86 V ar( i ) = 95 % V ar(

Intervalo de Conanza de 1 :

P r 7 1,99

3 < 1 < 7 + 1,99

3 = 95 %

P r [10,45 < 1 < 3,55] = 95 % 11

Intervalo de Conanza de 2 :

P r 12 1,99

2 < 2 < 12 + 1,99

2 = 95 %

P r [9,19 < 2 < 14,81] = 95 % Intervalo de Conanza de 3 :

P r 3 1,99

2 < 3 < 3 + 1,99

2 = 95 %

P r [0,19 < 3 < 5,81] = 95 % Por otra parte, el intervalo de conanza para 2 se obtiene de la siguiente forma: Pr (n k ) 2 (n k ) 2 2 < < 2 2 0,95,86 0,05,86 = 95 %

2 El valor de tabla de 2 0,95,86 65 (para la correccin se utiliz 43.8) y el de 0,05,86 107 (para la correccin se utiliz 18.5). POr lo tanto,

Pr

86 0,5 86 0,5 < 2 < = 95 % 43,8 18,5 P r 0,98 < 2 < 2,32 = 95 %

(viii) (6 puntos) Que nivel de ingresos totales esperara Ud. para el ao 2005, si se espera que una nueva tienda abra en el mercado con lo cual tendra 10 competidores, el gasto en publicidad sea 100 y el el nmero de vendedores sea 30. Del modelo estimado tenemos que el valor promedio del ingreso de la empresa depende de la siguiente forma de las variable explicativas: ingt = 11 7 nc + 12 gp + 3 nv Reemplazando nc por 10, gp por 100 y nv por 30, se obtiene un valor predicho para el ingreso del prximo ao de 1,231 millones de pesos.

12

Econometra I Profesores: Emerson Melo Rodrigo Montero Javiera Vsquez Primavera 2005 Pauta Solemne

Parte I: Comentes (30 puntos) (Contestar slo en las lneas disponible)


Pregunta 1: (5 puntos) Si los coecientes asociados a las pendientes de la regresin no son estadsticamente signicativos a nivel individual, entonces, tampoco lo sern en conjunto. Comente. Respuesta: Respuesta: No necesariamente. Es posible que los coecientes asociados a las pendientes de la regresin no sean signicativos a nivel individual, pero s lo sean en su conjunto. Esto se debe a que podra ocurrir que la contribucin individual que hace cada uno de los elementos presentes en X no sea signicativa en s, pero que en conjunto la covarianza existente entre stos permita explicar de manera signcativa la variable dependiente. Pregunta 2: (5 puntos) Signicancia estadstica implica signicancia econmica. Comente. Respuesta: Falso. La signicancia estadstica (obtenida a travs de un test t) no permite inferir que se est en presencia de signifcancia econmica. Esto ltimo depende crticamente del modelo terico subyacente. Recuerde que cuando el N (tamao de la muestra) es lo sucientemente grande, entonces, es muy probable que todos los coecientes estimados resulten ser estadsticamente signicativos. Por otro lado, que el coeciente estimado no sea estadsticamente signicativo no quiere decir que no lo sea desde el punto de vista del modelo que se est estudiando. Muchas cosas (problemas) podran estar pasando con los datos, por lo tanto, no se debe hacer teora a partir de stos. Pregunta 3: (5 puntos) Si el p-value asociado a cierta hiptesis nula es 0 no existir zona de rechazo y por lo tanto, no es posible rechazar la hiptesis nula. Respuesta: Falso, el p-value mide el nivel de signicancia asociado al t-calculado de cierta hiptesis nula. Si este toma el valor de 0, signica que rechazo la hiptesis nula a un 0 % de signicancia (cometiendo 0 % de error de tipo I). Pregunta 4: (5 puntos) En el modelo de regresin lineal clsico dado que la distribucin de los errores no tiene relevancia para la forma de los estimadores, siempre podremos realizar los test de hpotesis tradicionales (tests t y F). Comente. Respuesta: Falso, el supuesto de Normalidad es clave para poder derivar los estadsticos de prueba. Si los errores poseen otra distribucin, entonces no es posible derivar los test t y F tradicionales. 1

Pregunta 5: (5 puntos) En un modelo de regresin lineal clsico siempre ser conveniente incluir regresores, ya que esto permite aumentar el R2 . Respuesta: Falso, sabemos que una mejor medida de la bondad de ajuste del modelo, es 2 que justamente controla por el nmero de regresores presentes en el modelo. Adems, el R cada vez que se incluyen regresores, se debe considerar el sentido econmico de incluirlo. Pregunta 6: (5 puntos) En un modelo de regresin lineal: Yi = 0 + 1 X1 + 2 X2 + u, se determina el siguiente intervalo de conanza para 2 , P r[2,5367 < 2 < 3,2785] = 95 %, Que 2 y sobre la hiptesis nula de que 2 es puede concluir sobre la signicancia del parmetro igual a 3.1?. Respuesta: El intervalo de conanza de un parmetro mide el rango de valores posibles que puede tomar, mide la zona donde no podemos rechazar la hiptesis nula de que el parmetro tome cierto valor (el que esta contenido en el intervalo de conanza). Como la hiptesis de sig2 = 0, y 0 esta fuera de intervalo de conanza se rechaza nicancia del parmetro testea que que 2 sea igual a cero y se puede concluir que el parmetro es estadsticamente signicativo. 2 sea igual Adems como 3.1 esta dentro del intervalo de conanza, no se puede rechazar que a 3.1.

Parte II: Ejercicios Cortos (Contestar slo en el espacio disponible)


Ejercicio 1: (15 puntos) En el modelo de regresin lineal clsico: Y = X + U
u u Demuestre usando matrices que =n k es un estimador insesgado de la varianza del error del modelo. (Ind: Utilice el operador Traza)

Respuesta: Lo primero que debemos darnos cuenta para demostrar lo que se pide, es que : = Y (X X )1 X Y = [Inn (X X )1 X ]Y u = Y X S denimos M = [Inn (X X )1 X ] , que como es bien sabemos es una matriz smetrica e idempotente. Luego u = M Y = M (X + U ) = M U De esta forma, podemos escribir u u = U MU Tomando esperanza en la expresin anterior, asumiendo X jo E( uu ) = E(U M U ) Usando el operador traza escribimos: E (T r(U M U )) = E (T r(M U U )) y por propiedad del operador traza y de la esperanaza, se tiene T r(M E(U U )) = T r(M 2 Inn ) = 2 T r(M ) donde T r(M ) = T r(Inn ) T r((X X )1 X ) = T r(Inn ) T r(Ikk ) = n k

de donde se obtiene que: E ( uu ) = (n k ) 2 y de esta forma el estimador insesgado ser: 2 =


u u nk

Ejercicio 2: (15 puntos) El profesor O. Thero es un acadmico muy dedicado a sus labores, y ama la docencia; es por ello que durante el semestre recin pasado dict en cuatro universidades distintas el curso "Introduccin a la Microeconoma". Una de las grandes interrogantes para este docente se reere a cules seran los determinantes del xito de sus estudiantes. Es por ello que una vez concluido los cursos decidi ir en busca de la respuesta, y construy una base de datos que contiene la informacin para cada uno de sus 300 estudiantes. El modelo que l ha estimado es el siguiente: Ni = + Hi + Yi + Si + ui Donde Ni representa la nota nal obtenida por el alumno i, Hi corresponde a las horas promedio que el alumno dedicaba cada semana al estudio de dicha asignatura (de acuerdo a la informacin que recopil en una breve encuesta hecha al nal del curso), Yi es el ingreso per cpita de la familia y Si representa los aos de escolaridad (promedio simple1 ) de los padres. Los resultados de la estimacin se presentan en la siguiente tabla: Coeciente 2.48 0.187 9.9e(-07) -0.002 Error Estndar 0.074 0.005 1.32e(-07) 0.007 300 0 0.78 0.77 p-value 0 0 0 0.691

Constante Horas Ingreso Escolaridad de padres N F-Test (p-value) R2 R2 ajustado En base a esta informacin:

i) Calcule el test t de signicancia estadstica para cada uno de los parmetros estimados (Ayuda: utilice como valor crtico de tabla 1,96) (4 puntos) Respuesta: La prueba consiste en calcular el estadstico t asociado a cada uno de los coecientes estimados: t = t = 2, 48 = 33, 51 > 1, 96 signif icativo 0, 074 0, 187 = 37, 4 > 1, 96 signif icativo 0, 005 9, 9 = 7, 5 > 1, 96 signif icativo 1, 32

t = t =

0, 002 = | 0, 28| < 1, 96 no es signif icativo 0, 007

ii) Qu signica que el p-value del coeciente asociado a la escolaridad de los padres sea de 0,691? (2 puntos)
1S i

m Si +Si , 2

donde p=padre y m=madre

Respuesta: El p-value representa la probabilidad de que el valor crtico sea mayor que el t calculado, es decir, describe el nivel de signcancia asociado a un estadstico t particular. Por lo tanto, un p-value de 0,05 representa signicancia estadstica del coeciente estimado con un nivel de conanza del 95 %. Como en este caso el p-value es ostensiblemente mayor que dicho valor, entonces, se puede concluir que el coeciente asociado a la escolaridad de los padres, no es estadsticamente signicativo al 5 % (ni tampoco al 10 %). iii) Qu signica que el p-value del test F sea de 0? (2 puntos) Respuesta: El test F permite determinar la signifcancia estadstica conjunta del modelo (testea que todas los coecientes asociados a las pendientes son igual a cero). Si el p-value de dicho test es cero (0), entonces, se rechaza la hiptesis nula con un 99 % de conanza, es decir, el modelo es signifcativo en su conjunto. iv) Cul es la nota esperada para un alumno que dedicaba 10 horas a la semana al estudio de la asignatura, cuyo ingreso familiar per cpita es de $43.000 y que la escolaridad promedio de los padres es de 17 aos? (2 puntos) Respuesta: i = 2, 48 + 0, 187 (10) + 9, 9e(7) (43,000) 0, 002 (17) = 4, 3 N v) Por qu podra preferir usted jarse en el R2 ajustado ms que en el R2 ? (2 puntos) Respuesta: El R2 presenta muchas deciencias, dentro de las cuales cabe mencionar que es monotnonico en la incorporacin de regresores adicionales. Por el contrario el R2 ajustado penaliza la incorporacin de regresores por la prdida de grados de libertad en que se incurre. Por lo tanto, eventualmente, mientras que el R2 siempre aumenta con la incorporacin de una variable independiente adicional, el R2 ajustado podra disminuir. vi) Qu crticas podra usted hacerle a este modelo (mencione dos)? (4 puntos) Respuesta: (1) Es posible que las respuestas de los alumnos estn sesgadas a la hora de responder acerca de cuntas horas dedic en promedio a la semana a estudiar la asignatura. (2) Un determinante signicativo de las notas de las personas viene dado por su habilidad, la cual no es observable en este caso, y por ende, no se incorpora en el modelo. (3) La estimacin MCO no restringe a que la prediccin de la nota se encuentre en el rango uno siete. Por lo tanto, podra darse el caso que para alguna persona en particular, el modelo arroje una nota estimada que no pertenezca al rango admisible. vii) Si el modelo fuera estimado nuevamente pero utilizando como variable dependiente el logaritmo de la nota nal del curso (N = ln(N )), qu representaran los coecientes estimados? (2 puntos) Respuesta: En este caso, los coecientes estimados representaran semielasticidades.

Ejercicio 3: (15 puntos) Para estimar el modelo yi = xi + ui se propone el siguiente estimador: =


n i=1 2 2

xi yi n 2 i=1 xi

i) Pruebe que dicho estimador subestima el verdadero valor del parmetro. (8 puntos) ii) Pruebe que (7 puntos): ]2 = E [ 2
2 2 n i=1

x2 i

Respuesta: i) = = = ] = E [ Por lo tanto, el sesgo es: ] E [ ] E [ = 2 2 +


2 2 n 2 i=1 xi n 2 i=1 xi
2

n i=1 2 2

xi yi n 2 i=1 xi

n i=1 xi (xi + ui ) n 2 2 i=1 xi 2 + n i=1 x2 i + 2 2 n 2 + 2 i=1 xi 2 n 2 i=1 xi n 2 2 i=1 xi 2 +

n i=1

xi ui n 2 i=1 xi

n i=1

x2 i

] > 0 E [ ] > , subestima ya que en valor esperado es menos Si <0 E [ negativo que . ] < 0 E [ ] < , subestima ya que en valor esperado es menos Si >0 E [ positivo que . : ii) Primero obtengamos = 2 2 +
2 2 n 2 i=1 xi n 2 i=1 xi
2

n i=1 2 2

+
n i=1

xi ui n 2 i=1 xi xi ui n 2 i=1 xi

n i=1

x2 i

2 2

Ahora apliquemos elevamos al cuadrado la expresin anterior y aplicamos valor esperado: E ( ]2 E [ =


2 2 n i=1

xi ui ) 2 +

n i=1

xi ui +

n i=1

x2 i

]2 E [

2
2 2

n i=1

4 2 2 n 2 i=1 xi

x2 i +

]2 E [ ]2 E [

2
2 2

n i=1

+ 2

2 2 2 n 2 i=1 xi

x2 i +

2 2

n i=1

x2 i

Parte III (30 puntos) (Contestar slo en el espacio disponible)


Suponga que esta interesado en estimar la inversin realizada por una empresa, para lo cual dispone de 90 observaciones mensuales sobre: inversin en millones de pesos (inv ), tasa de inters (r), utilidades en millones de pesos (ut) y crecimiento del PIB proyectado para el prximo periodo (pib). Ud. debe estimar el siguiente modelo de regresin lineal: inv = 0 + 1 r + 2 ut + 3 pib + u donde las matrices (X X )1 y X Y vienen 5 3 3 6 (X X )1 = 2 2 0 4
2 y adems u = 0 ,5 y 90 i=1 (Yi

dadas por: 2 0 2 4 4 3 3 4

3 2 XY = 1 2

Y )2 = 80

(i) (5 puntos) Encuentre el estimador MCO de los parmetros de este modelo. = (X X )1 X Y , utilizando la informacin El estimador MCO del vector de parmetros disponible: 0 5 3 2 0 3 1 3 6 2 4 2 = = 2 2 4 3 1 2 3 0 4 3 4 2 11 7 = 12 3 1 , 2 y 3 . (ii) (6 puntos) Testee la signicancia estadstica de Para ver la signicancia individual de cada uno de los parmetros del modelo se utiliza el siguiente estadstico t: tc = i i ) V ar( asociado a la hipotesis i = 0 nula H0 : covarianzas 0 2 1,5 2

Para realizar los test primero necesitamos computar la matriz de varianzas y de los parmetros: 5 3 2 0 2,5 1,5 1 3 6 2 4 3 1 ] = = V ar[ 2 (X X )1 = 0,5 2 2 4 3 2 0 4 3 4

Para todas las hiptesis nulas se utiliza el mismo valor de tabla de la distribucin tstudent: tt = t86,95 % 1,99. 8

1 : Test de signicancia de 7 tc = = 4,04 3 1 sea igual a cero, con lo cual el parmetro resulta Se rechaza la hiptesis nula de que ser estadsticamente signicativo. 2 : Test de signicancia de 12 tc = = 8,46 2 2 sea igual a cero, con lo cual el parmetro resulta Se rechaza la hiptesis nula de que ser estadsticamente signicativo. 3 : Test de signicancia de 3 tc = = 2,12 2 3 sea igual a cero, con lo cual el parmetro resulta Se rechaza la hiptesis nula de que ser estadsticamente signicativo.

(iii) (3 puntos) Qu factor es ms importante en determinar el la inversin?. Como consultor, que recomendara? De la regresin se puede ver que la tasa de inters tiene un efecto negativo sobre la inversin, y que tanto las utilidades como el crecimiento esperado del PIB tienen un efecto positivo. De esta forma, se recomienda que en meses donde las utilidades han aumentado y se espera un mayor crecimiento del PIB, la inversin aumente. (iv) (6 puntos) Determine la Bondad de Ajuste del modelo, a travs del R2 y R .
2

R2

= =

1 1

u u Y M0 Y

n 2 i i=1 u n 2 i=1 (Yi Y )


n

=1 i De la informacin que se entrega sabemos que 2 = i86 = 0,5, por lo tanto i=1 u 2 i = 2 86 0,5 = 43. Adems se nos entrega la informacin de que (Yi Y ) = 80. Reemplazando:

u 2

R2 = 1
2

43 = 0,4625 80

Para obtener el R utilizamos la siguiente denicin y luego reemplazando los valores correspondientes: R R
2

u 2 i /(n k ) n 2 i=1 (Yi Y ) /(n 1) 0,5 89 43/86 =1 = 0,44375 = 1 80/89 80 = 1 9

n i=1

(v) (3puntos) Testee la hiptesis de que todos los coecientes a excepcin de la constante son cero. Bajo esta hiptesis nula el estadstico F calculado se puede escribir de la siguiente forma: Fc = R2 /(k 1) (1 R2 )/(n k )

Reemplazando por lo valores correspondientes: Fc = 0,154 0,4625/3 = = 24.6 0,5375/86 0,00625

El valor de tabla del estadstico F a un 5 % de signicancia y con 3 grados de libertad en el numerador y 86 en el denominador es aproximadamente 2.7, con lo cual se rechaza la hiptesis nula de que todos los parmetros del modelo a excepcin del de la constante sean igual a cero, es decir, el modelo es globalmente signicativo. (vi) (3 puntos) Construya un intervalo de conanza para 2 y 2 . El intervalo de conanza para 2 se construyen de la siguiente forma: i t0,975,86 Pr i ) < i < i + t0,975,86 V ar( i ) = 95 % V ar(

Intervalo de Conanza de 2 :

P r 12 1,99

2 < 2 < 12 + 1,99

2 = 95 %

P r [9,19 < 2 < 14,81] = 95 % Por otra parte, el intervalo de conanza para 2 se obtiene de la siguiente forma: Pr (n k ) 2 (n k ) 2 < 2 < 2 0,95,86 2 0,05,86 = 95 %

2 El valor de tabla de 2 0,95,86 65 (para la correccin se utiliz 43.8) y el de 0,05,86 107 (para la correccin se utiliz 18.5). Por lo tanto,

Pr

86 0,5 86 0,5 < 2 < = 95 % 43,8 18,5 P r 0,98 < 2 < 2,32 = 95 %

(vii) (4 puntos) Que nivel de inversin esperara Ud. para el ao 2006, si se espera que la tasa de inters sea un 4 %, las utilidades 10 millones de pesos y que el pib crecer en un 7 %. Del modelo estimado tenemos que el valor promedio de la inversin de la empresa depende de la siguiente forma de las variable explicativas: inv = 11 7 r + 12 ut + 3 pib Reemplazando r por 0.04, ut por 10 y pib por 0.07, se obtiene un valor predicho para la inversin del prximo ao es de 130.93 millones de pesos.

10

Verano 2005-2006

Econometra I
: :

Profesor Ayudante

Jaime Ruiz-Tagle V. Roberto Jaramillo M.

Prueba Solemne - Pauta de Correccin

Instrucciones
Ud. Dispone de 90 minutos para resolver este control. No puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio. Si contesta con lpiz mina no tiene derecho a reclamo.

Pregunta 1 (30 puntos)


Considere un modelo con una sola variable explicativa

Yi = 0 + 1 Xi + ui ,
donde

(1)

Yi

es el peso de una persona medido en gramos que se quiere explicar con la

variable explicativa

Xi

que es la altura medida en centmetros.

Usted sugiere que es ms intuitivo usar kilogramos y metros para las medidas, en cuyo caso el modelo a estimar sera

Yi = 0 + 1 Xi + vi ,
donde

(2)

Yi

es el peso de una persona medido en kilogramos y

Xi

es la altura medida

en metros. [Recuerde que 1kg = 1.000 gramos y que 1m = 100cm.]

(a) (5 puntos) Son los modelos equivalentes? Explique intituivamente.


Los modelos son equivalentes porque la relacin entre peso y altura no tiene por qu verse alterada de acuerdo a las unidades de medida. Ciertamente los parmetros sern distintos, pero reejarn exactamente la misma relacin entre las variables. Simplemente se trata de un modelo con variables reescaladas.

(b) (10 puntos) A partir de la estimacin por MCO en (1) y (2), derive una expresin para la relacin existente entre los los estimadores

y entre

1 .

Sabemos que la estimacin por MCO arroja

1 =
donde

xi yi x2 i

yi

xi

son las variables en desviaciones con respecto a la media. Adems,

0 + 1 X i = i Y
Dado que

yi =

yi ; 1,000

x i =

xi , el modelo alternativo implica estimadores MCO 100 x i yi 2 = x i 1 1,000100 1 100100

1 =
y

xi yi x2 i

1 1 10

= . Y 0 + 1 X i i

De donde se obtiene

0 = Y 1 X i i 1 1 X = Y i i 10 1 1 1 = 1 Xi Yi 1,000 10 100 1 1 X i i Y = 1,000 1 0 . 0 = 1,000

(c) (5 puntos) Cul modelo explica mejor el peso de una persona? Explique intituivamente.
Dado que los modelos son equivalentes y que los parmetros son tienen una relacin proporcional, ambos modelos explican de igual forma el peso de una persona. La nica diferencia es la unidad de medida, pero el la capacidad del modelo para esplicar es la misma porque se esta ocupando exactamente la misma informacin.

(d) (10 puntos) Derive una expresin para la relacin entre el coeciente de bondad del ajuste R2 del modelo en (1) y para el coeciente R2 en el modelo (2).
Sabemos que

R2 =

ESS T SS

=1

RSS , donde T SS

RSS =

u 2 i

T SS =

)2 . (Yi Y

Dadas las relaciones de las variables,

T SS =

)2 = (Yi Y

1 1,0002

1 1,0002

)2 = (Yi Y

T SS . RSS =
2 u i .
Pero

Por otro lado,

u i = Yi Yi =

Yi ( 0 + 1 Xi ) 1,000 1 1 1 Yi 0 + = 1 Xi 1,000 1,000 10 100 1 Yi 0 + 1 Xi = 1,000 1,000 i Yi Y = 1,000 1,000 u i = . 1,000 u 2 i. =1


1 RSS 1,0002 1 T SS 1,0002

Por lo tanto,

RSS =

1 1,0002 RSS T SS

Finalmente,

R2 = 1

=1

RSS T SS

= R2 .

Pregunta 2 (30 puntos)


Se tiene el siguiente modelo con 2 variables explicativas:

Yi = 1 + 2 X2i + 3 X3i + ui ,

(3)

(a) (5 puntos) Explique cmo testeara la hiptesis que los parmetros de las variables explicativas son iguales entre s. Plantee el problema matricialmente.
Se busca testear la hiptesis en forma matricial

H0 :
donde

q k k 1

R = r

q 1

corresponde al nmero de restricciones. Dado que slo hay una restriccin

dado que

H0 : 2 = 3 H0 : 2 3 = 0,
R

la forma matricial es

H0 :

0 1 1

1 2 = 3

0 .

(b) (5 puntos) Explique cmo testeara la hiptesis conjunta que el parmetro de la variable X2 es igual a 5 y que el parmetro de la variable X3 es no signicativo. Plantee el problema matricialmente.
Se busca testear la hiptesis en forma matricial donde

corresponde al nmero

de restricciones, en este caso 2. La hiptesis nula est dad por

H0 : 2 = 5 3 = 0
O equivalentente en forma matricial

H0 :
De donde se obtiene que

2 3

5 0

H0 :

0 1 0 0 0 1

1 2 = 3

5 . 0

2 R(X X )1 R , donde R es la matriz (c) (5 puntos) Muestre que la varianza de R es u que se utiliza para testear hiptesis lineales conjuntas.
Sabemos que, si se cumplen los supuestos del modelo, el estimador de MCO es insesgado con varianza forma

] = R , E [R

) = 2 (X X )1 . V ar(

Por lo tanto,

] = E [

y de esta

y la varianza ser:

) = E [(R R )(R R ) ] V ar(R )( ) R ] = E [R( )( ) ]R = RE [(


) V ar (

= R (X X )1 R = 2 R(X X )1 R .

(d) (10 puntos) Derive una expresin algebraica para el estadgrafo F explicitando cada uno de sus pasos. 4

Dado que los errores se distribuyen u N (0, 2 I ) por los supuestos del modelo, el N (, 2 (X X )1 ), y nalmente estimador de MCO se distribuye se distribuye 2 1 N (R, R(X X ) R ). Estandarizando la distribucin, se tiene que R
R R 2 R(X X )1 R N (0, 1),

y bajo la hiptesis nula (si es que sta se cumple)


r R 2 R(X X )1 R N (0, 1).

Tomando la forma cuadrtica de la expresin anterior y aplicando la propiedad de que una normal estndar al cuadrado se distribuye como una chi-cuadrado con 1 grado de libertad y que la suma de q chi-cuadrados se distrbuye chi-cuadrado con q grados de libertad, se obtiene
r) [ 2 R(X X )1 R ]1 (R r ) 2 . (R q
u Por otro lado, se puede demostrar que u 2 nk . Por lo tanto utilizando la 2 propiedad de que una distribucin F es una divisin de dos chi-cuadrado dividas por sus respectivos grados de libertad, se puede obtener r ) [ 2 R(X X )1 R ]1 (R r ) (R q u u 2 (nk)

Fq,nk ,

lo que se simplica a
r) [R(X X )1 R ]1 (R r) (R q u u nk

Fq,nk .

u u Dado que n corresponde al estimador insesgado de la varianza de los errores k 2 , el estadgrafo F nalmente se calcula como

r) R[ r) (R 2 (X X )1 R ]1 (R Fq,nk . q

(e) (5 puntos) Suponga que el estadgrafo F de la hiptesis en (b) es igual a 3.13. Si la estimacin se hizo con 20 observaciones, rechazara la hiptesis nula? De qu tamao tendra que haber sido la muestra para que, con el estadgrafo que se calcul, se hubiese rechazado la hiptesis nula con un 95 % de conanza. [Recuerde que la distribucin F se escribe como Fd1 ,d2 , donde d1 y d2 son los grados 5

de libertad correspondientes.]
Dado que el nmero de restricciones es q = 2 y que n k = 17, los valores cticos correspondientes en las tablas de la distribucin F son: F2,17 ( = 10 %) = 2,64, F2,17 ( = 5 %) = 3,59, F2,17 ( = 1 %) = 6,11. Por lo tanto, la hiptesis nula se rechaza al 90 % de signicancia y no se puede rechazar al 95 % o ms de conanza, porque slo al 90 % el estadgrafo calculado es mayor al valor crtico de tabla. Los valores crticos de tabla cercanos a 3.13 con un 95 % de conanza son F2,60 ( = 5 %) = 3,15 y F2,120 ( = 5 %) = 3,07. Por lo tanto, con una muestra de tamao n >= 123 se garantiza que el test se hubiera aceptado porque el estadgrafo calculado habra sido mayor al valor crtico de tabla.

Pregunta 3 (30 puntos)

(a) (10 puntos) Explique por qu en la prediccin puntual existen dos fuentes de error.
En la prediccin puntual se pretende predecir un valor en particular de la variable dependiente con el modelo estimado. Entonces, el error de prediccin puntual se puede escribir como
i = Xi + ui Xi e i = Yi Y ) + ui , = Xi ( ) corresponde al error de estimacin de los parmetros y ui cordonde ( responde al error aleatorio. Al querer predecir un valor en particular tendremos 2 fuentes de error; una proveniente de la estimacin de los parmetros (es una estimacin que siempre contiene algn grado de error) y otra proveniente de la naturaleza estocstica del modelo, donde aunque el modelo sea perfecto siempre habr un componente aleatorio que genere error.

(b) (10 puntos) Utilizando la matriz de desvos M 0, derive la expresin matricial para el coeciente R2. Recuerde que para ello debe hacer una descomposicin de la varianza total de la variable a explicar entre la parte explicada de la varianza y la parte residual.
Primero expresamos el modelo general (asumiento que se usa una constante) en desvos con respecto a la media, para lo cual premultiplicamos por la matriz M 0

y descomponemos la matriz X = [X X ] con X


1 2

=i

, es decir, la constante:

M 0Y

= = = =

M 0 X + M 0 u + M 0u M 0X 0 M X1 1 + M 0 X2 2 + M 0 u 0 0 0 M i1 + M X2 2 + M u
=0 0

M 0Y

= M X2 2 + M 0 u 0 = M X2 2 + u .

Luego premultiplicamos por Y para obtener la expresin de la suma total de los cuadrados (TSS):
2 + u ) T SS = Y M 0 Y = Y (M 0 X2 0 2 + u T SS = (X + u ) (M X2 ) 0 2 + u Xu 2 + X M X2 u M 0 X2 +u =
ESS =0 =0 RSS

T SS = ESS + RSS,

donde ESS es la parte explicada de la varianza total y RSS es la parte residual (los trminos que sea hacen iguales a cero lo hacen porque las variables explicativas son ortogonales a los residuos por construccin del modelo de MCO). Finalmente, para construir el coeciente de R se determina qu parte de la varianza total es explicada por el modelo, es decir,
2

1=

ESS RSS + T SS T SS ESS RSS R2 = =1 . T SS T SS

(c) (10 puntos) Derive una expresin para el

ros estimados por MCO. Explicite los supuestos que utilice.

estimador de la varianza de los parmet-

Sabemos que el estimador de MCO es insesgado (bajo los supuestos del modelo) y es igual a
= (X X )1 X Y = (X X )1 X (X + u) = + (X X )1 X u).

Por lo tanto, la varianza es

) = E [( E [ ])( E [ ]) ] = V ar( = = = ) = V ar(

E [((X X )1 X u)((X X )1 X u) ] E [(X X )1 X uu X (X X )1 ] (X X )1 X E [uu ]X (X X )1 2 (X X )1 X u IX (X X )1 2 (X X )1 . u

Esto es porque se asume que los errores son homocedsticos y que no existe autocorrelacin.

F Values for = 0.10 d1 d2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 inf 1 39.86 8.53 5.54 4.54 4.06 3.78 3.59 3.46 3.36 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01 2.99 2.97 2.96 2.95 2.94 2.93 2.92 2.91 2.90 2.89 2.89 2.88 2.84 2.79 2.75 2.71 2 49.5 9.00 5.46 4.32 3.78 3.46 3.26 3.11 3.01 2.92 2.86 2.81 2.76 2.73 2.70 2.67 2.64 2.62 2.61 2.59 2.57 2.56 2.55 2.54 2.53 2.52 2.51 2.50 2.50 2.49 2.44 2.39 2.35 2.30 3 53.59 9.16 5.39 4.19 3.62 3.29 3.07 2.92 2.81 2.73 2.66 2.61 2.56 2.52 2.49 2.46 2.44 2.42 2.40 2.38 2.36 2.35 2.34 2.33 2.32 2.31 2.30 2.29 2.28 2.28 2.23 2.18 2.13 2.08 4 55.83 9.24 5.34 4.11 3.52 3.18 2.96 2.81 2.69 2.61 2.54 2.48 2.43 2.39 2.36 2.33 2.31 2.29 2.27 2.25 2.23 2.22 2.21 2.19 2.18 2.17 2.17 2.16 2.15 2.14 2.09 2.04 1.99 1.94 919 5 57.24 9.29 5.31 4.05 3.45 3.11 2.88 2.73 2.61 2.52 2.45 2.39 2.35 2.31 2.27 2.24 2.22 2.20 2.18 2.16 2.14 2.13 2.11 2.10 2.09 2.08 2.07 2.06 2.06 2.05 2.00 1.95 1.90 1.85 6 58.2 9.33 5.28 4.01 3.40 3.05 2.83 2.67 2.55 2.46 2.39 2.33 2.28 2.24 2.21 2.18 2.15 2.13 2.11 2.09 2.08 2.06 2.05 2.04 2.02 2.01 2.00 2.00 1.99 1.98 1.93 1.87 1.82 1.77 7 58.91 9.35 5.27 3.98 3.37 3.01 2.78 2.62 2.51 2.41 2.34 2.28 2.23 2.19 2.16 2.13 2.10 2.08 2.06 2.04 2.02 2.01 1.99 1.98 1.97 1.96 1.95 1.94 1.93 1.93 1.87 1.82 1.77 1.72 8 59.44 9.37 5.25 3.95 3.34 2.98 2.75 2.59 2.47 2.38 2.3 2.24 2.20 2.15 2.12 2.09 2.06 2.04 2.02 2.00 1.98 1.97 1.95 1.94 1.93 1.92 1.91 1.90 1.89 1.88 1.83 1.77 1.72 1.67 9 59.86 9.38 5.24 3.94 3.32 2.96 2.72 2.56 2.44 2.35 2.27 2.21 2.16 2.12 2.09 2.06 2.03 2.00 1.98 1.96 1.95 1.93 1.92 1.91 1.89 1.88 1.87 1.87 1.86 1.85 1.79 1.74 1.68 1.63 d2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 inf 10 60.19 9.39 5.23 3.92 3.30 2.94 2.70 2.54 2.42 2.32 2.25 2.19 2.40 2.10 2.06 2.03 2.00 1.98 1.96 1.94 1.92 1.90 1.89 1.88 1.87 1.86 1.85 1.84 1.83 1.82 1.76 1.71 1.65 1.60 12 60.71 9.41 5.22 3.90 3.27 2.90 2.67 2.50 2.38 2.28 2.21 2.15 2.10 2.05 2.02 1.99 1.96 1.93 1.91 1.89 1.87 1.86 1.84 1.83 1.82 1.81 1.80 1.79 1.78 1.77 1.71 1.66 1.60 1.55 15 61.22 9.42 5.20 3.87 3.24 2.87 2.63 2.46 2.34 2.24 2.17 2.10 2.05 2.01 1.97 1.94 1.91 1.89 1.86 1.84 1.83 1.81 1.80 1.78 1.77 1.76 1.75 1.74 1.73 1.72 1.66 1.60 1.55 1.49

F Value for = 0.10 d1 24 62 9.45 5.18 3.83 3.19 2.82 2.58 2.40 2.28 2.18 2.10 2.04 1.98 1.94 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.73 1.72 1.70 1.69 1.80 1.67 1.66 1.65 1.64 1.57 1.51 1.45 1.38

20 61.74 9.44 5.18 3.84 3.21 2.84 2.59 2.42 2.30 2.20 2.12 2.06 2.01 1.96 1.92 1.89 1.86 1.84 1.81 1.79 1.78 1.76 1.74 1.73 1.72 1.71 1.70 1.69 1.68 1.67 1.61 1.54 1.48 1.42 920

30 62.26 9.46 5.17 3.82 3.17 2.80 2.56 2.38 2.25 2.16 2.08 2.01 1.96 1.91 1.87 1.84 1.81 1.78 1.76 1.74 1.72 1.70 1.69 1.67 1.66 1.65 1.64 1.63 1.62 1.61 1.54 1.48 1.41 1.34

40 62.53 9.47 5.16 3.80 3.16 2.78 2.54 2.36 2.23 2.13 2.05 1.99 1.93 1.89 1.85 1.81 1.78 1.75 1.73 1.71 1.69 1.67 1.66 1.64 1.63 1.61 1.60 1.59 1.58 1.57 1.51 1.44 1.37 1.30

60 62.79 9.47 5.15 3.79 3.14 2.76 2.51 2.34 2.21 2.11 2.03 1.96 1.90 1.86 1.82 1.78 1.75 1.72 1.70 1.68 1.66 1.64 1.62 1.61 1.59 1.58 1.57 1.56 1.55 1.54 1.47 1.40 1.32 1.24

120 63.06 9.48 5.14 3.78 3.12 2.74 2.49 2.32 2.18 2.08 2.00 1.93 1.88 1.83 1.79 1.75 1.72 1.69 1.67 1.64 1.62 1.60 1.59 1.57 1.56 1.54 1.53 1.52 1.51 1.50 1.42 1.35 1.26 1.17

inf 63.33 9.49 5.13 3.76 3.10 2.72 2.47 2.29 2.16 2.06 1.97 1.90 1.85 1.80 1.76 1.72 1.69 1.66 1.63 1.61 1.59 1.57 1.55 1.53 1.52 1.50 1.49 1.48 1.47 1.46 1.38 1.29 1.19 1.00

F Values for = 0.05 d1 d2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 inf 1 161.4 18.51 10.13 7.71 6.61 5.99 5.59 5.32 5.12 4.96 4.84 4.75 4.67 4.60 4.54 4.49 4.45 4.41 4.38 4.35 4.32 4.30 4.28 4.26 4.24 4.23 4.21 4.20 4.18 4.17 4.08 4.00 3.92 3.84 2 199.5 19.00 9.55 6.94 5.79 5.14 4.74 4.46 4.26 4.10 3.98 3.89 3.81 3.74 3.68 3.63 3.59 3.55 3.52 3.49 3.47 3.44 3.42 3.40 3.39 3.37 3.35 3.34 3.33 3.32 3.23 3.15 3.07 3.00 3 215.7 19.16 9.28 6.59 5.41 4.76 4.35 4.07 3.86 3.71 3.59 3.49 3.41 3.34 3.29 3.24 3.20 3.16 3.13 3.10 3.07 3.05 3.03 3.01 2.99 2.98 2.96 2.95 2.93 2.92 2.84 2.76 2.68 2.60 4 224.6 19.25 9.12 6.39 5.19 4.53 4.12 3.84 3.63 3.48 3.36 3.26 3.18 3.11 3.06 3.01 2.96 2.93 2.90 2.87 2.84 2.82 2.80 2.78 2.76 2.74 2.73 2.71 2.70 2.69 2.61 2.53 2.45 2.37 921 5 230.2 19.3 9.01 6.26 5.05 4.39 3.97 3.69 3.48 3.33 3.20 3.11 3.03 2.96 2.90 2.85 2.81 2.77 2.74 2.71 2.68 2.66 2.64 2.62 2.60 2.59 2.57 2.56 2.55 2.53 2.45 2.37 2.29 2.21 6 234.0 19.33 8.94 6.16 4.95 4.28 3.87 3.58 3.37 3.22 3.09 3.00 2.92 2.85 2.79 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.53 2.51 2.49 2.47 2.46 2.45 2.43 2.42 2.34 2.25 2.17 2.10 7 236.8 19.35 8.89 6.09 4.88 4.21 3.79 3.50 3.29 3.14 3.01 2.91 2.83 2.76 2.71 2.66 2.61 2.58 2.54 2.51 2.49 2.46 2.44 2.42 2.40 2.39 2.37 2.36 2.35 2.33 2.25 2.17 2.09 2.01 8 238.9 19.37 8.85 6.04 4.82 4.15 3.73 3.44 3.23 3.07 2.95 2.85 2.77 2.70 2.64 2.59 2.55 2.51 2.48 2.45 2.42 2.40 2.37 2.36 2.34 2.32 2.31 2.29 2.28 2.27 2.18 2.10 2.02 1.94 9 240.5 19.38 8.81 6.00 4.77 4.10 3.68 3.39 3.18 3.02 2.90 2.80 2.71 2.65 2.59 2.54 2.49 2.46 2.42 2.39 2.37 2.34 2.32 2.30 2.28 2.27 2.25 2.24 2.22 2.21 2.12 2.04 1.96 1.88 d2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 inf 10 241.9 19.4 8.79 5.96 4.74 4.06 3.64 3.35 3.14 2.98 2.85 2.75 2.67 2.60 2.54 2.49 2.45 2.41 2.38 2.35 2.32 2.30 2.27 2.25 2.24 2.22 2.20 2.19 2.18 2.16 2.08 1.99 1.91 1.83 12 243.9 19.41 8.74 5.91 4.68 4.00 3.57 3.28 3.07 2.91 2.79 2.69 2.60 2.53 2.48 2.42 2.38 2.34 2.31 2.28 2.25 2.23 2.20 2.18 2.16 2.15 2.13 2.12 2.10 2.09 2.00 1.92 1.83 1.75 15 245.9 19.43 8.70 5.86 4.62 3.94 3.51 3.22 3.01 2.85 2.72 2.62 2.53 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.18 2.15 2.13 2.11 2.09 2.07 2.06 2.04 2.03 2.01 1.92 1.84 1.75 1.67

F Values for = 0.05 d1 24 249.1 19.45 8.64 5.77 4.53 3.84 3.41 3.12 2.90 2.74 2.61 2.51 2.42 2.35 2.29 2.24 2.19 2.15 2.11 2.08 2.05 2.03 2.01 1.98 1.96 1.95 1.93 1.91 1.90 1.89 1.79 1.70 1.10 1.52

20 248.0 19.45 8.66 5.80 4.56 3.87 3.44 3.15 2.94 2.77 2.65 2.54 2.46 2.39 2.33 2.28 2.23 2.19 2.16 2.12 2.10 2.07 2.05 2.03 2.01 1.99 1.97 1.96 1.94 1.93 1.84 1.75 1.66 1.57 922

30 250.1 19.46 8.62 5.75 4.50 3.81 3.38 3.08 2.86 2.70 2.57 2.47 2.38 2.31 2.25 2.19 2.15 2.11 2.07 2.04 2.01 1.98 1.96 1.94 1.92 1.90 1.88 1.87 1.85 1.84 1.74 1.65 1.55 1.46

40 251.1 19.47 8.59 5.72 4.46 3.77 3.34 3.04 2.83 2.66 2.53 2.43 2.34 2.27 2.20 2.15 2.10 2.06 2.03 1.99 1.96 1.94 1.91 1.89 1.87 1.85 1.84 1.82 1.81 1.79 1.69 1.59 1.50 1.39

60 252.2 19.48 8.57 5.69 4.43 3.74 3.30 3.01 2.79 2.62 2.49 2.38 2.30 2.22 2.16 2.11 2.06 2.02 1.98 1.95 1.92 1.89 1.86 1.84 1.82 1.80 1.79 1.77 1.75 1.74 1.64 1.53 1.43 1.32

120 253.3 19.49 8.55 5.66 4.40 3.70 3.27 2.97 2.75 2.58 2.45 2.34 2.25 2.18 2.11 2.06 2.01 1.97 1.93 1.90 1.87 1.84 1.81 1.79 1.77 1.75 1.73 1.71 1.70 1.68 1.58 1.47 1.35 1.22

inf 254.3 19.5 8.53 5.63 4.36 3.67 3.23 2.93 2.71 2.54 2.40 2.30 2.21 2.13 2.07 2.01 1.96 1.92 1.88 1.84 1.81 1.78 1.76 1.73 1.71 1.69 1.67 1.65 1.64 1.62 1.51 1.39 1.25 1.00

F Values for = 0.01 d1 d2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 inf 1 4052 98.50 34.12 21.20 16.26 13.75 12.25 11.26 10.56 10.04 9.65 9.33 9.07 8.86 8.68 8.53 8.40 8.29 8.18 8.10 8.02 7.95 7.88 7.82 7.77 7.72 7.68 7.64 7.60 7.56 7.31 7.08 6.85 6.63 2 4999.5 99.00 30.82 18.00 13.27 10.92 9.55 8.65 8.02 7.56 7.21 6.93 6.70 6.51 6.36 6.23 6.11 6.01 5.93 5.85 5.78 5.72 5.66 5.61 5.57 5.53 5.49 5.45 5.42 5.39 5.18 4.98 4.79 4.61 3 5403 99.17 29.46 16.69 12.06 9.78 8.45 7.59 6.99 6.55 6.22 5.95 5.74 5.56 5.42 5.29 5.18 5.09 5.01 4.94 4.87 4.82 4.76 4.72 4.68 4.64 4.60 4.57 4.54 4.51 4.31 4.13 3.95 3.78 4 5625 99.25 28.71 15.98 11.39 9.15 7.85 7.01 6.42 5.99 5.67 5.41 5.21 5.04 4.89 4.77 4.67 4.58 4.50 4.43 4.37 4.31 4.26 4.22 4.18 4.14 4.11 4.07 4.04 4.02 3.83 3.65 3.48 3.32 923 5 5764 99.30 28.24 15.52 10.97 8.75 7.46 6.63 6.06 5.64 5.32 5.06 4.86 4.69 4.56 4.44 4.34 4.25 4.17 4.10 4.04 3.99 3.94 3.90 3.85 3.82 3.78 3.75 3.73 3.70 3.51 3.34 3.17 3.02 6 5859 99.33 27.91 15.21 10.67 8.47 7.19 6.37 5.80 5.39 5.07 4.82 4.62 4.46 4.32 4.20 4.10 4.01 3.94 3.87 3.81 3.76 3.71 3.67 3.63 3.59 3.56 3.53 3.50 3.47 3.29 3.12 2.96 2.80 7 5928 99.36 27.67 14.98 10.46 8.26 6.99 6.18 5.61 5.2 4.89 4.64 4.44 4.28 4.14 4.03 3.93 3.84 3.77 3.70 3.64 3.59 3.54 3.50 3.46 3.42 3.39 3.36 3.33 3.30 3.12 2.95 2.79 2.64 8 5982 99.37 27.49 14.80 10.29 8.10 6.84 6.03 5.47 5.06 4.74 4.50 4.30 4.14 4.00 3.89 3.79 3.71 3.63 3.56 3.51 3.45 3.41 3.36 3.32 3.29 3.26 3.23 3.20 3.17 2.99 2.82 2.66 2.51 9 6022 99.39 27.35 14.66 10.16 7.98 6.72 5.91 5.35 4.94 4.63 4.39 4.14 4.03 3.89 3.78 3.68 3.60 3.52 3.46 3.40 3.35 3.30 3.26 3.22 3.18 3.15 3.12 3.09 3.07 2.89 2.72 2.56 2.41 d2 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 60 120 inf 10 6056 99.40 27.23 14.55 10.05 7.87 6.62 5.81 5.26 4.85 4.54 4.30 4.10 3.94 3.80 3.69 3.59 3.51 3.43 3.37 3.31 3.26 3.21 3.17 3.13 3.09 3.06 3.03 3.00 2.98 2.80 2.63 2.47 2.32 12 6106 99.42 27.05 14.37 9.89 7.72 6.47 5.67 5.11 4.71 4.40 4.16 3.96 3.80 3.67 3.55 3.46 3.37 3.30 3.23 3.17 3.12 3.07 3.03 2.99 2.96 2.93 2.90 2.87 2.84 2.66 2.50 2.34 2.18 15 6157 99.43 26.87 14.20 9.72 7.56 6.31 5.52 4.96 4.56 4.25 4.01 3.82 3.66 3.52 3.41 3.31 3.23 3.15 3.09 3.03 2.98 2.93 2.89 2.85 2.81 2.78 2.75 2.73 2.70 2.52 2.35 2.19 2.04

F Values for = 0.01 d1 24 6235 99.46 26.60 13.93 9.47 7.31 6.07 5.28 4.73 4.33 4.02 3.78 3.59 3.43 3.29 3.18 3.08 3.00 2.92 2.86 2.80 2.75 2.70 2.66 2.62 2.58 2.55 2.52 2.49 2.47 2.29 2.12 1.95 1.79

20 6209 99.45 26.69 14.02 9.55 7.40 6.16 5.36 4.81 4.41 4.10 3.86 3.66 3.51 3.37 3.26 3.16 3.08 3.00 2.94 2.88 2.83 2.78 2.74 2.70 2.66 2.63 2.60 2.57 2.55 2.37 2.20 2.03 1.88 924

30 6261 99.47 26.50 13.84 9.38 7.23 5.99 5.20 4.65 4.25 3.94 3.70 3.51 3.35 3.21 3.10 3.00 2.92 2.84 2.78 2.72 2.67 2.62 2.58 2.54 2.50 2.47 2.44 2.41 2.39 2.20 2.03 1.86 1.70

40 6287 99.47 26.41 13.75 9.29 7.14 5.91 5.12 4.57 4.17 3.86 3.62 3.43 3.27 3.13 3.02 2.92 2.84 2.76 2.69 2.64 2.58 2.54 2.49 2.45 2.42 2.38 2.35 2.33 2.30 2.11 1.94 1.76 1.59

60 6313 99.48 26.32 13.65 9.20 7.06 5.82 5.03 4.48 4.08 3.78 3.54 3.34 3.18 3.05 2.93 2.83 2.75 2.67 2.61 2.55 2.50 2.45 2.40 2.36 2.33 2.29 2.26 2.23 2.21 2.02 1.84 1.66 1.47

120 6339 99.49 26.22 13.56 9.11 6.97 5.74 4.95 4.40 4.00 3.69 3.45 3.25 3.09 2.96 2.84 2.75 2.66 2.58 2.52 2.46 2.40 2.35 2.31 2.27 2.23 2.20 2.17 2.14 2.11 1.92 1.73 1.53 1.32

inf 6366 99.50 26.13 13.46 9.02 6.88 5.65 4.86 4.31 3.91 3.60 3.36 3.17 3.00 2.87 2.75 2.65 2.57 2.49 2.42 2.36 2.31 2.26 2.21 2.17 2.13 2.10 2.06 2.03 2.01 1.80 1.60 1.38 1.00

Econometra I Profesoras: Claudia Sanhueza Javiera Vsquez. Otoo 2006 Pauta Solemne Comentes: (30 puntos) 1. En un modelo de regresin lineal simple 0 = 3, 0 y 1 = 2, 0, a ) la media de Y es 3,0 + 2,0 = 5,0. b ) se espera que Y aumente en 2,0 si X aumenta en 1 unidad. c ) los supuestos de mnimos cuadrados se cumplen. d ) el valor de 0 no importa. R: La media de Y se describe como 0 + 1 x, luego depender del valor de X cual sea la media de Y . Respecto a que se cumplan los supuestos de MCO, es necesario tener mas informacin, y la armacin de que el valor de 0 carece de cualquier fundamento. Por ultimo la armacin verdadera es el hecho de que dado que 1 = 2, 0, es la pendiente en este modelo, representa el cambio marginal de una unidad adicional de X , por lo tanto se espera que Y aumente en dos unidades por cada unidad adicional de X . 2. En el modelo de regresin lineal Y = X + u, el estimador MCO alcanza la cota inferior de Cramer-Rao. R: Falso. Bajo el supuesto de normalidad del trmino de error, se tiene que el estimador MCO y MV de son equivalentes, pero no as el estimador de la varianza del error 2 . Entonces bajo el supuesto de normalidad tenemos que el estimador MCO de alcanza la cota inferior de Cramer-Rao, pero no as el estimador de 2 . 3. En un modelo de regresin simple Y = + X + u, si la correlacin entre Y y X es positiva, el parmetro estimado de tambin ser positivo. R: Verdadero. En un modelo de regresin lineal simple es posible escribir el parmetro de la siguiente forma: V ar(Y ) Cov (Y, X ) = = x,y V ar(X ) V ar(X ) por tanto como el ratio entre las races de las varianzas de X e Y es siempre positivo, el signo del parmetro esta directamente determinado por el signo de la correlacin. 4. Cuando hay un problema de variable omitida, a ) el supuesto que E (ui |Xi ) = 0 es violado. b ) el supuesto que (Xi , Yi ) son iid es violado. c ) el supuesto que (Xi , ui ) tiene cuarto momento nito es violado. d ) hay perfecta multicolinealidad. 1

R: El problema de variable omitida (se dice solo variable omitida y no variable omitida relevante porque si dicha variable no fuera relevante no sera omitida) implica que el error de la regresin del modelo incorrecto esta capturando la informacin acerca de la variable omitida, por tanto si la variable omitida es correlacionada con alguna de las variables incluidas luego E (ui |Xi ) = 0. El resto de las armaciones no son implicancias derivadas del problema de variable omitida. 5. Si no hay sucientes variables explicativas en la regresin entonces los parmetros estimados estarn sesgados. R: El hecho de que el numero de regresores afecte el sesgo de un parmetro estimado es falso, sin embargo si se excluyen variables relevantes, y ocurre que ellas estn correlacionadas con las incluidas, esto producir un sesgo, pero una cantidad reducida de variables explicativas, a priori, no tiene implicarais en el sesgo de un estimador. 6. Es equivalente realizar un Test F de signicancia global del modelo y realizar varios test de signicancia individual de todos los parmetros. R: Falso, aunque realicemos todos los test de signicancia individual para las pendientes del modelo este resultado no va a ser equivalente al test de signicancia global, ya que este ltimo considera la correlacin entre las variables explicativas. Puede existir un caso extremo que las variables tengan una correlacin muy alta y esta varianza conjunta explique el comportamiento de la variable independiente, aunque cada una por separado no es capaz de explicar el comportamiento de Y .

Demostraciones (30 puntos) 1. (15 puntos) En un modelo de regresin lineal con dos regresores yi =0 + 1 X1i + 2 X2i + ui . Demuestre que si los errores son homosedsticos y n es grande entonces la varianza del estimador de 1 se puede escribir como:
2 =
1

2 1 u 1 2 n 1 2 X X1 X2 1

donde 2 X1 X2 es el coeciente de correlacin poblacional entre los regresores X1 y X2 , y 2 X es la varianza poblacional de X1 1 Respuesta: Primero expresamos el modelo en desviaciones con respecto a la media: 1 (X1i X 2 (X2i X = 1) + 2 ) + ( Yi Y ui u ) Como u = 0 entonces queda: 1 X1i + 2 X2i + u Yi = i Donde representa que la variable esta en desviaciones con respecto a su media. La matriz X y la X X quedan: X11 . X= . . X1n X21 . . . , X X = X 2n
2 X1 i X2i X1i

X1i X2i 2 X2 i

2 para obtener la matriz de varianzas y Ahora invertimos X X y la multiplicamos por u covarianzas de 2 u 2 X1 i 2 X2 i 2 X2 i X2i X1i

2 u (X X )1 =

X1i X2i

)2

X1i X2i 2 X1 i

1 : De la cual podemos obtener una expresin para la varianza de 1 ) = V (


2 u 2 X1 i 2 X2 i

2 ( X2 i

X1i X2i )2

Ahora, sabemos que la correlacin entre 2 variables esta denida como: X1 ,X2 = Cov (X1i , X2i ) V (X1i )V (X2i ) = X1i X2i
2 X1 i 2 X2 i

Ahora obtenemos 2 X1 ,X2 y luego lo reemplazamos en la expresin para V (1 ) 2 X1 ,X2 = 3 ( X1i X2i )2
2 X1 i 2 X2 i

1 ) = V (

2 u 2 X1 i

2 X2 i 2 X1 i 2 X2 i

2 2 X2 i X1 ,X2

2 u 2 X1 i

2 X2 i

2 (1 2 X2 i X1 ,X2 )

Luego simplicando la expresin, y reemplazando la varianza poblacional de X1 1 ) = V (


2 u 2 (1 2 X1 i X1 ,X2 )

1 2 1 2u 2 n 1 X1 ,X2 X1

2. (15 puntos) Demuestre que la varianza del error de una prediccin individual, en un modelo de regresin lineal simple, se puede expresar de la siguiente forma: 0 ) = 2 1 + V AR(Y0 Y 1 (X0 X )2 + n xi

R: Si se desea predecir el valor individual de Y correspondiente a X = X0 , es decir, se quiere obtener: Y0 = 1 + 2 X0 + u0 Se predice de la siguiente forma: 1 + 2 X0 0 = Y 0 es: El error de prediccin Y0 Y 0 Y0 Y 1 + 2 X0 ) 1 + 2 X0 + u0 ( 1 ) + (2 2 )X0 + u0 = (1 = (1) (2)

Por consiguiente, 0 ] = E [Y0 Y = 1 ) + E (2 2 )X0 + E (u0 ) E (1 0

1 y 2 son insesgados, X0 es un nmero jo y E (u0 ) es cero pos los supuestos tpicos. porque Elevando (2) al cuadrado y tomando valor esperado se obtiene: 0 ] = V [Y0 Y Adems tenemos que: 1 ) = V ( 2 ) = V ( 1 , 2 ) = Cov ( Reemplazando (4), (5) y (6) en (3): 0 ] = V [Y0 Y 0 ] = V [Y0 Y
2 Xi 2 2 2 + X0 + 2X0 X 2 n xi x2 i 2 Xi 2 n x2 i 2 x2 i 2 X x2 i

1 ) + V ( 2 )X 2 + 2X0 cov ( 1 , 2 ) + V (u0 ) V ( 0

(3)

(4) (5) (6)

2 x2 i

+ 2

2 1 +

(X0 X )2 1 + n x2 i

Ejercicio Matemtico (20 puntos) Una muestra de 20 observaciones correspondientes al modelo: Yi = + Xi + u i = 1, ..., n en el que los errores se distribuyen independiente e idnticamente normal con media cero y varianza constante, ofrece los siguientes datos: Yi = 21,9 (Yi Y )2 = 86,9 (Xi X )(Yi Y ) = 106,4 (Xi X )2 = 215,4

Xi = 186,2

Estimar y y calcular los errores estndar, estimar el valor de la media condicional correspondiente a X = 10, y encontrar un intervalo de conanza del 95 % para esta media. Respuesta: Utilizando MCO en desvios, los estimadores de y son:

= =

(Xi X )(Yi Y ) 106,4 = 0,494 = 2 215,4 (Xi X ) X = 21,9 0,494 186,2 = 3,504 Y 20 20
2

u Para calcular el error estndar, u = nk , necesitamos la suma de los errores al cuadrado. Esta se puede obtener de la siguiente ecuacin:

u 2

= = =

i )2 (Yi X 2 X 2 2 i Y i + 2 i) (Yi2 + 2 + Yi 2X X i 2 Yi2 + n 2 +


2 Xi 2

Yi 2

Xi Yi + 2 Xi Yi ,

Xi
2 Xi y

(7) Yi2 :

Para obtener

u 2 hay que obtener los valores que falta, que son )(Yi Y ) = (Xi X Xi Yi Xi Yi Y Xi Yi nX

)(Yi Y ) + nX Y = (Xi X = 106,4 + 20 9,31 1,095 = 310,289 (8)

)2 (Xi X
2 Xi

= = = =

2 2 Xi nX

) 2 + nX 2 (Xi X 215,4 + 20 9,312 1948,922 6 (9)

2 Xi

)2 (Yi Y Yi2

= = =

2 Yi2 nY )2 + nY 2 (Yi Y 86,9 + 20 1,0952 (10)

Reemplazando 8,9 y 10 en 7 queda:

u 2 = 34,343
u 2 nk

Por lo tanto, el error estndar u =

es:

2 u u

u 2 nk 34,343 = 20 2 = 1,908 = 1,381 =

El valor de la media condicional para X = 10 es:

Y0 Y0 Y 0

= = =

X0 + 3,504 + 0,494 10 1,436

La desviacin estndar del error de prediccin:


2 2 e = u (1 + X0 (X X )1 X0 )

La que para un modelo con constante y pendiente se resume en:

2 e

2 e e

(Xi X0 )2 )2 n (Xi X 2500,9 = 1,908(1 + ) 20 4308 = 3,017 = 1,737 =


2 u 1+

El t de tabla para un test de dos colas con un 95 % de conanza es tt = 2,101, por lo que el intervalo de conanza queda:

0 tt,/2 e Y 0 Y 1,436 2,101 1,737 Y 0 2,213 Y 0

0 + tt,1/2 e Y 1,436 + 2,101 1,737 5,085

Ejercicio Emprico (40 puntos)

En la Table 5.2 se presentan los resultados de las regresiones de desempeo educacional en la razn profesor-alumno y otras variables de control de caractersticas de los estudiantes usando colegios del grado K-8 de los distritos del Estado de California en Estados Unidos. EL modelo general es: yi = c + 1 X1i + 2 X2i + 3 X3i + 4 X4i + ui Donde y es el puntaje promedio de los colegios en el distrito (desempeo educacional), X1i es la razn profesor alumno, X2i es el porcentaje de alumnos que no saben ingls, X3i es el porcentaje de alumnos que tienen derecho a almuerzo subsidiado, X4i es el porcentaje de los ingresos del colegio que proviene del Gobierno, y c es el intercepto. SER es la desviacin estndar de 2 la regresin ( 2 ), R es el R cuadrado ajustado, y n es el nmero de observaciones de la regresin. Notar que las columnas indican las variables explicativas que se incluyen en la regresin. No todas ellas contienen todas las variables explicativas y controles.

Las desviaciones estndares de los parmetros estimados se encuentra entre parntesis abajo de los estimadores. Un coeciente individual es estadsticamente signicativo al nivel 5 % (*), nivel 1 % (**) usando un test de dos colas. Usando los resultados de la Tabla 5.2 adjunta conteste las siguientes preguntas: 1. En la regresin de la columna (3), el valor estimado de 1 es -1,00. Qu signica un valor de -1,00 en esta regresin? R: Mientras mas alumnos sean por profesor, existe una incidencia negativa sobre el puntaje estimado, adems este efecto es estadsticamente distinto de cero al 1 % de signicancia. En otras palabras, si el ratio alumnos/profesores aumenta en una unidad, se espera que el promedio caiga en un punto, segn nuestra especicacin. 2. Usando los resultados de la columna (3), construya un intervalo de conanza para 1 del 99 %. R: Un intervalo de conanza de 1 de signicancia, con varianza desconocida y T-k grados de libertad, se dene como: 1 t1 ,T k < 1 < 1 + t1 ,T k ]=1 P r [ (1 ) (1 ) 2 2 Remplazando valores1 1 2, 575(0, 27) < 1 < 1 + 2, 575(0, 27) 1, 69525 < 1 < 0, 30475 3. Construya el R2 de la regresin en la columna (3). R: Recordemos que: 2 = 1 (1 R2 ) T 1 R T k Despejando para R2 : R2 = 1 + Remplazando los datos: R2 = 1 + 420 4 (0, 773 1) 420 1 (6) (7) T k 2 (R 1) T 1 (5) (4) (2) (3) (1)

= R2 = 0, 7746
2

4. El R en la regresin de la columna (3) es muchas mayor que la regresin de la columna (1). Esto signica que puede ser eliminado un potencial sesgo de variable omitida? Explique.
el tamao muestral es lo sucientemente grande, se puede usar una normal estandar para encontrar los valores tipicados (T > 100).
1 Como

10

2 , a diferencia del R2 el cual aumenta al incluir ms regreR: Es posible, ya que el R sores, corrige por los grados de libertad que se van perdiendo al incluir ms regresores. 2 se dene como: Recordemos que R 2 = 1 + R /(T k ) Y M Y /(T 1) (1)

Adems posteriormente las variables que fueron omitidas en (1) e incluidas en (3) resultaron ser signicativas al 1 %, por lo tanto, es probable que se este eliminado un potencial sesgo de variable relevante omitida. 5. Sea 4 el coeciente de la variable porcentaje de ingresos pblicos". a ) Es 4 estadsticamente signicativo en la regresin de la columna (4)? Construya un intervalo de conanza para 4 del 95 % usando la regresin de la columna (4). R: Por enunciado sabemos que es signicativo al 1 %. Recordemos la denicin de un intervalo de conanza al 1 : 4 t1 ,T k < 4 < 4 + t1 ,T k ]=1 P r [ (4 ) (4 ) 2 2 Remplazando valores: 0, 79 1, 96(0, 068) < 4 < 0, 79 + 1, 96(0, 068) 0, 92328 < 4 < 0, 65672 (2) (3) (1)

b ) Es 4 estadsticamente signicativo en la columna (5)? Construya un intervalo de conanza para 4 del 95 % usando la regresin de la columna (5). R: Por enunciado sabemos que no es signicativo al 5 % ni al o %. Usando la denicin de un intervalo de conanza: 0, 048 1, 96(0, 059) < 4 < 0, 048 + 1, 96(0, 059) 0, 06764 < 4 < 0, 16364 Notemos que el intervalo de conanza pasa por cero. c ) Explica porque las respuestas de a y b son diferentes. R: Por que en (4) se omiti X3 , la cual esta correlacionada con X4 , es decir que 4 en (3) esta siendo sub estimada, ya que cov (X3 , X4 ) = 0, la intuicin de este razonamiento es que mientras mayor sea la ayuda estatal, mayores sern los subsidios de almuerzos otorgados. Como ejemplo de esto, cuando en el modelo lineal simple, se omite una variable relevante, obtenemos: 1 ) = i + E ( cov (X1 , X2 ) V (X1 ) 2 (6) (4) (5)

Siendo X2 la variable relevante omitida, el signo del sesgo del parmetro depender de la cov (X1 , X2 ) y del beta de la variable omitida. 11

6. Se lleva a cabo un test F para testear la hiptesis nula H0 : 2 = 4 = 0 para la especicacin de la regresin de la columna (5). El valor calculado del test es 6.88. a ) Es H0 rechazada al 1 % de signicancia? Explique. R: El valor tipicado es: F = 6, 88, el cual debe ser comparado con el valor critico, que se obtiene de una F(2,415) , ya que se tienen 2 restricciones y 415 grados de libertad con 1 % de signicancia. La hiptesis es rechazada, ya que F(2,415) 4, 6, por lo que nuestro valor tipicado es mucho mayor al valor critico, es decir cae en la zona de rechazo. b ) Est el punto 2 = 4 = 0 contenido en el intervalo de conanza del conjunto al 99 % para 2 y 4 ? Explique. R: Usando un intervalo de conanza para 2 y 4 : 2 + 4 )t1 ,T k < 2 +4 < ( 2 + 4 )+t1 ,T k ] = 1 (1) P r[( (2 +4 ) (2 +4 ) 2 2 2 + 4 ) = ( 2 ) + ( 4 ) + 2cov ( 2 , 4 ), si suponemos que la Recordemos que ( covarianza es pequea, entonces (1) es aproximadamente: 0, 082 2, 575(0, 036 + 0, 059) < 2 + 4 < 0, 082 + 2, 575(0, 036 + 0, 059) (2) 0, 326625 < 2 + 4 < 0, 162625 (3)

El intervalo de conanza pasa por 0, por lo cual el punto 2 = 0 y 4 = 0 esta contenido en el intervalo. 7. En la regresin representada en la columna (1), est la razn profesor alumno no correlacionada con el error de la regresin? Es esta correlacin positiva o negativa? R: Existe una correlacin, ya que hay variables relevantes omitidas. Por lo cual se viola el supuesto que E (i , Xi ) = 0. En otras palabras, en las innovaciones o en el trmino de error, existen componentes sistemticos, no ortogonales a las variables incluidas, que explican la variable dependiente. 8. Comparando las columnas (1) y (2), crees que la razn profesor alumno y el porcentaje de aprendices de ingls correlacionado positiva o negativamente? Explique. R: A modo de dar una intuicin del problema, usamos el modelo lineal simple, para poder observar como afecta la no inclusin de una variable relevante, en cuyo caso nuestro estimador estar sesgado: 1 ) = i + E ( cov (X1 , X2 ) V (X1 ) 2 (1)

Siendo X2 la variable relevante omitida, el signo del sesgo del parmetro depender de la cov (X1 , X2 ) y del beta de la variable omitida. En (1), 1 esta siendo sub estimado comparado con (2). La correlacin es positiva ya que 2 < 0 en el modelo (2), por lo cual cov (X1 , X2 ) > 0. 9. Supongamos que el tamao muestral aumenta al doble, entonces n = 840. Como esperas que cambien los errores estndares de los estimadores MCO? Explique. 12

R: Si T aumenta el doble, contamos con una mayor parte de la poblacin, por lo cual estaremos mas cerca de estimar los verdaderos parmetros poblacionales, adems nuestras estimaciones son ms precisas, ya que aumenta la variabilidad de las variables independientes, con esto la varianza de los betas ser menor. Como la estimacin es ahora mas precisas, los errores de MCO son menores.

13

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Solemne

Semestre: Primavera 2006 Profesores: Jos Miguel Benavente, Rodrigo Montero Tiempo de duracin: 110 minutos No hay preguntas de ningn tipo para los ayudantes

1.

Comente en no ms de 10 lneas las siguientes armaciones (30 puntos)

1. El supuesto de normalidad es clave para que el estimador de mnimos cuadrados ordinarios sea MELI. Respuesta. Falso. El estimador de mnimos cuadrados ordinarios es el mejor estimador lineal e insesgado. Dentro de los supuestos necesarios para que eso se cumpla estn: (i) el modelo es lineal (Y = X + ), (ii) la matriz X es de rango completo, (iii) los errores (disturbios) son esfricos, es decir, tienen media cero, y covarianza nula, y (iv) los regresores son no estocsticos. El supuesto de normalidad slo es necesario para realizar inferencia estadstica, puesto que de esa manera se obtiene una distribucin conocida para el vector de parmetros estimados. 2. Mientras mayor sea la variabilidad de los datos ms inecientes sern las estimaciones de MCO. Respuesta. Considere la varianza del estimador en el contexto del modelo de dos variables: 2 ) = var( x2 El denominador de la expresin representa la variablidad de los xs, es decir, a la variabilidad de los datos. De esta manera, mientras mayor sea sta, menor ser la varianza del estimador MCO, y por lo tanto, ms precisas (ecientes) sern las estimaciones. El comente es falso.

3. Si una variable es econmicamente signicativa, entonces, no debiera ocurrir que estadsticamente no lo fuera. Respuesta. Falso. En trminos econmicos, la signcancia de la variable viene determinada por el modelo terico subyacente. Sin embargo, a nivel estadstico la signicancia estar determinada en parte por la naturaleza y caractersticas de los datos. En particular, la variable podra ser estadsticamente no signicativa debido a una alta colinealidad en los datos (covarianza). Esto ocurre pues mientras mayor sea sta, mayor ser tambin la varianza del estimador, y por lo tanto, ms probabilidades hay que el cero est contenido en el intervalo de conanza asociado. 4. El anlisis economtrico permite descartar teoras, y de esa manera, progresar en el entendimiento de la economa. Respuesta. En parte esto es correcto. En la medida que el anlisis economtrico sea el apropiado, y que los datos no estn muy contaminados, entonces, es posible validar teoras a partir de ste. Sin embargo, las conclusiones de todo anlisis economtrico deben ponderarse adecuadamente en funcin de las limitaciones que ste ofrece. Ahora bien, si existe abundante evidencia emprica que apoya cierta armacin terica, entonces, habra fundamento para poder establecer que el modelo explica relativamente bien la realidad. 5. La singularidad de la matriz (X X ) no afecta la precisin de las estimaciones. Respuesta. La precisin de las estimaciones vienen dadas por su varianza, es decir: ) = 2 (X X )1 var( (1) En la medida que la matriz (X X )1 sea singular, esto es, no invertible, entonces, su inversa no existe, pues su determinante tiende a cero. Por lo tanto, se tendrn varianzas gigantes, y en el lmite, es decir, cuando la matriz es singular, stas no se podrn calcular. Por lo tanto, el comente es falso. 6. Siempre es mejor utilizar un slo modelo para predecir, en lugar de escoger una combinacin de distintos modelos. Respuesta. Falso. En la medida que se reconoce que ningn modelo es perfecto, y que por lo tanto, los defectos de uno pueden ser las virtudes de otro, entonces, al tomar ms de un modelo para realizar proyecciones, y hacer una ponderacin de stas, ser posible obtener mejores estimaciones. Esto ocurrira pues los errores de unos con otros tenderan a cancelarse, obtenindose as una mejor prediccin.

2.

Demostraciones (30 puntos)


2 1 X + n x2 i

1. Considere el siguiente modelo: Yi = + Xi + i . Demuestre que: var( M CO ) = 2 Respuesta. Se sabe que: X X )X = + X + = ( + =Y Por lo tanto: )X + = ( Por lo tanto, la varianza de puede escribirse como: )X )2 + E ( ) + 2 E ( [( E ( )2 = E [( ]2 = X 2 ) 2XE ] Por otro lado, se sabe que:
2 )2 = E ( x2

y: E ( 2 ) = Adems: ) E [( ] = E ) E [( ] = 1 n x2 2 n x x2 1 n

E [(x1 1 + x2 2 + + xn n )(1 + 2 + + n )] 2 ) E [( ] = n x =0 x2

Reemplazando estos trminos en la expresin original, se llega a lo siguiente:


2 2 2 + E ( )2 = X x2 n

Finalmente: E ( )2 = 2

2 1 X + n x2

2. Demuestre que 2 = nki es un estimador insesgado de 2 . Respuesta. Considere lo siguiente: = Y X (X X )1 X Y = M Y = Y X con: M = I X (X X )1 X donde M es una matriz simtrica e idempotente. Note adems lo siguiente: = M Y = M (X + ) = M . Un estimador natural de 2 sera la suma de los errores estimados al cuadrado, es decir: = 2 Aplicando esperanza: E ( ) = E ( M M ) = E ( M ) Dado que la traza de un escalar es un escalar, se tiene: E ( M ) = E [tr( M )] = E [tr( M )] = 2 tr(M ) Reemplazando M : E ( M ) = 2 tr(I ) 2 tr[X (X X )1 X ] = 2 tr(I ) 2 tr[(X X )1 (X X )] Por lo tanto: E ( M ) = 2 (n k ) Es decir, la suma de los cuadrados de los errores estimados es un estimador sesgado de 2 . Por lo tanto, y dado el resultado anterior: 2 = 2 i nk

corresponde a un estimador insesgado de 2 .

3.

Matemtico (20 puntos)

Se quiere explicar la evolucin de la demanda de pescado de una ciudad (Dt ), en funcin del ingreso medio disponible (Yt ). Para ello se dispone de datos de los cien ltimos meses, (donde la demanda viene medida en toneladas mtricas, TM, y el ingreso disponible en millones de pesos). Se dispone de la siguiente informacin: 2 = 10 Yt = 6 Dt = 3 Dt Yt2 = 36 con t = 1, 2, ..., 100. 1. Escriba un modelo de regresin adecuado para la estimacin de la demanda de pescado en funcin del ingreso y calcule los coecientes estimados por MCO. Respuesta. El modelo a estimar sera el siguiente: Dt = 0 + 1 Yt +
t

Dt Yt = 15

con t = 1, ..., 100, y t correspondera al trmino de error con media cero y varianza homoscedstica. La estimacin viene dada por: = (X X )1 X D Se tiene lo siguiente: 0 1 = 100 6 6 36
1

(2)

3 15

0, 005051 0, 415825

2. Se piensa que una forma mejor de estimar la demanda sera incluyendo adems del ingreso medio disponible, los precios de pescado (Pt ) como nueva variable explicativa. Sabiendo que: Pt = 4 Yt Pt = 30 Pt2 = 100 Pt Dt = 5

calcule los nuevos coecientes estimados. Respuesta. El nuevo a modelo a estimar viene dado por: Dt = 0 + 1 Yt + 2 Pt +
t

Aplicando MCO se tiene lo siguiente: 1 0 100 6 4 3 0, 004041 1 = 6 36 30 15 = 0, 499282 2 4 30 100 5 0, 09995 5

2 de los modelos estimados. Comente qu modelo sera 3. Obtenga el R2 y R preferido en base a los resultados anteriores. Respuesta. Se sabe que: + + = X D=D Por lo tanto: X + = X D + + ) (D + ) = D D + = X D D = (D Por otro lado, la variabilidad de D viene dada por: )2 = (Dt D
2 2 = D D nD 2 Dt nD

(3)

Por lo tanto, la descomposicin de la varianza viene dada por: D nD 2 = (X 2) + D D nD (4)

es decir: T SS = ESS + RSS . De esta manera, el R2 del primer modelo viene dado por: D nD 2 X R2 = (5) 2 = 0, 621 D D nD 2 por: y el R 2 = 1 (1 R2 ) R n1 nk = 0, 617 (6)

Para el segundo modelo los resultados son: D nD 2 X R = 2 = 0, 697 D D nD


2

(7)

2 por: y el R 2 = 1 (1 R2 ) R n1 nk = 0, 691 (8)

2 , es decir, el segundo El modelo preferido ser aquel que tenga el mayor R 2 modelo. No sera correcto jarse en el R , pues ste es monotnico frente a la 2 toma en cuenta la incorporacin de regresores adicionales, mientras que el R prdida en grados de libertad en que se incurre.

4.

Analtico (20 puntos)

Considere la siguiente estimacin que ha sido generada a partir de la informacin proporcionada por la Encuesta de Caracterizacin Nacional (CASEN) para el ao 2003: Variable Aos de escolaridad Experiencia laboral Experiencia laboral al cuadrado Constante El modelo estimado es el siguiente: Yi = 0 + 1 X1i + 2 X2i + 3 X3i + i donde Yi corresponde al logaritmo del salario por hora, X1i son los aos de escolaridad, X2i representa la experiencia laboral del individuo, y X3i es el cuadrado 2 de sta (es decir, X2 i ). 1. Son econmicamente signicativos los coecientes asociados a las pendientes? Respuesta. La teora econmica establece que los factores productivos deben ser retribuidos de acuerdo a la contribucin marginal que hacen al proceso productivo, es decir, de acuerdo a su productividad. La productividad de los trabajadores no es observable, por lo que sta suele aproximarse mediante las variables incluidas en este modelo, esto es, aos de escolaridad y experiencia laboral. El cuadrado de esta ltima trata de capturar el perl decreciente que tiene el premio a la experiencia en el mercado laboral (de hecho, el coeciente asociado es negativo). 2. Son estadsticamente signicativos los coecientes asociados a las pendientes? Respuesta. Para evaluar esto se requieren construir los test t de cada uno de los coecientes estimados: t 1 = 1 0, 1202 = = 170, 81 1 0, 0007037 2 0, 0212 = = 33, 3 2 0, 0006365 7 Coeciente 0,1202 0,0212 -0,0000938 5,0379 Desviacin Estndar 0,0007037 0,0006365 0,0000127 0,0112151

t 2 =

t 3 =

3 0, 0000938 = = 7, 38 3 0, 0000127

Por lo tanto, las pendientes del modelo son estadsticamente distintas de cero, pues el intervalo de conanza (al 95 %) no contendra el cero, ya que los t son todos mayores que dos (2) en valor absoluto. 3. Es la constante estadsticamente signicativa? Si as fuera, tendra sentido desde un punto de vista econmico? Respuesta. A continuacin se presenta el test t para la constante del modelo: 0 5, 0379 = = 449, 2 t 0 = 0 0, 0112151 Dado que el t es mayor que dos, entonces, la constante es signicativa. Este resultado tiene sentido desde un punto de vista econmico, pues reejara de alguna forma el salario mnimo que paga el mercado, es decir, independiente del capital humano de la persona sta recibira al menos dicha cantidad. 4. Cul es el salario (mensual) estimado para una persona con 14 aos de escolaridad, y cuatro aos de experiencia laboral? (Asuma que la jornada laboral es de 45 horas a la semana, y que el mes tiene 4,2 semanas) Respuesta. La prediccin es la siguiente: 0 + 1 X1i + 2 X2i + 3 X3i i = Y Reemplazando: i = 5, 0379 + 0, 1202(14) + 0, 0212(4) 0, 0000938(16) = 6, 8039992 Y Aplicando e() se llega a que el salario por hora estimado es de $901. Como la persona trabaja 45 horas a la semana, y el mes tiene 4,2 semanas, entonces, el salario mensual estimado para esta persona es de $170.289.

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Solemne

Semestre: Primavera 2007 Profesores: Jos Miguel Benavente, Rodrigo Montero Ayudantes: Rodrigo Bravo, Felipe Ros, Loreto Silva Tiempo de duracin: 120 minutos No hay preguntas de ningn tipo para los ayudantes

1.

(30 puntos) Comente en no ms de 10 lneas las siguientes armaciones:

1. El estimador de mnimos cuadrados ordinarios (MCO) maximiza el valor del R2 . Respuesta. Verdadero. Dado que el estimador MCO minimiza la suma de los residuos al cuadrado, entonces, automticamente lo que hace es maximizar la el valor del R2 , el cual se dene de la siguiente manera: R2 = 1 . donde yi = Yi Y 2. Si un estimador es estadsticamente signicativo, entonces, tambin es signicativo desde un punto de vista econmico. Respuesta. Falso. El hecho de que un coeciente de una ecuacin sea estadsticamente signicativo, no quiere decir que sea signicativo desde el punto de vista econmico. La signicancia econmica del coeciente viene dada por el modelo en cuestin, el cual sustenta la inclusin de una determinada variable. Sin embargo, podra darse el caso que, por un problema de los datos, el coeciente no sea estadsticamente signicativo, an cuando el modelo establezca que dicha variable es relevante para explicar la variable dependiente (Y ). 1 u 2 i 2 yi

3. Una de las principales ventajas del test t es que es insensible al tamao de la muestra, y por lo tanto, sus resultados siempre son conables. Respuesta. Falso. Se sabe que el test t se dene de la siguiente manera: t =

A su vez, sin perder generalidad, se sabe que para el caso del modelo de dos variables (Yi = + Xi + ui ), la varianza del estimador MCO viene dada por: 2 ) = var( x2 i donde: u 2 i N k donde k corresponde al nmero de parmetros a estimar. De esta manera, es posible apreciar cmo el tamao muestral (N ) afecta el valor del test , y por ende, mayor t. Mientras mayor sea N menor es la varianza de es el valor del test t. En consecuencia, es ms probable que el coeciente estimado resulte ser estadsticamente signicativo. 2 =

2.

Matemticos
Yi = + Xi + ui donde ui se encuentra independiente e idnticamente distribuido con media cero y varianza 2 . Considere los siguientes dos estimadores alternativos para la pendiente del modelo (b): b1 = Yn Y1 Xn X1 Yi Xi

1. (30 puntos) Sea el siguiente modelo:

b2 =

a ) Determine si b1 y b2 son estimadores insesgados de . Respuesta. E (b1 ) = E Yn Y1 Xn X1 2 = 1 (Xn X1 ) = Xn X1

ya que E (Yi ) = + Xi . Por lo tanto, b1 es un estimador insesgado de . Por otro lado: E (b2 ) = E Por lo tanto: E (b2 ) = 1 (n + Xi Xi ) = n + = Xi Yi Xi = 1 E( Xi Yi ) = 1 Xi ( + Xi )

Es decir, b2 es un estimador sesgado de . b ) Encuentre las varianzas de b1 y b2 . Respuesta. En primer lugar se debe establecer lo siguiente: var(Yi ) = var( + Xi + ui ) = 2 ya que y son parmetros jos, y Xi es una variable exgena al modelo (los valores de Xi son jos. Luego: var(b1 ) = 2 2 1 var ( Y Y ) = n 1 (Xn X1 )2 (Xn X1 )2

ya que cov (Yi , Yj ) = 0 para todo i = j , puesto que el trmino de error (ui ) tiene una distribucin independiente. Por otro lado: var(b2 ) = 1 var( Xi )2 Yi ) = n 2 ( Xi )2

c ) Muestre que var(b1 ) var(b), donde b corresponde al estimador de mnimos cuadrados ordinarios para la pendiente del modelo. Respuesta. Se sabe que: var(b) = 2 x2 i

. Luego, se debe demostrar lo siguiente: donde xi = Xi X 2 2 (Xn X1 )2 o bien que: 2 )2 (Xn X1 )2 (Xi X 2 )2 (Xi X

) y v = (Xn X ). Por Se denen las siguientes variables, u = (X1 X lo tanto:


n1

)2 = 2(u2 + (Xi X
i=2

)2 + v 2 ) 2(u2 + v 2 ) (Xi X

Por otro lado: (Xn X1 )2 = (v u)2 As, habra que probar que: 2(u2 + v 2 ) (v u)2 = v 2 2vu + u2 Luego: u2 + v 2 2vu u2 + v 2 + 2vu 0 Por lo tanto, para que var(b1 ) var(b), bastara con probar que: (u + v )2 0 lo cual se cumple. d ) Muestre que existe un conjunto de datos Xi , con i = 1, 2, ..., n, para los cuales se cumple que var(b2 ) < var(b). Contradice este resultado el Teorema de Gauss-Markov? Respuesta. Supongamos los siguientes datos: X1 = 1, X2 = 2 y X3 = 3. Luego: var(b2 ) = Por otro lado: var(b) = 2 2 2 = = 0, 5 2 = 2 2 2 2 xi (1 2) + (2 2) + (3 2) 2 3 2 n 2 = = 0, 083 2 ( Xi )2 36

Por lo tanto, var(b) var(b2 ), sin embargo, este resultado no contradice el teorema de Gauss-Markov ya que b2 no es un estimador insesgado de . 2. (30 puntos) Considere la siguiente informacin sobre precios y cantidad demandada:

i 1 2 3 4 5 6 7 8 9 10 11 12

Precio (P ) Cantidad (Q) 1 89 1 86 1 74 1 79 1 68 1 84 0,95 139 0,95 122 0,95 102 0,95 186 0,95 179 0,95 187

En base a estos datos, se plantea el siguiente modelo: Qi = + Pi + ei Donde ei representa el trmino de error que cumple con los supuestos convencionales. a ) Encuentre los estimadores de mnimos cuadrados ordinarios (MCO) para y . Respuesta. La estimacin para la pendiente del modelo viene dada por: p i qi = (Pi P )(Qi Q) = = 1450 )2 p2 (Pi P i Por otro lado, el intercepto se estima como: P = 1530 =Q b ) Calcule la suma de los cuadrados totales (TSS), la suma de los cuadrados de la regresin (ESS), la suma de los errores al cuadrado (RSS) y el coeciente R2 . Respuesta. La suma de los cuadrados totales viene dada por: T SS = )2 = (Qi Q 2 Q2 i nQ = 22760, 25

La suma de los cuadrados de la regresin viene dada por: 2 ESS = )2 = 15768, 75 (Qi Q

La suma de los errores al cuadrado viene dada por: RSS = T SS ESS = 22760, 25 15768, 75 = 6991, 5 Y nalmente: R2 = ESS 15768, 75 = = 0, 69 T SS 22760, 25

c ) Estime la varianza ( 2 ) del trmino de error (ei ). Respuesta. 2 = RSS 6991, 5 e 2 i = = = 699, 15 n2 n2 10

d ) Calcule el error estndar de b (el estimador MCO de ) y haga un test sobre su signicancia estadstica (H0 : = 0), utilizando un nivel de signicancia del 5 %. (Ayuda: el valor crtico de una distribucin t de dos colas con diez grados de libertad es c =2,23) Respuesta. El error estndar de b viene dado por: b = Por otro lado: )2 (Pi P tb = = 699, 15 = 305, 31 0, 0075

b 1450 = 4, 74 = b 305, 31 por lo tanto, se rechaza la hiptesuis nula, y el coeciente es estadsticamente signicativo.

e ) Construya un intervalo de conanza de 95 % para . Respuesta. El intervalo viene dado por: b cb < < b + cb Por lo tanto: 2130, 8 < < 769, 15

3.

(15 puntos) Analtico

La movilidad social es un tema que preocupa a las autoridades de muchos pases. Economas que presentan una elevada movilidad social son aquellas en donde existe una elevada probabilidad de avanzar a lo largo de la distribucin de ingresos, mediante un acceso razonable a las oportunidades que ofrece el mercado. Una de las principales herramientas para lograr movilidad social es la educacin, 6

puesto que permite a las personas aumentar su capacidad de generacin de ingresos. Con el objetivo de poder evaluar el nivel de movilidad social de Samunda, un prspero pas africano, un investigador propone la siguiente regresin: SiH = + SiP + i donde SiH representa los aos de escolaridad del individuo i, SiP denota los aos de escolaridad promedio de los padres del individuo i (promedio simple de la escolaridad del padre y de la madre), y i es un trmino de error que resume todos los otros aspectos que no han sido incluidos de manera explcita en la ecuacin, pero que afectan la escolaridad de i. Se sabe que 0 < < 1. En base a esta informacin, responda: 1. Explique el trasfondo econmico de la ecuacin anterior. Respuesta. Bsicamente, el modelo establece que la escolaridad de los padres es un determinante fundamental de la escolaridad que puedan alcanzar los hijos. 2. Suponiendo que se cuenta con informacin conable para estimar mediante mnimos cuadrados ordinarios (MCO) la relacin planteada: qu represenM CO en el contexto de la discusin sobre movilidad social? (Ayuda: tara = 1, es decir, que el impacto que tiene el piense en qu signicara que nivel de escolaridad de los padres sobre la de los hijos fuera total.) = 1, entonces, no existira movilidad Respuesta. En la medida que puesto que la escolaridad de los padres deerminara, en promedio, uno a uno = 0, entonces, no habra ninguna relacin la escolaridad de los hijos. Si entre la escolaridad de los padres y la de los hijos. En otras palabras, si el padre tuviera solo educacin bsica incompleta, eso no sera razn para que el hijo no pudiera alcanzar la educacin superior. 3. Qu crticas podra hacerle al modelo propuesto? Mencione tres. Respuesta. a ) Omite variables relvantes, como por ejemplo, la habilidad de los individuos b ) La relacin no tiene por qu ser lineal, pudiera haber una relacin ms sosticada para este modelo c ) Pudiera ser que la escolaridad del padre inuya de mayor manera en la escolaridad de los hijos, por lo que el promedo simple de la escolaridad de los progenitores podra no ser la ms apropiada.

Rut:____________________________

Facultad de Economa y Negocios Universidad de Chile PAUTA SOLEMNE Econometra 1 Primavera 2007

Profesora: Claudia Sanhueza Ayudante: Jos Manuel Eguiguren Felipe Rios Tiempo: Puntaje Total: p. 1) Preguntas de Eleccin Mltiple. (p) i. In the multiple regression model, the adjusted R2, R 2 a. cannot be negative. b. will never be greater than the regression R2. c. equals the square of the correlation coefficient r. d. cannot decrease when an additional explanatory variable is added.
Answer: b

ii. Consider the following multiple regression models (a) to (d) below. DFemme = 1 if the individual is a female, and is zero otherwise; DMale is a binary variable which takes on the value one if the individual is male, and is zero otherwise; DMarried is a binary variable which is unity for married individuals and is zero otherwise, and DSingle is (1-DMarried). Regressing weekly earnings (Earn) on a set of explanatory variables, you will experience perfect multicollinearity in the following cases unless:

a. Earn i = 0 + 1 DFemme + 2 Dmale + 3 X 3i . b. Earn i = 0 + 1 DMarried + 2 DSingle + 3 X 3i . + DFemme + X . = c. Earn


i 0 1 3 3i

d. Earn i = 1 DFemme + 2 Dmale + 3 DMarried + 4 DSingle + 5 X 3i .


Answer: c

iii. When there are omitted variables in the regression, which are determinants of the dependent variable, then a. you cannot measure the effect of the omitted variable, but the estimator of your included variable(s) is (are) unaffected. b. this has no effect on the estimator of your included variable because the other variable is not included.

Rut:____________________________

c. this will always bias the OLS estimator of the included variable. d. the OLS estimator is biased if the omitted variable is correlated with the included variable.
Answer: d

iv. The assumption that X has full column rank implies that a. b. c. d. the number of observations equals the number of regressors. binary variables are absent from the list of regressors. there is no perfect multicollinearity. none of the regressors appear in natural logarithm form.

Answer: c v. One implication of the extended least squares assumptions in the multiple regression model is that a. b. c. d. feasible GLS should be used for estimation. E(U|X) = In. XX is singular. 2 the conditional distribution of U given X is N(0n, u In).

Answer: d vi. The following linear hypothesis can be tested using the F-test with the exception of a. 2 = 1 and 3 = 4 / 5 . e. 2 = 0 . f. 1 + 2 = 1 and 3 = 2 4 . g. 0 = 1 and 1 = 0.
Answer: a

vii. One of the properties of the OLS estimator is


= 0k+1. a. X has full rank. b. that the coefficient vector ) = 0k+1. c. X(Y X

d. (XX)-1= XY
viii. The GLS estimator is defined as

a. (X -1X)-1(X -1Y). b. (XX)-1XY.

Rut:____________________________

c. AY. d. (XX)-1XU. Answer: a


ix.

a. b. c. d.

cannot be calculated since the population parameter is unknown. = (XX)-1XU . . =Y- Y = + (XX)-1XU

Answer: b x. In the case when the errors are homoskedastic and normally distributed, conditional on X, then
2 is distributed N( , ),where a. | X | X = u I(k+1).

is distributed N(, ), where = b.

) n (

1 1 V QX /n = Q X / n.

-1 2 is distributed N( , ),where c. | X | X = u (X'X) .

= PXY where PX = X(XX)-1X. d. U


Answer: c

2)

Ensayos y Preguntas Largas (p)

2.1. Give several economic examples of how to test various joint linear hypotheses using matrix notation. Include specifications of R = r where you test for (i) all coefficients other than the constant being zero, (ii) a subset of coefficients being zero, and (iii) equality of coefficients. Talk about the possible distributions involved in finding critical values for your hypotheses.
Answer: Answers will vary by student. Many restrictions involve the equality of coefficients across different types of entities in cross-sections (stability). Using earnings functions, students may suggest testing for the presence of regional effects, as in the textbook example at the end of Chapter 5 (exercises). The textbook tested jointly for the presence of interaction effects in the student achievement example at the end of Chapter 6. Students may want to test for the equality of returns to education and on-the-job training. The panel chapter allowed for the presence of fixed effects, the presence of which can be tested for. Testing for constant returns to scale in production functions is also frequently mentioned.

Consider the multiple regression model with k regressors plus the

Rut:____________________________

constant. Let R be of order q (k + 1) , where q are the number of restrictions. Then to test (i) for all coefficients other than the constant to be zero, H 0 : 1 = 0, 2 = 0,..., k = 0 vs. H1 : j 0 , at least one j, j=1,,n, you have R = [0k1 Ik ] and r = 0k1. In large samples, the test will produce the overall regression F-statistic, which has a Fk , distribution. In case (ii), reorder the variables so that the regressors with non-zero coefficients appear first, followed by the regressors with coefficients that are hypothesized to be zero. This leads to the following formulation Yi = 0 + 1X1i + 2X2i + g g g + k-qXk-q,i +k-q+1Xk-q+1,i +k-q+2Xk-q+2,i + . . . + kXki + ui, i = 1,, n. R = [0q (k-q+1) Iq ] and r = 0q1. In large samples, the test will produce an F-statistic, which has an Fq , distribution. In (iii), assume that the task at hand is to test the equality of two coefficients, say H 0 : 1 = 2 vs. H1 : 1 2 , as in section 5.8 of the textbook. Then R = [0 1 -1 0 0], r = 0 and q = 1. This is a single restriction, and the F-statistic is the square of the corresponding t-statistic. Hence critical values can be found either from F1, or from the standard normal table, after taking the square root.

2.2. Consider the multiple regression model from Chapter 5, where k = 2 and the assumptions of the multiple regression model hold. (a) Show what the X matrix and the vector would look like in this case.
1 X 11 1 X 12 Answer: X = M M 1 X 1n X 21 0 X 22 , and = 1 M 2 X 2n

(b)

Having collected data for 104 countries of the world from the Penn World Tables, you want to estimate the effect of the population growth rate (X1i) and the saving rate (X2i) (average investment share of GDP from 1980 to 1990) on GDP per worker (relative to the U.S.) in 1990. What are your expected signs for the regression coefficient? What is the order of the (XX) here? Answer: You would expect the population growth rate to have a negative coefficient, and the saving rate to have a positive coefficient. The order of XX is 3 3.

(c)

You are asked to find the OLS estimator for the intercept and slope in this model

Rut:____________________________

= (XX)-1XY. Since you are more comfortable in inverting a using the formula 22 matrix (the inverse of a 22 matrix is,

a b 1 d b = ) ad bc c a c d
you decide to write the multiple regression model in deviations from mean form. Show what the X matrix, the (XX) matrix, and the XY matrix would look like now. (Hint: use small letters to indicate deviations from mean, i.e., zi = Zi Z and note that + X + X +u $i Yi = 0 1 1i 2 2i + X + X . Y =
0 1 1 2 2

Subtracting the second equation from the first, you get

x + x +u $ i .) yi = 1 1i 2 2i
x11 x Answer: X = 12 M x 1n x21 x22 , XX = M x2 n

n 2 x1i i =1 n x1i x2i i =1

n x x 1i 2 i yi x1i i =1 , XY = i =1 . n n 2 x2 i yi x2 i i =1 i =1
n

(d)

Show that the slope for the population growth rate is given by

= 1

yi x1i x22i yi x2i x1i x2i


i =1 i =1 i =1 i =1

x x
i =1 2 1i i =1
1

2 2i

( x1i x2 i ) 2
i =1
n x1i x2 i i =1 . n x12i i =1

n 2 x1i i =1 Answer: n x1i x2i i =1

n 2 x1i x2 i x2 i 1 i =1 = i =1 n n n n n 2 2 2 2 x x ( x x ) x 1i 1i 1i 2i 2i x1i x2 i i =1 i =1 i =1 i =1 i =1
n

Rut:____________________________

n yi x1i i =1 results in the two least squares estimators Post multiplying this expression with n yi x2 i i =1 n n n n 2 yi x1i x2 i yi x2 i x1i x2i i =1 i =1 i =1 n i =1 n n 2 2 2 x1i x2i ( x1i x2i ) i =1 . 1 = n i =1 ni =1 , and hence gives the formula for 1 n n 2 2 y x x y x x x i 2 i 1i i 1i 1i 2 i i =1 i =1 i =1 i =1 n n n 2 2 2 ( ) x x x x 1i 2i 1i 2i i =1 i =1 i =1

Rut:____________________________

(e)

The various sums needed to calculate the OLS estimates are given below:

yi2 = 8.3103; x12i = .0122; x22i = 0.6422


i =1 i =1 i =1

yx
i =1

i 1i

= 0.2304; yi x2i = 1.5676; x1i x2i = 0.0520


i =1 i =1

Find the numerical values for the effect of population growth and the saving rate on per capita income and interpret these.

0.2304 0.6422 (1.5676 (0.0520)) 1 0.0122 0.6422 (0.0520) 2 = Answer: = 1.5676 0.0122 ((0.2304) (0.0520) 2 0.0122 0.6422 (0.0520) 2

12.953 1.393 .

A reduction of the population growth rate by one percent increases the per capita income relative to the United States by roughly 0.13. An increase in the saving rate by ten percent increases per capita income relative to the United States by roughly 0.14.

(f)

Indicate how you would find the intercept in the above case. Is this coefficient of interest in the interpretation of the determinants of per capita income? If not, then why estimate it? Answer: The first order condition for the OLS estimator in the case of k = 2 is

Y =n
i =1 i

0 + 1 X 1i + 2 X 2i , which, after dividing by n, results in


i =1 i =1

=Y X X . The intercept is only of interest if there are 0 1 1 2 2 observations close to the origin, which is not the case here. If it is set to zero, then the regression is forced through the origin, instead being allowed to choose a level.
2.3. Define the GLS estimator and discuss its properties when is known. Why is this estimator sometimes called infeasible GLS? What happens when is unknown? What would the matrix look like for the case of independent sampling with heteroskedastic errors, where var( ui | X i ) = ch( X i ) = 2 X 12i ? Since the inverse of the error variance-covariance matrix is needed to compute the GLS estimator, find 1 . The textbook shows that the original model Y = X + U will be transformed % = X %+U % = FY, X % = FX, and U % , where Y % = FU, and FF = -1. Find F into Y in the above case, and describe what effect the transformation has on the original data.

Rut:____________________________

GLS = (X -1X)-1(X -1Y). The key point for the GLS estimator with Answer: known is that is used to create a transformed regression model such that the resulting error term satisfies the Gauss-Markov conditions. In that case, GLS is BLUE. However, since is typically unknown, the estimator cannot be calculated, and is therefore sometimes referred to as infeasible GLS. If is unknown, then a feasible GLS estimator can be calculated if is a known function of a number of parameters which can be estimated. Once the parameters have been estimated, they can then be , which is the estimator of . The feasible GLS used to calculate estimator is then GLS = (X 1 X)-1(X 1 Y).

In the above example of heteroskedasticity,


2 X 11 0 2 0 X 12 E(UU|X) = (X) = 2 M M 0 0 1 0 L X2 11 1 L 1 0 2 1 X 12 (X) = 2 M M O 0 0 L

L L O L

0 0 M 1 X 12n

0 0 , M X 12n , F=

1 X 11 0 M 0

0 1 X 12 M 0

L L O L

0 0 . M 1 X 1n

The transformation in effect scales all variables by X 1 .

Prueba Solemne Econometr a I


Profesor: Tom as Rau Binder Ayudante: Victor Nahuelpan 27 de diciembre
Tiempo Total: 120 Minutos.

1.

Preguntas Cortas (5 puntos, m aximo 5 renglones)

1. Dena funci on de regresi on poblacional. R. La funci on de regresi on poblacional es el lugar geom etrico de las medias condicionales E (Yi |Xi ) = f (Xi ) que puede ser una funci on cualquiera. Un caso particular es la recta de regresi on poblacional Y = X + u. 2. Demuestre que E (u|X ) = 0 E (u) = 0. R. Por Ley de las Esperanzas Iteradas (Iterated Law of Expectations) sabemos que E (E (u|X )) = E (u). Luego, reemplazando E (u|X ) = 0, tenemos que E (u) = 0. = (X X )1 X Y es insesgado. R. Reemplazando la recta 3. Muestre que = + (X X )1 X u. Tomando de regresi on poblacional tenemos que valor esperado y usando el supuesto 2 (X no estoc asticas) y supuesto 3 ) = . (E (u|X ) = 0) tenemos que E ( 4. Muestre que el rango de Mnn = In X (X X )1 X es igual a n k donde X es de orden n k . Recuerde que el rango de una matriz sim etrica e idempotente es igual a su traza. R. Usando las propiedades: tr(AB)=tr(A)-tr(B) y tr(AB)=tr(BA). Tenemos que:

r(M ) = tr(M )

= =

tr(In ) tr(X (X X )1 X ) = n tr((X X )1 X X ) n tr(Ik ) = n k

5. Qu e establece el Teorema de Gauss-Markov? R. Establece que bajo los supuestos vistos en clases, el estimador MCO es MELI (mejor estimador linealmente insesgado ) o BLUE (best linear unbiased estimator ) 1

6. Comente la siguiente armaci on: dado que los estimadores MCO de y 2 en el modelo de regresi on lineal son id enticos a los obtenidos por M axima Verosimilitud, da lo mismo usar cualquiera de los dos m etodos de estimaci on. R. Falso, el estimador MV para es el mismo que MCO si se asume normalidad en los errores. Adem as, el estimador MV para 2 es sesgado. Por otra parte, los estimadores MV tienen propiedades deseables que MCO no tienen como invarianza ante transformaciones, permiten estimar modelos no lineales y testear hip otesis no lineales, entre otras.

2.

Preguntas de Desarrollo
yi = 1 + 2 xi + ui donde f (ui ) = (1/)eui / y ui 0. Este modelo es bien particular puesto que los errores son asumidos positivos. Note que el valor esperado de ui es igual a . Muestre que el estimador MCO de 2 es insesgado pero que el estimador MCO de 1 es sesgado. Es consistente el estimador MCO de 1 ? Por u ltimo, bajo qu e condiciones es el estimador MCO de 1 consistente? (10 puntos) R. Escribiendo el model en desviacones a la media tenemos: y = 2 x +u y sabemos que x y 2 = x 2 i Luego un poquito de algebra despu es de reemplazar la funci on de regresi on poblacional en desviaciones respecto de la media tenemos, 2 = 2 + 2 + 2 + x i u i 2 x i x i E ( ui ) = 2 + 2 x i x i ( ) = 2 x 2 i

1. Suponga que el modelo de regresi on lineal

2 ) = E ( 2 ) = E ( Para 1 sabemos que:

x i E (ui u) x 2 i

2 X = 1 + 2 X + u tomando valor esperado 1 ) E ( 2 )X = 1 + 2 X + E (u) E ( = 1 + 2

2 X = Y

Ahora, es claro que el estimador MCO para 1 no es consistente a no ser que 0 cuando n es muy grande. 2. Sea la funci on de regresi on poblacional y = 1 + 2 x + u y considere la siguiente muestra aleatoria simple: 1 2 1 1 Y = 1 X= 1 1 0 3 1 2 0

a) Calcule el estimador m nimo cuadr atico de y 2 . (10 puntos) R. Podemos ver que en desviaciones con respecto de la media, la muestra es 3/2 1 1/2 0 y= 0 x = 1/2 3/2 1 adem as: xi yi = 3/2 + 3/2 = 3, (3/2)2 = 20/4 = 5. Luego
2 2 2 x2 i = (3/2) + (1/2) + (1/2) +

2 = 3/5 = 0,6 1 = Y 2 X = 1 (3/5) (3/2) = 1 9/10 = 0,1 Para estimar 2 necesitamos los residuos 1 (3/5) (3/2) = 0,1 0 + (3/5) (1/2) = 0,3 u = 0 (3/5) (1/2) = 0,3 1 + (3/5) (3/2) = 0,1 Luego, 0,01 2 0,09 u = 0,09 0,01

b) Testee la hip otesis nula H0 : 2 = 0 (a dos colas). Es 2 signicativo al 5 %?Y al 10 %? Ver Cuadro 1 para los valores cr ticos. (10 puntos)
2 2 2 = R. Sabemos que la varianza de / xi = 0,1/5 = 0,02. Por lo tanto el error est andar de 2 es 2/10 = 0,141. El test t es:

u 2 2 = 0,2/2 = 0,1 dado que n k = 2. i = 0,2 y

t=

2 6/10 = 4,24 = 2/10 SE (2 )

y el valor cr tico de una t-student con 2 grados de libertad para = 5 % es 4.303. Por lo tanto se rechaza H0 . Si = 10 % el cr tico es 2.92 luego no se rechaza H0 . 3

c) Calcule el R2 y R2 ajustado. (10 puntos) R. Sabemos que R2 = ESS/T SS , luego R2 = 2 x2 2 x2 0,62 5 2 i = 0,90 = 2 2i = 2 2 yi yi

El R2 ajustado se escribe:
2 Ra =1

RSS/(n k ) 0,2/2 =1 = 0,85 T SS/(n 1) 2/3

3. Suponga que la distribuci on condicional de y dado x es una exponencial con par ametro x. 1 y/x f (y |x, ) = e x donde y > 0, x > 0 a) Obtenga el estimador m aximo veros mil de . (10 puntos) R. Escribamos la funci on de verosimilitud (en log)
n

l=
i=1

log logxi

yi xi

tomando derivadas obtenemeos el score: s() = l = n/ + (1/2 ) yi /xi

igualando el score a 0 obtenemos: = 1 n yi /xi

b) Considere la siguiente muestra aleatoria simple 2 1 4 2 Y = 1 X = 1 3 3 obtenga una estimaci on de . (5 puntos) = (1/4) (2 + 2 + 1 + 1) = R. Note que si reemplazamos nos queda 3/2. c) Pruebe la siguiente hip otesis: H0 : = 3 y H1 : = 3 usando un Test de Wald. (15 puntos) Indicaci on: recuerde que el valor esperado de una distribuci on exponencial con parametro es igual a y considere las xs jas. Use el 4

valor cr tico de una 2 con 1 grado de libertad con =5 % visto en clases. R. El test de Wald es: W = (R r) I ()(R r) En este caso R = 1 y r = 3. Necesitamos la matriz de informaci on que podemos calcularla como el negativo del valor esperado de la matriz de segundas derivadas (que en este caso es un escalar). Luego, I () = E 2l = n/2 + (2/3 ) 2 E (yi /xi )

usando que las xs son jas y que E (yi |xi ) = xi , tenemos que I () = n/2 + (2/3 ) xi = n/2 + 2n/2 = n/2 xi

) = Luego, reemplazamos el valor de R = 2, r = 3 y evaluando I ( 2 4/(3/2) = 16/9 = 1.7, entonces W = (1,5 3) (1. 7)(1,5 3) = (3/2)2 (16/9) = 4 El cr tico de una 2 con 1 grado de libertad y =5 % es 3.84. Luego se rechaza H0 .

Cuadro 1: Valores Cr ticos para una distribuci on t-Student


n-k 1 2 3 4 5 6 7 90 % 3.078 1.886 1.638 1.533 1.476 1.44 1.415 95 % 6.314 2.92 2.353 2.132 2.015 1.943 1.895 97.50 % 12.71 4.303 3.182 2.776 2.571 2.447 2.365 99 % 31.82 6.965 4.541 3.747 3.365 3.143 2.998 99.50 % 63.66 9.925 5.841 4.604 4.032 3.707 3.499

Pauta Prueba Solemne Econometr a I


Profesores: Tom as Rau y Javiera V asquez Ayudantes: Roberto Gillmore, Eugenio Rojas y Jorge Sep ulveda 06 de mayo de 2008
Tiempo Total: 150 minutos. Puntaje Total: 130 puntos.

1.

Comentes (5 puntos, m aximo 5 renglones)

1. La funci on de regresi on poblacional es el lugar geom etrico de las esperanzas condicionales para distintos valores de X . R. Verdadero. La funci on de regresi on poblacional es el lugar geom etrico de la esperanza condicional de y en X , luego es una funci on de X . En particular E (Y |X = x), para distintos valores de X = x. Si bien no se explicita en el texto si la esperanza es sobre y , se puede asumir dado que hablamos de una funci on de regresi on. 2. Si tenemos dos estimadores de un par ametro: uno sesgado y otro insesgado, elegiremos siempre el insesgado. R. Falso. Preferiremos aquel que tenga un menor error cuadr atico medio. 3. Si tenemos dos columnas de la matriz X linealmente dependientes el estimador MCO de es igual a cero. R. Falso. El estimador MCO de no existe puesto que X X no tiene inversa si dos columnas de X son linealmente dependientes. 4. Cuando tenemos hip otesis lineales del tipo R = r, si q = 1 podemos usar un simple test t. R. Verdadero. Cuando q = 1, podemos escribir un test t teniendo cuida. do en incorporar las covarianzas en el c alculo del error est andar de R Adem as, para un est adistico que sigue una F con (1,n-k) grados de libertad, su ra z cuadrada sigue una t-student con n k grados de libertad. 1

5. La varianza del error de predicci on en el modelo de regresi on lineal aumenta a medida que aumenta el valor de x. R. Verdadero/depende. Como se pudo apreciar en la clase 11, la varianza del error de predicci on depende de una forma cuadr atica de X y como se vio en el gr aco, el intervalo de conanza aumenta con x siempre y cuando estemos a la derecha de x. La varianza tambi en aumenta si nos movemos a la izquierda de x. Es por ello que la menor varianza (luego el intervalo de conanza m as angosto) se logra en la media. 6. El m etodo de m axima verosimilitud y de m nimos cuadrados ordinarios son equivalentes en el caso del modelo de regresi on lineal puesto que arroja los mismos estimadores. R. Falso. En el caso en que los residuos sean independientes e id enticamente distribuidos con funci on de densidad de probabilidad normal, el estimador MV de y el estimador MCO de son num ericamente equivalentes (no as el de 2 ) pero los m etodos no son equivalentes. El m etodo de MV permite testear hip otesis no lineales y es invariante a transformaciones y no as el m etodo de MCO.

2.

Preguntas de Desarrollo

1. (50 puntos) Sea el modelo de regresi on con k variables Y = X + u, donde Y es un vector de n 1, X una matriz de n k , un vector de k 1 y u un vector de n 1. Suponga que se cumplen los supuestos vistos en clases y en especial E (u|X ) = 0. Sea xi la i- esima columna de la matriz n X y suponga que m=1 xim xjm = 0 para todo i = j , es decir que las columnas son ortogonales. a) Si la primera columna de X es un vector de unos, qu e implica el supuesto de ortogonalidad de las columnas de la matriz X ? Ayuda: analice algunos elementos de X X . (10 puntos) R. Si la primera columna es un vector de unos, y usando el supuesto n de ortogonalidad tenemos que m=1 xjm = 0 para todo j = 2, .., k lo que implica que las medias son ceros para todas las variables. b) Demuestre que el estimador MCO de 1 , ..., k es equivalente a estimar por MCO el modelo de UNA variable, es decir y = i xi + u para cada i = 1, .., k . (20 puntos) R El estimador MCO de 1 , ..., k est a dado por la f ormula usual: = (X X )1 X Y

Dado que m=1 xjm = 0, tenemos que todos los elementos fuera de la diagonal de X X son ceros (recuerde que la multiplicaci on es la por columna). As , n 0 . . . 0 0 0 x2 0 2,i . .. . . . . . . 0 0 0 0 . . . x2 k,i

y adem as

X X =

Usando el hecho que la inversa de una matriz diagonal A con elemento aii es diagonal con elemento 1/aii tenemos que
P yi P n x2,i yi P 2 x2,i

yi x2,i yi X Y = . . . xk,i yi

Ahora, si se estima separadamente el modelo de UNA variable, es decir y = i xi + u para cada i = 1, .., k , es f acil notar que, m n
i j

. . .

P x yi P k,i x2 k,i

(yj i xi,j )2
j

obtenemos i = incluso para i = 1 puesto que


j

xi,j yj
j

x2 i,j
j

x2 1,j =
j

12 = n, luego

i =

yi

c) Suponga que Ud. dispone de la informaci on dada en el Cuadro 1 y adicionalmente Ud. sabe que u 2 = 2 ,5. Usando algebra matrii cial obtenga X X y X Y . Obtenga los estimadores de 1 , 2 , 3 . (10 puntos) R. Como sabemos, debemos multiplicar la por columna, luego 3

Cuadro 1: Datos x1 x2 x3 y 1 1 -2 1 1 -1 1 -2 1 -1 -1 1 1 1 2 0 1 0 0 0

1 1 X X = 1 1 2 1 y

1 1 1 1 1 0 1 2 0

1 1 1 1 1

1 2 1 1 5 0 1 1 = 1 2 0 0 0 1 2 1 0 0

0 0 4 0 0 10

1 1 X Y = 1 1 2 1 y nalmente

1 1 1 1 1 0 1 2 0

0 = 2 5

d) Usando los resultados obtenidos en c), testee la siguiente hip otesis al 5% H0 : HA : 1 + 3 2 1 + 3 2 = 4 0 4 0

1/5 0 0 0 0 = 0 1/4 0 2 = 0,5 0 0 1/10 5 0,5

Indicaci on: escriba la hip otesis de la manera R = r y utilice el test F visto en clases cuya f ormula est a dada por (R r) [R(X X )1 R ]1 (R r)/q u u /(n k )

(10 puntos)

R. Escribamos la matriz R 1 0 0 1 r, y R r = R 1 + 3 4 2 = 9/2 1/2 1 0

ahora, escribamos R(X X )1 R R(X X )1 R = 1/5 0 0 1/4 0 0 1 1/5 0 1/10 0 0 1/4 0 1 1 0 0 1 1 0 0 1 0 0 0 1 1/10 1 0 0 1 0

= = luego

3/10 0 0 1/4

[R(X X )1 R ]1 = y as ,

10/3 0 0 4

(R r) [R(X X )1 R ]1 (R r)

= = =

9/2 1/2 90/6 2

10/3 0 0 4 9/2 1/2

9/2 1/2

810/12 + 1 = 68,5

y nalmente, 68,5/2 (R r) [R(X X )1 R ]1 (R r)/q = = 27,4 u u /(n k ) 2,5/2


5% el valor cr tico de una F(2 otesis nula. ,2) = 19, luego se rechaza la hip

2. (50 puntos) Suponga el modelo de regresi on lineal yi = 1 + 2 x2,i + ui donde ui is independiente e id enticamente (i.i.d.) con funci on distribuido u2 /22 2 i de densidad de probabilidad f (ui ) = (1/ 2 )e . Asuma que las xs son no estoc asticas y note que x1,i = 1 para todo i. 5

a) Escriba el logaritmo de la funci on del verosimiltud l(1 , 2 , 2 ; y, x). (9 puntos) R. El log de la funci on de verosimilitud para una observaci on es 1 1 (yi 1 2 xi )2 li (1 , 2 , 2 ) = ln(2 ) ln( 2 ) 2 2 2 2 luego el logaritmo de la funci on de verosimilitud es la suma, l(1 , 2 , 2 ) = n n ln(2 ) ln( 2 ) 2 2 (yi 1 2 xi )2 2 2

b) Encuentre el Score. (9 puntos) R. El Score es el vector de derivadas con los siguientes componentes l 1 l 2 l 2 (yi 1 2 xi ) 2 (yi 1 2 xi )xi = 2 n 1 = 2+ 4 (yi 1 2 xi )2 2 2 =

c) Encuentre el estimador MV de 1 , 2 y 2 . (9 puntos) R. Igualando a cero el Score obtenemos los estimadores MV 1 2 2 = = = 2 x y yi xi y xi nx2 x2 i 2 xi )2 (yi 1 n

d) Suponga que Ud. dispone de la informaci on dada en el Cuadro 2. Obtenga el estimador MV de 1 y 2 . [Puede usar los resultados de ortogonalidad] (9 puntos) R. Usando el resultado del problema 1) parte b) y el hecho que el Cuadro 2 tiene exactamente los mismos valores para x1 , x2 e y , sabemos que 1 2 6 = 0 = 0,5

e) Suponga que se quiere testear la siguiente hip otesis: H0 : 1 = f (2 ) y se estima el modelo restringido obteniendo la siguiente suma de errores al cuadrado: n 2 as Ud. conoce la suma de r,i = 10. Adem i=1 u n los errores al cuadrado del modelo sin restricciones i=1 u 2 nr,i = 5. Demuestre que
n n

LR = n ln(
i=1

u 2 r,i ) ln(

u 2 nr,i )
i=1

Realice el test de LR al 5 % usando el valor cr tico de una 2 con un grado de libertad (3.84). (14 puntos). R. Como vimos en clases
2 nr,1 , nr,2 , r,1 , r,2 , LR = 2[l( 2 ) l( r )]

Ahora, el logaritmo de la funci on de verosimilitud evaluada en el estimador no restringido y restringido est a dada por nr,1 , nr,2 , l( 2) =
2 r,1 , r,2 , l( r )=

n n ln(2 ) ln 2 2

u 2 nr,i n u 2 r,i n

n 2

n 2

n n ln(2 ) ln 2 2

donde en el tercer t ermino del log de la funci on de verosimilitud viene de reemplazar el estimador de 2 para los dos casos. En el segundo t ermino se reemplaza el estimador de 2 por la suma de los errores al cuadrado en ambos casos. As ,
n n

LR = n ln
i=1

u 2 r,i

ln

u 2 nr,i
i=1

Evaluando la expresi on tenemos que, LR = 5[ln(10) ln(5)] = 3,46

se aprecia que el estad stico LR=3.46 es menor que 2 5 % (1) = 3,84, luego no se rechaza la hip otesis nula H0 : 1 = f (2 ). Como vimos, MV permite testear hip otesis no lineales de una manera relativamente sencilla.

Cuadro 2: Datos x1 x2 y 1 1 1 1 -1 -2 1 -1 1 1 1 0 1 0 0

Cuadro 3: Valores Cr ticos para la F al 5 % df num/df den 1 2 3 4 5 2 18.51 19 19.16 19.25 19.3 3 10.13 9.55 9.28 9.12 9.01 4 7.71 6.94 6.59 6.39 6.26 5 6.61 5.79 5.41 5.19 5.05

EXMENES

Econometra I Profesores: J.M. Benavente, A. Otero y J. Vsquez. Primavera 2004 Examen Final

Nombre: Rut:

........................................................................................... .......................................

Ud. Dispone de 120 minutos para resolver el examen, no puede hacer consultas a los ayudantes, no puede tener nada ms que lpiz en su escritorio, si contesta con lpiz mina no tiene derecho a reclamo.

1.

Comentes
( 35 puntos)Debe responder 5 de los siguientes 8 comentes. Debe justicar sus respuestas

Comente 1: ( 7 puntos) La omisin de una variable relevante siempre siempre sesga la estimacin MCO de . Comente. Falso, el sesgo que se produce en el parmetro depende de la covarianza entre la variables explicativas y la omitida, y el valor poblacional de la variable omitida. ) = 1 + En un modelo de regresin simple: E ( Si cov (x1 , x2 ) = 0 no existe sesgo, Si omitida = 0 no existe sesgo. Comente 2: (7 puntos) La presencia de errores no esfricos implica que la estimacin de la varianza MCO de V ( ) estar sesgada. Comente. )mco = El estimador de MCO de la varianza era var ( 2 (x x)1 , sin embargo, en presencia de errores no esfricos y estimando por MCO, la varianza de que obtenemos es: 2 (x x)1 (x x)(x x)1 , dado que es una matriz denida positiva, siempre se cumple que: )mco = var ( 2 (x x)1 > 2 (x x)1 (x x)(x x)1 Donde (x x)(x x)1 corresponde al sesgo (> 1). Comente 3: ( 7 puntos) Un estadstico de Durbin-Watson de 4 signica inequivocamente una presencia de autocorrelacin positiva. Comente. La hiptesis nula de este estadstico es: Ho : = 0 (no hay autocorrelacin), dado que 1
cov (x1 ,x2 ) var (x1 ) omitida

Dw = 2(1 ) podemos apreciar que cuando = 1 signica que Dw = 4. De esta forma si se rechaza Ho : = 0, porque Dw = 4, es en favor de la hiptesis alternativa de autocorrelacin negativa. Falso, inequivocamente hay autocorrelacin negativa. Comente 4: ( 7 puntos) Un sntoma de la existencia de multicolinealidad es la presencia de un R2 ajustado alto . Comente. El sntoma corresponde no simplemente a la observacin de un R2 alto, sino que adems acompaado por estadsticos t que nos hacen concluir que los parmetros no son signicativos (t bajos). Esto porque en presencia de multicolinealidades, las varianzas de los estimadores son altas, pues (x x) es cercano a cero. Lo que resulta en estadsticos t pequeos. Comente 5: ( 7 puntos) La estimacin por Mxima Verosimilitud es MELI. Comente. Falso, el estimador MELI es el de MCO. El estimador MV es asintonticamente ms eciente ya que alcanza la cota de Cramer-Rao, aun cuando en muestras nitas puede ser sesgado. Bajo el supuesto de normalidad,el estimador MV y MCO de coinciden. Sin embargo, dieren en la estimacin de sus varianzas, ya que la varianza de MV es sesgada. De esta forma, MV es el mejor estimador pero en muestras grandes (Cramer-Rao). Comente 6: ( 7 puntos) Si los errores del modelo de regresin lineal no tienen distribucin normal, a pesar de que los estimadores OLS ya no son MELI siguen siendo insesgados. Comente. La propiedad de Meli no requiere de un supuesto especco de la distribucin de los errores, simplemente requiere que stas sean iid. Bajo independencia e idntica distribucin (cualquiera sea), MCO ser MELI. Comente 7: ( 7 puntos) La inclusin de variables independientes rezagadas no trae consecuencias de sesgo ni de eciencia en las estimaciones MCO . Comente. Verdadero, cuando se incluyen rezagos de la variable dependiente MCO pierde la propiedad de insesgamiento, pero sigue siendo consistente. Sin embrago, si asumimos jo los regresores (variables independientes), sus rezagos tambin los sern y por lo tanto, no se produce ningn problema con las propiedades de MCO. El nico peligro es que se puede generar un problema de multicolinealidad. Comente 8: ( 7 puntos) La utilizacin de la matriz de White permite corregir el problema de heterocedasticidad sin saber a priori la especicacin de esta. Comente. Falso, la estimacin de White no corrige la heterocedasticidad, sino que permite obtener un estimador consistente de la matriz de varianzas y covarianzas con heterocedasticidad, y de esta forma, poder realizar la inferencia. Efectivamente, esto se puede hacer sin conocer el patrn de heterocedasticidad. Pero no se corrige la heterocedasticidad.

2.

Demostraciones
( 40 puntos) Debe responder 2 de las siguientes 4 demostraciones.

Pregunta 1: ( 20 puntos) Demuestre que el R2 ajustado es menor que el R2 . Respuesta: u u Y MY

R2 = 1

(1)

2 = 1 R Reemplazando (1) en (2):

u u /(n k ) Y M Y /(n 1)

(2)

2 2 = 1 (1 R2 ) (n 1) = (n k ) (1 R )(n 1) R (n k ) (n k )

2 = (n k ) (1 R2 )(n 1) = (1 k ) + R2 (n 1) (n k )R 2 = (1 k ) + R2 (n 1) R (n k ) (n k ) 2 = 0 + R2 = R2 , por ende son iguales. Para K = 1, R 2 = () + R2 (< 1) R 2 < R2 Para K > 1, R

Pregunta 2: ( 20 puntos) Considerando el siguiente modelo de regresin lineal con error de medicin en la variable explicativa

Yi = Xi + ui
= Xi + ei En donde Xi

ui N (0, 2 )

Demuestre que el estimador por variables instrumentales se puede escribir como V I = = X )1 X y (X [X Z (Z Z )1 Z X ]1 X Z (Z Z )1 Z y (3)

Respuesta:
Modelo verdadero: Yi = Xi + ui , se observa: Xi = Xi + ei Como Xi est medida con error, se puede utilizar el instrumento Z. Para obtener el estimador de variables instrumentales hago un estimador en dos etapas: : y Zi , para obtener X Primera etapa: regresin entre Xi i Xi = Zi + vi

= (Z Z )1 Z X = Z (Z Z )1 Z X X

del modelo original. Segunda etapa: regresin entre Y y X + ui Yi = X i V I = (X X )1 X Y V I en funcin de Z. = Z (Z Z )1 Z X , podemos escribir Dado que X V I = (X Z (Z Z )1 Z Z (Z Z )1 Z X )1 X Z (Z Z )1 Z Y V I = (X Z (Z Z )1 Z X )1 X Z (Z Z )1 Z Y

Pregunta 3: ( 20 puntos) Considerando el siguiente modelo de regresin lineal

Yi = Xi + ui

ui N (0, 2 )

Demuestre que el estimador de MCO de es igual al estimador Mxima Verosimilitud de . Respuesta: Sea Y = X + U , para calcular MCo tenemos que: ) (Y X )] = m m n[(Y X n
N

u 2
i=1

Y + X X ] m n[Y Y 2X

=0 M CO = (X X )1 X Y = 0 2X Y + 2X X

MV: bajo el supuesto de u N (0, 2 ), la verosimilitud es: L=


(Y X ) (Y X ) 1 2 2 e (2 2 ) n 2

ln(L) = l = ln(2) ln( 2 ) ln

n (Y X ) (Y X ) 2 2 2

l 1 M V = (X X )1 X Y = 2 2(Y X )(X ) = 0 2 Maximizar l con respecto a es lo mismo que minimizar (Y X ) (Y X ). Para ambos casos se resuelve igual problema, por lo que el estimador resultante es anlogo en ambas estimaciones.

Pregunta 4: ( 20 puntos) Demuestre que la inclusin de variables irrelevantes disminuye la eciencia de las estimaciones MCO. Respuestas: Modelo correcto: Y = X1 1 + u Modelo incorrecto: Y = X1 1 + X2 2 + u Recordando la regresin particionada: el estimador de 1 del modelo incorrecto es: 1 = (X M2 X1 )1 X M2 Y 1 1 Donde M2 = I X2 (X2 X2 )1 X2 1 = (X M2 X1 )1 X M2 (X1 1 + u) = 1 + (X M2 X1 )1 X M2 u 1 1 1 1 1 ) = 1 + (X M2 X1 )1 X M2 E (u) E ( 1 1 1 ) = 1 Como E (u) = 0 E ( Respecto a la varianza: 1 ) = E [( 1 E ( 1 ))( 1 E ( 1 )) ] V ( = E [(X1 M2 X1 )1 X1 M2 uu M2 X1 (X1 M2 X1 )1 ] Como M2 es idempotente y simtrica. 1 ) = 2 (X M2 X1 )1 X M2 X1 (X M2 X1 )1 V ( 1 1 1 = 2 (X1 M2 X1 )1 La varianza verdadera (estimando el el modelo correcto) sera: 1 ) = 2 (X X )1 V ( 1 )]1 [V ( 1 )]1 = 1 (X X1 ) 1 (X M2 X1 ) [V ( 2 1 2 1 1 = 2 X1 [I M2 ]X1 1 = 2 X1 X2 (X2 X2 )1 X2 X1 Donde esta ltima es una matriz semidenida positiva 1 )]1 > [V ( 1 )]1 [V ( 1 )] < [V ( 1 )] [V ( 6

3.

Pregunta Obligatoria
( 45 puntos)

Suponga que un amigo de usted esta interesado en estimar el retorno a la educacin utilizando una encuesta de corte transversal, pero no esta muy seguro de los resultados obtenidos. El modelo que su amigo estim es el siguiente.

Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + ui En donde Wi corresponde al logaritmo natural del salario del individuo i , Dsexoi es una variable dicotmica que toma el valor de 1 si el individuo i es hombre, Esci corresponde a los aos de educacin del individuo i, Expei corresponden a los aos de experiencia construida mediante la proxy Expei = Edad Esci 6. Los resultados obtenidos de su estimacin son los siguientes.

Dependent Variable: W Method: Least Squares Included observations: 4021 after adjustments W=C(1)+C(2)*DSEXO+C(3)*ESC+ C(4)*EXPE Coefficient C(1) C(2) C(3) C(4) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 10.16332 0.347502 0.123967 0.012138 0.302890 0.302369 0.701184 1974.992 -4276.154 Std. Error 0.061402 0.034635 0.003168 0.000964 t-Statistic 165.5208 10.03325 12.58711 Prob. 0.0000 0.0000 0.0000 11.89096 0.839496 2.128900 2.135167

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

1. (5 puntos) Interprete el parmetro 3 . Es signicativo?. Cunto aumenta en promedio Wi ante un cambio porcentual de 1 % de los aos de educacin? (Esc) = 9). Respuesta: 3 representa el retorno a la educacin, mide el impacto marginal de un ao de educacin sobre el ingreso. 3 = lnWi %W i = ESCi ESCi

Mide en cuanto cambia en trminos porcentuales el ingreso, frente a un aumento en un 7

ao de educacin. Como t =
0,123967 0,003168

= 39,13, (n k ) = 4021 4 = 4017 y, adems, t4017,95 % = 1,96

Esto implica que tc > tt se rechaza Ho : 3 = 0 3 es estadsticamente signicativo. A su vez, como: %Wi = 3 %ESCESC = 0,123967 0,01 9 = 0,01115703 = 1,11 % 2. (7 puntos) Si su amigo quisiera testear la hiptesis de que los hombres poseen un mayor retorno a la educacin superior. Qu especicacin le recomendara y como testeara la signicancia de esta hiptesis?. Respuesta:

Wi = 1 + 2 Dsexoi + 3 Esci + 4 Expei + 5 Dsexo ESCi + ui E [Wi /hombre] = 1 + 2 + 3 Esci + 4 Expei + 5 ESCi E [Wi /mujer] = 1 + 3 Esci + 4 Expei En el caso de los hombres el retorno a la educacin es: E [Wi /hombre] = 3 + 5 ESC Para la mujeres: E [Wi /mujer] = 3 ESC Entonces para testear la hiptesis de que los hombres tienen mayor retorno a la educacin, habra que ver la signicancia de 5 en la especicacin anterior (Ho : 5 = 0). 3. (7 puntos) Suponga que el investigador omite en la estimacin la variable Expei . Cules son los efectos en la estimacin del retorno a la educacin.(Cov(Expei , Esci ) = 51,04) Respuesta: 3 = 3 + cov (Expe, ESC ) 4 V (ECS ) 51,04 = 3 0,012138 V (ESC ) 8

Dado que si incluyramos la variable experiencia su coeciente sera positivo y dada la correlacin positiva entre EXP y ESC (por la forma en que la experiencia se construye); la omisin de la variable experiencia generara un sesgo hacia abajo en el parmetro del retorno a la educacin. 4. (7 puntos) Su amigo esta preocupado por la posibilidad de que el modelo estimado presente heterocedasticidad. Sin embargo, no tiene muy claro los efectos de este problema y no sabe como tratarla. Cules seran tericamente los efectos sobre las estimaciones realizadas si existiera heterocedasticidad?. Explique detalladamente algn mtodo para testear su presencia. Ante el desconocimiento de la estructura de heterocedasticidad. Cul sera el consejo que le dara a su amigo?. Respuesta: La presencia de heterocedasticidad no genera problemas sobre la propiedad de insesgamiento del estimador de MCO, pero si sobre su eciencia. Si se conoce el patrn de heterocedasticidad o se puede estimar, el estimador eciente es el de MCG o MCF respectivamente. Posibles test: White, G. y Quant, Breusch y Pagan y Glesjer (en apunte est descrito). Si se desconoce el patrn de heterocedasticidad y es difcil de estimar, lo mejor es obtener una estimacin consistente de la matriz de varianzas y covarianzas por el mtodo de White, lo que me permite realizar la inferencia de forma correcta. 5. (7 puntos) Suponga que la varianza de los errores est dada por V (u) = 2 Expei . Como estimara el modelo? Qu resultados esperara en comparacin a los resultados obtenidos en la estimacin?. Respuesta: Si conozco el patrn de Expe1 0 0 0 Expe 0 2 0 0 . 0 0 0 0 0 0 0 0 0
2 heterocedasticidad : i = 2 Expei , puedo componer la matriz : . . 0 . . 0 0 . 0 . 0 . 0 . . . . Expen

Y estimar ecientemente mediante el mtodo de mnimos cuadrados generalizados: M CG = (X 1 X )1 X 1 Y Lo que es equivalente a aplicar MCO a un modelo transformado, cuya transformacin consiste en dividir cada observacin de variable dependientes y explicativas por Expei . 6. (7 puntos) Su amigo esta preocupado, adems, por la posibilidad de que el modelo estimado presente autocorrelacin. Sin embargo, no tiene muy claro, nuevamente, los efectos de este problema y no sabe como tratarla. Cules seran tericamente los efectos sobre las estimaciones realizadas si existiera autocorrelacin?. Su amigo le proporciona adems los resultados de una estimacin de un proceso AR(1) para los residuos de la regresin original. Construya el estadstico Durwin-Watson y testee la presencia de autocorrelacin. Explique intuitivamente por qu este modelo arroja estos resultados. 9

Dependent Variable: RESID01 Method: Least Squares Date: 12/01/04 Time: 12:27 Sample (adjusted): 6 6499 Included observations: 2480 after adjustments RESID01=C(1)*RESID01(-1) Coefficient C(1) 0.0085142 Std. Error 0.020 t-Statistic 0.4208 Prob. 0.673

Respuesta: La autocorrelacin al igual que la heterocedasticidad, no tiene impactos sobre el insesgamiento, pero si sobre la eciencia de estimador de MCO. Un posible test es el Durbin-Watson (hay otros, ver apuntes) Si se desconoce el patrn de autocorrelacin y no es posible estimarlo ecientemente, se puede utilizar la estimacin consistente de la matriz de varianzas y covarianzas utilizando el mtodo de Newey and West, para realizar la inferencia. Si ocupamos DW tenemos que : DW = 2(1 ) = 2(1 0,0085142) = 1,98 Con lo que se rechaza la hiptesis nula de autocorrelacin. El modelo arroja estos resultados, pues es un modelo de corte transversal donde es muy extrao encontrar autocorrelacin entre individuos, recordar que la autocorrelacin es un problema comn de series de tiempo. 7. (5 puntos) Como se mencion en el enunciado la variable experiencia se construy como Expei = Edad Esci 6. Qu consecuencias puede acarrear esta especicacin de la variable experiencia?. Explique detalladamente. Respuesta: Como la variable experiencia es construida a partir de otra variable explicativa (ESC), esto genera un gran grado de asociacin entre dos variables explicativas del modelo o multicolinealidad.

10

Econometra I Profesora: Javiera Vsquez. Verano 2005 Examen Comente 1: (10 puntos) Ud. posee informacin de la estimacin de los siguientes modelos: Modelo (1) yi = 0 + 1 x1,i + 2 x2,i + ui (2) yi = 0 + 1 x1,i + 3 x3,i + ui R2 0.96 0.85 Akaike 2.15 2.10 Schwarz 3.19 2.98

De acuerdo a esta informacin me debera quedar con el modelo (2). Comente. Falso, de acuerdo a la informacin reportada me debera quedar con el modelo (1) que es el que tiene un mayor R2 . Si bien el modelo (2) tiene menores criterios de informacin que el (1), estos modelos no son comparables utilizando los criterios de informacin ya que no son modelos anidados. Comente 2: (10 puntos) El R2 mide la proporcin de la varianza de la variable dependiente que es explicada por la varianza de las variables explicativas, de esta forma, siempre es un nmero que esta entre 0 y 1. Comente. Depende, cuando el modelo de regresin incluye un trmino constante, se cumple que: ST = SR + SE , lo que se conoce como la descomposicin de varianza, lo que garantiza que el R2 sea siempre positivo. Sin embargo, si el modelo no incluye constante, no se cumple la ecuacin anterior de descomposicin de varianza y el R2 puede tomar valores negativos, pero sigue siendo siempre menor a 1. Comente 3: (10 puntos) La omisin de una variable relevante siempre sesga la estimacin MCO de . Comente. Falso, la omisin de una variable relevante siempre produce sesgo en los parmetros a menos que la correlacin entre la variable omitida y las explicativas incluidas sea cero, el signo del sesgo depende de dos cosas: la correlacin entre la variable omitida y las variables explicativas incluidas y el valor del parmetro que tendra asociado la variable omitida (valor poblacional). Para un modelo sencillo con una variable explicativa (x1 ) y una variable omitida (x2 ) se mostr (x1 ,x2 ) en clases que el sesgo es: cov V (x1 ) 2 . Comente 4: (10 puntos) Si el estadstico Durbin-Watson (DW) tomo el valor de 2, estamos seguros que no existe autocorrelacin en nuestro modelo. Comente. Si el estadstico Durbin-Watson toma valor de 2, el coeciente de correlacin asociado a este valor del estadstico es de 0. Recordar que DW 2(1 ), de esta forma si DW es 2 implica que = 0. Sin embargo, como la hiptesis nula es de no autocorrelacin en los errores, a pesar de que con este valor del estadstico no puede rechazar la nula, no signica que pueda aceptar que no existe autocorrelacin. Adems este test slo sirve para testear autocorrelacin de primer orden, entonces a pesar de que no se puede rechazar la hiptesis nula de autocorrelacin de este tipo, puede existir autocorrelacin de un orden superior. El comente es Falso. 1

Pregunta 1: (15 puntos) Considere la siguiente funcin de densidad condicional f (y |x) = ey (y )x x! y 0, 0

Obtenga el estimador de mxima verosimilitud de . Respuesta Pregunta 1: Para cada observacin i se tiene la siguiente densidad: f (yi |xi , ) = eyi (yi )xi xi !

La verosimilitud asociada a cada observacin i es: li (|yi , xi ) = = ln eyi (yi )xi xi ! ln yi + xi (ln + ln yi ) ln(xi !)

(1)

De esta forma, aplicando sumatoria a la ecuacin (1) obtengo la verosimilitud conjunta:


n n n n

L(|y, x) = n ln
i=1

yi + ln
i=1

xi +
i=1

xi ln yi
i=1

ln(xi !)

(2)

Maximizando (2) con respecto a obtenemos el estimador Mximo Verosmil: L n = yi + i=1 n


n n n i=1

xi

= 0 = 0 = = n+ 1+x y
n i=1

yi +
i=1 i=1

xi

n i=1

xi

yi

Pregunta 2: (15 puntos) En el siguiente modelo de regresin lineal simple: yi = xi + ui


iid

i = 1, ..., n

donde xi esta medida con error, de forma tal que slo accedemos a la variable x i = xi + i ,
2 con i (0, ). Demuestre que el estimador de variables instrumentales, es un estimador consistente.

Respuesta Pregunta 2: El estimador de variables instrumentales en este caso es: V I =


n i=1 zi yi n i=1 zi xi

Entonces, reemplazando yi por su versin poblacional yi = xi + ui : V I =


n i=1 zi (xi + n i=1 zi xi

ui )

Ahora sumando y restando i a la expresin entre parntesis y operando: V I =


n i=1 zi (xi

+ ui + i i ) n i=1 zi xi
x i i

V I V I V I V I

= = = =

n i=1 zi ( (xi

n i=1 zi (xi + i ) n i=1 zi xi n i=1 zi i + n i=1 zi xi n i=1 zi i /n + n i=1 zi xi /n

+ i ) + n i=1 zi xi

ui i )

Aplicando plim a la expresin anterior: V I plim = plim + plim plim


n i=1 zi i /n n i=1 zi xi /n

=0

V I plim V I plim

E (zi i ) E (zi x i)
=0

Para que z sea un instrumento vlido debe cumplir con que E (zi i ) = 0 y E (zi x i ) = 0, con lo cual se demuestra que el estimador de variable instrumentales es consistente.

Pregunta 3: (15 puntos) Considere el siguiente modelo: yt = C (1) + C (2)xt + C (3)yt1 + ut Del cual se obtiene el siguiente output en Eviews:
Dependent Variable: Y Method: Least Squares Date: 01/21/05 Time: 23:31 Sample (adjusted): 1976 2003 Included observations: 28 after adjustments Y=C(1)+C(2)*X+C(3)*Y(-1) Coefficient C(1) C(2) C(3) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 1.021150 0.271875 0.712607 0.987964 0.987001 1.975875 97.60204 -57.21199 Std. Error 1.074276 0.138389 0.143427 t-Statistic 0.950547 1.964572 4.968432 Prob. 0.3509 0.0607 0.0000 32.68142 17.33004 4.300857 4.443593 1.572226

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Testee la existencia de autocorrelacin en los errores. Respuesta Pregunta 3: Como el modelo incluye la variable dependiente rezagada como regresor, no se puede utilizar el test de Durbin-Watson. Se tiene que utilizar el siguiente test h-Durbin: h= 1 DW 2 n 2 N (0, 1) 1 n

Utilizando la informacin de la tabla anterior: DW 1.572226 De esta forma, h= 1 1,572226 2 28 = 1,738115749 1 28 (0,143427)2 n 28
2 (0,143427)2

El valor de tabla de la distribucin normal estndar a un 95 % de conanza es 1.960 y a un 90 % de conanza es 1.645, entonces a un 5 % de signicancia no se puede rechazar la nula de no autocorrelacin en los errores, sin embargo a un 10 % de signicancia se rechaza la hiptesis nula. Tambin podemos calcular el p-value: (1,738115749) = 0,9582 p = 2[1 (1,738115749)] = 0,0836

Pregunta 4: (20 puntos) Suponga que Ud. tiene que estimar el siguiente modelo: yi = 1 x1,i + 2 x2,i + ui De la cual obtiene los siguientes resultados: = 0,5 0,4 XX= 10 8 8 10 ) = ( V 0, 7 0,56 0,56 0,7 V (y ) = 25,2 con i = 1, ..., 102.

a) Realice los test de signicancia para cada uno de los parmetros. b) Determine el nmero de condicin de la matriz X, para ver la presencia de colinealidad entre las variables explicativas. Respuesta Pregunta 4: (a) Test de signicancia de 1 : 0,5 = 0,59 tt = t100 1,98 tc = 0,7 No se puede rechazar la hiptesis nula de que 1 sea 0, el parmetro no es estadsticamente signicativo. Test de signicancia de 2 : 0,4 tc = = 0,47 tt = t100 1,98 0,7 No se puede rechazar la hiptesis nula de que 2 sea 0, el parmetro no es estadsticamente signicativo. (b) El nmero de condicin de la matriz X, se obtiene con el siguiente coeciente de Belsley: = max min

donde max y min son los valores propios de la matriz B=S(XX)S. En esta caso la matriz (XX) contiene los elementos necesiarios para construir la matriz S: XX= De esta forma, B = S (X X )S B = =
1 10 n 2 i=1 x1i n i=1 x2i x1i n i=1 x1i x2i n 2 i=1 x2i

10 8

8 10

0
1 10 8 10

10 8 8 10

1 10

0
1 10

1
8 10

Continuacin Respuesta Pregunta 4: Ahora debemos obtener los valores propios de la matriz B , para cual debemos resolver el siguiente sistema de ecuaciones: |B I | 0 0 1 8 10
2 8 10

1
8 10

8 10

1
8 10

= 0 = 0 = 0 8 10

(1 )2

(1 ) = (1 1 ) = (1 2 ) =

8 2 1 = 10 10 8 18 2 = 10 10

De esta forma podemos construir el coeciente de Belsley (recordar que un nmero mayor a 25 sugiere la presencia de multicolinealidad): =
18 10 2 10

18 = 9=3 2

No existe evidencia de presencia de multicolinealidad entre las variables explicativas de este modelo.

Pregunta 5: (20 puntos) Dado el modelo de regresin: yi = + i donde E (i ) = 0 y


2 2 V (i ) = xi

(a) Encuentre el estimador MELI de . (b) Encuentre el estimador de la varianza de . Respuesta Pregunta 5: (a) El estimador eciente de es el estimador MCG (ya que conozco la matriz o el patrn de Heterocedasticidad. 2 x1 0 0 0 x2 0 2 = . (3) . . . . . . . . . . . 0 De esta forma 1 es:
1 1 x2 1

. ..
1 x2 2

0 0 . . . 0

x2 n 0 0 . . .
1 x2 n

(4)

0 . . . 0

Adems como nuestro modelo incluye como variable explicativa slo la constante, nuestra matriz X es: 1 1 X= . (5) . . 1 De esta forma: 1 1 1 X 1 Y = 1 1 1
1 x2 1

. . ..
1 x2 2

X 1 X =

0 . . . 0

..

1 x2 2

0 . . . 0 0 . . . 0
1

0 0 . . .
1 x2 n

1 1 . . . 1 y1 y2 . . . yT

=
T t=1

1 x2 t

(6)

1 x2 1

0 . . . 0

0 0 . . .
1 x2 n

=
T t=1

yt x2 t

(7)

M CG = (X

X)

(X

Y)=

T t=1 T t=1

yt x2 t 1 x2 t

(b) El estimador de la varianza de es:


2 ( V M CG ) = (X 1 X )1 = 2 T 1 t=1 x2 t

Econometra I Profesores: Andrs Otero Javiera Vsquez. Otoo 2005 Pauta Examen

Parte I: Comentes (30 puntos) (Contestar slo en las lneas disponible)


Pregunta 1: (5 puntos) Si en un modelo de regresin de la forma: Yt = Xt + ut el estadstico Durbin-Watson nos indica presencia de autocorrelacin, bastar con incluir la variable dependiente rezagada un periodo (Yt1 ) como regresor para solucionar denitivamente el problema. Comente. Falso, la autocorrelacin puede ser provocada por dos cosas: si la variable dependiente tiene una tendencia y esta no esta siendo capturada por las variables explicativas y por un patrn dinmico omitido. En el primer caso incluir la variable Yt1 como regresor no soluciona el problema, en el segundo caso puede que al incluir un rezago de la variable dependiente se solucione el problema de autocorrelacin si es que esta es de orden 1, pero si la autocorrelacin es de un orden superior habr que incluir ms rezagos de la variable dependiente como regresor. Pregunta 2: (5 puntos) El problema de error de medicin no es preocupante, ya que slo genera inconsistencia en el estimador MCO de la variable que esta medida con error. Comente. Falso, se puede demostrar que: plim M CO = [xx + ]1

(No es necesario poner esta ecuacin). Es decir, cuando existe error de medida, basta con que slo una de las variables explicativas este medida con error para generar inconsistencia en todos los parmetros estimados por MCO. Basta con la la matriz W tenga una de sus columnas distinta de cero, para que sea distinta de cero y se genere la inconsistencia. Esto porque una variable explicativa con error contamina toda la matriz (X X ). Pregunta 3: (5 puntos) Una de las variables macroeconmicas ms estudiadas empricamente ha sido la tasa de inters real(r). Suponga que usted esta interesado en estimar cuales son las variables que explican el comportamiento de la tasa de inters real. Sin embargo, no dispone de esta serie. Frente a este problema un amigo de usted, gentilmente, le ha ofrecido ayuda. Su amigo le propone construir la tasa de inters real mediante la identidad de Fischer, la cual dene a la tasa de inters real como la diferencia entre la tasa de inters nominal y las expectativas de inacin r = i e .Donde i corresponde a la tasa de inters nominal y e a las expectativas de inacin. A partir de esto le ha aconsejado estimar el siguiente modelo

rt = 0 + 1 i + 2 e + Xt +

Donde X es un conjunto de k 3 variables explicativas tales como tipo de cambio nominal, oferta monetaria, tasa de inters externa y otros. Y es un error bien comportado. 1

Qu le dira a su amigo acerca de la especicacin propuesta? Cmo esperara que fuera el ajuste del modelo y la signicancia de los parmetros.? Habra que decirle al amigo que esta cometiendo un importante error y que es mejor que revise los libros de econometra de nuevo. El esta proponiendo correr una regresin para una ecuacin contable, por lo que por denicin el modelo tendr un buen ajuste y los parmetros sern signicativos. La causalidad de la tasa de inters nominal y las expectativas de inacin sobre la tasa de inters real que se esta tratando de estudiar esta dada por denicin dada la forma en que se construy esta ltima. Pregunta 4: (5 puntos) Es sabido que la presencia de heterocedasticidad arroja problema de eciencia en las estimaciones. En este contexto el estimador Mnimos Cuadrados Generalizados Factibles ser el mejor estimado lineal insesgado. Por lo tanto, siempre es mejor implementar MCGF que la correccin consistente de White. La eciencia del estimador MCGF depende de la calidad de la estimacin del patrn de heterocedasticidad. Si esta estimacin es muy mala, por que por ejemplo no estamos seguro del patrn heterocedstico, podemos estar agregando ms problemas al modelo. Por lo tanto, en algunos escenarios es mejor utilizar el estimador consistente de White. Pregunta 5: (5 puntos) Un R2 alto siempre nos indica que nuestro modelo esta bien especicado. Comente. Falso, modelos con presencia de multicolinealidad pueden arrojar elevados R2 . Sin embargo, la estimacin de los parmetros del modelo ser ineciente arojando conclusiones errneas sobre la signicancia de los parmetros involucrados. Pregunta 6: (5 puntos) El estimador Mximo Verosmil es el ms eciente de todos los estimadores. Comente. Efectivamente, el estimador Mximo Verosmil es el ms eciente de todos los estimadores al alcanzar la cota inferior de Cramer-Rao, que es la mnima varianza asinttica que puede alcanzar cualquier estimador. Sin embargo, esta eciencia en slo en forma asinttica, en muestras pequeas el estimador ms eciente (Teorema de Gauss-Markov) es MCO (si se cumplen los supuestos). Por lo tanto, el comente es falso.

Parte II: Ejercicios (Contestar slo en el espacio disponible) Debe resolver obligatoriamente los siguientes cuatro ejercicios
Ejercicio 1: (15 puntos) Con datos de salario por hora y produccin por hora para Estados Unidos (1959-1998), se obtienen los siguientes resultados en Eviews:
120 110 100 90 80
Coefficient Std. Error 1.942347 0.024105 t-Statistic 15.19773 29.60658 Prob. 0.0000 0.0000 85.64500 12.95632 4.854881 4.939325 0.122904 Dependent Variable: SALARIO Method: Least Squares Date: 07/05/05 Time: 19:46 Sample: 1959 1998 Included observations: 40 SALARIO=C(1)+C(2)*PROD

70 60 50 40 1960 1965 1970 1975 1980 1985 1990 1995 salario por hora
C(1) C(2) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 29.51925 0.713659 0.958449 0.957356 2.675533 272.0220 -95.09761

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

produccion por hora

Breusch-Godfrey Serial Correlation LM Test: F-statistic Obs*R-squared 75.13900 32.26962 Probability Probability 0.000000 0.000000

Dependent Variable: SALARIO Method: Least Squares Date: 07/05/05 Time: 19:51 Sample: 1959 1998 Included observations: 40 SALARIO=C(1)+C(2)*PROD+C(3)*@TREND Coefficient Std. Error 13.59850 0.276476 0.420341 t-Statistic 0.042060 4.722620 -2.148822 Prob. 0.9667 0.0000 0.0383 85.64500 12.95632 4.787279 4.913945 0.204600

-2

C(1) C(2) C(3) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

0.571953 1.305693 -0.903238 0.963059 0.961063 2.556609 241.8413 -92.74559

-4
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

-6 1960 1965 1970 1975 1980 1985 1990 SALARIO Residuals 1995

Dependent Variable: ERRORES Method: Least Squares Date: 07/05/05 Time: 19:54 Sample (adjusted): 1960 1998 Included observations: 39 after adjustments ERRORES=C(4)*ERRORES(-1) Coefficient C(4) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 0.914245 0.873615 0.873615 0.910629 31.51134 -51.18093 Std. Error 0.056337 t-Statistic 16.22811 Prob. 0.0000 0.120615 2.561492 2.675945 2.718600 1.472987

Dependent Variable: DSALARIO Method: Least Squares Date: 07/05/05 Time: 19:57 Sample (adjusted): 1960 1998 Included observations: 39 after adjustments DSALARIO=C(5)+C(6)*DPROD Coefficient C(5) C(6) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 4.109836 0.528938 0.557983 0.546037 0.858069 27.24242 -48.34227 Std. Error 0.656965 0.077395 t-Statistic 6.255797 6.834267 Prob. 0.0000 0.0000 8.500412 1.273537 2.581655 2.666966 1.620598

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Qu puede concluir sobre el modelo estimado?. Sea bastante detallado y utilice las herramientas aprendidas en clases. Respuesta: 1. Se puede ver grcamente que tanto el salario por hora como la produccin por hora tienen un comportamiento tendencial, estos ya es un indicio de que podemos estar en presencia de autocorrelacin. (1 punto) 2. La estimacin del modelo: salario = 0 + 1 P rod tiene parmetros estadsticamente signicativos, con un R2 alto, nos muestra que por cada unidad adicional de produccin esto se reeja en un aumento de salario de 0.71 (1 punto), pero podemos ver que tenemos un problema de autocorrelacin, ya que el estadstico Durbin-Watson toma un valor de 0.12 con lo cual cae en la zona de rechazo de la nula de autocorrelacin en favor de la hiptesis alternativa de autocorrelacin positiva (3 puntos). Esto se conrma con el resultado del test de Breusch-Godfrey, ya que tiene un p-value de 0 %, lo que nos indica rechazo de la hiptesis nula de no autocorrelacin con 0 % de error tipo I (2 puntos); y con la inspeccin grca de los residuos del modelo, los que claramente tienen el comportamiento esperado bajo autocorrelacin positiva (rachas de valores por sobre la media seguidas de rachas de valores por debajo de la media) (2 puntos). 3. Como se menciono en un comienzo la autocorrelacin puede ser provocada por la tendencia de las variables, sin embargo, la estimacin que incluye una tendencia como variable explicativa muestra que a pesar de que esta es estadsticamente signicativa y que los criterios de informacin nos muestran que esta especicacin es mejor a la anterior, el problema de autocorrelacin sigue presente (DW=0.2) (2 puntos). 4. Si la tendencia no es slo lo que causa la autocorrelacin, debe ser porque adems existe un comportamiento dinmico omitido, el cual debera estar en el error. La estimacin de un proceso autorregresivo de primer orden para los errores muestra que efectivamente el error tiene un comportamiento dinmico, el coeciente de correlacin serial es de 0,9 y signicativo (1 punto). 5. Al transformar las variables en diferencias: DSalariot = Salariot 0,9 Salariot1 y DP rodt = P rodt 0,9 P rodt1 , y estimar el modelo con estas variables transformadas (primer paso del mtodo de Cochrane-Orcutt), vemos que el problema de autocorrelacin ha desaparecido (DW=1.62) (2 puntos). Conclusin: el modelo estimado tiene un problema de autocorrelacin provocado tanto por la existencia de una tendencia como de un comportamiento dinmico omitido (1 punto).

Ejercicio 2: (15 puntos) Suponga que se tiene el siguiente modelo yt = Xt + ut E (ut ) = 0 V ar(ut ) = 2 E (yt )2

Explique detalladamente cuales son las consecuencias sobre MCO cuando es aplicado a este modelo Cmo estimara este modelo? Que estimador utilizara? De que depender la e2 ciencia de su estimacin?. Plantee una expresin para el estimador ptimo de y de u . Respuesta: Este modelo presenta heterocedasticidad por lo que las estimaciones por MCO son inecientes. El patrn que sigue la heterocedasticidad depende del valor esperado de la variable dependiente yt , es decir, E (yt ) = Xt . Dado que es desconocido no podemos aplicar el estimador MCG. Sin embargo, podemos aplicar MCGF y el estimador Mximo Verosimilutud (MV). La aplicacin para aplicar el del primero requiere una estimacin en dos etapas, ya que es necesario obtener mtodo. De esta forma se puede estimar el modelo por MCO ignorando la heterocedasticidad y luego usar esta estimacin para normalizar las variables y aplicar MCGF. Este mtodo ser menos eciente que MV debido a que este ltimo estimar en conjunto todos los parmetros involucrados. (5 puntos) y Para encontrar las expresiones de 2 lo podan hacer por MV o MCG. Estimador Mximo Verosmil: La funcin de densidad (equivalente a la verosimilitud) para cada yt N (xt , 2 (xt )2 ) es: f (yt ) = El logaritmo de la verosimilitud es: 1 1 (yt xt )2 l(yt ) = ln(2 ) ln 2 ln( ) ln(xt ) 2 2 2 2 (xt )2 As, el logaritmo de la verosimilitud conjunta es: l(y) = T T (yt xt )2 ln(2 ) ln 2 T ln( ) ln(xt ) 2 2 2 2 (xt )2 t=1 t=1
T T

1 2 2 (xt )2

t t 2 2 (x )2 t

(y x )2

(1)

Maximizando (1) con respecto a y 2 obtenemos las condiciones de primer orden, las cuales nos entregan el estimador MV de ambos parmetros: l l 2 De (3) tengo: 1 2 2 4
T t=1

T 1 + 2 3

T t=1

)2 (yt xt 1 + 2 2 2 xt
T t=1

T t=1

)xt (yt xt =0 x2 t

(2) (3)

T 1 = + 2 2 2 4 2

)2 (yt xt =0 2 xt

)2 (yt xt T = 2 x2 2 t 5

De esta forma el estimador MV de 2 es: = Reemplazando (4) en (2): 1 T + 2


T t=1 2 )2 T (yt xt )2 t=1 (xt

(4)

)2 1 (yt xt + 2 2 2 2 xt
T 2

T t=1

)xt (yt xt x2 t
T

= 0

T T 1 + + 2 2

t=1

yt xt

= 0
T t=1

= T De esta forma, el estimador MV de es: = (10 puntos) Estimador MCF :


T yt t=1 xt

yt xt

La variables yt , xt y ut transformadas son (para lo cual previamente se debe estimar ):


yt

= = =

yt = t xt = t ut = t

yt 2 x2 t xt 2 x2 t ut 2 x2 t

= = =

yt xt 1 ut t x
iid

x t u t

2 = x El mtodo de MCF consiste en estimar por MCO el modelo: yt t + ut , donde ut (0, ):

M CF

= M CF

T t=1 yt xt T 2 t=1 (xt ) T yt 1 t t=1 x 2 T 1 t=1 T yt 1 2 t=1 xt T 2 T yt t=1 xt

= 6

El estimador MCF de 2 corresponde al promedio muestral de la suma de los errores estimados al cuadrados (pero de los errores transformados):
2 M CF

= =

T 2 u t) t=1 (

T
)2 T (yt xt )2 t=1 (xt

2 M CF

(10 puntos)

Ejercicio 3: (15 puntos) El semestre pasado mostr empricamente que a los alumnos con mejor rendimiento en los controles les iba mejor en el examen. En esta oportunidad se obtuvo la siguiente regresin estimada:

Modelo 1:
Dependent Variable: EXAMEN Method: Least Squares Date: 07/06/05 Time: 16:46 Sample: 1 110 Included observations: 110 EXAMEN=C(1)+C(2)*CONTROLES Coefficient C(1) C(2) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood 1.180496 0.664234 0.182248 0.174676 1.023741 113.1888 -157.6550 Std. Error 0.625536 0.135391 t-Statistic 1.887175 4.906056 Prob. 0.0618 0.0000 4.211818 1.126880 2.902818 2.951918 2.024406

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

a) Qu problemas puede presentar esta estimacin?. Explique. b) Especique Ud. un modelo que le permita explicar la nota del examen incluyendo todas la variables relevantes, y que a su vez le permita testear diferencias por gnero. Explcitamente, Cmo lo testeara?. c) Ahora plantee un modelo que le permita testear si existen diferencias en la productividad del estudio entre hombres y mujeres (midiendo productividad en horas de estudio). Explique y graque. Respuesta: a) Presentar serios problemas de omisin de variables relevantes. Ya que es muy probable que el rendimiento del alumno no solo dependa de como le fue en los controles pasados si no de un conjunto de otros regresores. Como por ejemplo las horas de estudio dedicadas para el examen. Como es sabido el sesgo en la estimacin depender del signo de los parmetros que acompaen a las variables omitidas y de la relacin de estas con las variables que si se incluyeron en el modelo. b) Podra ser: N.Examen = 0 + 1 N.Controles + 2 DummyGenero + 3 Xi + (5)

Donde Xi corresponde a un conjunto de variables signicativas que explican el rendimiento del alumno en el examen. La manera de testear diferencias por gnero es a trves de un test t al parmetro 2 .

c) Ahora plantee un modelo que le permita testear si existen diferencias en la productividad del estudio entre hombres y mujeres (midiendo productividad en horas de estudio). Explique y graque. N.Examen = 0 + 1 N.Controles + 2 DummyGenero + 3 Xi + 4 DummyGeneroHE + (6) Donde HE corresponde a las horas estudiadas para rendir el examen.

Nota

+DG 0+2 0 Horas Estudiadas

Ejercicio 4: (5 puntos) Sobre la tarea realizada para el curso, responda las siguientes preguntas: a) Seale el modelo estimado y la procedencia de los datos utilizados. b) Principales problemas de su estimacin y como los detecto. c) Principales conclusiones. Respuesta:Individual

De los siguientes dos ejercicios escoja solo UNO de ellos. (15 puntos)
Ejercicio 5: Considere el siguiente modelo: yt = 1 + los resultados de la regresin son : 6 5 = 2 xt + ut xt + 2 ut N (0, 2 )

con 2 = 16 y

2 = 18 y

Estos resultados se obtuvieron con la siguiente muestra de valores de X , xt = {4, 3, 3, 4}. Compute los criterios de informacin del modelo original y uno que asume que 2 = 0. Cul preere?. [Ayuda: recuerde que cuando el error de un modelo se distribuye normal los criterios de informacin se pueden escribir en funcin de 2] Respuesta: Cuando el error del modelo de regresin sigue una distribucin normal, los criterios de informacin pueden ser aproximados de la siguiente forma: AIC BIC = = ln( 2 ) + 2 k n k n

ln( 2 ) + ln(n)

De esta forma, del modelo sin restringir se tiene los siguientes valores de los criterios de informacin: AIC BIC 2 = 3,773 4 2 = ln(16) + ln(4) = 3,466 4 = ln(16) + 2

El modelo restringido (asumiendo que 2 =0) queda de la siguiente forma: yt yt = 1 + 1 + ut = 3 + ut

Como es un modelo que slo incluye una constante el estimador MCO de 3 es: 3 =
T t=1

yt

T
T t=1

=Y

El estimador de la varianza del error de este modelo es entonces: 2 = = = 2 = u t T k T t=1 (yt 3 xt ) T k T t=1 (yt Y 1) T k
2 y

10

Por lo tanto, los criterios de informacin del modelo restingido son: AIC BIC 1 = 3,390 4 1 = ln(18) + ln(4) = 3,237 4 = ln(18) + 2

Finalmente, de acuerdo a los criterios de informacin es mejor el segundo modelo.

11

Ejercicio 6: Si x tiene una distribucin uniforme, es decir: f (xt ) = 1 0<x<

Encuentre el estimador Mximo Verosmil de . Respuesta: Al tener xt tiene una distribucin uniforme, signica que la probabilidad de observar cual1 , la funcin de densidad de esta variable se puede dibujar de quier xt es constante e igual a la siguiente forma:

f(xt)

f(xt)= 1/

xt

Como se puede apreciar esta funcin no tiene un mximo en el rango [0, ] de xt , la solucin al problema de maximizar la probabilidad de ocurrencia de la muestra ser una solucin esquina. Como alpha determina el rango donde se mueve xt , el valor que me maximiza la probabilidad de ocurrencia de xt es: M V = m ax{xt } Veamos esto con ms detalle, supongamos que tenemos la siguinete muestra de x = {1, 5, 3, 4, 2, 1,5, 9}, los cuales tienen una distribucin uniforme, que pasa si tomo = min{xt }, en este caso yo estoy estimado que xt se puede mover entre 0 y 1, de acuerdo a esto la probabilidad de que mi muestra venga de una distribucin uniforme con este es bastante baja, ya que claramente observo valores mayores a 1 (Figura 1). Si eligiera = 2 signica que xt se puede mover entre 0 y 2, este valor de tampoco maximiza la probabilidad de ocurrencia de la muestra, ya que observo varios valores de xt mayores a dos (Figura 2). La nica forma de maximizar la probabilidad de ocurrencia de la muestra, es escoger igual al mximo valor observado de xt , as de acuerdo a esta densidad xt se puede mover entre 0 y el mximo, y no existe ningn valor observado de xt que quede fuera de este rango.

12

f(xt)

f(xt)

No se deberia observar

No se deberia observar

0 1 2 3 4 5 6 7 8 9

xt

0 1 2 3 4 5 6 7 8 9

xt

Figura 1: Si alfa fuese igual a 1 (min)

Figura 2: Si alfa fuese igual a 2

f(xt)

Es posible observar todas las observaciones


0 1 2 3 4 5 6 7 8 9

xt

Figura 3: Si alfa fuese igual a 9 (max)

13

Econometra Facultad de Ciencias Econmicas y Administrativas Universidad de Chile


Pauta Examen Final

Semestre: Primavera 2005 Profesores: Emerson Melo, Rodrigo Montero y Jaime Ruiz-Tagle / Javiera Vsquez No hay preguntas de ningn tipo para los ayudantes. Rut ....................................... Folio ....................................... Tiempo: 120 minutos Puntaje Total: 120 Puntos

1.

Pregunta 1: Modelo Lineal Generalizado (40 puntos)


Considere el siguiente modelo de regresin lineal multiple:

Y = X1 + X2 2 + U donde X1 y X2 son matrices de n k1 y n k2 respectivamente, mientras que 1 y 2 son de dimensin k1 1 y k2 1, Y es de dimensin n 1, y el trmino de error U cumple los supuestos del modelo de regresin lineal clsico. 1. Plantee el problema de mnimos cuadrados asociado al modelo.(5 puntos) Sol: El problema de mnimos cuadrados viene dado por 2 ) 1 X2 2 ) (Y X1 1 X2 m n(Y X1

1 , 2

Los supuestos sobre el trmino de error no son necesarios para plantear el problema de optimizacin anterior, son necesarios cuando necesitamos saber acerca de las propiedades de los estimadores. 1 y 2 vienen dados por: 2. Demuestre que los estimadores

1 = (X M2 X1 )1 X M2 Y 1 1 2 = (X M1 X2 )1 X M1 Y 2 2 donde Mi = [I Xi (Xi Xi )1 Xi ] i = 1, 2 (15 puntos) Sol:En clases vimos que las ecuaciones normales de este problema corresponden a 1 + X X2 2 = X Y X1 X1 1 1 1 + X X2 2 = X Y X2 X1 2 2 1 en la primera ecuacin y lo reemplazamos en la segunda Si despejamos 2 , que se escribe como: tenemos que resulta una ecuacin en trminos de 2 ] + X X2 2 = X Y X2 X1 [(X1 X1 )1 X1 (X1 X1 )1 X1 X2 2 2 2 encontramos la expresin que se pide Si se resuelve para i ) = i con i = 1, 2 (5 puntos) 3. Demuestre que E( 1 , donde lo podemos reescribir como Sol: Consideremos el caso para 1 = 1 + (X M2 X1 )1 X M2 X2 2 + (X M2 X1 )1 X M2 U 1 1 1 1 Pero podemos ver que M2 X2 = 0, ademas si tomamos esperanza y dado los i ) = 0, i=1,2 supuestos del enunciado, se concluye que E( 2

4. Demuestre que i ) = 2 (X M2 X1 )1 (5 puntos) V( u 1 Sol: Es facl ver que a partir de la parte c) se puede escribir 1 1 = (X M2 X1 )1 X M2 U 1 1 1 1 )( 1 1 ) , tenemos Luego, para ( 1 1 )( 1 1 ) = (X M2 X1 )1 X M2 U U M2 X1 (X M2 X1 )1 ( 1 1 1 Tomando E() en la expresin anterior, concluimos 5. Suponga ahora que los errores se distribuyen normalmente con media cero y varianza constante, es decir, U N (0, 2 I ). Si usted estima el mode1 y 2 . lo anterior por Mxima Verosimilitud que forma deben tener Porque? (5 puntos) Sol:Bajo supuestos de Normalidad, independencia y que adems los errores se distribuyen identicamente, se tiene que los estimadores de MV coinciden con los de OLS. Este es un resultado que probamos en clases, donde se mostr que los estimadores de MCO y de MV coinciden bajo las condiciones sealadas anteriormente. 6. Suponga ahora que los errores se distribuyen normalmente con media cero, pero

2 V(ui ) = i

Cov (ui , uj ) = 0 i = j Cambian sus conclusiones respecto a la parte e?. (5 puntos)

Sol:Cuando tenemos errores heterocedsticos, se rompe el supuesto de que sean idenicamente distribuidos. Luego a pesar de ser errores normales y no correlacionados, ya no se distribuyen de manera identica, por lo tanto tenemos que el resultado de la parte e) no es vlido.

2.

Pregunta 2: Heteroscedasticidad (40 Puntos)


Considere el siguiente modelo: Y = X + U donde Y es un vector de dimensin nx1, y X es una matriz de dimensin nxk .

Finalmente, representa el vector de coecientes a ser estimados (k x1) y U (nx1) corresponde al trmino de error que tiene la siguiente distribucin U (0, 2 I ). 1. Derive la matriz de varianzas y covarianzas del estimador de mnimos cuadrados ordinarios (MCO) de . (5 puntos) Respuesta. Se sabe que: M CO = (X X )1 X Y Reemplazando: M CO = (X X )1 X (X + U ) = + (X X )1 X U Despejando: M CO = (X X )1 X U Por lo tanto: M CO )( M CO ) = (X X )1 X U U X (X X )1 ( Aplicando esperanza: M CO )( M CO ) ] = (X X )1 X E (U U )X (X X )1 E [( 4

M CO )( M CO ) ] = (X X )1 X 2 IX (X X )1 E [( Finalmente: M CO ) = 2 (X X )1 V ar( A continuacin asuma que: E (U U ) = 2 : 2. Derive la nueva matriz de varianzas y covarianzas del estimador de mnimos cuadrados ordinarios (MCO) de . (5 puntos) Respuesta. Retomando el desarrollo anterior: M CO )( M CO ) ] = (X X )1 X E (U U )X (X X )1 E [( Sin embargo, ahora se considera que: E (U U ) = 2 Por lo tanto: M CO )( M CO ) ] = (X X )1 X 2 X (X X )1 E [( Finalmente: M CO ) = 2 (X X )1 X X (X X )1 V ar( 3. Derive la matriz de varianzas y covarianzas del estimador MCG de . (5 puntos) Respuesta. Se sabe que: M CG = (X 1 X )1 X 1 Y Reemplazando: M CG = (X 1 X )1 X 1 (X + U ) = + (X 1 X )1 X 1 U Despejando: M CG = (X 1 X )1 X 1 U 5

Por lo tanto: M CG )( M CG ) = (X 1 X )1 X 1 U U 1 X (X 1 X )1 ( Aplicando esperanza: M CG )( M CG ) ] = (X 1 X )1 X 1 E (U U )1 X (X 1 X )1 E [( M CG )( M CG ) ] = (X 1 X )1 X 1 2 1 X (X 1 X )1 E [( Finalmente: M CG ) = 2 (X 1 X )1 V ar( Considere ahora el siguiente modelo de slo dos variables: Yi = + Xi + Ui Suponga adems que la heteroscedasticidad toma la siguiente forma:
2 i = 2 Xi2

4. Encuentre E (U U ). (5 puntos) Respuesta. Como el trmino de error es heteroscedstico y libre de autocorrelacin la matriz de varianza y covarianza de ste toma la siguiente forma: 2 1 0
2 2 X1

0
2 2 X2

0 E (U U ) = . . . 0

0 . 2 . 2 0 . 0 = . ... 0 0 . . 2 0 n 0 X2 0 1 2 0 X2 0 2 E (U U ) = . .. . . . 0 0 0 6

0 ... 0

0 . . . 0
2 2 Xn

0 . . . = 2 0 2 Xn

5. Qu transformacin le hara a los datos para llevar a cabo de la estimacin por MCG? (Ayuda: Recuerde que la matriz P tiene que cumplir lo siguiente P P = 1 ) (10 puntos) Respuesta. Se tiene que cumplir lo siguiente: P P = 1 Dado que: = Entonces: =
2 1/X1

0
2 X2

X2 1 0 . . . 0

0 0
2 1/X2

0 . . 0 . ... 0 2 0 Xn 0 .. . 0 0 .. . 0 0 . . . 0
2 1/Xn

0 . . . 0

0 0
2 1/X2

Por lo tanto:

P P =
2 1/X1

0 . . . 0

0 . . . 0
2 1/Xn

De esta manera, se desprende que: 1/X1 0 0 . . 0 1/X2 0 . P = . .. . . . 0 0 0 0 1/Xn

La transformacin, entonces, sera: X = P X y Y = P Y , donde X es una matriz de nx2 e Y es un vector de nx1. 7

Considere ahora los siguientes datos:

X Y

4 1 6 3

2 4

12 15

6. Calcule el estimador de mnimos cuadrados generalizados para y . (10 puntos) Respuesta. El modelo a estimar es el siguiente: Yi = + Xi + Ui Por lo tanto: =
5 i=1 x y 5 2 i=1 (x )

donde la variable en minsculas denota que se encuentra en desviacin respecto de su media. Finalmente: 1, 22 y: X = 1, 65 Y

3.
3.1.

Pregunta 3 (40 puntos)


Problemas con los datos (20 puntos)

Considere el modelo: yi = 0 + 1 xi + ui (1)

2 ). Se sabe que la variable xi est medida con error, de modo donde ui N (0, u

que slo se observa x i = xi + v i 8

2 donde vi N (0, v ) y es independiente de ui , de xi y de yi .

(a) (3 puntos) Reescriba el modelo en la equacin (1) en funcin slo de las variables observables y de los trminos de error.

Respuesta: y i = 0 + 1 x i + ui = 0 + 1 (x i v i ) + ui = 0 + 1 x i 1 v i + ui = 0 + 1 xi + (ui 1 vi )
i

yi = 0 + 1 xi + i .

(b) (5 puntos) Muestre que en el modelo en (a) el error est correlacionado con la variable observable x i . Explique las implicancias de este problema. Respuesta: Cov (i , x i ) = Cov (ui 1 vi , x i + vi )

= Cov (ui , xi ) + Cov (ui , vi ) 1 Cov (vi , xi ) 1 Cov (vi , vi )


2 = 0 + 0 1 0 1 v 2 Cov (i , x i ) = 1 v .

Se observa que el error i est correlacionado con la variable observable x i. Esto implica que la estimacin por MCO generar estimadores sesgados de 9

los parmetros .

(c) (5 puntos) Explique cmo se podra solucionar el problema en (b).

Respuesta: Una forma de correccin es la utilizacin de variables instrumentales. La idea es utilizar un instrumento en vez de la variable medida con error. Para ello, se requiere que el instrumento no est correlacionado con el trmino de error y que el instrumento s est correlacionado con la variable explicativa para la cual acta como instrumento (la variable medida con error).

(d) (7 puntos) En el modelo en la equacin (1) considere ahora que slo la variable
2 dependiene yi est medida con error i N (0, ), el que es independiente

de xi y de ui . Cules son las implicancias de este problema de medicin? Explique y justique algebraicamente. Respuesta: Si slo la variable dependiente est medida con error, se tiene que slo se observa:
yi = yi + i .

De este modo, el modelo observable es


yi = 0 + 1 xi + ui

yi + i = 0 + 1 xi + ui yi = 0 + 1 xi + ui i yi = 0 + 1 xi + (ui i )
i

yi = 0 + 1 xi + i . 10

Se tendr entonces que la covarianza entre el trmino de error y las variables explicativas es igual a cero: Cov ( i , xi ) = Cov (ui i , xi )

= Cov (ui , xi ) + Cov (i , xi ) Cov ( i , xi ) = 0. Por lo tanto, no habr problema de sesgo en la estimacin de los parmetros.

3.2.

Prediccin (20 puntos)

(a) (10 puntos) Cuando se analiza la capacidad de prediccin de un modelo en un perodo en particular, habitualmente se utiliza el ndice Raz del Error Cuadrtico Medio (Root of Mean Square Error - RMSE) o el Promedio del Error Absoluto (Mean of Absolute Error - MAE). Dena estos dos ndices y explique intuitivamente qu signica cada uno de ellos. Qu problema tienen?

Respuesta: Los ndices se denen como RM SE = M AE =


i i (yi

yi )2 n0

|yi yi | n0

donde n0 corresponde al nmero de observaciones sobre las cuales se analiza la calidad de la prediccin.

El RMSE corresponde a una medida de diferencia de los valores predichos respecto a los valores verdaderos. Estas diferencias se consideran al cuadrado 11

y luego se calcula la raz para re-escalar el ndice. El ndice MAE es similar, pero considera el valor absoluto de las diferencias. Ambos ndices calculan un error promedio en la prediccin para un conjunto de observaciones en particular (habitualmente un perodo en particular en series de tiempo). El problema obvio que ambos ndices presentan es que la escala de comparacin para distintos valores de yi .

(b) (5 puntos) Considere dos modelos (1) (2) yt = 0 + 1 x1t + ut yt = 0 + 1 x1t + 2 x2t + ut ,

con t = 1 . . . T . Al estimar ambos modelos por MCO se calcula el ndice RMSE. En el modelo (1) obtiene un RMSE=1.8, mientras que en modelo 2 se obtiene RMSE=1.5. Cul modelo tiene menor error de prediccin? Son comparables los RMSE?

Respuesta: El modelo (2) tiene menor error de prediccin porque el error promedio es 1.5, menor a 1.8. Esta comparacin es vlida slo porque se considera el mismo perodo, es decir, el mismo conjunto de observaciones para yt .

(c) (5 puntos) En el modelo en (b), luego de estimar por MCO se calcula el ndice RMSE para el subperodo ta hasta T para el modelo (1) y se obtiene RMSE=1.2. Cul modelo es mejor para predecir?

Respuesta: En (a) el ndice RMSE es calculado para toda la muestra, de modo que para toda la muestra el modelo (2) es mejor para predecir. Sin

12

emabargo, si el objetivo fundamental es predecir slo en el subperodo ta hasta T , el modelo (1) es ms adecuado porque para ese subperodo presenta un error medio ms bajo.

13

Universidad de Chile Facultad de Economia y Negocios

PAUTA EXAMEN Econometra I Otoo 2006

Profesoras: Javiera Vasquez y Claudia Sanhueza. Puntaje Total: 88 puntos. 1. (40 puntos) Establezca si cada una de las siguientes armaciones es verdadera, falsa o incierta. Y demuestre su argumento matemticamente. a ) Slo en el caso que se omita una variable que tiene una varianza no constante se generar el problema de heterocedasticidad, si la variable omitida tiene una varianza constante no se genera mayor problema. RESPUESTA: Supongamos el siguiente modelo: yi = 0 + 1 xi + ui en el cual se ha omitido la variable zi , de forma tal que el error del modelo ui tiene los siguientes componentes: ui = zi + i i (0, 2 )
iid

De esta forma la varianza del error del modelo, ui es: v (ui ) = v (ui ) = V (zi ) + V (i ) V (zi ) + 2

Si V (zi ) es constante entonces V (ui ) es constante y el modelo es homocedstico, en el caso contrario tendremos heterocedasticidad. Por lo tanto, el comente es verdadero. b ) Un tema de preocupacin en anlisis de datos de corte transversal es la medicin de ciertas variables con error. De echo, cuando una variable es medida con error se produce sesgo en la estimacin de los parmetros. RESPUESTA: Depende, si la variable dependiente esta medida con error no se genera problema de sesgo, sin embargo, si una o mas variables explicativas estn medidas con error se

genera un problema de sesgo en todos los parmetros del modelo. Supongamos el siguiente modelo: yi = 0 + 1 xi + ui
adems tenemos que no observamos yi sino yi que esta medida con error: yi yi

= =

yi + i donde i (0, 2 ) i yi

escribiendo el modelo en funcin de la variable observada:


yi = 0 + 1 xi + ui + i i

donde i cumple con los supuesto tradicionales bajo los cuales MCO es insesgado. Ahora si xi esta medida con error, de forma tal que observamos x i , tal que: x i xi = = xi + i donde i (0, 2 ) x i i

escribiendo el modelo en funcin de la variable observada: yi yi = = 0 + 1 (x i i ) + ui 0 + 1 x i + (ui 1 i )


i

como la covarianza entre i y x i es distinta de cero, se rompe el supuesto 6 MCO, y el estimador de ser sesgado. Cov (i , x i) = Cov (ui 1 i , xi + i ) = Cov (ui , xi ) 1 Cov (i , xi ) + Cov (ui , i ) Cov (i , i ) 2 = 0 1 0 + 0 1
2 = 1 =0

c ) Tanto si existe heterosedasticidad como si hay una variable omitida relevante se violan los supuestos del modelo de regresin lineal. Por lo tanto, los estimadores MCO sern sesgados e inecientes bajo cualquiera de estas circunstancias. RESPUESTA: Cuando tenemos heterocedasticidad la varianza del trmino de error deja de ser 2 I pasando a ser 2 , como el error sigue teniendo valor esperado iguala cero, en estas circunstancias el estimador MCO sigue siendo insesgado: = ] = E [ ] = E [ 2 + (X X )1 X u + (X X )1 X E [u]

Pero la matriz de varianzas y covarianzas de es mayor a 2 (X X )1 , con lo cual el estimados deja de ser eciente: ] = V [ ] = V [ ] = V [ E ( ))( E ( )) ] E [( E [(X X )1 X uu X (X X )1 ] 2 (X X )1 X X (X X )1

Ahora cuando omitimos variables relevantes, y si esta variable esta correlacionada con las variables incluidas en el modelo, se produce un problema de sesgo, pero no de eciencia: Si en el modelo: Yi = 0 + 1 Xi + ui Se ha omitido la variable zi , tenemos que el modelo verdadero es: Yi = 0 + 1 Xi + 2 Zi + i donde i (0, 2 )

El estimador MCO de 1 se dene de la siguiente forma: xi yi x2 i x ( i 1 xi + 2 zi + i ) 1 = x2 i z x i xi i i 1 = 1 + 2 + 2 xi x2 i z x E [ i ]xi i i 1 ] = 1 + 2 E [ + 2 xi x2 i z x i i 1 ] = 1 + 2 E [ x2 i 1 =


=0

De esta forma el comente es Falso. d ) Si la correlacin muestral entre dos variables independientes es 0,95 entonces probablemente el estadstico t de MCO no ser vlido (es decir la distribucin no ser una t bajo H0 ). RESPUESTA: Falso, cuando tenemos una alta correlacin entre las variables explicativas del modelo la matriz (XX) es casi singular (determinante cercano a cero), lo que hace que la matriz de varianzas y covarianzas de los parmetros MCO 2 (X X )1 sea grande. Como los estadisticos t para una hiptesis lineal se denen como: t= i i i ) V (

De esta forma, el estadstico t en esta situacin tender a ser mucho ms pequeo, por ende no se va a rechazar la hiptesis nula en casos que si debera ser rechazada, se comente ms error tipo II, pero la distribucin del estadstico sigue siendo t. 3

e ) Tanto el error de media en una variable dependiente, como si hay una variable omitida relevante pueden corregirse usando la metodologa de variables instrumentales. Es ms, este ltimo estimador es insesgado. RESPUESTA: Mitad falso mitad verdadero. El error de medida en la variable dependiente no produce sesgo. Por lo tanto no hay para que usar variables instrumentales (IV). Demostracin en b). En el caso de variable omitida relevante si hay sesgo y se puede corregir usando IV. Demostracin: Supongamos el siguiente modelo de regresin simple: yi = xi + ui Donde existe una variable hi omitida, la cual est correlacionada con xi . Es decir ui = hi + i , donde i es iid 0, 2 . Si existe una variable zi correlacionada con xi (E (zi xi ) = 0) y no correlacionada con ui (E (zi ui ) = 0), o sea no correlacionada con hi (E (zi hi ) = 0), entonces zi puede ser usada como una variable instrumental para xi , y IV ser insesgado. Demostracin. Sabemos que el estimador de variables instrumentales ser: IV = = = = Tomando E (.) tenemos E (IV ) = + E = Ya que
i

zi yi zi xi zi (xi + ui ) zi xi zi (hi + i ) + zi xi zi hi zi i + + zi xi zi xi

zi hi zi xi

+E

zi i zi xi

es iid 0, 2 y E (zi hi ) = 0.

2. (10 puntos) Suponga que el desempleo se puede explicar exclusivamente por el comportamiento del ndice mensual de actividad econmica (IMACEC): T Dt = + IM ACECt + ut Ahora plantee un modelo ms general que le permita testear que el impacto del IMACEC sobre la Tasa de Desempleo diere entre el primer trimestre y el tercer trimestre del ao. Sea explcito en como lo testeara. RESPUESTA:

Denamos las siguientes Dummies: d1i d2i = = 1 primer trimestre: enero, febrero, marzo 0 1 tercer trimestre: julio, agosto, septiembre 0

Entonces el modelo que nos permite testear lo planteado en el enunciado es el siguiente: T Dt = + IM ACECt + 2 IM ACECt d1i + 3 IM ACECt d2i + ut As, E [T Dt |primertrimestre, IM ACECt ] = + IM ACECt + 2 IM ACECt E [T Dt |tercertrimestre, IM ACECt ] = + IM ACECt + 3 IM ACECt Entonces debemos realizar el siguiente test de hiptesis: H0 : 2 = 3

Si se cumplen la hiptesis nula se comprueba que no existe diferencia estadstica entre el impacto del IMACEC sobre la tasa de desempleo entre el primer y tercer trimestre. 3. (10 puntos) En el siguiente modelo de regresin: Yi = 1 + 2 Di + ui donde Y representa el salario por hora, y D es la variable dicotmica, que toma el valor 1 si es un titulado universitario y 0 si es titulado de educacin media. Utilizando las frmulas 1 = Y m y 2 = Y u Y m , donde el subndice m del estimador MCO, demuestre que signica con educacin media y u titulado universitario. RESPUESTA: En este modelo se tiene la siguiente matriz de variables explicativas (X ): X = [i D] donde i es un vector columna de puros unos, y D es la variable dicotmica que toma valores 1 y 0. As se denen las siguientes matrices: XX= ii Di XY = iD DD iY DY = = n nu nu nu Yi Yi
D =1

donde n es el tamao muestral, nu es la cantidad de individuos con educacin universitaria en la muestra, adems denamos nm como la cantidad de individuos con educacin media, de forma tal que n = nu + nm . Adems Yi es la suma de la variable dependiente
D =1

slo para los individuos con la dummy igual a uno, es decir, los con educacin universitaria. Ahora calculemos la inversa de la matriz (X X ): (X X )1 = 1 n nu nu nu nu nu nu n =
1 nm n1 m n nu nm )

n1 m

De esta forma, el estimador MCO es: = (X X )1 X Y = = = = = = =


D =0 D =0 D =0

1 nm n1 m Yi

n1 m n nu nm

Yi Yi
D =1

Yi
D =1

Yi n
D =1

Yi

nm Yi nm

nu nm

D =0

nm

Yi +
D =1 D =0

Yi Yi
D =0

nm nm Yi
D =1

Yi
D =1

nu nm

=0 Dn m

Yi

nm Yi
D =0

Yi

D =1

nu nm

Yi nm

nm Yi
D =1

nm Yi

n nu

D =0

Yi nm

nm

+
Yi

Yi

D =1

nm

nm nu

D =0

nm Yi nm

Yi
D =1

nu

Ym YuYm

4. (13 puntos) Sea hijos el nmero de hijos de una mujer y educ los aos de escolaridad de ella. Un modelo simple que regresiona fertilidad y educacin es: hijos = 0 + 1 educ + u en el que u es el error observado. a ) Qu factores contiene u? Es probable que se correlacione con educacin? Que efectos tendra esto sobre la estimacin de 1 ? Demuestre matemticamente su respuesta. RESPUESTA: u contiene todos los factores que tambin determinan la eleccin del nmero de hijos que tiene una mujer y un trmino de error aleatorio. 6

Si alguno de los factores que contiene u est correlacionado con educ entonces estimar por MCO entregar estimadores de 1 sesgados. Por ejemplo, el nivel de ingresos de una mujer tambin afecta en su decisin de si tener hijos o no, y est altamente correlacionada con educacin. Tambin el estado civil de la mujer, a mayor educacin de la mujer mayor es la probabilidad de disolucin matrimonial. Demostracin. Sea F es el set de variables omitidas correlacionadas con educacin (E (educ.F ) = 0). = X X
1

Xy

Donde = [0 , 1 ] , X = [1|educ] e y = hijos. Entonces: E ( ) = X X


1

X (X + u) = + X X = + X X
1

X (F + )
1

X F + X X = + (X X )

X F

=0

Por lo tanto, 1 estar sesgado. b ) Un anlisis de regresin simple planteara el efecto ceteris paribus de la educacin en la fertilidad? Explique. RESPUESTA: Un anlisis de regresin simple como el que se plantea originalmente (hijos = 0 + 1 educ + u), asume que un efecto de educ sujeto a una serie de supuestos c/r al error u. Este anlisis ceteris paribus es ms pertinente a un anlisis de regresin lineal mltiple, en el cual cada parmetro mide el efecto sobre la variable dependiente de alguna variable independiente, asumiendo constantes todas las otras variable dependientes. 5. (15 puntos) El modelo siguiente permite que el salario adems dependa de los aos de educacin de ambos padres, denominada educpm: log(sal) = 0 + 1 educ + 2 educ educpm + 3 exper + 4 antig + u a ) Muestre cul es, en forma decimal, la retribucin de otro ao de educacin en este modelo. Qu signo esperara de 2 ? Por qu? RESPUESTA: La variacin porcentual en los salarios por un ao adicional de educacin es: %sal log(sal) = = %sal = 1 + 2 educpm educ educ = 1 Si la educacin de los padres es mayor mayor probablemente ser la educacin de los hijos, por lo tanto 2 debera ser positivo. b ) Con datos la ecuacin estimada es: log(sal) = 5, 65 + 0, 047educ + 0, 00078 (educ educpm)
(0,13) (0,004) (0,010) (0,00021) (0,003)

+0, 019exper + 0, 010antig + u

n=722, R2 =0,169 Interprete el coeciente del trmino de interaccin. (Ayuda: elegir dos valores especcos de educpm y comparar efecto de educ ) RESPUESTA: Un ao adicional de educacin implica 0, 047 + 0, 00078 educpm % ms de salarios. Es decir una persona cuyos padres tienen 18 aos de educacin tiene un retorno a la educacin total de 0, 047 + 0, 00078 18. Una persona cuyos padres tiene en promedio 17 aos de educacin tienen un retorno a la educacin de 0, 047 + 0, 00078 17. La diferencia es de 0, 00078. Es decir, un ao adicional en la educacin de los padres reporta 0,00078 ms de log(sal), esto es 0, 078 % ms de salario. c ) Cuando educpm se agrega como una variable adicional en la ecuacin, obtenemos: log(sal) = 4, 94 + 0, 97 educ + 0, 033educpm
(0,38) (0,027) (0,017) (0,004)

+0, 0016 (educ educpm) + 0, 020exper


(0,0012)

+0, 010antig + u
(0,003)

n=722, R2 =0,174 El salario depende ahora de manera positiva de la educacin de los padres? Pruebe la hiptesis nula de que el salario no depende de la instruccin de los padres. RESPUESTA: Si, ahora el salario depende en forma positiva e independiente de la educacin de los padres. log(sal) = 0, 033 + 0, 0016 educ educpm Probando la hiptesis nula de que el salario no depende de la instruccin de los padres. Primero, en esta estimacin ambas variables relacionadas con la educacion de los padres son no signicativas en forma independiente. Los valores de los test t respectivos son: t = 0, 033/0, 017 = 1, 94 t = 0, 0016/0, 0012 = 1, 33 Ambos son menores a 1,96 que es el valor del test t al 95 % de conanza con muchas observaciones. Sin embargo, antes cuando estaba solamente la variable interactiva esta era signicativa al 95 %, 0,00078/0,00021=3,71. Por lo tanto, la educacin de los padres en forma independiente no es signicativa, pero en forma interactiva si lo es. El efecto de la educacin de los padres es a travs de que afectan la educacin de los hijos. Pero no tienen un efecto directo en que los hijos tengan mayores salarios. Esta ltima hiptesis sera verdad si, por ejemplo, padres ms educados tienen ms networks (pitutos) para que sus hijos tengan mejores trabajos y por lo tanto mejores salarios. 8

Adicionalmente uno podra testear la hiptesis de que ambos parmetros en conjunto sean cero, pero esto no se puede hacer con los datos entregados. H0 : educpm = 0 y educeducpm = 0 Hipotesis conjunta de que ambos parametros sean cero. Un subconjunto de las pendientes del modelo son cero. Para testear esto se ocupa un test F, el cual es: F = (u u u u) /k2 F(k2 ,nk) u u/ (n k )

donde u denotan los residuos MCO restringidos (donde k2 representa el nmero de regresores del modelo restringido o sin las dos variables asociadas a la educacin de los padres), mientras que u representan los residuos del modelo MCO original.

Econometra Facultad de Economa y Negocios Universidad de Chile


Pauta Examen

Semestre: Primavera 2007 Profesores: Jos Miguel Benavente, Rodrigo Montero Ayudantes: Loreto Silva, Rodrigo Bravo, Felipe Ros Tiempo de duracin: 150 minutos No hay preguntas de ningn tipo para los ayudantes Est permitido utilizar calculadora

1.

Teora (40 puntos)

La empresa Gini est evaluando implementar una nueva estructura de remuneraciones, para lo cual es fundamental entender primero cmo se determinan en la actualidad los salarios de sus trabajadores. Es por ello que han decidido contratarlo a usted, amante ex-alumno del curso de econometra 1 para que les ayude en el anlisis economtrico de su problema. Con el objetivo de abordar adecuadamente el problema planteado, usted propone estimar la siguiente ecuacin: wi = 0 + 1 Si + 2 Xi +
i

donde wi representa el logaritmo del salario que percibe el trabajador i, Si corresponde a los aos de escolaridad del trabajador, Xi son los aos que lleva el trabajador en la empresa Gini (antiguedad), y nalmente, i corresponde a un trmino de error con media cero y varianza 2 . 1. Analice si en este modelo se est omitiendo alguna variable relevante. Adems, establezca cules seran las consecuencias sobre la estimacin de los parmetros (por MCO) de dicha omisin. (8 puntos) Respuesta. El modelo planteado omite claramente algunas variables que son relevantes, como por ejemplo, la habilidad, la antiguedad al cuadrado (para ver perl creciente o decreciente de la experiencia), y variables que reejen caractersticas cualitativas como gnero. Por lo tanto, la estimacin por MCO ser sesgada; la direccin de este sesgo depender de la correlacin de la posible variable omitida con las variables explicativas y con la variable dependiente del modelo. 2. Explique al menos dos procedimientos que usted utilizara para detectar la presencia de heteroscedasticidad en los residuos. En caso de haberla, cules 1

seran las consecuencias sobre la estimacin de MCO? Cmo podra corregir el problema? (8 puntos) Respuesta. Se deben mencionar y describir brevemente dos de los siguientes tests: White, Goldfeld y Quandt, Breusch-Pagan, Glesjer. La estimacin por MCO no ser sesgada, sin embargo, las varianzas s sern sesgadas. 3. Usted observa en los datos que existe un elevado grado de asociacin (negativo) entre la variable antiguedad y escolaridad del trabajador. Cmo podra usted determinar si tiene en verdad un problema de multicolinealidad en los datos? En caso de haberla, cules seran las consecuencias para la estimacin de MCO. (8 puntos) Respuesta. Se debe mencionar y describir el test de Belsey y uno o ms sntomas que indiquen la presencia de multicolinealidad. Algunos de ellos podran ser: R2 alto con coecientes estadsticamente no signicativos, pequeo cambio en los datos produce grandes variaciones en estimaciones por MCO, y coecientes con signos y magnitudes distintas a las esperadas. En presencia de multicolinealidad, MCO sigue siendo MELI, sin embargo, las varianzas sern muy grandes. 4. Suponga que es posible clasicar a los trabajadores de la empresa Gini en tres categoras: operarios, personal administrativo y profesionales. Explique detalladamente cmo podra incorporar esta informacin al modelo planteado originalmente. (8 puntos) Respuesta. Se deben denir detalladamente las variables dummies a incorporar: una para cada categora (1 si pertenece a ella y 0 en caso contrario). En caso de incoporar las tres variables dummies (hay tres categoras de trabajadores) se debe dejar fuera del modelo la constante. 5. Suponga que usted no est seguro con cul de ambas especicaciones quedarse, es decir, la que excluye la informacin planteada en la pregunta anterior, o bien, aquella que explcitamente la incluye (tipo de trabajador: operarios, personal administrativo y profesionales). Cmo podra determinar usted qu especicacin es mejor? (8 puntos) Respuesta. Se debe notar que el modelo 1 est anidado en el modelo planteado en la pregunta anterior, por ende, es posible utilizar los denominados criterios de informacin, como el criterio de Akaike y Schwarz. Se escoge el modelo que minimice el criterio de informacin.

2.

Ejercicios (50 puntos)

1. (25 puntos) Considere el siguiente modelo con perturbaciones no esfricas, para el cual usted dispone de cuatro observaciones: Yi = 0 + 1 Xi + ui

donde var(ui ) = i 2 , y 1 =1; 2 =2; 3 =3; 4 =4. Por otro lado, se tiene lo siguiente: Yi =(3,6,9,12), y Xi =(1,2,4,5). Estime los parmetros 0 y 0 por el mtodo de mnimos cuadrados ordinarios. Respuesta. M CG = (X 1 X )1 X 1 Y 1 1 1 2 X = 1 4 1 5 3 6 Y = 9 12 = V ar() = E ( ) 1 0 0 0 0 2 0 0 = 2 0 0 3 0 0 0 0 4 1 0 0 0 0 2 0 0 = 2 0 0 3 0 0 0 0 4 1 0 0 0 1 1 0 0 2 0 1 = 1 2 0 0 3 0 0 0 0 1 4 Por lo tanto, sustituyendo con lo anterior, se pueden obtener los de mnimos cuadrados generalizados: M CG = 1, 066 2, 133

2. (25 puntos) Las ventas de gasolina en una determinada zona geogrca se modelaron a travs de la siguiente especicacin: = 70 0, 01P + 0, 2Y 1, 5S1 + 3, 6S2 + 4, 7S3 Q donde Q representan las ventas, P es el precio, Y corresponde al ingreso disponible, y Si son variables dummies trimestrales (i=1,2,3,4). Los valores esperados para Y y P para el prximo ao vienen dados por:
Trimestre P Y 1 110 100 2 116 102 3 122 104 4 114 103

a ) Calcule las ventas esperadas para para cada trimestre del prximo ao. (7 puntos) Respuesta. Las ventas esperadas para cada trimestre del prximo ao vienen dadas por: 1 = 70 0, 01P 1 + 0, 2Y 1 1, 5 = 87, 4 Q 2 = 70 0, 01P 2 + 0, 2Y 2 + 3, 6 = 92, 84 Q 3 = 70 0, 01P 3 + 0, 2Y 3 + 4, 7 = 94, 28 Q 4 = 70 0, 01P 4 + 0, 2Y 4 = 89, 46 Q b ) Otro investigador propone utilizar los mismos datos para estimar una ecuacin igual que la anterior, pero desea utilizar las variables dummies S2 , S3 y S4 . Encuentre los coecientes asociados a esta especicacin. (9 puntos) Respuesta. Este investigador propone el siguiente modelo: Q = 1 + 2 S2 + 3 S3 + 4 S4 + P + Y Adems, se sabe que la siguiente identidad se cumple para estos datos: S4 = 1 S1 S 2 S3 Luego, reemplazando en la ecuacin anterior: Q = 1 + 2 S2 + 3 S3 + 4 (1 S1 S2 S3 ) + P + Y Reagrupando trminos: Q = (1 + 4 ) 4 S1 + (2 4 )S2 + (3 4 )S3 + P + Y que corresponde a la regresin original. Por lo tanto, haciendo uso de la estimacin original, se tiene que: 1 + 4 = 70 4 = 1, 5 2 4 = 3, 6 3 4 = 4, 7 = 0, 01 = 0, 2 As, los coecientes estimados por este investigador sern: 1 = 68,5; 2 = 5,1; 3 = 6,2; 4 = 1,5; = -0,01 y = 0,2.

c ) Un tercer investigador propone utilizar las cuatro variables dummies: S1 , S2 , S3 y S4 . Encuentre los coecientes asociados a esta estimacin. (9 puntos) Respuesta. El modelo a estimar utilizando las cuatro variables dummies es el siguiente: Q = 1 S1 + 2 S2 + 3 S3 + 4 S4 + P + Y Haciendo uso de la misma identidad que en la pregunta anterior: Q = 4 + (1 4 )S1 + (2 4 )S2 + (3 4 )S3 + P + Y que corresponde a la regresin original. Por lo tanto, haciendo uso de los resultados de la estimacin original, se tiene que la estimacin llevada a cabo por este tercer investigador ser: 1 = 68,5; 2 = 73,6; 3 = 74,7; 4 = 70; = -0,01 y = 0,2.

3.

(40 puntos) Analtico


Con datos para 100 rmas se ha estimado la siguiente relacin: Yi = + Xi +
i

donde Yi es el logaritmo del salario promedio anual de los gerentes de la rma i, y Xi es el logaritmo de las utilidades (benecios anuales). El siguiente grco muestra la dispersin de las observaciones (se han eliminado los datos correspondientes a cuatro rmas pues tenan utilidades negativas en el ao en cuestin):
Figura 1: Salarios de gerentes y utilidades de la empresa
8.5

8.0 LOGSALARY

7.5

7.0

6.5 0 2 4 6 8 10 12

LOGPROFIT

Los resultados de la estimacin son los siguientes:


Figura 2: Determinantes de los salarios de los gerentes
Dependent Variable: LOGSALARY Method: Least Squares Sample(adjusted): 5 100 Included observations: 96 after adjusting endpoints Variable Coefficient Std. Error t-Statistic C 6.350.338 0.128961 4.924.249 LOGPROFIT 0.162212 0.021984 7.378.765 R-squared 0.366774 Mean dependent var Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.360037 0.326982 1.005.023 -2.789.396 2.233.248 S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Prob. 0.0000 0.0000 7.269.493 0.408740 0.622791 0.676215 5.444.617 0.000000

1. Note que se han dejado fuera cuatro observaciones para llevar a cabo la estimacin, por qu? (8 puntos) Respuesta. Se dejaron fuera pues las utilidades de esas cuatro empresas eran negativas (prdidas), por lo tanto, la funcin logaritmo se indene. el sig2. Son estadsticamente signicativos los coecientes estimados? Tiene no esperado? (8 puntos) Respuesta. Son estadsticamente signicativos, lo cual se desprende del pvaue (menor a 0,05), o bien, del cuociente entre el valor estimado del coeciente y la desviacin estndar del mismo (cuyo valor es mayor que 1,97). 3. Segn los resultados del test de Ramsey RESET, habra un problema de especicacin del modelo? (8 puntos)

Figura 3: Test de Ramsey RESET


Ramsey RESET Test: F-statistic 0.878905 Probability Log likelihood ratio 0.902997 Probability Test Equation: Dependent Variable: LOGSALARY Method: Least Squares Sample: 5 100 ; Included observations: 96 Variable C LOGPROFIT FITTED^2 Coefficient -5.981.640 -0.582640 0.312867 Std. Error 1.315.475 0.794813 0.333725 t-Statistic -0.454713 -0.733053 0.937499 Prob. 0.6504 0.4654 0.3509

0.350930 0.341979

Respuesta. Este test fue diseado originalmente para detectar la omisin de variables relevantes en el modelo (Xs). Sin embargo, en la prctica ha resultado muy til para detectar no linealidades presentes en el modelo. El p-value del test es mayor que 0,05 por lo tanto, no se puede rechazar la hiptesis nula de que el modelo est bien especicado. 4. Segn los resultados del test de White sobre heteroscedasticidad, existe un problema de este tipo en los residuos? (8 puntos)
Figura 4: Test de heteroscedasticidad de White
White Heteroskedasticity Test: F-statistic 0.589335 Obs*R-squared 1.201.465 Probability Probability 0.556754 0.548410

Test Equation: Dependent Variable: RESOLS^2 Method: Least Squares Sample: 5 100 ; Included observations: 96 Variable C LOGPROFIT LOGPROFIT^2 R-squared Coefficient -0.032151 0.048798 -0.004059 0.012515 Std. Error 0.140858 0.046586 0.003746 t-Statistic -0.228249 1.047.494 -1.083.502 Prob. 0.8200 0.2976 0.2814

Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puede rechazar la hiptesis nula de que los residuos del modelo son homoscedsticos. 5. Segn los resultados del test de Breusch-Godfrey sobre correlacin serial, ex7

iste un problema de este tipo en los residuos? (8 puntos)


Figura 5: Test de autocorrelacin serial de BreuschGodfrey
Breusch-Godfrey Serial Correlation LM Test: F-statistic 0.759000 Probability Obs*R-squared 1.558.288 Probability Test Equation: Dependent Variable: RESOLS Method: Least Squares Variable Coefficient Std. Error C LOGPROFIT RESOLS(-1) RESOLS(-2) R-squared -0.005453 0.001021 -0.119031 0.035061 0.016232 0.129438 0.022068 0.104460 0.105207 0.471043 0.458798

t-Statistic -0.042130 0.046281 -1.139.490 0.333255

Prob. 0.9665 0.9632 0.2575 0.7397

Respuesta. El p-value del test es mayor que 0,05 por lo tanto, no se puede rechazar la hiptesis nula de que los residuos no estn autocorrelacionados.

ECONOMETRIA I PROFESORA: JAVIERA VASQUEZ Pauta Examen

I. Comentes (25 puntos)

I.1. El estimador MCO es el mejor estimador siempre que se cumpla el supuesto de normalidad en el trmino de error, de no ser as es preferible el estimador Mximo Verosmil. Comente. Respuesta: Falso, para que MCO sea el mejor estimador LINEAL INSESGADO se requiere slo que el error sea independiente e idnticamente distribuido, el supuesto de normalidad slo es necesario para la inferencia y predicciones. Por el contrario, el estimador Mximo Verosmil SI requiere el supuesto de distribucin del trmino de error (ya sea normal o alguna otra) para la estimacin. El estimador MV es preferible cuando la muestra es grande y el modelo no es lineal. I.2 Suponga que Ud. esta interesado en estimar la demanda por entradas al concierto de The Police, Qu problemas puede presentar en la estimacin de esta demanda?Qu metodologa es la ms apropiada en este caso? Respuesta: Para estimar la demanda por el concierto de The Police podemos utilizar la demanda por artistas similares y ver que ha pasado cuando se han realizado estos conciertos, es decir, podemos tomar datos de nmero de personas en conciertos con caracterstica similares y tratar de explicarlo por el da que se realiza, cantidad de conciertos en la misma semana, etc. El problema es que la variable dependiente, nmero de personas en el concierto, en algunos casos puede estar censurada ya que para algunos conciertos puede que la demanda haya sido mayor a la capacidad el Estadio Nacional (agotndose las entradas), para todos estos conciertos donde se agotaron las entradas la variable dependiente esta censurada a partir de la capacitada del estadio (80.000 personas). La metodologa de estimacin ms apropiada en este caso es el modelo Tobit, que considera dentro de la estimacin la probabilidad de estar censurado. I.3 El nico problema de estimar por MCO un modelo de probabilidad (donde la variable dependiente es binaria) es que las predicciones de la probabilidad pueden estar fuera del rango [0,1]. Comente. Respuesta: Si bien este es un problema del modelo de probabilidad lineal no es el nico, dos problemas adicionales es que el modelo de probabilidad tiene heterocedasticidad, y
1

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

que MCO cumple con las caractersticas deseable cuando el modelo lineal, supuesto que no se cumple en los modelos de probabilidad, no incluir la no linealidad es equivalente a omitir una variable relevante generando sesgo en la estimacin. I.4 Si en la estimacin de un modelo de regresin de la forma Yt=Xt+ut el estadstico de Durban-Watson nos indica presencia de autocorrelacin, bastar con incluir la variable dependiente rezada un periodo como regresor para solucionar definitivamente el problema. Comente. Respuesta: Falso, la autocorrelacin puede ser provocada por dos cosas: si la variable dependiente tiene una tendencia y esta no esta siendo capturada por las variables explicativas y por un patrn dinmico omitido. En el primer caso incluir la variable Yt1 como regresor no soluciona el problema, en el segundo caso puede que al incluir un rezago de la variable dependiente se solucione el problema de autocorrelacin si es que esta es de orden 1, pero si la autocorrelacin es de un orden superior habr que incluir ms rezagos de la variable dependiente como regresor.

I.5 Indique cuales son los problemas en la estimacin MCO que generan problema de slo problemas de sesgo e inconsistencia, y cuales generan slo problemas de eficiencia. Respuesta: Problemas de sesgo/inconsistecia: Omisin de variables relevantes Error de medicin en las variables explicativas No linealidades omitidas

Problemas de eficiencia: Inclusin de variables irrelevantes Multicolinealidad Heterocedasticidad/autocorrelacin

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

II. Demostracin (20 puntos)

Considere el explicativas:

siguiente modelo de regresin mltiple que contiene tres variables

Yi = 0 + 1 X 1 + 2 X 2 + 3 X 3 + ui
Pero Ud. esta interesado en estimar (=1+2). (i) (ii) la suma de los parmetros de X1 y X2

= 1 + 2 es un estimador insesgado de . Muestre que ) en trminos de Var ( 1 , 2 ) 1 ) , Var ( 2 ) , y corr ( Encuentre la Var (

Respuesta: (i) Te tiene que demostrar que:

] = E[ 1 + 2 ] = 1 + 2 E[
Para lo cual hay que demostrar que los estimadores de 1 y 2 son insesgados. El modelo anterior se puede escribir como Y=X+u, donde es un vector que contiene los cuatro parmetros del modelo, y X una matriz que contiene las tres variables explicativas del modelo ms una columna de unos que representa la constante. El estimador MCO del modelo es:

= ( X ' X ) 1 X 'Y
Reemplazando Y por la especificacin poblacional del modelo, se tiene:

= ( X ' X ) 1 X ' ( X + u ) = ( X ' X ) 1 X ' X + ( X ' X ) 1 X ' u = + ( X ' X ) 1 X ' u


Tomando valor esperado a la expresin anterior, y bajo los supuestos clsicos del modelo MCO, que el error es bien comportado, se obtiene que el estimador es insesgado.

] = + ( X ' X ) 1 X ' E[u ] E[ {


0

] = E[
3

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Por lo tanto,

1 ] = 1 E[ 2 ] = 2 E[ 1 + 2 ] = 1 + 2 E[ ] = E[
(ii) La varianza del estimador de equivale a:

) = E[ E ( )]2 V (
Como acabamos de demostrar que el estimador es insesgado:

) = E[ ]2 V (
Ahora reemplazando en funcin de los coeficientes s:

) = E[ 1 + 2 ( 1 + 2 )]2 V (
Reorganizando trminos, elevando al cuadrado y aplicando valor esperado:

) = E[ 1 + 2 ( 1 + 2 )]2 V ( ) = E[( 1 1 ) + ( 2 2 )]2 V ( ) = E[( 1 1 ) 2 + 2( 1 1 ) ( 2 2 ) + ( 2 2 ) 2 ] V ( ) = E[( 1 1 ) 2 ] + 2 E[( 1 1 ) ( 2 2 )] + E ( 2 2 ) 2 ] V ( ) = V ( 1 ) + 2 cov( 1 , 2 ) + V ( 2 ) V (


III. Ejercicio matemtico (20 puntos)

Suponga que una variable aleatoria Y tiene la siguiente funcin de distribucin de probabilidad:

Pr(Y = 1) = p f (Y ) = Pr(Y = 2) = q Pr(Y = 3) = 1 p q


Considerando esta funcin de distribucin de probabilidad se toma una muestra aleatoria con n observaciones denotadas como Y1, Y2,, Yn.
4

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

(i)

Derive la funcin de verosimilitud de los parmetros p y q.

Respuesta: Sea n1 el nmero de observaciones donde Y=1, n2 el nmero de observaciones donde Y=2, y por lo tanto n-n1-n2 el nmero de observaciones donde Y=3. Entonces la distribucin de probabilidad conjunta de las n observaciones se puede escribir de la siguiente forma:

Pr(Y1 = y1 , Y2 = y 2 ,..., Yn = y n ) = Pr(Yi = yi ) = p n1 q n2 (1 p q ) n n1 n2


i =1

As, la funcin de verosimilitud esta representada por la funcin anterior pero tratando a p y q como parmetros desconocidos. (ii) Derive los estimador mximo verosmil de p y q

Respuesta: Aplicando logaritmo natural a la expresin encontrada en la parte (i) obtenemos la log-likelihood a optimizar con respecto a p y q:

l = ln L = n1 ln( p ) + n2 ln(q ) + (n n1 n2 ) ln(1 p q )


Tomando derivadas parciales con respecto a p y q:

l n1 n n1 n2 = p p (1 p q ) l n2 n n1 n2 = p q (1 p q )
Haciendo ambas ecuaciones iguales a cero (condiciones de primer orden) y resolviendo se obtienen los estimadores MV de p y q:

n1 n n1 n2 =0 p (1 p q ) n2 n n1 n2 ( 2) =0 q (1 p q ) (1)
5

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

De (1):

n1 (1 p q) p(n n1 n2 ) = 0 n1 n1 p n1q np + n1 p + n2 p = 0 n1 n1q np + n2 p = 0 (3)


Adicionalmente restando (2) de (1):

n1 n2 =0 p q n q = 2 p ( 4) n1
Reemplazando (4) en (3):

n1 n1

n2 p np + n2 p = 0 n1

n1 np = 0 p MV = n1 n

Y reemplazado la ltima expresin en (4):

q MV =

n2 n

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

IV. Ejercicios prcticos (70 puntos)

Ejercicio 1 (20 puntos): Suponga que Ud. es el secretario de estudios de la FEN y esta interesado en evaluar el impacto de distintos profesores sobre el rendimiento de los alumnos. Especficamente se debe concentrar en un ramo, por ejemplo, Econometra y plantear una metodologa que le permita evaluar en forma cientficamente correcta el efecto profesor sobre el rendimiento de los alumnos en esta asignatura. Sea especifico en como lo hara: datos, variables, mtodo de estimacin, etc; que problemas puede enfrentar, es decir, que puede amenazar la validez interna y/o externa de sus resultados. Respuesta: La mejor forma cientfica de evaluar el efecto del profesor sobre el rendimiento de los alumnos es disear un experimento donde los alumnos sean asignados aleatoriamente a un profesor u otro. Supongamos que especficamente estamos interesados en evaluar el desempeo del profesor 1, por lo cual se asignarn aleatoriamente cierta cantidad de alumnos a este profesor, los que sern parte del grupo de tratamiento, y los restantes alumnos que fueron asignados al otro profesor representan el grupo de control. La variable de resultado es el promedio del curso. Es importante para que los resultados de ambos grupos sean comparables y midan exactamente el efecto del profesor las evaluaciones, clases y ayudantes tienen que ser exactamente iguales, de esta forma la nica fuente de variacin es como el profesor explica la materia a sus alumnos. De esta forma, para estimar el efecto del profesor 1 sobre el rendimiento de los alumnos se debe definir la siguiente variable binaria:

1 si es alumno del profesor 1 T = 0 si es alumno del profesor 2


Y se debe estimar entonces el siguiente modelo de regresin:

Pi = 0 + 1Ti + X i + ui
Donde 1 mide el efecto causal del profesor 1 sobre el promedio de los alumnos (P), adems se deben incluir otras variables explicativas que permita limpiar por cualquier cosa que haya afectado la aleatoriedad completa del experimento. La comparacin de la estimacin del efecto causal sin otros regresores y con otros regresores ayuda a ver si existieron estas amenazas en el diseo experimental. Potenciales amenazas a la validez interna de los resultados: Que los alumnos no sean asignados 100% en forma aleatoria sino por rendimiento
7

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Fallas en seguir el protocolo de tratamiento: pueden existir alumnos que quieran tomar con profesor 1 o 2 y hagan valer su prioridad para que se les sea concedido el profesor que deseen. O que se cambien de seccin despus de la asignacin. Atricin: Alumnos que abandonan el curso, ya sea del grupo de control o tratamiento, por bajo rendimiento, carga acadmica o problemas mdicos. Si la atricin no es aleatoria generar sesgo en la muestra resultante al final del experimento. Efecto experimental: si se le indica a los alumnos que estn siendo sometidos a un experimento, estos consiente o inconscientemente tendern a cambiar su comportamiento. Muestras pequeas: El mximo nmero con que podr contar cada curso es 60 alumnos, un tamao muestral bastante reducido que incluso puede ser menor si menos alumnos toman el ramo en el semestre.

Potenciales amenazas a la validez externa de los resultados: Muestra no representativa: se tiene que elegir un semestre que corresponda al de la malla de los alumnos, no puede ser semestre de verano, ni el semestre donde toma la gente que repite el curso.

Ejercicio 2 (50 puntos): El siguiente cuadro muestra la estimacin de una modelo de retorno a la educacin para las mujeres en la fuerza de trabajo. Donde la variable dependiente es el logaritmo del salario por hora, el que ha sido regresionado contra los aos de escolaridad (educ), la experiencia (exper), experiencia al cuadrado (expersq), ingreso familiar excluyendo su salario en miles de pesos (nwifeinc), la edad (age), nmero de hijos menores de 6 aos (kidslt6), y nmero de hijos entre 6 y 18 aos (kidsge6).
Source | SS df MS -------------+-----------------------------Model | 36.6476796 7 5.2353828 Residual | 186.679761 420 .444475622 -------------+-----------------------------Total | 223.327441 427 .523015084 Number of obs F( 7, 420) Prob > F R-squared Adj R-squared Root MSE = = = = = = 428 11.78 0.0000

.66669

-----------------------------------------------------------------------------lwage | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .0998844 .0150975 .0702084 .1295604 exper | .0407097 .0133723 .0144249 .0669946 expersq | -.0007473 .0004018 -1.86 0.064 -.0015371 .0000424 nwifeinc | .0056942 .0033195 1.72 0.087 -.0008307 .0122192 age | -.0035204 .0054145 -0.65 0.516 -.0141633 .0071225 kidslt6 | -.0558725 .0886034 -0.63 0.529 -.2300339 .1182889 kidsge6 | -.0176484 .027891 -0.63 0.527 -.0724718 .0371749 _cons | -.3579972 .3182963 -1.12 0.261 -.9836494 .2676551 ------------------------------------------------------------------------------

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Con respecto a esta estimacin: (i) Complete la informacin faltante (5 puntos)

El R2 del modelo representa la proporcin de la varianza de la variable dependiente que es explicada por la varianza de las variables explicativas, de esta forma corresponde a la razn entre la suma al cuadrado (SS) del modelo y la suma al cuadrado total:

SSM 36.6476796 = = 0.16409842 SST 223.327441 SSR /(n k ) 0.44447562/420 R 2 = 1 = 1 = 0.15016672 SST /(n 1) 0.52301508/427 0.0998844 t educ = = 6.6159563 0.0150975 0.0407097 t expr = = 3.0443304 0.0133723 R2 =
(ii) Qu puede decir sobre la bondad de ajuste del modelo? (5 puntos)

Con respecto a la bondad de ajuste del modelo, tanto el R-cuadrado como el Rcuadrado ajustado indican que las variables explicativas del modelo explican slo un 15% del comportamiento de la variable dependiente, lo que es relativamente bajo pero no despreciable. (iii) Qu puede decir sobre la significancia del retorno a la educacin? (5 puntos)

Comparando el estadstico calculado (6.62) con el valor de tabla se rechaza la hiptesis nula de que el coeficiente sea igual a cero. Lo mismo se puede concluir al observar que el cero no esta incluido en el intervalo de confianza. De esta forma los aos de escolaridad es una variable estadsticamente significativa para explicar el logaritmo del salario de las mujeres. (iv) Qu problemas presenta la estimacin anterior? (5 puntos)

La estimacin anterior presenta sesgo de seleccin, ya que slo se esta utilizando a las mujeres que trabajan en la estimacin no tenemos antecedentes de ingresos de las mujeres que no participan en el mercado del trabajo, esto hace que la distribucin de la variable dependiente este truncada.

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

La siguiente tabla muestra una estimacin alternativa del mismo modelo.


Heckman selection model (regression model with sample selection) Number of obs Censored obs Uncensored obs Wald chi2(7) Prob > chi2 = = = = = 753 325 428 75.37 0.0000

Log likelihood = -883.8828

-----------------------------------------------------------------------------| Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------lwage | educ | .1066795 .0208209 5.12 0.000 .0658713 .1474876 exper | .0406657 .0132436 3.07 0.002 .0147088 .0666226 expersq | -.0007457 .0003979 -1.87 0.061 -.0015255 .0000341 nwifeinc | .0047293 .0038863 1.22 0.224 -.0028877 .0123463 age | -.0049886 .0062221 -0.80 0.423 -.0171837 .0072064 kidslt6 | -.0974594 .1250796 -0.78 0.436 -.3426109 .1476921 kidsge6 | -.0191121 .0278513 -0.69 0.493 -.0736996 .0354754 _cons | -.40472 .3311825 -1.22 0.222 -1.053826 .2443857 -------------+---------------------------------------------------------------select | educ | .1568112 .0240434 6.52 0.000 .109687 .2039355 nwifeinc | -.0209167 .0045791 -4.57 0.000 -.0298915 -.0119418 age | -.034533 .007576 -4.56 0.000 -.0493817 -.0196843 kidslt6 | -.8921331 .1144159 -7.80 0.000 -1.116384 -.6678821 kidsge6 | -.0385341 .0404704 -0.95 0.341 -.1178545 .0407864 _cons | .4155959 .4726033 0.88 0.379 -.5106895 1.341881 -------------+---------------------------------------------------------------/athrho | .121872 .2608112 0.47 0.640 -.3893085 .6330525 /lnsigma | -.4109284 .0383022 -10.73 0.000 -.4859993 -.3358574 -------------+---------------------------------------------------------------rho | .1212722 .2569754 -.3707639 .5601505 sigma | .6630344 .0253957 .6150822 .714725 lambda | .0804076 .1717962 -.2563066 .4171219 -----------------------------------------------------------------------------LR test of indep. eqns. (rho = 0): chi2(1) = 0.17 Prob > chi2 = 0.6777 ------------------------------------------------------------------------------

Al respecto se le pide que conteste las siguientes preguntas: (v) De que manera esta estimacin soluciona el problema mencionado en la parte (iv)?. Explique tericamente. (15 puntos)

Lo que hace la estimacin es estimar el modelo original pero corrigiendo por el problema de truncamiento de la variable dependiente, sabemos que cuando la variable esta truncada la media de la variable cambia agregndole el inverso de mill evaluado en el punto de truncamiento. En los modelos de sesgo de seleccin o truncamiento incidental el inverso de mill no se evalua en un punto fijo sino que en una set de variables explicativas por sus respectivos coeficientes que son los que determinan la probabilidad de estar o no truncado. La ecuacin que se estima y que corrige el problema de sesgo de seleccin es la siguiente:
10

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

E[Yi | X i , Z i , S = 1] = X i + ( Z i )
Donde S es la variable indicador de seleccin, cuya probabilidad de que sea igual a uno es estimada utilizando las variables Z, y son los coeficientes de esta estimacin. La variable () es el IMR que corrige el problema de truncamiento pero no basado en un umbral fijo, sino con las variables que determinan la probabilidad de seleccin. El no incorporar la variable lambda o inverso de mill equivale a omitir una variable relevante por lo que los parmetros sern sesgados en la medida que exista una correlacin importante entre la variable omitida y las variables incluidas en la estimacin y en la medida que la variable omitida sea realmente relevante (o sea significativa). En la tabla anterior veamos que la educacin, ingreso familiar, edad y nmero de hijos menores de 6 aos son importantes para explicar la probabilidad de que la mujer trabaje o no. (vi) Por qu cambia la estimacin del retorno a la educacin?esta siendo sub o sobre estimado?porque? (10 puntos)

Vemos que el retorno a la educacin cambia marginalmente entre una estimacin y otra, en la primera estimacin el coeficiente estaba siendo subestimado indicando que la correlacin entre el inverso de mill y educacin es negativa. Esto se debe a que a mayor aos de escolaridad la probabilidad de trabajar aumenta (tal como lo muestra la estimacin anterior), y con esto disminuye la probabilidad de estar truncado. (vii) con cual de las dos estimaciones se quedara Ud.? (5 puntos)

Ya habamos mencionado que no se ven diferencias significativas en el retorno educacin sin corregir por que la muestra esta truncada y corrigiendo. Adems el test de hiptesis sobre el coeficiente rho, indica que no se puede rechazar que este sea igual a cero, es decir, el inverso de mill no es estadsticamente significativo, indicando que el problema de sesgo de seleccin no era tan grave. Por lo tanto, me debera quedar con la estimacin MCO que es la ms eficiente y la mejor considerando que el problema se sesgo de seleccin no es relevante.

11

ECONOMETRIA I /PROFESORA: JAVIERA VASQUEZ DEP ARTAME NTO DE EC ONOM A UNIVERSIDAD DE C HILE

Pauta Examen Final Econometr a I


Profesor: Tom as Rau Binder Ayudante: Victor Nahuelpan 23 de enero
Tiempo Total: 180 Minutos. Puntaje Total: 150 puntos.

1.

Comente las siguientes armaciones. Diga si estas son verdaderas, falsas o inciertas y justique su respuesta. (30 puntos en total, 5 puntos c/u, m aximo 5 renglones)

a) La presencia de error de medida produce que el estimador MCO sea sesgago e inconsistente. R. Incierto: si el error de medida es en la variable dependiente, este s olo producir a errores est andar m as elevados, pero el estimador MCO seguir a siendo insesgado y consistente. Por otra parte, si el error de medida es en las variables independientes, efectivamente, el estimador MCO ser a sesgado e inconsistente. b) La multicolinealidad implica que necesariamente aumente la probabilidad de cometer error de tipo II. R. Verdadero. Si existe multicolinealidad (no exacta, si la multicolinealidad es exacta el estimador MCO no existe) los errores est andar ser an muy elevados, con lo cual, los estad sticos ser an peque nos (por ejemplo el estad stico t o F) y tenderemos a no rechazar la hip otesis nula, aun cuando esta sea falsa. Por denici on, el error tipo II es el que se comete cuando uno no rechaza la hip otesis nula cuando ella es falsa, luego estaremos m as expuestos a este tipo de error. c) Dado que el estimador de MCG es MELI, siempre deber amos usar este m etodo en lugar de MCO. R. Incierto. Si bien es cierto que el estimador MCG es MELI ante perturbaciones no esf ericas, no es menos cierto que el estimador MCO tambi en es MELI si se cumplen los supuestos del Teorema de Gauss-Markov. En el caso de perturbaciones no esf ericas, la matriz es generalmente desconocida, luego es posible estimar usando MCF en lugar de MCG. En consencuencia, el comente s olo es verdedaro en el caso que es conocida y es diferente a la matriz de identidad. En todos los dem as casos es falso. d) La estimaci on por el m etodo de variables instrumentales es muy u til para los casos en que el residuo est a correlacionado con las variables independientes. R. Vedadero. El m etodo sirve para esos casos, puesto que se viola el supuesto de que las variables independientes y el residuo no est en correlacionadas. Un ejemplo que vimos en clases es cuando hay error de medida en las variables dependientes. Esto bajo el supuesto de que tenemos buenos instrumentos, que est en correlacionados con la variables independientes y no correlacionados con el residuo. 1

e) El m etodo de Cochrane-Orcutt sirve para obtener un estimador eciente cuando estamos en presencia de autocorrelaci on. R. Incierto. Es verdadero si la Autocorrelaci on es de primer orden, es decir, el proceso del error sigue un proceso AR(1). Es falso o incierto si la autocorrelaci on es de mayor orden. f) El criterio de informaci on bayesiano (BIC) es mayor al criterio de Akaike (AIC) cuando n > 3. R. Verdadero. De acuerdo a las f ormulas que vimos en clases, la u nica diferencia entre el criterio BIC y AIC es la manera en que penalizan la saturaci on del modelo (la p erdida de grados de libertad). Mientras el criterio AIC suma k/n el criterio BIC suma ln(n) k/n. Luego, si n > 3, tenemos que BIC AIC = ln(n) 1 > 0.

2.

Problema de Desarrollo (50 puntos)


y = 0 + 1 x1 + 2 x2 + u

Considere el siguiente modelo de regresi on lineal:

donde u satisface todos los supuestos vistos en clases. a) Suponga que Ud. no dispone de informaci on para la variable x2 y posee una muestra aleatoria simple para x1 e y . De qu e manera afecta al estimador MCO de 1 si Ud. omite la variable x2 del modelo de regresi on lineal? (5 puntos) R. La omisi on de una variable relevante, implica que el estimador MCO ser a sesgado. La direcci on del sesgo depender a del signo del par ametro de la variable omitida (2 ) y del signo de la covarianza de la variable omitida (x2 ) y con aquella que est a en el modelo (x1 ). Si 2 o cov (x1 , x2 ) = 0, la omisi on de la variable x2 no sesga la estimaci on de 1 . b) Suponga ahora que Ud. consigue informaci on para la variable x2 pero es advertido que esta fue medida con error. De que manera afecta al estimador MCO de 2 si Ud. estima el modelo con la informaci on disponible? (5 puntos) R. El error de medida siempre produce un sesgo de atenuaci on (hacia abajo) en la variable que se midi o con error. Luego este caso no est a excento de dicho problema. c) Suponga que Ud. nalmente consigue una muestra aleatoria simple para las variables y , x1 y x2 donde se le garantiza que no sufren de problemas de medici on, la cual est a dada en el cuadro 1. Cuadro 1: Datos y x1 x2 2 2 0 -2 -1 2 1 0 0 -1 -1 -2

Evalue la matriz X X . Qu e puede decir acerca de la relaci on entre x1 y x2 ? Como cambia su respuesta en a)? (5 puntos)

R. La matriz X X es diagonal y est a dada por: 0 0 8

4 0 X X = 0 6 0 0

Esto implica que las variables son ortogonales entre ellas, luego el producto punto entre x1 y x2 es cero y tambi en lo es su covarianza. La respuesta en a) cambia puesto que omitir x2 no produce problemas en la estimaci on de 1 d) Obtenga el estimador MCO de 0 , 1 y 2 (10 puntos) R. La estimaci on MCO entrega los siguientes valores: 0 0 = 1 = 7 / 6 2 1/4 e) Calcule los errores est andar y el R2 , Qu e puede decir acerca de la calidad de los datos? (10 puntos) R. Los errores est andar son los siguientes: 0 ) 0,577 SE ( ) = SE ( 1 ) = 0,471 SE ( 2 ) 0,408 SE ( y el R2 = 0,866. A la luz de los errores est andar, notamos que los test-t son en general bajos (de hecho ninguna variable es signicativa al 5 % si vemos los valores cr ticos en el Cuadro 1) y el R2 es relativamente alto, esto sugiere un potencial problema de multicolinealidad, pero debemos hacer una inspecci on m as formal para determinarlo. f) Obtenga el n umero de condici on (condition number ) y discuta si estamos en presencia de multicolinealidad. Ayuda: recuerde que los valores propios de una matriz A, corresponde a las ra ces de la siguiente ecuaci on |A I | = 0. (15 puntos) R. La matriz que debemos calcular es S (X X )S donde el elemento si,j = 1/ x i xj donde xi es el vector columna que contiene todas las observaciones para la variable xi . Luego, una simple inspecci on nos muestra que S (X X )S = I , es decir la matriz de identidad. Los valores propios de una matriz identidad son iguales a 1. Luego el n umero de condici on es igual a = max /min = 1 < 25, y de acuerdo a este criterio no habr a multicolinealidad.

3.

Problemas de An alisis

Problema I (40 puntos)


Keynes postul o que la propensi on marginal a consumir (P M C = Ct /Yt ) est a acotada entre 0 y 1. El tambi en postul o que la propensi on media a consumir (P M EC = Ct /Yt ) disminuye a medida que el ingreso disponible aumenta.

a) Especique la funci on lineal de consumo Keynesiana. Muestre que el supuesto de que la PMEC decrece con el ingreso implica que el itercepto es positivo. (5 puntos) R. La funci on de consumo Keynesiana se puede escribir como una relaci on lineal entre el consumo y el ingreso disponible. Ct = 0 + 1 Yt Se puede ver que P M EC = Ct 0 = + 1 Yt Yt

Luego para que P M EC sea decreciente a medida que aumenta Yt , 0 tiene que ser positivo. Si este es igual a 0, la PMEC es constante. Si este fuera negativo, la P M EC ser a creciente. b) Usando datos per c apita anuales, la estimaci on de la funci on de consumo para Estados Unidos fue la siguiente para el per odo 1929-1938:

981,35 + 0,735Y , R2 = 0,98 (158,65) (0,038)

Puede Ud. rechazar la hip otesis nula que la pendiente es mayor que cero? y menor que uno? Testee la hip otesis que el intercepto es igual a cero. (10 puntos) R. Asumiendo que los supuestos vistos en clases se cumplen, el estad stico t para PMC es -6.97, luego no se rechaza la hip otesis nula H0 : 1 1 ante la alternativa H0 : 1 > 1 al 5 %. Note que es un test a una cola donde la zona de rechazo est a en la cola derecha con unvalor cr tico aproximadod e 1.895 y entonces t = 6,97 < 1,895. Para la hip otesis nula H0 : 1 > 0 y H1 : 1 0 tenemos que el estad stico t=19.34 y el valor cr tico es -1.895 (la zona de rechazo est a en la cola izquierda). Luego, t = 19,34 > 1,895 con lo cual no se rechaza la hip otesos nula. Finalmente, la hip otesis nula H0 : 0 = 0 con la alternativa Ha : 0 = 0 se rechaza puesto que t=6.18 el cual es mayor que el valor cr tico 2.365. c) Dada la identidad del producto para una econom a cerrada Yt = Ct + It + Gt muestre por qu e los economistas notaron una implicancia de pol tica muy importante del hecho que la PMEC disminuya en el tiempo (debido a que el producto crece). (10 puntos) R. Si dividimos la identidad por Yt tenemos que, 1= Ct It Gt + + Yt Yt Yt

luego, si la P M EC decrece para mantener la igualdad debe crecer el gasto p ublico o la inversi on respecto al producto. El candidato m as probable era el gasto p ublico, lo cual es b asicamente una pol tica scal expansiva. 4

d) Simon Kuznets, que gan o el premio Nobel de econom a, junt o datos sobre gasto en consumo e ingreso desde 1869 y 1938 y encontr o que la PMEC era relativamente constante en el tiempo. Para reconciliar este hecho con los resultados de la regresi on, Milton Friedman, tambi en premio Nobel. formul o su hip otesis del ingreso permanente. En esencia Friedman postul o que tanto el consumo como el ingreso son medidos con error.
Ct = Ct + vt , Yt = Yt + wt

donde Ct y Yt son el consumo e ingreso permanente respectivamente y vt y wt son los errores de medida que fueron llamados consumo e ingreso transitorios respectivamente. Friedman pensaba que los componentes transitorios eran s olo errores aleatorios, no correlacionados con las t erminos permanentes. Considere que el consumo e ingreso permanente est an relacionados de la siguiente manera: Ct = k Yt as la PMC y PMEC son iguales y adem as constantes en el tiempo. Por u ltimo, asuma que el consumo e ingreso transitorio (vt y wt ) son errores independientes. Muestre que si estimamos la regresi on con los datos observados (Ct e Yt ) la PMC estar a sesgada hacia abajo y el intercepto ser a mayor que cero, incluso en muestras grandes. Para simplicar el an alisis asuma que Ct e Yt son independientes. (15 puntos) R. Recuerde que en presencia de error de medida en la variable independiente tenemos que 1 1+
2 2 SY

1 plim
1 2 donde SY = plim n tenemos que, n i=1

1 < k . Para el intercepto Yi2 . Luego, en este caso 1 = k y por lo tanto

1 Y = C 1 Y 1 w = C +v 1 w + v = 0 + 1 Y 1 Y 1 w + v 1 )Y = 0 + (1 1 )Y = 0 + (1 plim 2 = 0 + 1 2 w 2 Y w + SY

0 plim

0 > 0 . Luego, plim

Problema II (30 puntos)


Sir Francis Galton (1822-1911), un antrop ologo y primo de Charles Darwin, cre o el t ermino Regresi on a la mediocridad en estatura hereditaria, Galton compar o la altura de los hijos con la de sus padres, usando una muestra de 930 hijos y 205 parejas. En esencia, el encontr o que padres altos (bajos) tienen altos (bajos) hijos, pero que los ni nos no ser an tan altos (bajos) como sus padres, en promedio. Luego, habr a lo que conocemos como regresi on a la media, o como Galton se reri o, regresi on a la mediocridad. Este resultado es una falacia si se intenta inferir este comportamiento a lo largo del tiempo. Si fuera verdad, la varianza de la altura en humanos hubiese disminuido de generaci on en generaci on y ese no es el caso. 5

a) Para investigar acerca este resultado Ud. junta datos de estudiantes universitarios y sus padres y estima la siguiente relaci on:

Ae

0,5 + 0,7 Ap , R2 = 0,45, n = 1000 (0,7) (0,32)

donde Ae es la altura del estudiante medida en centim etros y Ap es la altura del padre del estudiante. Los valores entre par entesis son los errores est andar corregidos por heterocedasticidad. Haga un gr aco con esta l nea de regresi on junto con una l nea de 45 grados y explique por qu e el resultado encontrado arriba sugiere regresi on a la media. (10 puntos) R. Gracando la recta tenemos que

El resultado sugiere regresi on a la media puesto que los hijos de padres bajos ser an m as altos que sus padres y los hijos de padres altos ser an m as bajos que sus padres. Si esto sucede de generaci on en generaci on, tenemos que la altura de las personas converger a a un valor medio. b) Investigando la literatura m edica Ud. encuentra que la altura depende, en una proporci on important sima, de un gen llamado phog y de factores ambientales. Suponga la altura del hijo(a) est a determinada por el padre y que padre e hijo(a) tienen exactamente el mismo gen el cual no cambia en el tiempo y que la altura es medida con error de la siguiente manera: Xi,h = f (Xi ) + vi,h , y Xi,p = f (Xi ) + ui,p donde Xi,h es la medida de la altura del hijo h que tiene un gen Xi y los factores ambientales est an dades por vi,h para el hijo y ui,p para el padre. La estatura medida del padre est a dada por Xi,p . Considere que los factores ambientales son independientes el uno del otro y adem as son independientes del gen. Combinando las dos ecuaciones, encuentre una funci on de regresi on poblacional y discuta su relaci on con la falacia de Galton. (10 puntos) 6

R. Restando las dos ecuaciones tenemos la siguiente funci on de regresi on poblacional: Xi,h = Xi,p + (vi,h vi,p ) claramente esta funci on no se condice con la falacia de Galton puesto que el intercepto es igual a 0 y la pendiente es igual a 1, por lo tanto seg un esta especicaci on no habr a regresi on a la media. c) C omo testear a las dos restricciones implicitas en la funci on de regresi on poblacional encontrada en b)? A la luz de lo que encontr o en sus estimaciones en a?, c omo testear a si estas restricciones se cumplen o no? (10 puntos) R. las restricciones son que e intercepto sea igual a cero y la pendiente igual a uno. Para testear las dos restricciones habr a que hacer un test conjunto como el test de Wald o un test F. Con lo encontrado en b) y s olo con la informaci on que tenemos de b), la u nica manera de testear esas hip otesis separadamente mediantes test-t. Los valores de los test-t son para el intercepto t = 0,71 y para la pendiente t = 0,93, luego no se rechaza ninguna de las dos hip otesis. Esto no nos ayuda mucho, puesto que como se dijo anteriormente la u nica manera de testear este modelo correctamente es haci endolo con un test de hip otesis conjunta.

Cuadro 2: Valores Cr ticos para una distribuci on t-Student


n-k 1 2 3 4 5 6 7 90 % 3.078 1.886 1.638 1.533 1.476 1.44 1.415 95 % 6.314 2.92 2.353 2.132 2.015 1.943 1.895 97.50 % 12.71 4.303 3.182 2.776 2.571 2.447 2.365 99 % 31.82 6.965 4.541 3.747 3.365 3.143 2.998 99.50 % 63.66 9.925 5.841 4.604 4.032 3.707 3.499

AYUDANTAS

Ayudanta de Econometra 17 de Junio 2004 Heterocedasticidad y Autocorrelacin


Profesores: Javiera Vasquez y Andres Otero
1. Considere el siguiente modelo: Yi = +

1 Y = 3 5

0 1 0 = 0.5 0 . 0 2
2

MCG MCO y a) Calcule MCO ) y Var( MCG ) b) Calcule Var( MCO ) que resultara de un modelo sin heterocedasticidad. c) Calcule la Var( d) Cul estimador es ms eficiente? 2. Considere ahora N=50 en las siguientes estimaciones calculadas a partir de los residuos de mnimos cuadrados ordinarios.
2 2 e2 0 + a 1et 1 + a 2 et 2 + v t t = a 2 e2 0 + c 1 x t1 + c 2 x t + wt t = c

R 2 = 0 .5 R 2 = 0 .6 R 2 = 0 .9

0 + b 1 xt + b 2 et 1 + b 3 et 2 + vt et = b
0 + b 1et 1 + wt et = b R 2 = 0 .4

a) Evale la existencia de autocorrelacin de orden 2 utilizando un test asinttico b) Evale la existencia de heterocedasticidad utilizando un test F de bondad de ajuste. 3. Considere la siguiente informacin para responder las siguientes preguntas. 3 2 Y = 2.75 1 0 1 2 X = 2 dnde el modelo a estimar es yi = xi + u i 5 1

3.1) Si u i ~ N (0, i 2 )

con i = 1,2, K 5 .

3.1.1) Muestre cual es la variable dependiente e independiente que debe utilizar


MCO y MCG . para calcular

3.1.2) Muestre cuanto vale

3.2) Si con la informacin del apartado 3.1) Usted obtuvo los siguientes
MCO = 0.5 , MCG = 1.22 , Var( MCG ) = 0.3 y resultados

j 1 e e [x ' x L + 1
2 5 j =1

t = j +1

t t j

t j

+ xt j ' xt = 0.5

3.2.1) Evale si

= 0.5 asumiendo que existe heterocedasticidad del tipo

u i ~ N (0, i 2 ) con i = 1,2, K 5

3.2.2) Evale si = 1 asumiendo que el problema no es el sealado en 3.1, sino que existe autocorrelacin.

4. Considere el modelo: yt = + t

t = u t - u t -1

u ~ N(0,5)

4 Si y = 5 , obtenga el estimador de 3 5. Considere el siguiente MRL donde se cumplen todos los supuestos de MCO. Yi = X i + u i 4 1 3 2 donde Y = y X = 6 3 1 0 Sin embargo, se presume que puede existir heterocedasticidad.

en una estimacin de MCO? a) Cul es el usual estimador de la varianza de


b) Cul es la matriz de varianza y covarianzas de White? c) Realice un test de White para probar la existencia de heterocedasticidad.

d) Realice un test de Lagrange Multiplier para testear autocorrelacin (con un rezago), cul es la hiptesis alternativa para este caso en particular? Para este apartado usa en vez de la informacin original, los siguientes vectores: 4 1 3 2 Y = 6 y X = 3 1 0 6 3 6. Considere la siguiente estimacin entre el retorno de las acciones de Microsoft y el retorno de mercado medido por el retorno asociado al ndice de Dow Jones.
Dependent Variable: RMICROSOFT Method: Least Squares Included observations: 150 after adjusting endpoints Variable C RDOW JONES Coefficie Std. Error t-Statistic nt 0.003845 0.002445 1.572531 0.941777 0.110496 8.523149 Prob. 0.1167 0.0000

150 0.0028 0.015 0.7679 0.0012 ei2 xi ' xi = ( X ' X ) 1 = 5.6914 0.0004 i =1 5 150 0.8718 0.0007 j et et j xt x't j + xt j x't = 1 0.0003 L + 1 t = j +1 j =1

et et 1 e
1 1 150 2 t 1

150

= 0.25

e
1

150

2
t

148

= 0.052

a) Evale la existencia de autocorrelacin de orden 1. b) Basndose en la conclusin obtenida en a), evale la hiptesis nula de que el retorno de Microsoft es igual al retorno del mercado.

Resoluci on Problema 5 y 6 Ayudant a Econometr a 17 de Junio


Profesores Javiera V asquez y Andr es Otero Preparado por Javier Fern andez

Problema 5:
es A) El estimador de la varianza de 2 (X X )1 , para lo cual necesitamos , y luego con este, los e obtener el (para estimar 2 ), por lo tanto: = (X X )1 X Y = 28 = 2, 14 Con lo que

= Y

2 4 6 0

,e =

2 1 0 1

4+1+0+1 e e 2 = = 2, , = nk 41

mco ) = 2 = 1 V ar( 14 7

B) La matriz de varianzas y covarianzas de White (S0 ) esta denida de la siguiente forma: 1 n 2 S0 = e xi xi n i=1 Donde xi es un vector la correspondiente a la iesima observaci on, por lo tanto: 1 S0 = [4 (1)2 + 1 (2)2 + 0 (3)2 + 1 (0)2 ] = 2 4

C) Para realizar un test de White necesitamos primero estimar por MCO (que ya fue hecho en partes anteriores) y luego correr una regresi on entre el error estimado al cuadrado de la regresi on MCO y todas las combinaciones posibles de X (notar que los regresores de esta regresi on son todos combinaciones de variables o variables al cuadrado), sin olvidar la constante, pues usaremos el R2 de la regresi on. En este caso, como la matriz X tiene solo una columna, el regresor es X 2 , con lo cual, si Y = e 2 y Z es una matriz que posee una columna de unos, y otra con X 2 , la regresi on entre Y y Z en desviaciones de

media resulta como sigue:

Y Y =

2,5 0,5 1,5 0,5

,Z Z =

2,5 0,5 5,5 3,5

13 , = 49

Con los resultados anteriores se puede obtener el R2 de la regresi on, para realizar el test de White: Z M0 Z R = = Y M0 Y
2 13 49 2

49

= 0,3832

TW hite = n R2 = 4 0,3832 = 1,5328 Lo que se compara con 3.84, que es el T critico proveniente de una 2 con p 1 grados de libertad, donde p es el numero de par ametros de la regresi on auxiliar; dado lo anterior, no se rechaza la hip otesis nula de este test, que es de Homocedasticidad. D) En este caso, lo que hace el test de Breusch-Godfrey (LM) es estimar por MCO, y luego correr una regresi on con el error estimado resultante dependiendo de una constante (pues se usa el R2 ), las variables X, y rezagos del error. Luego el test es n R2 y debe distribuirse bajo la nula como una 2 p, donde p es el numero de rezagos del error incluidos en la regresi on.
Y =

4 3 6 1 6

, X =

1 2 3 0 3

= 46 = 2, e , = 23

2 1 0 1 0

Ahora se corre una regresi on entre:

e =

1 0 1 0

y Z =

1 2 2 1 3 1 1 0 0 1 3 1

y el R2 resultan como sigue: Al hacerlo en desviaciones de media, el = 0,018 0,345 y R2 = Z M0 Z = 0,67 Y M0 Y

Con lo cual el test de Breusch-Godfrey toma la siguiente forma: Tbg = n R2 = 4 0,67 = 2,68 El resultado anterior nos lleva a no rechazar la hip otesis nula (ausencia de autocorrelaci on de hasta orden p), pues el T critico es 3.84. La hip otesis alternativa de este test es la existencia de autocorrelaci on de orden p, donde p, como ya se dijo, es el numero de rezagos del error que se incluyen en la regresi on auxiliar. La hip otesis alternativa de este test es la existencia de autocorrelaci on de al menos orden p, dado que no se vericaron ordenes superiores. 2

Problema 6:
A) La autocorrelaci on de orden 1 puede ser testeada con el test de Durbin 1 Watson, que es de la forma 2(1), en este caso disponemos de una estimaci on de ,2 que es:
150 i=1 et et1 150 2 i=1 et1

= 0,25, con lo cual el test queda: DW = 2(1 0,25) = 1,5

(1)

lo anterior pudiese sugerir autocorrelaci on positiva, y al comparar el DW con 3 la zona critica (provenientes de alg un libro, Greene por ejemplo) se aprecia que es estad stico cae en la zona de autocorrelaci on positiva, lo que entrega evidencia estad stica a favor de la existencia de autocorrelaci on de orden 1, y solo de orden 1, ya que este test no entrega ning un tipo de conclusi on acerca de ordenes superiores de autocorrelaci on. B) En este caso, para realizar inferencia lo correcto es usar la matriz de Newey West al calcular el proxy a la matriz de varianzas y covarianzas, pues hay evidencia de autocorrelaci on de al menos orden 1, y como no conocemos el patr on exacto, esto es lo adecuado. La hip otesis conjunta que se pide evaluar es C = 0 y RDOW JON ES = 1, pues esta es equivalente con que el retorno de Microsoft es igual al retorno del mercado. El estad stico adecuado es un test F para hip otesis conjuntas, que depende de la normalidad del error, o un test asint otico de hip otesis conjuntas, como el test de Wald, que requiere de una muestra grande. Dado el contexto, y todo lo anterior, lo m as adecuado pareciera ser usar el test de Wald, (pues no estamos seguros de la normalidad del error, disponemos de un n grande, y adem as 2 debemos usar un estimador asint otico de (X X )) cuya expresi on es como sigue: M CO q RV ( M CO )R 1 R M CO q TW = R (2) M CO ) es la correcta matriz de varianzas y covarianzas de M CO , y Donde V ( en este caso particular, dado la presunci on de autocorrelaci on, esta es de la siguiente manera: M CO ) = (X X )1 S (X X )1 V ( (3)

0,0028 0,015 5,6914

1 150

0,7679 0,0012 0,0004

0,8718 0,0007 0,0003

0,0028 0,015 5,6914 (4)

M CO q ] es de la forma: y [R =
1

1 0 0 1

0,003845 0,941777

0 1

(5)

Recordar que se puede usar solo si la estimaci on no incluye a la variable dependiente rezagada. 2 El par ametro proviene de la relaci on et = et1 + , donde es un ruido blanco. 3 En este caso, se uso una zona critica para un n = 150, y un K = 1, hay que recordar que este K no incluye a la constante; as es como la zona critica que nos interesa, que es la del lado izquierdo, esta entre 1.611 y 1.637.

El calculo del estad stico queda propuesto, al igual que la conclusi on, la cual 2 con un de tabla. se obtiene al comparar el 2 calc (2)

Departamento de Econom a

Universidad de Chile

Econometr a I
o 2005 Oton Ayudant a No 8 Profesores: Andr es Otero y Javiera V asquez Ayudantes: Rodrigo Bravo y Roberto Jaramillo

Comentes
Comente las siguientes armaciones. Utilice matem aticas y gr acos si lo cree pertinente. 1. Siempre podemos utilizar para testear hip otesis los test t y F. Respuesta: Falso, ya que es necesario que se cumpla que el error est e normalmente distribuido. Esto es porque cualquier funci on lineal de variables normalmente distribuidas estar a tambi en nor malmente distribuida, lo que es equivalente a decir que si u est a normalmente distribuida, los tambi en lo estar an. 2. Una funci on de distribuci on normal se caracteriza porque su simetr a es cero, y su kurtosis es indenida. Respuesta: Falso. Es correcto que la funci on de distribuci on normal tiene simetr a igual a cero, pero su coeciente de kurtosis (es decir, el ancho de las colas de la distribuci on) es igual a 3. 3. Si los errores del modelo de regresi on lineal no tienen distribuci on normal, a pesar de que los estimadores MCO ya no son MELI, siguen siendo insesgados. Respuesta: El comente es falso ya que el resultado de que los estimadores por MCO son MELI no requiere que los errores se distribuyan normal. En efecto tal propiedad requiere que los errores 2 cumplan la siguiente condici on: E (ui ) = 0 i, V ar(ui ) = i I y Cov (ui , uj ) = 0 = j , es decir, que los errores ui iid sean independientes e id enticamente distribuidos. 4. Es mejor predecir un valor puntual de y 0 que el valor esperado E (y 0 /x0 ), ya que uno hace lo primero con mayor precisi on. Respuesta: Falso. La varianza del error de predicci on al predecir un valor puntual de y 0 es mayor 0 0 que al predecir E (y /x ), por lo tanto lo primero es menos preciso.

Ejercicios
(al predecir el valor de E (y 0 )), y 1. Encontrar la varianza del error de predicci on e = E (y 0 ) X 0 compararla con la varianza que se obtiene al predecir un valor puntual de y 0 Respuesta: = x0 x0 = x0 ( ) = x0 (X X )1 X u e = E (y 0 ) Y 0
2 e ee ] = E [x0 (X X )1 X uu X (X X )1 x 0 ] = E [

2 0 1 2 e X (u )X (X X )1 x 0 ] = x (X X )

2 2 0 1 e X X (X X )1 x 0 ] = u [x (X X )

Departamento de Econom a

Universidad de Chile

2 2 0 1 0 e x ] = u [x (X X )

0 = x0 ( ) + u0 . Por Al calcular un valor puntual de y 0 , el error de predicci on es e0 = y 0 y lo tanto, calculando su varianza:


2 ) + u0 )(x0 ( ) + u0 ) ] e ee ] = E [(x0 ( = E [

2 0 0 0 0 0 0 0 0 e = E [x ( )( ) x + x ( )u + (x ( )) u + u u ]

2 0 0 0 0 e = E [x ( )( ) x ] + E [u u ]

2 2 0 1 0 2 e x ] + u = u [x (X X )

2. Suponga que con datos de 2 pa ses (Uganda y Suiza) tomados anualmente durante 10 a nos, usted obtiene la siguiente estimaci on: Crecimiento = RecursosN aturales + HDI + u 2 = 0, 09. Adem = 0, 01, Con = 0, 01, as: (X X )1 = 1, 0 0, 2 0, 2 0, 1

Suponga que usted se entera de que el pr oximo a no Uganda tendr a 2 unidades de RecursosN aturales y 0 de HDI , mientras que Suiza tendr a 0 de RecursosN aturales y 2 de HDI . Cu al es su predicci on para el crecimiento de ambos pa ses el pr oximo a no? Cu al es su certeza de la armaci on anterior? Respuesta: El modelo que usaremos para calcular la predicci on es el siguiente: HDI y = RN + Por lo tanto, la predicci on para el crecimiento de y de Uganda es: 0 = x0 y 0, 01 = 0, 02 0, 01

Ahora hay que calcular el valor del estad stico t, para ver si el valor es estad sticamente signicativo. Pero para calcular el estad stico t, a un nos falta conocer la varianza de la predicci on de y . Recordar que estamos calculando la varianza del error de predicci on cuando se quiere conocer un valor puntual (para cada pa s). Calculando para Uganda se obtiene:

Departamento de Econom a

Universidad de Chile

0 1 0 2 2 x ] e = u0 [1 + x (X X )

2 e = 0,09[1 + 2

1 0,2

0,2 2 ] 0,1 0 2 ] 0

2 e = 0,09[1 + 2

0,4

2 e = 0,45

Calculando el intervalo de conanza: P r[t/2,nk < 0 yt+1 y


2 V ar(e )

< t1/2,nk ] = 1

Los grados de libertad son 10-2=8. Adem as asumimos un grado de signicancia de 0.05. Por lo tanto el estad stico t es igual a 2.306 (dos colas). Esto implica que: P r[2,306 < yt+1 0,02 < 2,306] = 0,95 0,45

P r[1,5269 < yt+1 < 1,5669] = 0,95 Siguiendo los mismos pasos anteriores para Suiza, obtenemos que el crecimiento (predicci on) es: 0 2 0, 01 = 0, 02 0, 01

Para calcular el estad stico t, es necesario calcular nuevamente la varianza del error de predicci on, ya que los datos de la matriz x0 cambiaron.
2 2 0 1 0 e x ] = u0 [1 + x (X X )

2 e = 0,09[1 + 0

1 0,2

0,2 0 ] 0,1 2 0 ] 2

2 e = 0,09[1 + 0,4

0,2

2 e = 0,09[1 + 0,4]

2 e = 0,126

Ya que se tiene la varianza del error de predicci on, ahora podemos calcular el intervalo de conanza de la predicci on del crecimeinto de Suiza. Calculando el intervalo de conanza: 3

Departamento de Econom a

Universidad de Chile

P r[t/2,nk <

0 yt+1 y
2 V ar(e )

< t1/2,nk ] = 1

Los grados de libertad son 10-2=8. Adem as asumimos un grado de signicancia de 0.05. Por lo tanto el estad stico t es igual a 2.306 (dos colas). Esto implica que: P r[2,306 < yt+1 0,02 < 2,306] = 0,95 0,126

P r[0,7986 < yt+1 < 0,8386] = 0,95 El nivel de certeza que utilizamos para calcular los intervalos de conanza fue del 95 por ciento. 3. La Subseccretar a de electricidad y combustibles est a interesada en conocer la relaci on que existe entre consumo de energ a el ectrica (y ) y el consumo de gas natural (x). Con este n, encarga a la Subdirecci on General de Estudios la especicaci on de un modelo econom etrico entre estas variables y su estimaci on a partir de las series de datos disponibles en la subsecretar a. Suponga que usted trabaja como t ecnico en la citada subdirecci on y es el encargado de realizar el informe solicitado. Para ello dispone de la siguiente informaci on elaborada por su ayudante a partir de los datos originales: n = 35 (yi y )2 = 12,15 x = 17,22 xy = 37,1022 x2 = 10,92 R = 0,7462
2

y = 85

Es signicativo el coeciente del consumo de gas natural en la explicaci on del consumo de energ a? Respuesta: Primero es necesario calcular el valor del = n n xy x y x2 ( x)2

= 35 37,1022 17,22 85 35 10,92 (17,22)2 = 165,123 85,6716 = 1,9274 Ahora calculando la varianza del coeciente: ) = V ar(
2 u (xi x )2

2 Sin embargo a un nos falta conocer el valor de u . Este valor lo podemos obtener del R2

R2 = 1

SR ST

SR = ST (1 R2 ) 4

Departamento de Econom a

Universidad de Chile

SR = u u = 12,15(1 0,7462) = 3,08367 u u nk

2 u =

2 u =

3,08367 = 0,09345 33

Por lo tanto el estad stico t es igual a : 1,9274 0 t= = 6,305 0,09345 En una tabla T, evaluando con 33 grados de libertad y con un = 0,05, el t calculado es igual a (usamos el de 30 GL porque no est a disponible el de 33: t0,975,30 = 2,042 Por lo tanto existe suciente evidencia para decir que el coeciente es estad sticamente signicativo, con un 95 por ciento de conanza.

Demostracin

Econometra I FACEA, Universidad de Chile

Matriz P cuando estamos en presencia de slo Heterocedasticidad: Recordemos que para aplicar Mnimos Cuadros Generalizados (MCG) debemos hacer una descomposicin espectral de la matriz : Descomposicin Espectral de una Matriz:1 = C C donde C es la matriz de vectores caractersticos, y una matriz diagonal cuyos elementos en la diagonal son los valores propios asociados a cada vector propio de la matriz C . Valores propios: Los valores propios de la matriz se obtienen resolviendo el siguiente sistema de ecuaciones: | I | = 0 donde es el valor propio e I una matriz identidad con las misma dimensin de . Vectores propios: Cada vector propio (c) tiene dimensin n 1, y debe satisfacer la siguiente ecuacin: ( I )c = 0 Adems debe satisfacer que c c=1. Finalmente utilizando esta descomposicin, el estimador MCG dena la matriz P = C 1/2 para transformar el modelo a un modelo con matriz de varianzas y covarianzas escalar o esfrica de los errores. EJEMPLO: Veamos como sera la matriz P cuando tenemos slo Heterocedasticidad en el error, adems asumamos un caso sumamente sencillo donde slo tenemos dos observaciones i=1,2. En este caso la matriz es2 : =
1 2

2 0 1 2 0 2

Greene. Anlisis Econometrico, pgs. 30-33. Recuerde que se puede denir indistintamente reescalando por 2 o no

Demostracin

Econometra I FACEA, Universidad de Chile

Obtengamos los valores propios de para construir la matriz :


2 1 0 2 0 2

0 0

=0 =0

2 1 0 2 0 2

2 2 (1 )(2 ) = 0 2 2 2 2 1 2 1 2 + 2 = 0 2 2 2 2 1 2 (1 + 2 ) + 2 = 0

2 2 (1 + 2 )

2 2 2 2 2 (1 + 2 ) 41 2 2 2 2 2 2 2 ( + 2 ) (1 2 ) = 1 2 2 2 2 2 (1 + 2 ) (1 2 ) = 2 2 1 = 1 2 2 = 2

De esta forma la matriz es: =


2 1 0 2 0 2

Ahora calculemos los vectores propios, recuerde que cada valor propio tiene asociado un vector propio. Comencemos con el vector propio de 1 . Este debe cumplir las siguientes ecuaciones:
2 1 1 0 2 0 2 1

c1 c2

=0

(1) (2)

2 c c = 1 c2 1 + c2 = 1

2 2 1 ) = 0, lo que implica que c2 = 0. Utilizando (2) De (1) obtenemos que c2 (2 podemos obtener c1 = 1. De esta forma el vector propio asociado a 1 es:

1 0 De igual forma podemos calcular el vector propio asociado al segundo valor propio (2 ), el que debe cumplir con las siguientes ecuaciones:
2 2 0 1 2 0 2 2

c1 c2

=0

(3) (4)

2 c c = 1 c2 1 + c2 = 1

Demostracin

Econometra I FACEA, Universidad de Chile

2 2 De (3) obtenemos que c1 (1 2 ) = 0, lo que implica que c1 = 0. Utilizando (4) podemos obtener c2 = 1. De esta forma el vector propio asociado a 1 es:

0 1 De esta forma, la matriz C de vectores propios es simplemente una identidad: C= Luego la matriz P es: P = C 1/2 = 1 0 0 1
1 1

1 0 0 1

0
1 2

1 1

0
1 2

De lo cual se obtiene una gran conclusin, cuando estoy slo en presencia de Heterocedasticidad, para trasformar mi modelo en uno Homocedstico, debo dividir cada observacin de mi variable dependiente y variables explicativas por la desviacin estndar de su error. Es decir, dividir (yi , xi ) por i .

Departamento de Econom a

Universidad de Chile

Econometr a I
o 2005 Oton n Multicolinealidad y Error de Medicio Profesores: Andr es Otero y Javiera V asquez Ayudantes: Jos e Manuel Castell on y Roberto Jaramillo

1.

Comentes
Comente las siguientes armaciones. Utilice matem aticas y gr acos si lo cree pertinente.

1. El error de medici on no genera ning un problema cuando este se encuentra en la variable independiente. Sin embargo, si este se encuetra en la variable dependiente, el estimador MCO deja de ser MELI. Respuesta: Falso. El error de medici on cuando se encuentra en la variable dependiente no genera problemas que provoquen que el estimador MCO deje de ser MELI, ya que no se ha roto el supuesto de que cov (x, u) = 0. Sin embargo, cuando el error de medici on se encuentra en la variable independiente, el estimador MCO deja de ser MELI. 2. La multicolinealidad es un problema grave, que siempre hay que eliminar. Respuesta: No necesariamente. La multicolinealidad es problema que afecta muchos elementos en la estimaci on de los modelos. Sin embargo, esta es propia del modelo que se est a analizando, por lo que si esta se trata de eliminar, se corre el riesgo de estar cambiando el modelo en s . 3. Cuando los datos que estamos analizando tienen multicolinealidad, el estimador MCO no puede calcular el valor de los par ametros, porque la varianza de los coecientes estimados es casi cero. Respuesta: No siempre. Cuando la multicolinealidad es exacta, no se pueden calcular los par ametros por MCO, ya que det((X X )1 ) no est a denido. Sin embargo, cuando no es exacta, s se pueden calcular los par ametros por MCO, pero estos tienen una serie de problemas. 4. Una de las formas m as f aciles de identicar la multicolinealidad es cuando vemos que el modelo que estamos estimando tiene un R2 bajo, pero todos los coecientes son estad sticamente signicativos. Respuesta: Falso, porque es al rev es. Una de las form as m as f aciles de detectar la multicolinealidad, es cuando se tiene un R2 , pero los p ar ametros no son estad sticamente signicativos.

2.

Ejercicios

1. Considerar el siguiente modelo: Yi = Xi + ui a ) Demostrar que la covarianza entre el t ermino de error del modelo y la variable X es igual a cero si es que la variable X es medida correctamente, pero la variable Y es medida con error. Respuesta: Para el siguiente modelo: Yi = Xi + ui Cuando la variable dependiente est a medida con error:

(1)

Departamento de Econom a

Universidad de Chile

Yi = Yi + Reemplazando (2) en (1): Yi +


i

(2)

= Xi + ui

Yi = Xi + ui + Con = ui +
i

Yi = Xi + i Para sacar la covarianza, sabemos que Cov (X, i ) = E (X i )

E (X i )

= = = =

E (X (ui i )) E (Xui + X i ) E (Xui ) + E (X i ) 0

b ) Obtener una expresi on para la covarianza entre el t ermino de error y la variable X , suponiendo que el error de medici on de Y es directamente proporcional a X . Respuesta: Si el error de medici on de Y es proporcional a X equivale a decir que: Yi
i

= Yi + i = Xi + i

Siguiendo que Cov (Xi , i ) = E (Xi i )

E (Xi i )

= = = = = =

E (X (ui i )) E (Xi (ui X i )) E (Xi ui X 2 Xi ) E (Xi ui ) E (X 2 ) E (Xi ) 2 E (Xi ) 0

Por lo tanto MCO deja de ser MELI. 2. Considerar el siguiente modelo:

Yi = 1 + 2 Xi + 3 Zi + ui

(3)

Ser a igual que se tenga que Xi + Zi = 8 que 2 + 3 = 8 para obtener los par ametros estimados? 2

Departamento de Econom a

Universidad de Chile

Respuesta: Para ver los efectos de estas equivalencias, las reemplazaremos para observar los resultados que tienen sobre la estimaci on MCO. Reemplazando Zi = 8 Xi en (3) resulta:

Yi

= 1 + 2 Xi + 3 (8 Xi ) + ui = 1 + 2 Xi + 83 3 Xi + ui = 1 + 83 + Xi (2 3 ) + ui

Utilizando 4 = 1 + 83 y 2 3 = 5 queda:

Yi = 4 + 5 Xi + ui

(4)

En (4) el problema es que se genera es que al momento de estimar el modelo, encontrar amos 4 y 5 , volvi los valores de endose imposible encontrar los valores originales (antes de la trans 1 , beta 2 y beta 3 . Esto se debe a que el modelo sin la transformaci formaci on) de beta on ten a multicolinealidad, que provoca alguns de los par ametros no puedan ser estimados. Ahora utilizando 3 = 8 2 y reemplazando en (3) resulta:

Yi

= 1 + 2 Xi + (8 2 )Zi + ui

3 = 8 2 , y al encontrar los par Por lo que no afectar a nuestra estimaci on, ya que ametros no generar a los problemas que aparec an con la primera transformaci on. 3. Suponga que usted tiene que estimar el siguiente modelo en desviaci on con respecto a la media: yi = 1 x1,i + 2 x2,i + ui con i = 1, ..., 102 De la cual se obtienen los siguientes resultados: 1 = 0,5, 2 = 0,4, x1 x2 = x2 x2 1 = 2 = 10, Cov (x1 , x2 ) = Cov (x2 , x1 ) = 0,56, V ar(y ) = 25,2 1 ) = V ar( 2 ) = 0,7, x2 x1 = 8, V ar(

a ) Realice los test de signicancia para cada uno de los par ametros. b ) Determine el n umero de condici on de la matriz X, para ver la presencia de colinealidad entre las variables explicativas. Respuesta: a) Para realizar los test de signicancia de los par ametros utilizamos un estad stico t, que se compara con el valor de tabla de un valor tnk , en que n k = 102 2 = 100 al 95 % de conanza con dos colas. El valor del estad stico es 1.9840. 1 : Para t= 1 1 ) V ar( 3 0,5 = = 0,59 0,7

Departamento de Econom a

Universidad de Chile

Como t100,95 % = 1,9840, por lo que el par ametro no es estad sticamente signicativo. Para 2 : t= 2 2 ) V ar( 0,4 = = 0,48 0,7

Como t100,95 % = 1,9840, por lo que el par ametro tampoco es estad sticamente signicativo. b) El n umero de condici on de la matriz X se obtiene calculando el valor de Belsley, que se calcula como =
M AX M IN ,

en que son los valores propios de la matriz S (X X )1 S . S es

una matriz de n n diagonal, en que su diagonal est a formada por 1 S=

P1x

Px
. . . 0

2 1

... . ... ..

0
1 P x


nn

. . .

2 n

Para este ejercicio, el valor de S est a dado por:


1 10

S= Adem as la matriz (X X )1 es igual a :

0
1 10

(5)

(X X )1 =

x2 1 x2 x1

x1 x2 x2 2

10 8

8 10

(6)

Por lo que la matriz B = S (X X )1 S utilizando (5) y (6) queda 1 : 1 4/5 4/5 1

B = S (X X )1 S =

(7)

Ahora hay que calcular el o los valores propios de B , lo que se hace a continuaci on:

|B I | = 1 4/5 1 0 | | = 4/5 1 0 1 | 1 4/5 4/5 | = 1

0 0 0

Calculando el valor anterior (determinante) queda: (1 )2 (4/5)2 = 0


1 Recomendable

(8)

comprobar, para ejercitar la parte matem atica

Departamento de Econom a

Universidad de Chile

De (8) obtenemos los valores propios 1 = 1/5 y 2 = 9/5 y reemplazando estos valores en el ndice de Belsley queda:

M AX = M IN

9/5 =3 1/5

Como el ndice es menor que 25, no estamos en presencia de multicolinealidad.

Departamento de Econom a

Universidad de Chile

Econometr a I
Primavera 2005 Ayudant a Extra - 05-08-05 Profesores: J. V asquez-F. Tagle, R. Montero, E. Melo Ayudante: Roberto Jaramillo 1

1.

Ejercicios
a ) Qu e variaciones puede obtener de este modelo? Nota: Encuentre los estimadores cuando el modelo tiene s olo constante, s olo pendiente, y ambas. Respuesta: Para todos los modelos que se denan, lo que se busca es minimizar las suma de los errores al cuadrado. 1) Utilizando este criterio en un modelo con pendiente y constante: yi ui
n

1. Derive los estimadores MCO a partir de un modelo con una variable explicativa.

= 0 + 1 xi + ui = yi 0 1 xi
n

i=1

u2 i

=
i=1

(yi 0 1 xi )2

Minimizando la suma de los errores al cuadrado:


n

M IN0 ,1 Trabajando con (2)


n

u2 i =0 =0

(1) (2) (3)

i=1 n 2 i=1 ui

0
n i=1

u2 i

n i=1

u2 i

0 2
i=1 n

= = = =

0 0 0 0

(yi 0 1 xi ) (yi 0 1 xi )
i=1

yi n0 1
i=1 i=1

xi

0 = y 1 x
1 rojarami@facea.uchile.cl

Departamento de Econom a

Universidad de Chile

Usando ahora (3)


n n i=1

u2 i

1 2
i=1 n

= = = =

0 0 0 0

(yi 0 1 xi )xi (yi 0 1 xi )xi


i=1

xi yi 0
i=1 i=1

xi 1
i=1

x2 i

0 en la u Reemplazando el estimador de ltima expresi on resulta:


n n n

1 x xi yi ( y )
n

xi 1
i=1 n i=1 n

x2 i x2 i
i=1 n

= = =

0 0 0

xi yi (
i=1 n

i=1 n i=1 yi

n xi n

1 yi

n i=1

xi

)
i=1

xi 1 xi )2 1
n i=1 n

xi yi
i=1

n i=1

n i=1

1 ( +
n

n i=1

n xi yi

x2 i yi
i=1

n 1 =
i=1

xi
i=1 n

n
i=1

x2 i (
i=1

xi )2

2) Ahora usando un modelo que s olo tiene constante: yi ui


n

= 0 + ui = yi 0
n

i=1

u2 i

=
i=1

(yi 0 )2

Minimizando la suma de los errores al cuadrado:


n

M IN0 2
i=1 n

u2 i i=1 n 2 i=1 ui

0 (yi 0 ) yi n0

= = =

0 0 0

i=1

0 = y 2

Departamento de Econom a

Universidad de Chile

3) Y con un modelo s olo con la pendiente: yi ui


n

= 1 xi + ui = yi 1 xi
n

i=1

u2 i

=
i=1

(yi 1 xi )2

Minimizando:
n

M IN1
n

u2 i
i=1 n 2 i=1 ui

1 xi

= = =

0 0 0

2
i=1 n

(yi 1 xi )xi
n

xi yi 1
i=1 i=1 n

x2 i xi yi

1 =

i=1 n

x2 i
i=1

b ) Explique qu e diferencias puede inferir entre estos modelos, con respecto a sus propiedades. Respuesta: En el caso de un modelo sin constante, resulta:
n

2
i=1

(yi 1 xi )xi
ui n

i=1

ui xi

Sin embargo no garantiza que la suma de los errores sea igual a cero. Viendo el caso de un modelo s olo con constante:
n

2
i=1

(yi 0 )
ui n

i=1

ui

En este caso no garantiza que el error no est e correlacionado con los datos, en caso de que estos se est en omitiendo. Estas dos condiciones se encuentran al mismo tiempo cuando se utiliza un modelo con constante y pendiente. 3

Departamento de Econom a

Universidad de Chile

c ) Son estos estimadores insesgados? Respuesta: Propuesto en la ayudant a. 2. Suponga que usted, tras haber buscado en las p aginas del curso Econometr a I en los distintos semestres, encontr o una base de datos con una muestra de las notas del primer control (PC) y la nota nal (NF). PC 2.2 7.0 3.2 4.0 3.1 NF 2.2 6.2 3.6 4.2 4.6

a ) Estime por MCO el valor de los par ametros del siguiente modelo:

yi

= 0 + 1 xi + ui

(4)

Respuesta: Utilizaremos los estimadores cuando el modelo tiene pendiente y constante encontrados en el ejercicio 1: 0 1 x = y
n n n

(5) xi
i=1 n i=1

n 1 =
i=1

xi yi
n

yi (6)
2

n
i=1

x2 i

(
i=1

xi )

Los elementos para encontrar los estimadores, que se sacan de la tabla son:
n n

xi = 19,5
i=1 n i=1 n

x2 i = 89,69 yi = 20,8
i=1

xi yi = 90,82
i=1

1 : Reemplazando estos valores en el estimador de 5 90,82 19,5 20,8 5 89,69 19,52 0,71

1 1 0 : Ahora reemplazando en 0 0 0

= =

1 x = y = 20,8/5 0,71 19,5/5 = 1,391

Departamento de Econom a

Universidad de Chile

b ) Qu e puede decir del valor de los par ametros? El modelo indica que existe una relaci on positiva entre la nota que el alumno se saque en el primer control, con respecto a la nota nal que obtendr a en el ramo. Esta relaci on dice que si la nota en el primer control aumenta un punto, la nota nal lo har a en 0.71 puntos. c ) Qu e problemas se pueden presentar al tener una muestra tan reducida como esta? Lo primero es que los datos pueden estar sesgados, ya que la muestra obtenida puede no ser representativa de los datos de la poblaci on (error muestral). d ) Calcule ahora los valores de los par ametros para los siguientes modelos:

yi yi

= 0 + ui = 1 xi + ui

(7) (8)

Dan los mismos par ametros? Por qu e? Utilizando los estimadores que encontramos en el primer ejercicio, sabemos que para un 0 = y modelo s olo con constante ; y para un modelo s olo con la pendiente, el estimador de n i=1 xi yi 0 = . Reemplazando n x2

P P

i=1

En el caso del primer modelo (s olo constante): 0 0 0

= y = 20,8/5 = 4,16

Ahora en en caso de que el modelo tenga s olo pendiente:


n i=1 xi yi n 2 i=1 xi

0 0 0

= = =

90,82/89,69 1,01

Los par ametros no son iguales por lo explicado en la parte b) del ejercicio 1, ya que los modelos no pueden asegurar las propiedades que se nombran en ese apartado. 3. La Subsecretar a de electricidad y combustibles est a interesada en conocer la relaci on que existe entre consumo de energ a el ectrica (y ) y el consumo de gas natural (x). Con este n, encarga a la Subdirecci on General de Estudios la especicaci on de un modelo econom etrico entre estas variables y su estimaci on a partir de las series de datos disponibles en la subsecretar a. Suponga que usted trabaja como t ecnico en la citada subdirecci on y es el encargado de realizar el informe solicitado. Para ello dispone de la siguiente informaci on elaborada por su ayudante a partir de los datos originales:
n n

n = 35
n i=1 n

xi = 17,22
i=1 n 2

x2 i = 10,92 yi = 85
i=1

(yi y ) = 12,15
i=1 i=1

xi yi = 37,1022

Departamento de Econom a

Universidad de Chile

Encuentre los valores de los par ametros si dene el modelo de la siguiente manera:

yi

= 0 + 1 xi + ui

(9)

Respuesta: Como el modelo est a denido con pendiente y constante podemos, al igual como se ha denido en los ejercicios anteriores, podemos utilizar los siguentes estimadores de los par ametros:

1 x = y
n n n

n 1 =
i=1

xi yi
n

xi
i=1 n i=1

yi

n
i=1

x2 i (
i=1

xi )2

1 : Reemplazando en el estimador de 35 37,1022 17,22 85 35 10,92 17,22 2

1 1 0 : Ahora reemplazando en 0 0 0

= 1,93

1 x = y = 85/35 + 1,93 17,22/35 = 3,38

Podemos decir que como la pendiente de la recta de regresi on es negativa, al aumentar el consumo de energ a el ectrica, disminuye el consumo de gas natural; y viceversa.

2.

Comentes
Comente las siguientes armaciones.

1. La estimaci on por MCO adem as de garantizar que la recta de regresi on pasa por las medias muestrales de las variables, tambi en garantiza que no est an relacionados el error y el valor predicho de la variable dependiente. 2. Si la varianza de un estimador es igual a su Error Cuadr atico Medio (ECM), podemos decir que el estimador es insesgado. 3. En el modelo de regresi on lineal de una variable explicativa, si al variable independiente no var a, 2 ser entonces el estimador de a igual al verdadero valor poblacional de 2 . 4. A un investigador no le conviene utilizar un par ametro sesgado. 5. Cuando la varianza de las variables explicativas es alta, el estimador por MCO de la pendiente del modelo es menos preciso. 6

Departamento de Econom a

Universidad de Chile

3.

Propuestos

1. Encuentre al menos dos formas diferentes de expresar el c alculo de los par ametros por MCO, cuando el modelo tiene s olo una variable explicativa. Ayuda: puede encontrar dos formas distintas encontrando las expresiones en desviaciones con respecto a la media, y otra forma es desarrollando esta u ltima expresi on. 2. Para el ejercicio 1, analice las propiedades de los estimadores encontrados (insesgamiento, eciencia, menor ECM, consistencia) 3. Suponga que encontr o una base de datos, pero ahora no sabe su procedencia. Lo u nico que sabe es que Y es la variable dependiente, y X es la variable explicativa. X -8 -1 0 4 2 Y 0 1 3 5 4

Realice los mismos puntos que se le ped an en el ejercicio 2

Departamento de Econom a

Universidad de Chile

Econometr a I
Primavera 2005 Ayudant a Extra - 02-09-05 Profesores: J. V asquez-F. Tagle, R. Montero, E. Melo Ayudante: Roberto Jaramillo

1.

Comentes

1. Un amigo suyo le comenta que en un modelo de regresi on lineal, en el peor de los casos los residuos explican un cero % la variabilidad del t ermino dependiente. Qu e opina usted? Respuesta: Si los residuos explican en un cero % la variabilidad del modelo, signica que el total est a siendo explicado por las variables explicativas, lo que en teor a muestra un modelo que bien ajustado. Sin embargo, un R2 alto puede no ser el mejor de los casos, ya que se pueden presentar problemas de inclusi on de variables irrelevantes, multicolinealidad, pocos datos (R2 = 1 cuando hay s olo dos datos), o que el modelo no incluya la constante. 2. La ventaja que tiene el test F, es que con una sola hip otesis me permite hacer todos los test de signicancia de Student al mismo tiempo. Respuesta: El test F permite testear al mismo tiempo un conjunto de hip otesis. Al testear la signicancia estad stica de un par ametro, estamos realizando un test individual para cada uno de los par ametros, lo que ser a distinto al testear que todos no son estad sticamente signicativos al mismo tiempo (Conjuntos distintos). Por esto el comente ser a falso. 3. En una prueba de hip otesis cualquiera, la zona de rechazo nunca cambia al cambiar la hip otesis nula. Respuesta: Falso. Para ver si es que cambia la zona de rechazo de una hip otesis, hay que ver si cambia el estad stico de tabla. El comente ser a falso, ya que en el caso de un estad stico F al cambiar la cantidad de hip otesis nulas, el estad stico F de tabla va cambiando. 4. La ventaja que tiene el test t de Student es que puedo utilizarlo sin importar la distribuci on del error, suponiendo que tenemos una muestra nita. Respuesta: Para utilizar los Test t y F es necesario que el error est e destribuido en forma normal. Si esto no sucede, no podr amos conocer la distribuci on de estos estad sticos.

2.

Ejercicios

1. Encuentre la expresi on para la suma total al cuadrado cuando el modelo de regresi on no incluye un t ermino constante.

y yy yy yy
n 2 yi i=1

= = = =

y +u yy +y u ( y+u ) y + ( y+u ) u y y + u y +y u + uu
0 n n 0

=
i=1

y i 2 +
i=1

u i 2

(1)

Departamento de Econom a

Universidad de Chile

Descomponiendo la Suma Total y la Suma Explicada:


n

ST ST
n 2 yi i=1

=
i=1 n

(yi y )2
2 yi ny 2 i=1

= ST + ny 2

(2)

SE SE
n 2 y i i=1

=
i=1 n

( yi y )2
2 y i ny 2 i=1

= SE + ny 2

(3)

Reemplazando 2 y 3 en 1 queda:
n

ST + ny

= SE + ny 2 +
i=1

u i 2
SR

ST

= SE + SR + n(y 2 y 2 )

2 . 2. Demuestre que el coeciente R2 es siempre mayor o igual al R SR ST (4)

R2 SR ST

= =

1 R2

2 = 1 SR n 1 R ST n k Reemplazando 4 en 5 queda: 2 R 2 1R n1 nk n1 (1 R2 ) nk 1 (1 R2 )

(5)

= =

2 = R2 k=1R 2 > 1 R2 R 2 < R2 k >11R 2

Departamento de Econom a

Universidad de Chile

3. Tras haber tenido alg un tiempo de ocio, usted ha encontrado una base de datos que tiene una muestra representativa de las notas del ramo Econometr a N. En esta se encuentran las notas de los controles 2 y 3, y tambi en la nota de la primera solemne. A usted le interesar a saber c omo afect o el rendimiento de los controles 2 y 3 en la solemne, as que utilizando lo datos, realice los siguientes puntos: Nota C2 2.2 5.1 5.1 2.2 3.9 3.8 Nota C3 3.7 5.1 3.4 1.9 3.4 2.8 Nota Sol 3 4 4.7 2.6 5 5.2

a ) Establezca un modelo que le permita solucionar lo planteado. Respuesta: Nota Solemne = y Nota Control 2= x1 Nota Control 3= x2 0 + 1 x1,i + 2 x2,i yi = b ) Estime por MCO el valor de los par ametros del modelo. Respuesta: M CO = (X X )1 X Y En desviaci on con respecto a la media XX X X 1 XY M CO = = = = 8,32 4,13 4,13 5,72 1 30,53 4,84 1,24 0,75 0,36 5,72 4,13 4,13 8,32

Para rescatar el valor de la constante: 0 0 1 x 2 = y x 1 2 = 2,51

c ) Analice la signicancia estad stica de todos los par ametros. Para esto encuentre los valores de los estad sticos, con su respectivo P-value. Es necesario encontrar el valor de las varianzas de los estimadores:

Departamento de Econom a

Universidad de Chile

) V ar(
2 u i

2 (X X )1 = u i

u 2 i nk

n i=1

2 u i

= = =

) V ar( ) V ar(

2,56 = 0,85 3 0,85 5,72 4,13 30,53 4,13 8,32 0,16 0,12 0,12 0,23

t i t 1 t 2

i 0 i ) V ar( 0,75 0 = 1,875 0,16 0,36 0 = 0,75 0,23

= =

P value i P value 1 P value 2

= 2(1 P r) = 0,15 = 0,51

El t de tabla es: t95 %,GL=3 = 3,18 Por lo tanto existe suciente evidencia para armar que las pendientes no son estadisticamente signicativas, con un 95 % de conanza. d ) Compruebe que la suma de los aportes marginales de los controles 2 y 3 resulta 1. Respuesta: 1 + 2 = 1 H0 : tH0 tH0 = = 1,58 1 + 2 1 1 ) + V ar( 2 ) + 2Cov ( 1 , 2 ) V ar(

El t de tabla es: t95 %,GL=3 = 3,18 Por lo tanto existe suciente evidencia para armar que las pendientes suman uno, con un 95 % de conanza. e ) Testee que el par ametro del control 2 es 0.3 y el del par ametro del control 3 es 0.4

Departamento de Econom a

Universidad de Chile

q nk R

= 2 = 3 = 1 0 0 1

= r Fq,nk Fq,nk = =

0,75 0,36 0,3 0,4 r) [R(X X )1 R ]1 (R r)]/q [(R


u u nk

2,16/2 = 1,27 0,85

El F de tabla con un 95 % de conanza es 9.55, por lo que existe suciente evidencia para no rechazar la hip otesis nula con un 95 % de conanza f ) Encuentre qu e porcentaje de la variabilidad se explica por los datos. Tambi en realice alg un ajuste a este coeciente en caso de encontrarlo necesario. Para encontrar ese porcentaje, hay que revisar el R2 SR ST
n 2 yi ny 2 i=1

R2 ST ST
n

= =

1
n

(yi y )2 =
i=1

6,01

SR =
i=1

u i 2 = 2,56 R2 = 1 2,56 = 0,57 6,01

Las variables independientes explican el modelo en un 57 %. Sin embargo, no estamos tomando en cuenta el problema de los grados de libertad (son muy pocos datos para la cantidad de 2 para corregir esto: par ametros), por lo que utilizamos el R 2 = 1 (1 R2 ) n 1 = 0,28 R nk g ) Qu e nos dicen los datos que ha obtenido? Tarea...

Pauta Comente Extra: Pregunta: mientras mayor es la varianza muestral y menor es la varianza de las variables explicativas, ms preciso es el estimador MCO. Respuesta: el comente es falso, si bien, mientras mayor es el tamao muestral (n) contamos con mayor informacin para estimar los parmetros y la muestra se acerca ms a la poblacin, lo que hace que nuestra estimacin sea ms precisa, necesitamos que la varianza de las variables explicativas sea la mayor posible para poder estimar el impacto que tiene un cambio marginal en la variable explicativa sobre la variables dependientes, mientras ms variada sea X contamos con una amplia gama de valores que nos permiten identificar en forma ms precisa su impacto sobre Y. En un modelo simple tenemos que la varianza del estimador MCO, tiene la siguiente forma:
) = V (

(X

2
i

X )2

Multiplicando y dividiendo por el tamao muestral:


) = V (

2
nV ( X )

Podemos observar que mientras mayor es el tamao muestral menor es la varianza del estimador MCO (ms preciso), y mientras mayor es la varianza de las variables explicativas menor es la varianza del estimador (ms preciso).

Departamento de Econom a

Universidad de Chile

Econometr a I
o 2006 Oton Ayudant a Extra 25/04/06 Profesores: Claudia Sanhueza, Javiera V asquez. Ayudante: Roberto Jaramillo Moya1 Nota: Esta pauta ha sido publicada a modo de referencia. No ha sido revisada, por lo que es un muy buen ejercicio para el estudio buscar incongruencias.

1.

Ejercicios

1. Para la siguiente base de datos: Nota C2 2.2 5.1 5.1 2.2 3.9 3.8 Nota C3 3.7 5.1 3.4 1.9 3.4 2.8 Nota Sol 3 4 4.7 2.6 5 5.2

Para esta muestra, que fue obtenida del curso Econometr a I de alg un semestre del pasado, responda las siguientes preguntas: a ) Encuentre los estimadores de los par ametros y su correspondiente matriz de varianzas y covarianzas. RESPUESTA
Al trabajar con los datos en desviaci on con respecto a la media:
  

XX X X 1 XY M CO 0
n X i=1

= = = = = =

8,32 4,13

 

1 30,53

4,13 5,72

4,84 1,24

5,72 4,13

4,13 8,32

0,75 0,36

2,51 2,56

u 2 i

La matriz de varianzas y covarianzas est a conformada por: Es necesario encontrar el valor de las varianzas de los estimadores:
1 rojarami@facea.uchile.cl

Departamento de Econom a

Universidad de Chile

) V ar(
2 u i

= =

2 u (X X )1 i

Pn

u 2 i nk
i=1

2 u i

= = =

) V ar( ) V ar(

2,56 = 0,85 3  0,85 5,72 30,53 4,13 0,16 0,12

0,12 0,23

4,13 8,32

b ) Calcule el ajuste del modelo. RESPUESTA


R2 ST ST SR =
n X i=1

= = =

1
n X i=1

SR ST
n X i=1 2 yi ny 2

(yi y )2 =

6,01

u i 2 = 2,56 R2 = 1 2,56 = 0,57 6,01

Las variables independientes explican el modelo en un 57 %. Sin embargo, no estamos tomando en cuenta el problema de los grados de libertad (son muy pocos datos para la cantidad de par ametros), 2 para corregir esto: por lo que utilizamos el R 2 = 1 (1 R2 ) n 1 = 0,28 R nk

c ) Son signicativos los par ametros que acompa nan a las variables indepedientes, a nivel individual y global? RESPUESTA
q

t i t 1 t 2

i 0 i ) V ar(

= =

0,75 0 = 1,875 0,16 0,36 0 = 0,75 0,23

Departamento de Econom a

Universidad de Chile

P value i P value 1 P value 2

= = =

2(1 P r) 0,15 0,51

El t de tabla es: t95 %,GL=3 = 3,18 Por lo tanto existe suciente evidencia para armar que las pendientes no son estadisticamente signicativas, con un 95 % de conanza. Para hacer un test de signicancia global, podemos utilizar la siguiente f ormula: R2 /(k 1) F(k1,nk) (1 R2 )/(n k) 0,57/(3 1) = 1,99 (1 0,57)/(6 3)

F F

= =

El valor F cr tico es de 9.55 para un 95 % , por lo que existe suciente evidencia para armar que los par ametros no ser an signicativos en forma global con un 95 % de conanza.

d ) Testee que la suma de las pendientes 1 y 2 es igual a uno. RESPUESTA


1 + 2 = 1 H0 : tH 0 tH 0 El t de tabla es: t95 %,GL=3 = 3,18 Por lo tanto existe suciente evidencia para armar que las pendientes suman uno, con un 95 % de conanza. = =
q

1 + 2 1

1 ) + V ar( 2 ) + 2Cov ( 1 , 2 ) V ar( 1,58

e ) Testee que el par ametro del control 2 es 0.3 y el par ametro del control 3 es 0.4 RESPUESTA
q nk R r Fq,nk Fq,nk = = = = = = 2
  

1 0

0 1

 

0,75 0,36


0,3 0,4

r) [R(X X )1 R ]1 (R r)]/q [(R


u u nk

2,16/2 = 1,27 0,85

Departamento de Econom a

Universidad de Chile

El F de tabla con un 95 % de conanza es 9.55, por lo que existe suciente evidencia para no rechazar la hip otesis nula con un 95 % de conanza

f ) Si un alumno se sac o un 3.6 en el control 2 y un 4.3 en el control 3, haga una predicci on del valor puntual de esta. RESPUESTA
y y = = 2,51 + 0,75 3,6 + (0,36) 4,3 3,7

Para la varianza del error de predicci on:


0 1 0 2 x )) u (1 + x (X X )

V ar( e)

= =

V ar( e)

1 3,6 0,85(1 + 30,53 3,64

4,3

5,72 4,13

4,13 8,32



3,6 ) 4,3

El intervalo queda:

3,7 3,18

3,64 y 0 2,37 y 0

3,7 + 3,18 9,78

3,64

Departamento de Econom a

Universidad de Chile

Econometr a I
o 2006 Oton Ayudant a 16-6-6 Profesoras: Javiera V asquez y Claudia Sanhueza Ayudantes: Juan Carlos Caro, Javier Fern andez, Nicol as Grau, Roberto Jaramillo 1 , Roque Montero

1.

Comentes

1. Un estad stico Durbin-Watson de 4 muestra inequ vocamente una autocorrelaci on positiva. 2. Si existe Heterocedasticidad en los errores, el estimador M nimos Cuadrados Ordinarios ser a sesgado, sin embargo, cuando existe autocorrelaci on en los errores no se produce sesgo en los par ametros estimados. 3. La utilizaci on de la matriz de White permite corregir el problema de heterocedasticidad sin saber a priori la especicaci on de esta.

2.

Ejercicios

1. Considere el siguiente modelo: yt = C (1) + C (2)xt + C (3)yt1 + ut

Testee la existencia de autocorrelaci on en los errores. RESPUESTA


Como el modelo incluye la variable dependiente rezagada, no se puede utilizar el estad stico Durbin-Watson. Se tiene que utilizar el test h-Durbin:
1 rojarami@facea.uchile.cl

Departamento de Econom a

Universidad de Chile

h = (1

DW ) 2

n 2 N (0, 1) 1 n

2 2 Con la informaci on anterior: DW = 1,572226, n = 28 y = (0,143427)

h h

= =

(1

1,572226 ) 2

28 N (0, 1) 1 28(0,143427)2

1,738115749

El estad stico t, en un test de dos colas, es de 1.96, por lo que no podr amos rechazar la hip otesis nula de no autocorrelaci on.

2. Dado el siguiente modelo

yt ut donde
t

= =

0 + 1 xt + ut ut1 + t

iid N (0, 2 ). Adem as dispone de las siguientes observaciones: t yt xt 1 22 4 2 26 6 3 32 10 4 34 12 5 40 14 6 46 16 7 46 20 8 50 22

Obtenga una estimaci on eciente de los par ametros 0 y 1 , sabiendo que = 0,5. RESPUESTA
Para estimar eciente el modelo debemos utilizar el m etodo de M nimos Cuadrados Generalizados, que consiste en transformar el modelo original de forma tal que el error este libre de autocorrelaci on, como en este caso el error sigue un procedimiento AR(1) se debe transformar de la siguiente forma la variable dependiente y explicativa del modelo:

y t = yt 0,5yt1 xt = xt 0,5xt1 De esta forma, se tienen los siguientes datos transformados: t 1 2 3 4 5 6 7 8 Suma yt 22 26 32 34 40 46 46 50 xt 4 6 10 12 14 16 20 22
yt

x t 4 7 7 8 9 12 12 59

x y 60 133 126 184 234 276 324 1337

x2 16 49 49 64 81 144 144 547

15 19 18 23 26 23 27 151

Departamento de Econom a

Universidad de Chile

El estimador MCG consiste en estimar por MCO el modelo transformado:

yt = 0 (1 ) + 1 x t +

As , el estimador MCG de los par ametros es:


8 t=2 xt 8 2 t=2 xt

X X X Y

= =

n
8 t=2 xt 8 t=2 yt 8 x y t=2 t t

7 59

59 547

151 1337

M CG M CG

= =

7 59

59 547

151 1337

10,67 1,29

3. Considere el modelo: yt = xt + ut , donde E (ut ) = 0, V (ut ) = k (xt )2 y Cov (ut , us ) = 0 = s. Adem as dispone de 5 observaciones de la variable dependiente y de la variable explicativa: yt 2 3 10 1 3 xt 1 2 4 1 1

Encuentre el estimador eciente de y de su varianza. RESPUESTA


Este modelo no tiene problemas de autocorrelaci on, pero si de heterocedasticidad, ya que la varianza del error cambia para para observaci on t. De esta forma, el estimador eciente es el de MCG que consiste en transformar el modelo original dividiendo cada observaci on de la variable dependiente y explicativas por la desviaci on est andar del error asociado a esta observaci on, una vez transformado el modelo se estima por MCO. La variables yt y xt transformadas son: yt = t xt = t yt xt k 1 = 2 2 k k xt k 2 x2 t xt =
iid

yt

= =

yt

x t

El m etodo eciente de MCG consiste en estimar por MCO el modelo: yt = x t + ut , donde ut

(0, 2 ):

Departamento de Econom a

Universidad de Chile

M CG

= = = =

n i=1 yt xt n 2 i=1 xt y 1 t k xt k n 1 2 i=1 ( k ) n yt t=1 xt

M CG M CG ) V (

= = =

n 2/1 + 3/2 + 10/4 + 1/1 + 3/1 5 2 (X X )1 1 n 1 2 ( t=1 k ) 2k 2k = n 10

M CG ) V (

Departamento de Econom a

Universidad de Chile

Econometr a I
Primavera 2006 Profesores: Jos e Miguel Benavente, Rodrigo Montero. Ayudantes: Javier Fern andez, Andrea Guti errez, Roberto Jaramillo, Roque Montero. Ayudant a 05-09-06

1.

Ejercicios

1. Tras haber tenido alg un tiempo de ocio, usted ha encontrado una base de datos que tiene una muestra representativa de las notas del ramo Econometr a N. En esta se encuentran las notas de los controles 2 y 3, y tambi en la nota de la primera solemne. A usted le interesar a saber c omo afect o el rendimiento de los controles 2 y 3 en la solemne, as que utilizando lo datos, realice los siguientes puntos: Nota C2 2.2 5.1 5.1 2.2 3.9 3.8 Nota C3 3.7 5.1 3.4 1.9 3.4 2.8 Nota Sol 3 4 4.7 2.6 5 5.2

a ) Establezca un modelo que le permita solucionar lo planteado. RESPUESTA


yi = 0 + 1 x1 + 2 x2 con yi x1 x2 = = = Nota Solemne Nota Control 2 Nota Control 3

b ) Estime por MCO el valor de los par ametros del modelo. RESPUESTA
Trabajando con el modelo en desv os con respecto a la media:


XX X X 1 XY M CO
n X i=1

= = = = = =

8,32 4,13

 

1 30,53

4,13 5,72


4,13 8,32

4,84 1,24

5,72 4,13

0,75 0,36

0 u 2 i

2,51 2,56

Departamento de Econom a

Universidad de Chile

2 c ) Obtenga los coecientes R2 y R RESPUESTA


R2 = = = =

Pu 2 P(y y )2 i P 2 u 1 P 2 y ny 2
1
i

SR ST

0,55

2 R

= = =

n1 nk 61 1 (1 0,55) 63 0,25 1 (1 R2 )

d ) Analice la signicancia estad stica de todos los par ametros. Para esto encuentre los valores de los estad sticos, con su respectivo P-value. Es necesario encontrar el valor de las varianzas de los estimadores: ) V ar(
2 u i 2 = u (X X )1 i

u 2 i nk

n i=1

2 u i

= = =

) V ar( ) V ar(

2,56 = 0,85 3 0,85 5,72 4,13 30,53 4,13 8,32 0,16 0,12 0,12 0,23 i 0 i ) V ar( 0,75 0 = 1,875 0,16 0,36 0 = 0,75 0,23 = 2(1 P r) = 0,15 = 0,51

t i t 1 t 2

= =

P value i P value 1 P value 2 2

Departamento de Econom a

Universidad de Chile

El t de tabla es: t95 %,GL=3 = 3,18 Por lo tanto existe suciente evidencia para armar que las pendientes no son estadisticamente signicativas, con un 95 % de conanza. e ) Compruebe que la suma de los aportes marginales de los controles 2 y 3 resulta 1. Respuesta: 1 + 2 = 1 H0 : tH0 tH0 = = 1,58 1 + 2 1 1 ) + V ar( 2 ) + 2Cov ( 1 , 2 ) V ar(

El t de tabla es: t95 %,GL=3 = 3,18 Por lo tanto existe suciente evidencia para armar que las pendientes suman uno, con un 95 % de conanza. f ) Testee que el par ametro del control 2 es 0.3 y el del par ametro del control 3 es 0.4

q nk R

= 2 = 3 = 1 0 0 1

= r Fq,nk Fq,nk = =

0,75 0,36 0,3 0,4 r) [R(X X )1 R ]1 (R r)]/q [(R


u u nk

2,16/2 = 1,27 0,85

El F de tabla con un 95 % de conanza es 9.55, por lo que existe suciente evidencia para no rechazar la hip otesis nula con un 95 % de conanza

Departamento de Econom a

Universidad de Chile

Econometr a I
Primavera 2006 Ayudant a Extra - 17-10-06 Profesores: Jos e Miguel Benavente, Rodrigo Montero Ayudantes: Javier Fern andez, Andrea Guti errez, Roberto Jaramillo, Roque Montero

1.

Comentes

1. El planteamiento de un modelo ANOVA tiene la ventaja de que genera un error tipo 1 menor que hacer varios test t al mismo tiempo. RESPUESTA
Falso, ya que la cantidad de test son distintos. Para ver la diferencia entre tres grupos, con ANOVA se plantean dos test de sinicancia, y con una comparaci on de medias 3, lo que genera que cada test en forma indiviual sea distinto. Como al hacer un test de signicancia individual en ANOVA incluye m as efectos al mismo tiempo (comparaci on con m as medias), entonces la probabilidad de que el test se rechace es m as alta, con lo que el comente ser a falso.

2.

Ejercicios

1. En el siguiente modelo de regresi on:

Yi = 1 + 2 Di + ui

(1)

Donde Y representa el salario por hora, y D es la variable dicot omica, que toma el valor 1 si es un titulado universitario y 0 si es titulado de educaci on media. Utilizando las f ormulas del estimador 1 = Y 2 = Y m y u Y m , donde el sub MCO, demuestre que ndice m signica con educaci on media y u titulado universitario. RESPUESTA Planteando el modelo, la matriz X de variables explicativas queda i
XX XX XX ( X X ) 1 ( X X ) 1 ( X X ) 1 = = = = = = D

i i D D iD ii Di DD n nu nu nu 1 nu nu nu n nu n n2 u 1 nu nu nu n nu nm 1/nm 1/nm 1/nm n/(nu nm )

(2)

(3)

Departamento de Econom a

Universidad de Chile

XY XY XY

= = =

i Y D iY DY P P yi D =1 yi

(4)

= = = = = = = =

( X X ) 1 X Y P 1/nm 1/nm P yi 1/nm n/(nu nm ) D =1 yi " P Y P # Y


i D=1 i

(5) (6) (7) (8) (9) (10) (11) (12)

"

"

"

"

P P P

Yi

nm

D=0 nm

nm P n D=1 Yi + nu nm P Yi

D=0 Yi P nm D=1 Yi nm

D=0 nm

Yi

Y Pm

D=1

Yi

nu nm

D=1 nm

Yi

m + Y

Y Pm

D=1 nm

Yi nm nu

m Y P =1 Yi Y m + D nu m Y u Y m Y

n (n 1) u

2. Si tenemos el siguiente modelo que puede ser subdividido en dos grupos:

Grupo 1 Grupo 2 Una forma de estimar este modelo es:

= =

Yi = N + 1 Xi + u1,i Yi = C + 1 Xi + u2,i

(13) (14)

Yi = 0 + N hi + C di + 1 Xi + ui

(15)

Donde hi = 1 si pertenece al grupo 1, y 0 si no. Adem as di = 1 hi . Est an de acuerdo con el modelo propuesto? RESPUESTA
No, debido a que la matriz de datos que se forma es: X = i hi di X = i hi 1 hi Xi (16) (17)

Xi

Departamento de Econom a

Universidad de Chile

Y en este caso la columna de unos se puede formar con la suma de la columna 2 y la columna 3, por lo que tendr amos una columna LD, y la matriz seria singular y no calculable bajo MCO (Trampa de las Dummies).

3. De acuerdo a un estudio de un respetado profesor de esta facultad, en que se ve an las diferencias de sueldos entre egresados de las distintas menciones, se han encontrado las siguientes conclusiones: a ) Existe la idea de que los egresados de Econom a de esta facultad, al salir reci en de la carrera, ganan m as que los egresados de Administraci on de la misma facultad. C omo plantear a el modelo y lo testear a? RESPUESTA
El modelo se puede plantear de la siguiente forma: yi = 0 + 1 di + ui (18)

En que di toma el valor 1 si es egresado de Econom a y 0 si es de Administraci on. En el caso que 1 : quisi eramos testear que los valores son distintos, s olo hay que hacer un test de signicancia de 1 t= . Sin embargo, si lo que queremos testear es que un estudiante de Econom a reci en egresado gana m as que un estudiante de Administraci on, entonces lo que hay que buscar es que el par ametro andose esto en un test de una cola, que se plantea igual que el 1 sea mayor que cero, transform anterior, pero lo que cambia es la zona de rechazo, que ahora s olo se encuentra a la izquierda de la curva de la tabla t-student.
1

b ) A pesar de esto, se ha encontrado que los egresados de Administraci on de esta facultad, a medida que pasa el tiempo, incluso pueden llegar a ganar m as que los egresados de econom a. C omo puede armar esto? RESPUESTA
Se puede armar cuando se agrega una variable explicativa, que es el tiempo de haber egresado, y que la pendiente sea distinta para cada menci on. El modelo por plantear es el siguiente: yi = 0 + 1 di + 2 t + 3 tdi + ui (19)

En que 3 es la diferencia de pendiente entre las distintas menciones. Si testeamos la signicancia 3 , ver de amos si la diferencia es signicativa. Sin embargo, lo que se plantea es que en el futuro un egresado de Administraci on pueda ganar m as, por lo que adem as debemos testear si 3 es menor que cero. Para esto nuevamente tendr amos que hacer un test de una cola, pero la zona de rechazo estar a a la derecha del test.

c ) A pesar de no haber sido inclu do en el estudio, tambi en existe la creencia de que los reci en egresados de la universidad que es competencia directa, pero no tan prestigiosa, obtienen salarios distintos. Plantee el modelo. RESPUESTA
Descartando la diferencia entre menciones, podemos plantear el modelo de la siguiente forma: yi = 0 + 1 chi + 2 tcati + ui (20)

omicaque toma el valor 1 si el egresado es de la Universidad de Chile, En que chi es una variable dicot y 0 si no; cati toma le valor 1 si pertenece a la Universidad no tan prestigiosa, y 0 si no; y tambi en 0 . si tenemos los datos de otras universidades, la media de estas va a estar determinada por

Universidad de Chile

Facultad de Economa y Negocios

Ayudanta Extra 03/11/2006


Econometra I Profesores: Rodrigo Montero, Jos Miguel Benavente Ayudantes: Roberto Jaramillo, Roque Montero, Javier Fernndez, Andrea Gutirrez

Repaso de conceptos
1. Omisin de variable relevante e inclusin de variable irrelevante 2. Heterocedasticidad

Comentes
1. La omisin de variables relevantes produce subestimacin en los parmetros estimados por MCO. Falso, es cierto que el estimador MCO siempre ser sesgado en presencia de variables irrelevantes omitidas: 1 ) 1 E( Cov( X 1 , X 2 ) 2 Var ( X 1 )
Sesgo

Por lo tanto el signo del sesgo depender del signo de 2 y la covarianza entre X1 y X2. Existen tres casos posibles:

2 positivo y covarianza positiva => sesgo positivo 2 positivo y covarianza negativa => sesgo negativo 2 negativo y covarianza positiva => sesgo negativo

2. En presencia de heterocedasticidad la mejor forma de estimar los parmetros de inters es mediante una transformacin del modelo original, que consiste en dividir cada observacin de la variable dependiente y explicativas ( yi , xi ) por la desviacin estndar del error asociado Si no conocemos la matriz la eficiencia del estimador MCGF depender de la calidad de la estimacin del patrn de heterocedasticidad. Si esta estimacin es muy mala, por ejemplo no estamos seguros del patrn heterocedstico, podemos estar agregando ms problemas al modelo. Por lo tanto, en algunos escenarios es mejor utilizar el estimador consistente de White.

Universidad de Chile

Facultad de Economa y Negocios

3. La omisin de una variable irrelevante es una fuente de heterocedasticidad. Falso. Efectivamente cuando omitimos una variable relevante en la especificacin, dicha variable quedar parcialmente recogida en el comportamiento de las perturbaciones aleatorias (error), pudiendo introducir en estas su variacin no necesariamente fija. No obstante al tratarse de una variable irrelevante esta no debiera afectar al modelo, y por lo tanto, su efecto no debera ser recogido por el trmino error. 4. Si hay heterocedasticidad, las pruebas convencionales t y F son invalidas. Verdadero, con perturbaciones no esfricas existe una alta probabilidad de que cometamos errores, puesto que con heterocedasticidad los estimadores MCO sern ineficientes (varianzas ms grandes). Esto podra traer como consecuencia que no rechacemos la hiptesis nula, cuando la deberamos rechazar, o en otras palabras, digamos que una variable no es significante cuando si lo es.

Ejercicios
1. Como sabemos, la demanda por un bien depende de muchas variables, entre ellas el ingreso y precio del bien. Un economista est estimando la demanda por un producto X, para lo cual ha propuesto el siguiente modelo:

Q b0 P b1Y b2 e
a) Linealice el modelo y obtenga las elasticidades precio e ingreso.

Q b0 P b1 Y b2 e ln Q ln b0 b1 ln P b2 ln Y ln Q b1 ln P b2 ln Y
Donde = ln b0 Por definicin:

Universidad de Chile

Facultad de Economa y Negocios

Q,P

Q,P

Q %Q Q ln Q b1 % P P ln P P Q Q ln Q %Q b2 %Y Y ln Y Y

b) De sus conocimientos microeconmicos Qu problema podra detectar en el modelo? qu consecuencias implicara y en qu sentido? cmo lo solucionara? Como sabemos la demanda por un bien tambin depende del precio de sus sustitutos, por lo que podramos estar omitiendo una variable relevante para el modelo, lo que implicara sesgo en los parmetros. Luego, agregando Ps a la estimacin, el modelo verdadero es el siguiente:

Q b0 P b1 Y b2 Ps b3 e ln Q ln b0 b1 ln P b2 ln Y b3 ln Ps ln Q b1 ln P b2 ln Y b3 ln Ps
Entonces los parmetros estarn sesgados:

E (b1 ) b1 b3 E (b2 ) b2 b3
Intuitivamente: cuando

COV (ln P, ln Ps ) Var (ln P) COV (ln Y , ln Ps ) Var (ln Y )

el Ps aumenta, el Y real disminuye COV (ln Y , ln Ps ) 0 , y cuando el Ps aumenta, aumenta la demanda por Q, aumentando P COV (ln P, ln Ps ) 0 . ser Entonces, como b es la elasticidad cruzada b 0 , el sesgo de b
3 3
1

ser negativo. positivo, y el sesgo de b 2

E (b1 ) Q , P

E (b2 ) Q ,Y

Universidad de Chile

Facultad de Economa y Negocios

2. Considere el siguiente modelo de regresin clsico:


y x' ut ut ~ N (0, )

La estructura de I es la siguiente:

a I e d

e b f

d f c

a) Cul o cules supuestos del modelo de regresin clsico no se cumpliran en este caso particular? Cmo se le llama a este o estos problemas? Se violan los supuestos: Varianza del error constante => Heterocedasticidad Covarianza de los errores igual a 0 => Autocorrelacin los coeficientes de este

b) Demuestre que el estimador MCO de modelo son insesgados.

c) La varianza de los estimadores de este modelo, es insesgada? No, ante presencia de heterocedasticidad y autocorrelacin la varianza de los estimadores est sesgada. d) Cmo se denomina el estimador MELI para los coeficientes de este modelo de regresin, suponiendo que los valores para a; b; c; d y f son conocidos? Si los valores de la matriz I son conocidos el estimador MELI es Mnimos Cuadrados Generalizados (MCG) e) Derive rigurosamente el estimador MELI que corresponde a la respuesta en (d), utilizando la notacin matricial. (ayuda: 1 P' P )

Universidad de Chile

Facultad de Economa y Negocios

Minimizando la suma de los errores al cuadrado

3. Una empresa de autobuses desea estimar la demanda de billetes (Yt) en funcin de la variable constante, del precio de los mismos (X2t) y de la calidad del servicio, evaluada a travs de los gastos que la empresa realiza para la mejora del mismo (X3t). Se dispone de 50 datos ordenados en forma creciente segn la variable X3t y de la estimacin MCO de las siguientes ecuaciones:

Las tres primeras ecuaciones se estimaron con los 50 datos; la cuarta se estimo con los 20 datos iniciales y la quinta con los 20 datos finales. Supondremos validas las aproximaciones asintticas. a) Contraste el supuesto de homoscedasticidad en el modelo estimado en la ecuacin (1) con el contraste de White. De los datos entregados nR2 = 50*0,053 = 2,65 este lo debo comparar 2 con una 50 6 27,575 como es menor concluimos que no existe evidencia suficiente para demostrar heterocedasticidad a un 95% de confiabilidad. b) Contraste el supuesto de homoscedasticidad en el modelo estimado en la ecuacin (1) con el contraste de Goldfeld-Quandt, eliminando las 10 observaciones centrales.

Universidad de Chile

Facultad de Economa y Negocios

u 1 ' u 1 / n1 k 2 2 u1 / u 2 204/150= 1,36 lo comparo con una F17,17=? u 2u 2 / n2 k (disculpen, pero no encontr la tabla) por lo tanto no existe evidencia suficiente para demostrar heterocedasticidad.

4. Suponga que se tiene el siguiente modelo Explique detalladamente cuales son las consecuencias sobre MCO cuando es aplicado a este modelo Cmo estimara este modelo? Que estimador utilizara? De que depender la eficiencia de su estimacin?. Plantee una expresin para el estimador ptimo de y

2
.

Este modelo presenta heterocedasticidad por lo que las estimaciones por MCO son ineficientes. El patrn que sigue la heterocedasticidad depende del valor esperado de la variable dependiente y t , es decir E ( yt ) X t . Dado que es desconocido no podemos aplicar el estimador MCG. Sin embargo, podemos aplicar MCGF y el estimador Mximo Verosimilutud (MV). La aplicacin del primero requiere una estimacin en dos etapas, ya que es para aplicar el mtodo. De esta forma se puede estimar necesario obtener el modelo por MCO ignorando la heterocedasticidad y luego usar esta estimacin para normalizar las variables y aplicar MCGF. Este mtodo ser menos eficiente que MV debido a que este ltimo estimar en conjunto todos los parmetros involucrados.

Universidad de Chile

Facultad de Economa y Negocios

Universidad de Chile

Facultad de Economa y Negocios