Está en la página 1de 122

Econometrı́a

ICO8106

Benjamı́n Villena Roldán


Departamento de Economı́a
Universidad Diego Portales

4 de junio de 2020

B. Villena ICO8106 4 de junio de 2020 1 / 44


Variables binarias o dummy

Podemos incorporar información cualitativa por variables binarias o


dummy.

B. Villena ICO8106 4 de junio de 2020 2 / 44


Variables binarias o dummy

Podemos incorporar información cualitativa por variables binarias o


dummy.
Ejemplos: género, nacionalidad, raza, estado laboral (empleado,
desempleado, inactivo), estado civil, votación (por candidato A, B o
C), empresa exporta/no exporta, existe o no sindicato, etc, etc.

B. Villena ICO8106 4 de junio de 2020 2 / 44


Variables binarias o dummy

Podemos incorporar información cualitativa por variables binarias o


dummy.
Ejemplos: género, nacionalidad, raza, estado laboral (empleado,
desempleado, inactivo), estado civil, votación (por candidato A, B o
C), empresa exporta/no exporta, existe o no sindicato, etc, etc.
Definición habitual
(
1 si observación n cumple condición
Dn =
0 en otro caso.

o de manera más compacta X = I[cumple condición]

B. Villena ICO8106 4 de junio de 2020 2 / 44


Variables binarias o dummy

Consideremos un modelo lineal con una variable cualitativa o dummy,


D
Yn = β0 + β1 Dn + Un

B. Villena ICO8106 4 de junio de 2020 3 / 44


Variables binarias o dummy

Consideremos un modelo lineal con una variable cualitativa o dummy,


D
Yn = β0 + β1 Dn + Un
A nivel poblacional sabemos que E [Y |D = 0] = β0 y
E [Y |D = 1] = β0 + β1 .

B. Villena ICO8106 4 de junio de 2020 3 / 44


Variables binarias o dummy

Consideremos un modelo lineal con una variable cualitativa o dummy,


D
Yn = β0 + β1 Dn + Un
A nivel poblacional sabemos que E [Y |D = 0] = β0 y
E [Y |D = 1] = β0 + β1 .
Por lo tanto, la diferencia esperada de medias es
E [Y |D = 1] − E [Y |D = 0] = β1 . El parámetro β1 representa la
diferencia entre el grupo con D = 1 y el grupo con D = 0.

B. Villena ICO8106 4 de junio de 2020 3 / 44


Variables binarias o dummy
Aplicación básica: Incorporando una variable cualitativa o dummy, D,
podemos entender diferencias de medias de Y .

Yn = β0 + β1 Dn + Un

B. Villena ICO8106 4 de junio de 2020 4 / 44


Variables binarias o dummy
Aplicación básica: Incorporando una variable cualitativa o dummy, D,
podemos entender diferencias de medias de Y .

Yn = β0 + β1 Dn + Un

Resultado básico por MCO en este caso

N −1 N
P
Cov (Yn , Dn ) n=1 Yn Dn − Ȳ D̄
β1 =
b = N
Var (Dn ) −1 2 2
P
N n=1 Dn − D̄

B. Villena ICO8106 4 de junio de 2020 4 / 44


Variables binarias o dummy
Aplicación básica: Incorporando una variable cualitativa o dummy, D,
podemos entender diferencias de medias de Y .

Yn = β0 + β1 Dn + Un

Resultado básico por MCO en este caso

N −1 N
P
Cov (Yn , Dn ) n=1 Yn Dn − Ȳ D̄
β1 =
b = N
Var (Dn ) −1 2 2
P
N n=1 Dn − D̄
P
Definimos N1 = n Dn , o sea es el número de observaciones que
cumplen condición.
PN
N1 Yn
N
n:Dn =1
N1 − NN1 Ȳ
βb1 =  2
N1 N1
N − N

B. Villena ICO8106 4 de junio de 2020 4 / 44


Variables binarias o dummy

Luego usamos que el promedio de Y es un promedio ponderado del


promedio de cuando se cumple la condición con proporción N1 /N y
cuando no, con proporción 1 − N1 /N.
  
N1 N1
Ȳ1 − Ȳ Ȳ1 − Ȳ1 N + Ȳ0 1 − N
βb1 = N1
= N1
1− N 1− N

B. Villena ICO8106 4 de junio de 2020 5 / 44


Variables binarias o dummy

Luego usamos que el promedio de Y es un promedio ponderado del


promedio de cuando se cumple la condición con proporción N1 /N y
cuando no, con proporción 1 − N1 /N.
  
N1 N1
Ȳ1 − Ȳ Ȳ1 − Ȳ1 N + Ȳ0 1 − N
βb1 = N1
= N1
1− N 1− N

Por lo tanto,
βb1 = Ȳ1 − Ȳ0

B. Villena ICO8106 4 de junio de 2020 5 / 44


Variables binarias o dummy

Reemplazando en la ecuación normal 1, se obtiene que

Ȳ = βb0 + βb1 D̄
N1
= βb0 + (Ȳ1 − Ȳ0 )
N
⇒ β0 = Ȳ0
b

Resultado muy intuitivo: expectativas condicionales se estiman por


promedios condicionales muestrales.

B. Villena ICO8106 4 de junio de 2020 6 / 44


Variables categóricas

¿Qué ocurre si hay múltiples categorı́as? Supongamos que intentamos


una dummy de estado civil de una persona.

0 si n es soltero(a)


1 si n es tiene conviviente



Cn = 2 si n es casado(a)

3 si n es divorciado(a)





4 si n es viudo(a)

B. Villena ICO8106 4 de junio de 2020 7 / 44


Variables categóricas
Podemos expresar esta misma información a través de 4 variables
dummy Ds = I[soltero], Dt = I[conviviente], Dc = I[casado],
Dd = I[divorciado].

Yn = β0 + βs Ds,n + βt Dt,n + βc Dc,n + βd Dd,n + Un

B. Villena ICO8106 4 de junio de 2020 8 / 44


Variables categóricas
Podemos expresar esta misma información a través de 4 variables
dummy Ds = I[soltero], Dt = I[conviviente], Dc = I[casado],
Dd = I[divorciado].

Yn = β0 + βs Ds,n + βt Dt,n + βc Dc,n + βd Dd,n + Un

Ası́ vemos que:

E [Y |soltero] = E [Y |Ds = 1] = β0 + βs
E [Y |conviviente] = β0 + βt
E [Y |casado] = β0 + βc
E [Y |divorciado] = β0 + βd
E [Y |viudo] = β0

B. Villena ICO8106 4 de junio de 2020 8 / 44


Variables categóricas
Podemos expresar esta misma información a través de 4 variables
dummy Ds = I[soltero], Dt = I[conviviente], Dc = I[casado],
Dd = I[divorciado].

Yn = β0 + βs Ds,n + βt Dt,n + βc Dc,n + βd Dd,n + Un

Ası́ vemos que:

E [Y |soltero] = E [Y |Ds = 1] = β0 + βs
E [Y |conviviente] = β0 + βt
E [Y |casado] = β0 + βc
E [Y |divorciado] = β0 + βd
E [Y |viudo] = β0

Las variables categóricas se pueden expresar siempre como un


conjunto de variables dicotómicas.
B. Villena ICO8106 4 de junio de 2020 8 / 44
Variables categóricas

¿Qué significan los coeficientes aquı́?.


βs = E [Y |soltero] − E [Y |viudo];
βt = E [Y |conviviente] − E [Y |viudo], etc.

B. Villena ICO8106 4 de junio de 2020 9 / 44


Variables categóricas

¿Qué significan los coeficientes aquı́?.


βs = E [Y |soltero] − E [Y |viudo];
βt = E [Y |conviviente] − E [Y |viudo], etc.
Las variables dummy de la categorı́a j indican la diferencia promedio
entre la categorı́a j y la categorı́a omitida (viudo(a)).

B. Villena ICO8106 4 de junio de 2020 9 / 44


Variables categóricas

¿Qué significan los coeficientes aquı́?.


βs = E [Y |soltero] − E [Y |viudo];
βt = E [Y |conviviente] − E [Y |viudo], etc.
Las variables dummy de la categorı́a j indican la diferencia promedio
entre la categorı́a j y la categorı́a omitida (viudo(a)).
La categorı́a omitida es arbitraria!

B. Villena ICO8106 4 de junio de 2020 9 / 44


Variables categóricas

¿Qué significan los coeficientes aquı́?.


βs = E [Y |soltero] − E [Y |viudo];
βt = E [Y |conviviente] − E [Y |viudo], etc.
Las variables dummy de la categorı́a j indican la diferencia promedio
entre la categorı́a j y la categorı́a omitida (viudo(a)).
La categorı́a omitida es arbitraria!
¿Por qué P
no podemos utilizar todas las categorı́as? La suma de
dummies j Dj = 1 para todo individuo de la muestra, lo cual
conduce a multicolinealidad total, es decir una columna es
combinación lineal de otras y X 0 X no es invertible. Volveremos sobre
este punto más adelante.

B. Villena ICO8106 4 de junio de 2020 9 / 44


Variables categóricas

¿Qué significan los coeficientes aquı́?.


βs = E [Y |soltero] − E [Y |viudo];
βt = E [Y |conviviente] − E [Y |viudo], etc.
Las variables dummy de la categorı́a j indican la diferencia promedio
entre la categorı́a j y la categorı́a omitida (viudo(a)).
La categorı́a omitida es arbitraria!
¿Por qué P
no podemos utilizar todas las categorı́as? La suma de
dummies j Dj = 1 para todo individuo de la muestra, lo cual
conduce a multicolinealidad total, es decir una columna es
combinación lineal de otras y X 0 X no es invertible. Volveremos sobre
este punto más adelante.
Si la información cualitativa es de R categorı́as (nacionalidad)
necesitamos R − 1 variables dummy.

B. Villena ICO8106 4 de junio de 2020 9 / 44


Variables categóricas

Alternativa a la normalización anterior es tener un modelo sin


intercepto para evitar multicolinealidad perfecta.

Yn = αs Ds,n + αt Dt,n + αc Dc,n + αd Dd,n + αv Dv ,n + Un

B. Villena ICO8106 4 de junio de 2020 10 / 44


Variables categóricas

Alternativa a la normalización anterior es tener un modelo sin


intercepto para evitar multicolinealidad perfecta.

Yn = αs Ds,n + αt Dt,n + αc Dc,n + αd Dd,n + αv Dv ,n + Un

Ası́ vemos que:

E [Y |soltero] = E [Y |Ds = 1] = αs = β0 + βs
E [Y |conviviente] = αt = β0 + βt
E [Y |casado] = αc = β0 + βc
E [Y |divorciado] = αd = β0 + βd
E [Y |viudo] = αv = β0

B. Villena ICO8106 4 de junio de 2020 10 / 44


Variables categóricas

Alternativa a la normalización anterior es tener un modelo sin


intercepto para evitar multicolinealidad perfecta.

Yn = αs Ds,n + αt Dt,n + αc Dc,n + αd Dd,n + αv Dv ,n + Un

Ası́ vemos que:

E [Y |soltero] = E [Y |Ds = 1] = αs = β0 + βs
E [Y |conviviente] = αt = β0 + βt
E [Y |casado] = αc = β0 + βc
E [Y |divorciado] = αd = β0 + βd
E [Y |viudo] = αv = β0

Notar que es exactamente el mismo modelo, la información no


cambia, sólo lo expresamos distinto.

B. Villena ICO8106 4 de junio de 2020 10 / 44


Variables categóricas

En cada uno de estos casos los estimadores MCO serán la versión


muestral de las esperanzas poblacionales. Ası́

bs = Ȳs y βbs = Ȳs − Ȳv


α
bt = Ȳt y βbt = Ȳt − Ȳv
α
bc = Ȳc y βbt = Ȳc − Ȳv
α
bd = Ȳd y βbd = Ȳd − Ȳv
α
α
bd = Ȳv y βb0 = Ȳv

B. Villena ICO8106 4 de junio de 2020 11 / 44


Interacciones con variables binarias

Es posible construir modelos con interacciones con variables continuas


o binarias.

B. Villena ICO8106 4 de junio de 2020 12 / 44


Interacciones con variables binarias

Es posible construir modelos con interacciones con variables continuas


o binarias.
Incluso, interacciones entre variables binarias.

B. Villena ICO8106 4 de junio de 2020 12 / 44


Interacciones con variables binarias

Es posible construir modelos con interacciones con variables continuas


o binarias.
Incluso, interacciones entre variables binarias.
A veces queremos ver si el efecto de una variable puede depender de
otra variable.

B. Villena ICO8106 4 de junio de 2020 12 / 44


Interacciones con variables binarias

Es posible construir modelos con interacciones con variables continuas


o binarias.
Incluso, interacciones entre variables binarias.
A veces queremos ver si el efecto de una variable puede depender de
otra variable.
Supongamos que deseamos ver si el efecto marginal de la educación
(retorno) depende el género del trabajador.

B. Villena ICO8106 4 de junio de 2020 12 / 44


Interacciones con variables binarias

Es posible construir modelos con interacciones con variables continuas


o binarias.
Incluso, interacciones entre variables binarias.
A veces queremos ver si el efecto de una variable puede depender de
otra variable.
Supongamos que deseamos ver si el efecto marginal de la educación
(retorno) depende el género del trabajador.
Entonces, incorporamos una interacción entre la educación y el
género, dejando de lado experiencia por ahora

log Wn = β0 + β1 Gn + β2 Sn + β3 Sn × Gn + Un

donde Gn = I[hombre].

B. Villena ICO8106 4 de junio de 2020 12 / 44


Interacciones

¿Qué capturan los coeficientes en este caso?

E [log W |Gn = 1] = (β0 + β1 ) + (β2 + β3 )Sn


E [log W |Gn = 0] = β0 + β2 Sn

B. Villena ICO8106 4 de junio de 2020 13 / 44


Interacciones

¿Qué capturan los coeficientes en este caso?

E [log W |Gn = 1] = (β0 + β1 ) + (β2 + β3 )Sn


E [log W |Gn = 0] = β0 + β2 Sn

Hay dos regresiones en una: una para hombres (Gn = 1) y otra para
mujeres (Gn = 0).

B. Villena ICO8106 4 de junio de 2020 13 / 44


Interacciones

Además se capturan diferencias de retornos a la educación entre


géneros

∂E [log W |Gn = 1]
= β2 + β3
∂S
∂E [log W |Gn = 0]
= β2
∂S

B. Villena ICO8106 4 de junio de 2020 14 / 44


Interacciones

Además se capturan diferencias de retornos a la educación entre


géneros

∂E [log W |Gn = 1]
= β2 + β3
∂S
∂E [log W |Gn = 0]
= β2
∂S
Por lo tanto β3 es el brecha de hombre-mujer en el retorno de
educación.

B. Villena ICO8106 4 de junio de 2020 14 / 44


Interacciones entre binarias

Supongamos un modelo que estudia salario para pueblo originarios


(On es 1 si individuo n se declara de pueblo originario) y por género
(Gn es 1 si individuo n es mujer, para ilustrar que definición de binaria
es arbitraria.)

log W = β0 + β1 On + β2 Gn + β3 On Gn + Un

E [log W |On = 1, Gn = 1] = β0 + β1 + β2 + β3 (originaria, mujer)


E [log W |On = 1, Gn = 0] = β0 + β1 (originario, hombre)
E [log W |On = 0, Gn = 1] = β0 + β2 (no originaria, mujer)
E [log W |On = 0, Gn = 0] = β0 (no originario, hombre)

B. Villena ICO8106 4 de junio de 2020 15 / 44


Interacciones entre binarias

Por lo tanto, los coeficientes equivalen a

β0 = E [log W |On = 0, Gn = 0]
(log salario no originario, hombre)
β1 = E [log W |On = 1, Gn = 0] − E [log W |On = 0, Gn = 0]
(brecha originario vs no originario, hombres)
β2 = E [log W |On = 0, Gn = 1] − E [log W |On = 0, Gn = 0]
(brecha género no originarios)
β2 + β3 = E [log W |On = 1, Gn = 1] − E [log W |On = 1, Gn = 0]
(brecha género originarios)

B. Villena ICO8106 4 de junio de 2020 16 / 44


Interacciones entre binarias

Por lo tanto β3 es la diferencia de brecha de géneros entre originarios


y no originarios

β3 = (E [log W |On = 1, Gn = 1] − E [log W |On = 1, Gn = 0])


− (E [log W |On = 0, Gn = 1] − E [log W |On = 0, Gn = 0])

responde si hay mayor brecha de género en pueblos originarios o en el


grupo no-originario de la población.

B. Villena ICO8106 4 de junio de 2020 17 / 44


Interacciones entre binarias

Por lo tanto β3 es la diferencia de brecha de géneros entre originarios


y no originarios

β3 = (E [log W |On = 1, Gn = 1] − E [log W |On = 1, Gn = 0])


− (E [log W |On = 0, Gn = 1] − E [log W |On = 0, Gn = 0])

responde si hay mayor brecha de género en pueblos originarios o en el


grupo no-originario de la población.
Notar que β3 puede ser escrito también como la diferencia de brecha
originarios vs no-originarios entre mujeres y hombres.

β3 = (E [log W |On = 1, Gn = 1] − E [log W |On = 0, Gn = 1])


− (E [log W |On = 1, Gn = 0] − E [log W |On = 0, Gn = 0])

B. Villena ICO8106 4 de junio de 2020 17 / 44


Interacciones

Pueden haber interacciones entre variables continuas también.

B. Villena ICO8106 4 de junio de 2020 18 / 44


Interacciones

Pueden haber interacciones entre variables continuas también.


Retorno de educación depende del nivel de experiencia?

log Wn = β0 + β1 Sn + β2 Sn × Xn + β3 Xn + β4 Xn2 + Un

B. Villena ICO8106 4 de junio de 2020 18 / 44


Interacciones

Entonces se obtiene
∂E [log W |X , S]
= β1 + β2 Xn
∂S
∂E [log W |X , S]
= β2 Sn + β3 + 2β4 Xn
∂X

B. Villena ICO8106 4 de junio de 2020 19 / 44


Interacciones

Entonces se obtiene
∂E [log W |X , S]
= β1 + β2 Xn
∂S
∂E [log W |X , S]
= β2 Sn + β3 + 2β4 Xn
∂X
Esto se puede entender como predicciones sobre segundas derivadas
del modelo ¿Cómo cambia el efecto de X en Y en la medida que
aumenta una tercera variable Z ?

B. Villena ICO8106 4 de junio de 2020 19 / 44


Interacciones
Otro ejemplo: efecto del tiempo dedicado por la madre, T en
comprensión lectora C puede variar de acuerdo a la edad del niño A
(sicologı́a del desarrollo infantil) y por la educación de la madre S
(mejor educación la hace mejor enseñando).

Cn = β0 + β1 Tn + β2 Tn × An + β3 Tn × Sn + Un

B. Villena ICO8106 4 de junio de 2020 20 / 44


Interacciones
Otro ejemplo: efecto del tiempo dedicado por la madre, T en
comprensión lectora C puede variar de acuerdo a la edad del niño A
(sicologı́a del desarrollo infantil) y por la educación de la madre S
(mejor educación la hace mejor enseñando).

Cn = β0 + β1 Tn + β2 Tn × An + β3 Tn × Sn + Un

Entonces se obtiene
∂E [C |X ]
= β1 + β2 An + β3 Sn
∂T
∂E [C |X ]
= β2 Tn
∂A
∂E [C |X ]
= β3 Tn
∂S

B. Villena ICO8106 4 de junio de 2020 20 / 44


Interacciones
Otro ejemplo: efecto del tiempo dedicado por la madre, T en
comprensión lectora C puede variar de acuerdo a la edad del niño A
(sicologı́a del desarrollo infantil) y por la educación de la madre S
(mejor educación la hace mejor enseñando).

Cn = β0 + β1 Tn + β2 Tn × An + β3 Tn × Sn + Un

Entonces se obtiene
∂E [C |X ]
= β1 + β2 An + β3 Sn
∂T
∂E [C |X ]
= β2 Tn
∂A
∂E [C |X ]
= β3 Tn
∂S
Notar que la interacción afecta tanto el efecto marginal del tiempo
como el de la edad y el de la educación de la madre.
B. Villena ICO8106 4 de junio de 2020 20 / 44
Ejercicio:

Considere que tenemos un modelo para explicar el número de postulantes


Y que recibe un aviso de trabajo en internet en un mes. Construya un
modelo lineal en parámetros que le permita estimar lo siguiente:
Efecto porcentual de un aumento de 1 % en la tasa de desempleo del
paı́s.
Incremento porcentual del número de postulantes del mes de marzo.
Efecto porcentual del número de postulantes si el salario ofrecido del
aviso de trabajo aumenta un 1 %.
Diferente efecto porcentual de la tasa de desempleo en meses de
verano con respecto a meses de invierno.
Explique cuidadosamente cuál es la interpretación de los parámetros.

B. Villena ICO8106 4 de junio de 2020 21 / 44


Test de Chow
Testeamos que los parámetros para dos submuestras sean iguales.

B. Villena ICO8106 4 de junio de 2020 22 / 44


Test de Chow
Testeamos que los parámetros para dos submuestras sean iguales.
Definimos un modelo no restringidoque permite
 parámetros
βA
diferentes en cada submuestra β = y proponemos
βB
H0 : βA = βB o bien H0 : βA − βB = 0.

B. Villena ICO8106 4 de junio de 2020 22 / 44


Test de Chow
Testeamos que los parámetros para dos submuestras sean iguales.
Definimos un modelo no restringidoque permite
 parámetros
βA
diferentes en cada submuestra β = y proponemos
βB
H0 : βA = βB o bien H0 : βA − βB = 0.
Hipótesis nula βA = βB , donde β es vector de 2(K + 1) × 1
parámetros.

B. Villena ICO8106 4 de junio de 2020 22 / 44


Test de Chow
Testeamos que los parámetros para dos submuestras sean iguales.
Definimos un modelo no restringidoque permite
 parámetros
βA
diferentes en cada submuestra β = y proponemos
βB
H0 : βA = βB o bien H0 : βA − βB = 0.
Hipótesis nula βA = βB , donde β es vector de 2(K + 1) × 1
parámetros.
La matriz de restricciones toma la siguiente forma
 
1 0 0 ... 0 −1 0 0 ... 0
 0 1 0 ... 0 0 −1 0 ... 0 
 
 0 0 1 ... 0 0
C(K +1)×2(K +1) =  0 −1 ... 0 

 ... ... ... ... ... ... ... ... ... ... 
0 0 0 ... 1 0 0 0 ... −1

= I(K +1)×(K +1) | − I(K +1)×(K +1)

B. Villena ICO8106 4 de junio de 2020 22 / 44


Test de Chow
Ejemplo sencillo, paso a paso: queremos saber si existen diferencias
sustanciales en el impacto de salarios y experiencia enre hombres y
mujeres.

B. Villena ICO8106 4 de junio de 2020 23 / 44


Test de Chow
Ejemplo sencillo, paso a paso: queremos saber si existen diferencias
sustanciales en el impacto de salarios y experiencia enre hombres y
mujeres.
El modelo que asume que ambas ecuaciones son iguales para hombres
y mujeres serı́a el modelo restringido
log Wn = β0 + β1 Sn + β2 Xn + β3 Xn2 + un (1)

B. Villena ICO8106 4 de junio de 2020 23 / 44


Test de Chow
Ejemplo sencillo, paso a paso: queremos saber si existen diferencias
sustanciales en el impacto de salarios y experiencia enre hombres y
mujeres.
El modelo que asume que ambas ecuaciones son iguales para hombres
y mujeres serı́a el modelo restringido
log Wn = β0 + β1 Sn + β2 Xn + β3 Xn2 + un (1)
El modelo alternativo (libre o no restringido) asume que ambas
ecuaciones son diferentes para hombres y mujeres. En el caso de
hombres
log WnH = β0H + β1H Sn + β2H Xn + β3H Xn2 + unH

B. Villena ICO8106 4 de junio de 2020 23 / 44


Test de Chow
Ejemplo sencillo, paso a paso: queremos saber si existen diferencias
sustanciales en el impacto de salarios y experiencia enre hombres y
mujeres.
El modelo que asume que ambas ecuaciones son iguales para hombres
y mujeres serı́a el modelo restringido
log Wn = β0 + β1 Sn + β2 Xn + β3 Xn2 + un (1)
El modelo alternativo (libre o no restringido) asume que ambas
ecuaciones son diferentes para hombres y mujeres. En el caso de
hombres
log WnH = β0H + β1H Sn + β2H Xn + β3H Xn2 + unH
En el caso de mujeres
log WnM = β0M + β1M Sn + β2M Xn + β3M Xn2 + unM

B. Villena ICO8106 4 de junio de 2020 23 / 44


Test de Chow
¿Cómo construir dos regresiones en una sola?

B. Villena ICO8106 4 de junio de 2020 24 / 44


Test de Chow
¿Cómo construir dos regresiones en una sola?
Usando dummy Gn = 1 si persona es mujer, 0 en otro caso (hombre).

log Wn = α0 + α1 Sn + α2 Xn + α3 Xn2
α4 Gn + α5 Gn Sn + α6 Gn Xn + α7 Gn Xn2 + un (2)

B. Villena ICO8106 4 de junio de 2020 24 / 44


Test de Chow
¿Cómo construir dos regresiones en una sola?
Usando dummy Gn = 1 si persona es mujer, 0 en otro caso (hombre).

log Wn = α0 + α1 Sn + α2 Xn + α3 Xn2
α4 Gn + α5 Gn Sn + α6 Gn Xn + α7 Gn Xn2 + un (2)

Se puede verificar la equivalencia entre ambos modelos “apagando y


encendiendo” Gn . Ası́

β0H = α0 y β0M = α0 + α4

β1H = α1 y β1M = α1 + α5
β2H = α2 y β2M = α2 + α6
β3H = α3 y β3M = α3 + α7

B. Villena ICO8106 4 de junio de 2020 24 / 44


Test de Chow

Test de Chow es un caso particular de test de

B. Villena ICO8106 4 de junio de 2020 25 / 44


Test de Chow

Test de Chow es un caso particular de test de


Ecuación (2) es el modelo libre y (1) serı́a modelo restringido.

B. Villena ICO8106 4 de junio de 2020 25 / 44


Test de Chow

Test de Chow es un caso particular de test de


Ecuación (2) es el modelo libre y (1) serı́a modelo restringido.
Usar test de suma de residuos libres versus restringidos.

B. Villena ICO8106 4 de junio de 2020 25 / 44


Test de Chow

Test de Chow es un caso particular de test de


Ecuación (2) es el modelo libre y (1) serı́a modelo restringido.
Usar test de suma de residuos libres versus restringidos.
Notar que los modelos son “anidados”, es decir, es posible escribir
uno como un caso particular del otro.

B. Villena ICO8106 4 de junio de 2020 25 / 44


Test de Chow

Test de Chow es un caso particular de test de


Ecuación (2) es el modelo libre y (1) serı́a modelo restringido.
Usar test de suma de residuos libres versus restringidos.
Notar que los modelos son “anidados”, es decir, es posible escribir
uno como un caso particular del otro.
Cuidado con el número de parámetros del modelo. El modelo libre es
aquél con más parámetros.

B. Villena ICO8106 4 de junio de 2020 25 / 44


Test de Chow

Test de Chow es un caso particular de test de


Ecuación (2) es el modelo libre y (1) serı́a modelo restringido.
Usar test de suma de residuos libres versus restringidos.
Notar que los modelos son “anidados”, es decir, es posible escribir
uno como un caso particular del otro.
Cuidado con el número de parámetros del modelo. El modelo libre es
aquél con más parámetros.
Si K + 1 es el número original de parámetros en el modelo
restringido, el modelo libre tiene 2(K + 1) parámetros.

B. Villena ICO8106 4 de junio de 2020 25 / 44


Test de Chow

Test de Chow es un caso particular de test de


Ecuación (2) es el modelo libre y (1) serı́a modelo restringido.
Usar test de suma de residuos libres versus restringidos.
Notar que los modelos son “anidados”, es decir, es posible escribir
uno como un caso particular del otro.
Cuidado con el número de parámetros del modelo. El modelo libre es
aquél con más parámetros.
Si K + 1 es el número original de parámetros en el modelo
restringido, el modelo libre tiene 2(K + 1) parámetros.
Por otro lado hay R = K + 1 restricciones.

B. Villena ICO8106 4 de junio de 2020 25 / 44


Test de Chow

Calcular SCRR es simple. Basta regresión de (1).

B. Villena ICO8106 4 de junio de 2020 26 / 44


Test de Chow

Calcular SCRR es simple. Basta regresión de (1).


Para calcular SCRL podemos hacerlo directamente también, o
alternativamente, calcular SCRL = SCRH + SCRM donde los SCR por
género provienen de estimar ecuaciones sólo para hombres y mujeres,
respectivamente.

B. Villena ICO8106 4 de junio de 2020 26 / 44


Test de Chow

Calcular SCRR es simple. Basta regresión de (1).


Para calcular SCRL podemos hacerlo directamente también, o
alternativamente, calcular SCRL = SCRH + SCRM donde los SCR por
género provienen de estimar ecuaciones sólo para hombres y mujeres,
respectivamente.
Por ende, el estadı́stico F en este caso es
(SCRR − SCRH − SCRM )/(K + 1)
F = ∼ F(K + 1, N − 2K − 2)
(SCRH + SCRM )/(N − 2K − 2)

B. Villena ICO8106 4 de junio de 2020 26 / 44


Más aplicaciones de Test de Chow

Cambios estructurales: Distinguir si el comportamiento de una


economı́a cambia por perı́odos de tiempo. Por ejemplo, curva de
Phillips (relación entre desempleo e inflación) antes y después de
independencia del Banco Central en 1990.

πt = β0 + β1 Ut + t

B. Villena ICO8106 4 de junio de 2020 27 / 44


Más aplicaciones de Test de Chow

Cambios estructurales: Distinguir si el comportamiento de una


economı́a cambia por perı́odos de tiempo. Por ejemplo, curva de
Phillips (relación entre desempleo e inflación) antes y después de
independencia del Banco Central en 1990.

πt = β0 + β1 Ut + t

Heterogeneiidad territorial: Distinguir si el “voto por bolsillo” en una


elección cambia entre distintas regiones de Chile. Un modelo que
impone igualdad regional serı́a

Vn = β0 + β1 Un + n

B. Villena ICO8106 4 de junio de 2020 27 / 44


Más aplicaciones de Test de Chow

Cambios estructurales: Distinguir si el comportamiento de una


economı́a cambia por perı́odos de tiempo. Por ejemplo, curva de
Phillips (relación entre desempleo e inflación) antes y después de
independencia del Banco Central en 1990.

πt = β0 + β1 Ut + t

Heterogeneiidad territorial: Distinguir si el “voto por bolsillo” en una


elección cambia entre distintas regiones de Chile. Un modelo que
impone igualdad regional serı́a

Vn = β0 + β1 Un + n

definir modelo para múltiples regiones de Chile con parámetros


distintos.

B. Villena ICO8106 4 de junio de 2020 27 / 44


Anatomı́a de Regresión Lineal

Regresión estima una aproximación a expectativa condicional, pero


qué significa cada βk en rigor?.

B. Villena ICO8106 4 de junio de 2020 28 / 44


Anatomı́a de Regresión Lineal

Regresión estima una aproximación a expectativa condicional, pero


qué significa cada βk en rigor?.
Cada regresor “compite” por explicar la mayor parte de la varianza
total. MCO escoge los estimadores para maximizar el R 2 del modelo y
eso define la contribución de cada uno.

B. Villena ICO8106 4 de junio de 2020 28 / 44


Anatomı́a de Regresión Lineal

Regresión estima una aproximación a expectativa condicional, pero


qué significa cada βk en rigor?.
Cada regresor “compite” por explicar la mayor parte de la varianza
total. MCO escoge los estimadores para maximizar el R 2 del modelo y
eso define la contribución de cada uno.
Diagrama de Ballentine es explicativo

B. Villena ICO8106 4 de junio de 2020 28 / 44


Anatomı́a de Regresión Lineal

Regresión estima una aproximación a expectativa condicional, pero


qué significa cada βk en rigor?.
Cada regresor “compite” por explicar la mayor parte de la varianza
total. MCO escoge los estimadores para maximizar el R 2 del modelo y
eso define la contribución de cada uno.
Diagrama de Ballentine es explicativo
Cada cı́rculo es la varianza de una variable, que pueden suporponerse
si hay más regresores porque hay cierto grado de asociación lineal.

B. Villena ICO8106 4 de junio de 2020 28 / 44


Regresión con K = 2

B. Villena ICO8106 4 de junio de 2020 29 / 44


Regresión con K = 3

B. Villena ICO8106 4 de junio de 2020 30 / 44


Multicolinealidad

Regresores no se controlan experimentalmente, y pueden tener una


alta correlación entre ellos, por lo cual se hace difı́cil discernir cuál es
el efecto individual de cada una de ellas.

B. Villena ICO8106 4 de junio de 2020 31 / 44


Multicolinealidad

Regresores no se controlan experimentalmente, y pueden tener una


alta correlación entre ellos, por lo cual se hace difı́cil discernir cuál es
el efecto individual de cada una de ellas.
Ejemplo intuitivo: cultivo de algún vegetal con sustancias X y Z . Si
pongo igual cantidad de X y Z en cada vegetal y luego, si en aquellos
en que puse más de ambas, crecieron más, ¿a cual de las dos
sustancias puedo atribuirlo?.

B. Villena ICO8106 4 de junio de 2020 31 / 44


Multicolinealidad

Regresores no se controlan experimentalmente, y pueden tener una


alta correlación entre ellos, por lo cual se hace difı́cil discernir cuál es
el efecto individual de cada una de ellas.
Ejemplo intuitivo: cultivo de algún vegetal con sustancias X y Z . Si
pongo igual cantidad de X y Z en cada vegetal y luego, si en aquellos
en que puse más de ambas, crecieron más, ¿a cual de las dos
sustancias puedo atribuirlo?.
Si tengo control experimental, X y Z ı́dealmente no se correlacionan
entre sı́. En un diagrama de Ballentine, si X y Z NO se superponen.

B. Villena ICO8106 4 de junio de 2020 31 / 44


Multicolinealidad

Multicolinealidad significa en un diagrama que el area común de


todos los regresores es grande y sus regiones de superposición
exclusiva con Y son reducidas.

B. Villena ICO8106 4 de junio de 2020 32 / 44


Multicolinealidad

Multicolinealidad significa en un diagrama que el area común de


todos los regresores es grande y sus regiones de superposición
exclusiva con Y son reducidas.
Conceptualmente, cuando hay regresores muy “parecidos” (es decir,
son predecibles unos con otros), hay poca variacı́ón de un regresor en
particular para estimar su efecto.

B. Villena ICO8106 4 de junio de 2020 32 / 44


Multicolinealidad

Multicolinealidad significa en un diagrama que el area común de


todos los regresores es grande y sus regiones de superposición
exclusiva con Y son reducidas.
Conceptualmente, cuando hay regresores muy “parecidos” (es decir,
son predecibles unos con otros), hay poca variacı́ón de un regresor en
particular para estimar su efecto.
Esto se traduce en poca precisión del estimador, es decir, alta
varianza.

B. Villena ICO8106 4 de junio de 2020 32 / 44


Multicolinealidad

Multicolinealidad significa en un diagrama que el area común de


todos los regresores es grande y sus regiones de superposición
exclusiva con Y son reducidas.
Conceptualmente, cuando hay regresores muy “parecidos” (es decir,
son predecibles unos con otros), hay poca variacı́ón de un regresor en
particular para estimar su efecto.
Esto se traduce en poca precisión del estimador, es decir, alta
varianza.
Consideremos el modelo Yn = β0 + βX Xn + βZ Zn + Un

B. Villena ICO8106 4 de junio de 2020 32 / 44


Multicolinealidad

Multicolinealidad significa en un diagrama que el area común de


todos los regresores es grande y sus regiones de superposición
exclusiva con Y son reducidas.
Conceptualmente, cuando hay regresores muy “parecidos” (es decir,
son predecibles unos con otros), hay poca variacı́ón de un regresor en
particular para estimar su efecto.
Esto se traduce en poca precisión del estimador, es decir, alta
varianza.
Consideremos el modelo Yn = β0 + βX Xn + βZ Zn + Un
Intuitivamente, la parte de X que no se mueve conjuntamente con Z
es la única información que permite estimar a βX .

B. Villena ICO8106 4 de junio de 2020 32 / 44


Multicolinealidad

Idea intutiva de cómo calcular la varianza de βX si X y Z covarı́an.

B. Villena ICO8106 4 de junio de 2020 33 / 44


Multicolinealidad

Idea intutiva de cómo calcular la varianza de βX si X y Z covarı́an.


σ2
Recordar varianza de Var (βbX ) = NVar (X ) si X fuese único regresor.

B. Villena ICO8106 4 de junio de 2020 33 / 44


Multicolinealidad

Idea intutiva de cómo calcular la varianza de βX si X y Z covarı́an.


σ2
Recordar varianza de Var (βbX ) = NVar (X ) si X fuese único regresor.
Remover la parte de la varianza de X que se “explica” o es común
con Z . ¿Cuánta varianza de X se “explica” por Z ? Para medirlo,
calcular esta regresión auxiliar

Xn = α0 + αZ Zn + Vn

y calculamos el RX2 de este modelo que representa la varianza común


de X y Z .

B. Villena ICO8106 4 de junio de 2020 33 / 44


Multicolinealidad: efecto en varianza

Volviendo al modelo principal, la varianza de βbX la podremos calcular


si extraemos la parte de la varianza conjunta con Z , la que no sirve
para estimar el efecto βX de X .

σ2
Var (βbX ) =
NVar (X )(1 − RX2 )

B. Villena ICO8106 4 de junio de 2020 34 / 44


Multicolinealidad: efecto en varianza

Volviendo al modelo principal, la varianza de βbX la podremos calcular


si extraemos la parte de la varianza conjunta con Z , la que no sirve
para estimar el efecto βX de X .

σ2
Var (βbX ) =
NVar (X )(1 − RX2 )

Esta intuición nos da la respuesta exacta, es la varianza que nos


entregar MCO en cada componente de Var (β|X b ) = σ 2 (X 0 X )−1

B. Villena ICO8106 4 de junio de 2020 34 / 44


Factor Inflador de Varianza (FIV)

Es aún más general, funciona para cualquier número de regresores.


Consideremos el modelo

Yn = β0 + β1 X1,n + .... + βK Xn,K + Un

B. Villena ICO8106 4 de junio de 2020 35 / 44


Factor Inflador de Varianza (FIV)

Es aún más general, funciona para cualquier número de regresores.


Consideremos el modelo

Yn = β0 + β1 X1,n + .... + βK Xn,K + Un

Para calcular la varianza del coeficiente de Xk , k = 1, 2, ..., K ,


solamente estimar la regresión auxiliar

Xk,n = α0 +α1 X1,n +...+αk−1 Xk−1,n +αk+1 Xk−1,n +αK −1 XK −1,n +Vn

B. Villena ICO8106 4 de junio de 2020 35 / 44


Factor Inflador de Varianza (FIV)

Es aún más general, funciona para cualquier número de regresores.


Consideremos el modelo

Yn = β0 + β1 X1,n + .... + βK Xn,K + Un

Para calcular la varianza del coeficiente de Xk , k = 1, 2, ..., K ,


solamente estimar la regresión auxiliar

Xk,n = α0 +α1 X1,n +...+αk−1 Xk−1,n +αk+1 Xk−1,n +αK −1 XK −1,n +Vn

Se obtiene el R 2 de ésta, llamado Rk2 y calculamos la varianza del


estimador
σ2
Var (βbk ) =
NVar (X )(1 − Rk2 )

B. Villena ICO8106 4 de junio de 2020 35 / 44


Factor Inflador de Varianza (FIV)

1
A la magnitud 1−Rk2
le llamamos Factor Inflador de Varianza (FIV).

B. Villena ICO8106 4 de junio de 2020 36 / 44


Factor Inflador de Varianza (FIV)

1
A la magnitud 1−Rk2
le llamamos Factor Inflador de Varianza (FIV).
A mayor FIV, mayor asociación de Xk con otros X y mayor
imprecisión en estimador, señal de un área compartida grande en un
diagrama de Ballentine.

B. Villena ICO8106 4 de junio de 2020 36 / 44


Factor Inflador de Varianza (FIV)

1
A la magnitud 1−Rk2
le llamamos Factor Inflador de Varianza (FIV).
A mayor FIV, mayor asociación de Xk con otros X y mayor
imprecisión en estimador, señal de un área compartida grande en un
diagrama de Ballentine.
Notar que el aumento del impacto es enorme para
R 2 = 0,9 ⇒ FIV = 10 y R 2 = 0,99 ⇒ FIV = 100

B. Villena ICO8106 4 de junio de 2020 36 / 44


Anatomı́a de la varianza

El estimador de varianza usando


b2 = SCR/(N − K − 1) = n yn2 (1 − R 2 )/(N − K − 1) finalmente
P
σ
puede escribirse ası́

Var (Y )(1 − R 2 )
Var
d (βbk ) =
(N − K − 1)Var (Xk )(1 − Rk2 )

B. Villena ICO8106 4 de junio de 2020 37 / 44


Anatomı́a de la varianza

El estimador de varianza usando


b2 = SCR/(N − K − 1) = n yn2 (1 − R 2 )/(N − K − 1) finalmente
P
σ
puede escribirse ası́

Var (Y )(1 − R 2 )
Var
d (βbk ) =
(N − K − 1)Var (Xk )(1 − Rk2 )

FIV es una medida de cuanta imprecisión hay en nuestra estimación


debido a la falta de control experimental.

B. Villena ICO8106 4 de junio de 2020 37 / 44


Anatomı́a de la varianza

El estimador de varianza usando


b2 = SCR/(N − K − 1) = n yn2 (1 − R 2 )/(N − K − 1) finalmente
P
σ
puede escribirse ası́

Var (Y )(1 − R 2 )
Var
d (βbk ) =
(N − K − 1)Var (Xk )(1 − Rk2 )

FIV es una medida de cuanta imprecisión hay en nuestra estimación


debido a la falta de control experimental.
Multicolinealidad es un problema de la naturaleza no-experimental de
los datos.

B. Villena ICO8106 4 de junio de 2020 37 / 44


Consecuencias de multicolinealidad

Con multicolinealidad, MCO cumple igual Gauss-Markov: Aunque las


varianzas estimadas sean altas, es lo mejor que se puede hacer con los
datos disponibles (para un modelo dado)

B. Villena ICO8106 4 de junio de 2020 38 / 44


Consecuencias de multicolinealidad

Con multicolinealidad, MCO cumple igual Gauss-Markov: Aunque las


varianzas estimadas sean altas, es lo mejor que se puede hacer con los
datos disponibles (para un modelo dado)
La multicolinealidad severa puede ser compensada por otros factores:
baja Var (Y ), alto R 2 , alta Var (Xk ), alto N − K − 1.

B. Villena ICO8106 4 de junio de 2020 38 / 44


Consecuencias de multicolinealidad

Con multicolinealidad, MCO cumple igual Gauss-Markov: Aunque las


varianzas estimadas sean altas, es lo mejor que se puede hacer con los
datos disponibles (para un modelo dado)
La multicolinealidad severa puede ser compensada por otros factores:
baja Var (Y ), alto R 2 , alta Var (Xk ), alto N − K − 1.
Efecto en test t de significancia individual: alta probabilidad de no
rechazar H0 debido a mayor imprecisión

B. Villena ICO8106 4 de junio de 2020 38 / 44


Consecuencias de multicolinealidad

Con multicolinealidad, MCO cumple igual Gauss-Markov: Aunque las


varianzas estimadas sean altas, es lo mejor que se puede hacer con los
datos disponibles (para un modelo dado)
La multicolinealidad severa puede ser compensada por otros factores:
baja Var (Y ), alto R 2 , alta Var (Xk ), alto N − K − 1.
Efecto en test t de significancia individual: alta probabilidad de no
rechazar H0 debido a mayor imprecisión
En tests conjuntos: la existencia de muy altas covarianzas entre
regresores hace que Cov (βbk , βbj ) sean altos en valor absoluto.

B. Villena ICO8106 4 de junio de 2020 38 / 44


Consecuencias de multicolinealidad

Con multicolinealidad, MCO cumple igual Gauss-Markov: Aunque las


varianzas estimadas sean altas, es lo mejor que se puede hacer con los
datos disponibles (para un modelo dado)
La multicolinealidad severa puede ser compensada por otros factores:
baja Var (Y ), alto R 2 , alta Var (Xk ), alto N − K − 1.
Efecto en test t de significancia individual: alta probabilidad de no
rechazar H0 debido a mayor imprecisión
En tests conjuntos: la existencia de muy altas covarianzas entre
regresores hace que Cov (βbk , βbj ) sean altos en valor absoluto.
Conclsiones de tests de hipótesis conjuntas e individuales pueden
tener resultados muy diferentes (en particular Significancia global vs
individual).

B. Villena ICO8106 4 de junio de 2020 38 / 44


Regiones de confianza individual vs conjunta
Para modelo log Salarion = β0 + β1 Escn + β2 Edadn + Un , mostramos
región de confianza conjunta e individuales de βb1 y βb2

Confidence ellipse
Coefficient centered
.135
Estimated años de escolaridad
.131 .132 .133 .134

.006 .0065 .007 .0075


Estimated edad (años cumplidos)
boundary constant = 5.9917

B. Villena ICO8106 4 de junio de 2020 39 / 44


Explicación

En los datos Cov (Escol, Edad) < 0, escolaridad ha aumentado en


personas más jóvenes.

B. Villena ICO8106 4 de junio de 2020 40 / 44


Explicación

En los datos Cov (Escol, Edad) < 0, escolaridad ha aumentado en


personas más jóvenes.
Si ∆+ escol, en promedio ∆− edad.

B. Villena ICO8106 4 de junio de 2020 40 / 44


Explicación

En los datos Cov (Escol, Edad) < 0, escolaridad ha aumentado en


personas más jóvenes.
Si ∆+ escol, en promedio ∆− edad.
Esto en general implica que Cov (βbescol , βbedad ) > 0. Por qué?

B. Villena ICO8106 4 de junio de 2020 40 / 44


Explicación

En los datos Cov (Escol, Edad) < 0, escolaridad ha aumentado en


personas más jóvenes.
Si ∆+ escol, en promedio ∆− edad.
Esto en general implica que Cov (βbescol , βbedad ) > 0. Por qué?
Para un salario constante, supongamos que ∆+ βbescol , por lo que
∆+ βbescol Escol. Como el salario se debe mantener constante,
necesitamos ∆− βbedad Edad.

B. Villena ICO8106 4 de junio de 2020 40 / 44


Explicación

En los datos Cov (Escol, Edad) < 0, escolaridad ha aumentado en


personas más jóvenes.
Si ∆+ escol, en promedio ∆− edad.
Esto en general implica que Cov (βbescol , βbedad ) > 0. Por qué?
Para un salario constante, supongamos que ∆+ βbescol , por lo que
∆+ βbescol Escol. Como el salario se debe mantener constante,
necesitamos ∆− βbedad Edad.
Ya que edad y escol están negativamente relacionados, requerimos
aumentar βbedad para poder contrapesar la suma y mantener el error al
explicar el salario.

B. Villena ICO8106 4 de junio de 2020 40 / 44


Efecto de multicolinealidad en tests
Para modelo log Salarion = β0 + β1 Esc0n + β2 Edadn + Un , con
Esc0n = Escn − 2Edadn .

Confidence ellipse
Coefficient centered
.135 .134
Estimated esc0
.132 .133
.131

.268 .27 .272 .274 .276 .278


Estimated edad (años cumplidos)
boundary constant = 5.9917

B. Villena ICO8106 4 de junio de 2020 41 / 44


Posibles “soluciones”

Es lo que hay: datos no son recogidos experimentalmente.

B. Villena ICO8106 4 de junio de 2020 42 / 44


Posibles “soluciones”

Es lo que hay: datos no son recogidos experimentalmente.


No es especialmente importante si el modelo es predictivo y no
interesa estimar un parámetro en particular.

B. Villena ICO8106 4 de junio de 2020 42 / 44


Posibles “soluciones”

Es lo que hay: datos no son recogidos experimentalmente.


No es especialmente importante si el modelo es predictivo y no
interesa estimar un parámetro en particular.
Pero muchos problemas en econometrı́a son de medición de impactos
o respuestas contrafactuales del tipo, ¿qué pasarı́a si...?

B. Villena ICO8106 4 de junio de 2020 42 / 44


Posibles “soluciones”

Es lo que hay: datos no son recogidos experimentalmente.


No es especialmente importante si el modelo es predictivo y no
interesa estimar un parámetro en particular.
Pero muchos problemas en econometrı́a son de medición de impactos
o respuestas contrafactuales del tipo, ¿qué pasarı́a si...?
En estos casos, la falta de información suficiente para individualizar
efecto de variables se puede suplementar con información a priori
(imponer restricciones teóricas).

B. Villena ICO8106 4 de junio de 2020 42 / 44


Posibles “soluciones”

Ejemplo: Supongamos una función de producción Cobb-Douglas


log-linealizada

log Y = β0 + β1 log K + β2 log L + U

donde RK2 = 0,9. Entonces FIV = 10, potencialmente un problema.


En muchos casos teóricamente es natural imponer retornos
constantes a escala, es decir β1 + β2 = 1. Al hacer esto, se obtiene

log Y − log L = β0 + β1 (log K − log L) + U

B. Villena ICO8106 4 de junio de 2020 43 / 44


Posibles “soluciones”

Ejemplo: Supongamos una función de producción Cobb-Douglas


log-linealizada

log Y = β0 + β1 log K + β2 log L + U

donde RK2 = 0,9. Entonces FIV = 10, potencialmente un problema.


En muchos casos teóricamente es natural imponer retornos
constantes a escala, es decir β1 + β2 = 1. Al hacer esto, se obtiene

log Y − log L = β0 + β1 (log K − log L) + U

En este ejemplo, la varianza estimada del modelo original serı́a

Var (log Y )(1 − R 2 )


Var
d (βb1 ) =
2
(N − K − 1)Var (log K )(1 − Rlog K)

B. Villena ICO8106 4 de junio de 2020 43 / 44


Efecto en precisión de la estimación

Se producen dos efectos al imponer la restricción:

B. Villena ICO8106 4 de junio de 2020 44 / 44


Efecto en precisión de la estimación

Se producen dos efectos al imponer la restricción:


1 La restricción teórica implica un menor ajuste (R 2 ), haciendo que
Var
d (βb1 ) suba.

B. Villena ICO8106 4 de junio de 2020 44 / 44


Efecto en precisión de la estimación

Se producen dos efectos al imponer la restricción:


1 La restricción teórica implica un menor ajuste (R 2 ), haciendo que
Var
d (βb1 ) suba.
2 La restricción teórica elimina un regresor muy colineal, haciendo
2
Rlog K −log L = 0 y ası́ Var (β1 ) disminuya
d b

B. Villena ICO8106 4 de junio de 2020 44 / 44


Efecto en precisión de la estimación

Se producen dos efectos al imponer la restricción:


1 La restricción teórica implica un menor ajuste (R 2 ), haciendo que
Var
d (βb1 ) suba.
2 La restricción teórica elimina un regresor muy colineal, haciendo
2
Rlog K −log L = 0 y ası́ Var (β1 ) disminuya
d b
¿Qué efecto predomina? Si la multicolinealidad es muy severa con
FIV muy alto, la varianza cae mucho al imponer la restricción. Si la
restricción no está dramáticamente desalineada con los datos, el
primer efecto predomina.

B. Villena ICO8106 4 de junio de 2020 44 / 44


Efecto en precisión de la estimación

Se producen dos efectos al imponer la restricción:


1 La restricción teórica implica un menor ajuste (R 2 ), haciendo que
Var
d (βb1 ) suba.
2 La restricción teórica elimina un regresor muy colineal, haciendo
2
Rlog K −log L = 0 y ası́ Var (β1 ) disminuya
d b
¿Qué efecto predomina? Si la multicolinealidad es muy severa con
FIV muy alto, la varianza cae mucho al imponer la restricción. Si la
restricción no está dramáticamente desalineada con los datos, el
primer efecto predomina.
Si FIV es alto, imponer la restrcción aunque sea “falsa” reduce el
Error Cuadrático Medio ECM(β) b = Var (β)
b + B(β)b 2 ya que la
varianza cae mucho más de lo que aumenta el sesgo.

B. Villena ICO8106 4 de junio de 2020 44 / 44

También podría gustarte