Está en la página 1de 5

Econometría I - Nota de Clase Nº 6: Modelo lineal

multivariable (errores de especificación)*


Alfonso Leonel Ayala Loro†

6 de Mayo de 2019

Resumen
En el presente trabajo mostramos los problemas que se presentan en los estimadores del modelo
lineal general, atendiendo principalmente a la forma funcional del modelo y a la estabilidad de los
parámetros obtenidos.

* Notasde Clase para el curso Econometría I.



B. Sc. Economía, Universidad Nacional Mayor de San Marcos. Maestría en Finanzas, Universidad del Pacífico. Profesor
Asociado del Departamento Académico de Economía de la UNMSM. Investigador asociado al Instituto de Investigaciones
FCE - UNMSM y al Instituto de Estudios Sociales del Rímac. Contacto: aayalal1@unmsm.edu.pe
1. Introducción
En esta parte del trabajo econométrico vemos si la forma del modelo responde a algunas preguntas
posibles: ¿el número de parámetros es el adecuado?, ¿la forma en la que se están incluyendo las variables
en el modelo es la mejor?, ¿existe un posible sesgo por variable omitida?.

2. Especificación del modelo


2.1. Número de estimadores en el modelo lineal
Para comparar el ajuste de un modelo se puede utilizar el R2 ajustado, este trata de descontar el
efecto de que un modelo posea mayor cantidad de estimadores que otro.

RSS
2
Radj =1− n−k−1 (1)
T SS
n−1
Para que la inclusión de una nueva variable explicativa se justifique, el efecto de la disminución de
los RSS debe compensar el aumento de k en la fracción RSS/(n − k − 1).
Otra forma de probar si el diseño del modelo es adecuado es comparando los denominados criterios
de información. El criterio de información de Akaike es:
 
RSS 2k
AIC = ln + (2)
n n
El criterio de información de Schwartz (o criterio de información Bayesiano) es:
 
RSS k × ln(n)
SIC = ln + (3)
n n
En estos indicadores podemos observar que tambien se evalúa el efecto de los RSS que disminu-
yen con el aumento de la función por k que aumenta. Al tratarse de una función de pérdida se busca
minimizar el valor de estos criterios cuando se elige la mejor especificación posible de un modelo de
regresión.
En el modelo log(salaryi ) = β0 + β1 yearsi + β2 gamesyri , obtenemos en STATA los valores de
los criterios de información, con k = 2

Cuadro 1: Valores de los criterios de información del modelo: log(salaryi ) = β0 + β1 yearsi +


β2 gamesyri + ui

estat ic

Akaike’s information criterion and Bayesian information criterion

-----------------------------------------------------------------------------
Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
. | 353 -559.5482 -399.1103 3 804.2206 815.82
-----------------------------------------------------------------------------
Note: N=Obs used in calculating BIC; see [R] BIC note.

En el modelo log(salary)i = β0 +β1 yearsi +β2 gamesyri +β3 bavgi +β4 hrunyri +β5 rbisyri +ui ,
obtenemos los criterios de información (BIC es el criterio de información de Schwartz), con k = 5:
Podemos observar que tanto para el criterio de información de Akaike como Schwartz, los valores
disminuyen (en el caso del AIC bajan de 804.22 a 782.21, y para el BIC bajan de 815.82 a 805.41).

1
Cuadro 2: Valores de los criterios de información del modelo: log(salaryi ) = β0 + β1 yearsi +
β2 gamesyri + β3 bavgi + β4 hrunyri + β5 rbisyri + ui

estat ic

Akaike’s information criterion and Bayesian information criterion

-----------------------------------------------------------------------------
Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
. | 353 -559.5482 -385.1076 6 782.2152 805.4141
-----------------------------------------------------------------------------
Note: N=Obs used in calculating BIC; see [R] BIC note.

2.2. Estabilidad de β
Uno de los supuestos iniciales del modelo fue que la relación entre X e Y es estable, esto es, no
se presentan situaciones en las que esa relación no se cumple para todos los valores de la muestra. Ello
puede darse por diversas situaciones, por ejemplo la relación entre los ingresos laborales y la educación
puede ser diferente para un grupo de la población sometido a discriminación, eventos políticos puede
afectar la disponibilidad a consumir, cambios en la legislación puede cambiar la cantidad de accidentes
laborales, etc.
Una primera manera de abordar el problema de estabilidad de los estimadores es dividir la muestra
de valores en dos partes n1 y n2 , con las primeras n1 observaciones se calcula el vector de β, luego se
estiman los valores predichos en n2 usando el vector β, luego de ello se analizan la secuencia de errores
estimados eˆ2
Siguiendo a Johnston and Dinardo (1997), en una base de datos de 59 observaciones trimestrales,
donde gas = logaritmo del gasto per cápita en combustible, price = índice real de precio de combustible,
income = logaritmo del ingreso per cápita disponible. Se ha seleccionado 51 observaciones (del primer
trimestre de 1959 al tercer trimestre de 1971), obteniendo el siguiente modelo:

Cuadro 3: Estimación del modelo: gasi = β0 + β1 pricei + β2 incomei + ui

reg gas price income if tin(1959q1,1971q3)

Source | SS df MS Number of obs = 51


-------------+---------------------------------- F(2, 48) = 622.14
Model | .670396421 2 .33519821 Prob > F = 0.0000
Residual | .025861701 48 .000538785 R-squared = 0.9629
-------------+---------------------------------- Adj R-squared = 0.9613
Total | .696258121 50 .013925162 Root MSE = .02321

------------------------------------------------------------------------------
gas | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
price | -.6623371 .1454585 -4.55 0.000 -.9548011 -.3698732
income | .8479072 .0603867 14.04 0.000 .7264917 .9693227
_cons | -1.104141 .4704253 -2.35 0.023 -2.049994 -.1582872
------------------------------------------------------------------------------

Para predecir los 8 valores que usamos para probar la estabilidad del vector β usamos el comando

predict p if tin (1971q4, 1973q3)

El test de Chow se realiza mediante tres pasos:

2
Estimar el modelo con las primeras n1 observacionexs, y rescatar los errores cuadráticos resultan-
tes, que llamaremos eT1 e1

Estimar el modelo con todas las n1 + n2 observacionexs, y rescatar los errores cuadráticos resul-
tantes, que llamaremos eT∗ e∗

Calcular el ratio F mediante:

eT∗ e∗ − eT1 e1
n2
Fcalc = T
e1 e1
n1 − k − 1
El F calculado se compara con su correspondiente F en tabla.

Realizamos el segundo paso, estimando el modelo con las n1 + n2 observaciones:

Cuadro 4: Estimación del modelo: gasi = β0 + β1 pricei + β2 incomei + ui

reg gas price income if tin(1959q1,1973q3)

Source | SS df MS Number of obs = 59


-------------+---------------------------------- F(2, 56) = 1101.27
Model | 1.04839581 2 .524197906 Prob > F = 0.0000
Residual | .026655688 56 .000475994 R-squared = 0.9752
-------------+---------------------------------- Adj R-squared = 0.9743
Total | 1.0750515 58 .018535371 Root MSE = .02182

------------------------------------------------------------------------------
gas | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
price | -.6726403 .1014437 -6.63 0.000 -.8758563 -.4694242
income | .8508767 .0511363 16.64 0.000 .7484384 .953315
_cons | -1.042949 .2961674 -3.52 0.001 -1.636244 -.4496543
------------------------------------------------------------------------------

El ratio F será:
0,0266 − 0,0258
8 0,000100
Fcalc = = = 0,184207
0,0266 0,000538
51 − 2 − 1
Si el Fc alc excede a valor crítico se rechaza la hipótesis nula (estabilidad de β). En este caso to-
mamos de la tabla F (8, 48) este valor es 2.18, según los resultados obtenidos los betas no presentan
inestabilidad.
Para explorar los posibles cambios en la relación entre Y y X se puede optar por una técnica simple,
se ordena la muestra en orden creciente (o decreciente) respecto a alguna X, y se calcula βk en un
periodo menor a la muestra, inmediatamente se toma otra muestra de igual tamaño, descartando el valor
más bajo de la muestra inicial e incorporando la siguiente observación más alta, este proceso se repite
hasta llegar al valor más alto de X de la muestra.

2.3. Variables omitidas


El problema de variables omitidas puede surgir por tres razones, a) debido a que no existe la dis-
ponibilidad de alguna variable que influye sobre Y , b) el investigador no ha realizado una suficiente

3
revisión de posibles variables explicativas, por tanto no recoge información sobre ella en la formulación
del modelo, y c) debido a que la variable es no observable, y aunque el investigador quisiera incluirla en
el modelo ello no es posible.

Referencias
Johnston, J. and Dinardo, J. (1997). Econometric methods. New York: McGraw-Hill.

También podría gustarte