Documentos de Académico
Documentos de Profesional
Documentos de Cultura
6 de Mayo de 2019
Resumen
En el presente trabajo mostramos los problemas que se presentan en los estimadores del modelo
lineal general, atendiendo principalmente a la forma funcional del modelo y a la estabilidad de los
parámetros obtenidos.
RSS
2
Radj =1− n−k−1 (1)
T SS
n−1
Para que la inclusión de una nueva variable explicativa se justifique, el efecto de la disminución de
los RSS debe compensar el aumento de k en la fracción RSS/(n − k − 1).
Otra forma de probar si el diseño del modelo es adecuado es comparando los denominados criterios
de información. El criterio de información de Akaike es:
RSS 2k
AIC = ln + (2)
n n
El criterio de información de Schwartz (o criterio de información Bayesiano) es:
RSS k × ln(n)
SIC = ln + (3)
n n
En estos indicadores podemos observar que tambien se evalúa el efecto de los RSS que disminu-
yen con el aumento de la función por k que aumenta. Al tratarse de una función de pérdida se busca
minimizar el valor de estos criterios cuando se elige la mejor especificación posible de un modelo de
regresión.
En el modelo log(salaryi ) = β0 + β1 yearsi + β2 gamesyri , obtenemos en STATA los valores de
los criterios de información, con k = 2
estat ic
-----------------------------------------------------------------------------
Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
. | 353 -559.5482 -399.1103 3 804.2206 815.82
-----------------------------------------------------------------------------
Note: N=Obs used in calculating BIC; see [R] BIC note.
En el modelo log(salary)i = β0 +β1 yearsi +β2 gamesyri +β3 bavgi +β4 hrunyri +β5 rbisyri +ui ,
obtenemos los criterios de información (BIC es el criterio de información de Schwartz), con k = 5:
Podemos observar que tanto para el criterio de información de Akaike como Schwartz, los valores
disminuyen (en el caso del AIC bajan de 804.22 a 782.21, y para el BIC bajan de 815.82 a 805.41).
1
Cuadro 2: Valores de los criterios de información del modelo: log(salaryi ) = β0 + β1 yearsi +
β2 gamesyri + β3 bavgi + β4 hrunyri + β5 rbisyri + ui
estat ic
-----------------------------------------------------------------------------
Model | Obs ll(null) ll(model) df AIC BIC
-------------+---------------------------------------------------------------
. | 353 -559.5482 -385.1076 6 782.2152 805.4141
-----------------------------------------------------------------------------
Note: N=Obs used in calculating BIC; see [R] BIC note.
2.2. Estabilidad de β
Uno de los supuestos iniciales del modelo fue que la relación entre X e Y es estable, esto es, no
se presentan situaciones en las que esa relación no se cumple para todos los valores de la muestra. Ello
puede darse por diversas situaciones, por ejemplo la relación entre los ingresos laborales y la educación
puede ser diferente para un grupo de la población sometido a discriminación, eventos políticos puede
afectar la disponibilidad a consumir, cambios en la legislación puede cambiar la cantidad de accidentes
laborales, etc.
Una primera manera de abordar el problema de estabilidad de los estimadores es dividir la muestra
de valores en dos partes n1 y n2 , con las primeras n1 observaciones se calcula el vector de β, luego se
estiman los valores predichos en n2 usando el vector β, luego de ello se analizan la secuencia de errores
estimados eˆ2
Siguiendo a Johnston and Dinardo (1997), en una base de datos de 59 observaciones trimestrales,
donde gas = logaritmo del gasto per cápita en combustible, price = índice real de precio de combustible,
income = logaritmo del ingreso per cápita disponible. Se ha seleccionado 51 observaciones (del primer
trimestre de 1959 al tercer trimestre de 1971), obteniendo el siguiente modelo:
------------------------------------------------------------------------------
gas | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
price | -.6623371 .1454585 -4.55 0.000 -.9548011 -.3698732
income | .8479072 .0603867 14.04 0.000 .7264917 .9693227
_cons | -1.104141 .4704253 -2.35 0.023 -2.049994 -.1582872
------------------------------------------------------------------------------
Para predecir los 8 valores que usamos para probar la estabilidad del vector β usamos el comando
2
Estimar el modelo con las primeras n1 observacionexs, y rescatar los errores cuadráticos resultan-
tes, que llamaremos eT1 e1
Estimar el modelo con todas las n1 + n2 observacionexs, y rescatar los errores cuadráticos resul-
tantes, que llamaremos eT∗ e∗
eT∗ e∗ − eT1 e1
n2
Fcalc = T
e1 e1
n1 − k − 1
El F calculado se compara con su correspondiente F en tabla.
------------------------------------------------------------------------------
gas | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
price | -.6726403 .1014437 -6.63 0.000 -.8758563 -.4694242
income | .8508767 .0511363 16.64 0.000 .7484384 .953315
_cons | -1.042949 .2961674 -3.52 0.001 -1.636244 -.4496543
------------------------------------------------------------------------------
El ratio F será:
0,0266 − 0,0258
8 0,000100
Fcalc = = = 0,184207
0,0266 0,000538
51 − 2 − 1
Si el Fc alc excede a valor crítico se rechaza la hipótesis nula (estabilidad de β). En este caso to-
mamos de la tabla F (8, 48) este valor es 2.18, según los resultados obtenidos los betas no presentan
inestabilidad.
Para explorar los posibles cambios en la relación entre Y y X se puede optar por una técnica simple,
se ordena la muestra en orden creciente (o decreciente) respecto a alguna X, y se calcula βk en un
periodo menor a la muestra, inmediatamente se toma otra muestra de igual tamaño, descartando el valor
más bajo de la muestra inicial e incorporando la siguiente observación más alta, este proceso se repite
hasta llegar al valor más alto de X de la muestra.
3
revisión de posibles variables explicativas, por tanto no recoge información sobre ella en la formulación
del modelo, y c) debido a que la variable es no observable, y aunque el investigador quisiera incluirla en
el modelo ello no es posible.
Referencias
Johnston, J. and Dinardo, J. (1997). Econometric methods. New York: McGraw-Hill.