Está en la página 1de 65

Universidad Nacional Autónoma de México

Instituto de Investigaciones Económicas

Econometría Intermedia
Econometría Intermedia
INDEPENDENCIA EN
INDEPENDENCIA EN LOS
LOS ERRORES
ERRORES Y
Y HETEROCEDASTICIDAD
HETEROCEDASTICIDAD

Mtro. Uberto Salgado Nieto


ubertosalgado@comunidad.unam.mx

Posgrado de Economía UNAM


 Cada ei tiene la misma varianza (σ2) y no está
correlacionado con ningún otro ej con i≠j
 Esto significa que:

Var[|X] = 2I.
En forma Matricial
 En el caso de las series de tiempo, se conoce
como correlación serial en los residuos.

 Considerando el modelo de regresión lineal


múltiple

 Donde los errores son estrictamente


exógenos es decir E(u)=0.
 En este sentido se pueden presentar dos
tipos de correlaciones seriales

 Correlación serial impura, (incorrecta


especificación)

 Correlación serial pura, (procesos ARMA(p,q))


Correlación serial impura
 Es el resultado de un error de especificación
debido a la omisión de variables relevantes
que presentan autocorrelación

 Considerando que el modelo correctamente


especificado para Yt es:
 Sí erróneamente especificamos el modelo:

 Entonces el término de error


depende de la variable omitida

 Si los datos de esta variable son


dependendientes en el tiempo, entonces el
error et presentará autocorrelación
Correlación serial pura
 Considerando el modelo de regresión lineal
múltiple

 Donde los errores son estrictamente


exógenos es decir E(u)=0.
 Los residuos pueden presentar un proceso
autoregresivo de orden 1tenemos:

 Donde et no tiene autocorrelación, y tiene


media cero y varianza
Consecuencias de la correlación
serial
 La correlación serial corresponde al caso donde
la matriz de covarianzas de los
disturbios no es diagonal, y asumimos que Ω es
desconocida.

 El estimador será insesgado y consistente.

 Sin embargo, ha dejado de ser eficiente y su


matriz de covarianzas no es igual a por
que ahora depende de una matriz de covarianzas
desconocida Ω.
PRUEBA DE DURBIN WATSON
 Se basa en una autocorrelación serial AR(1)
en los residuos obtenidos de una regresión
por MCO:

 Donde t es el número de observaciones y


dado que DW se aproxima a 2(1- ρ1), donde
ρ1 es la autocorrelación muestral de los
residuos.
 Cuando T es grande, entonces:

 Tal que
 El estadístico DW toma valores en el rango de
0 a 4, cumpliéndose que:
 Si DW es igual a dos indica que no existe
autocorrelación serial en los residuos.

 Los valores de DW van de 0 a 4 si el valor es


menor a 2, existe evidencia de correlación
serial positiva, aunque si es menor a 1 la
correlación serial será más fuerte, ya que
valores más pequeños indican que los términos
de error en promedio son más cercanos en sus
valores o correlacionados positivamente.
 Si el valor de DW es mayor a 2, esto indicaría
que los valores entre los residuos varían
considerablemente de uno a otro o que existe
correlación negativa.
AUTOCORRELACIÓN EN STATA
 Empleamos la base de datos “klein.dta” la
cual contiene información sobre el nivel de
consumo de la cuenta pública del gobierno.

 Para llevar a cabo estas pruebas es necesario


declarar la variable temporal para poder
aplicar los comandos de series de tiempo en
STATA.

 tsset yr
 Ahora realizamos la regresión del consumo
del gobierno, el cual depende de los ingresos
del gobierno.

 regress consump wagegovt

 El estadístico DW se obtiene con el comando


 estat dwatson
 Durbin y Watson (1950) derivaron la
distribución de DW (condicionada a X),
calculando umbrales para probar la hipótesis
nula de que los errores no están serialmente
correlacionados contra la alternativa de que
siguen un proceso autoregresivo de primer
orden.
 La regla de decisión es la siguiente:

 Si DW<dL se rechaza la hipótesis nula

 Si DW>dU no se rechaza la nula

 Si dL<DW<dU No hay conclusión.

 Comparamos el valor crítico


PRUEBA LM DE BREUSCH-GODFREY
 Estos autores consideraron una especificación
AR(p) o MA(q) para los errores

 Y formularon el problema de contraste


 Los pasos para realizar el contraste son los
siguientes:

◦ Estimar la ecuación de interés

◦ Estimar la ecuación de la regresión auxiliar

◦ Y obtener el R2
 Calcular el estadístico de contraste

 Que se distribuye como una ji-cuadrada con


p grados de libertad

 La hipótesis nula se rechaza a un nivel de


significación α, si χ>c, donde c es el valor
crítico para el cual Prob(χ2p>c)=0
Prueba en STATA
 Primero es necesario ejecutar la regresión lineal.

 regress consump wagegovt

 Posteriormente ejecutamos el comando “estat


bgodfrey” con la opción small para ejecutar la
prueba de Breusch Godfrey ajustada para
muestras pequeñas.

 estat bgodfrey, small


HOMOCEDASTICIDAD EN LOS
RESIDUOS
 Uno de los principales supuestos en la
regresión de MCO es la homogeneidad en la
varianza de los residuos.

 Si la varianza de los residuos no es constante,


entonces la varianza residual se dice que es
“heterocedástica”.
 En el modelo lineal general:

 Donde suponemos que

 El supuesto de que la varianza del error es


constante (homocedásticidad), es difícil de
justificar en algunas situaciones.
CAUSAS FRECUENTES DE
HETEROCEDASTICIDAD
 El problema de heterocedasticidad es típico
en datos de corte transversal

◦ Variables explicativas con una distribución


asimétrica
◦ Omisión de variables relevantes en el modelo
especificado
◦ Cambio estructural
◦ Outliers y apalancamiento
 En presencia de heterocedasticidad, el
estimador de mínimos cuadrados ordinarios
es lineal, insesgado y consistente, pero deja
de ser eficiente.

 Para tratar de encontrar una solución es


necesario proponer una forma para la
heterocedasticidad de las perturbaciones
 El resultado del proceso de minimizar los
errores al cuadrado en presencia de errores
heterocedásticos está dada por:

 Los parámetros son lineales


  Los estimadores son insesgados

 Asumiendo no autocorrelación, la varianza


del error no es constante entre las
observaciones

 =
  O en su forma equivalente.

 Notar que bajo presencia de


homocedasticidad Ω=I
 Bajo la presencia de heterocedasticidad, la
varianza muestral del estimador por MCO es:

 Var(b)=E[(b-β)(b-β)’]
 =E[(X’X)-1X’εε’X(X’X)-1]
 =(X’X)-1X’E(εε’)X(X’X)-1
 =σ2(X’X)-1X’ΩX(X’X)-1
Detectando la homocedasticidad
 Para hacer este ejercicio empleamos los datos
“elemapi2.dta” la cual contiene información
sobre el desempeño académico de la educación
básica en Estados Unidos.

 Vamos a demostrar que el desempeño


académico (api00) de una escuela está en
función del porcentaje de alumnos que recibe
desayunos gratuitos (meals), de los que están
aprendiendo ingles (ell) y del porcentaje de
maestros con credenciales nuevas (emer).
 Primero realizamos la estimación.

 regress api00 meals ell emer

 Utilizando el comando rvfplot

 rvfplot, yline(0)
Prueba de Breusch-Pagan para la
heterocedasticidad.
 Considerando el modelo lineal

 Con heterocedasticidad del tipo

 La varianza es función exponencial de una


combinación lineal de variables conocidas, las
variables Zj coinciden con las variables
explicativas Xj
 Breusch y Pagan (1979) consideran una forma
más general de heterocedasticidad

 Donde h es una función no especificada

 Las hipótesis a contrastar son:


 Un procedimiento equivalente es el siguiente:

◦ Estimar por MCO la ecuación de regresión de


interés, obtener los residuos
◦ Estimar por MCO la ecuación de regresión auxiliar

◦ Y calcular el coeficiente de determinación R 2


◦ Con esto se puede construir el estadístico del
Multiplicador de Lagrange (LM)
 El estadístico del multiplicador de Lagrange (LM)
nos permitirá probar la significación conjunta de
los regresores.

 ML se distribuye asintóticamente como con k-


1 grados de libertad, donde k es el número de
parámetros empleados en la regresión

 Si H0 es cierta, entonces la varianza σ2i no


depende de las variables Zj (variables que causan
la heterocedasticidad)
Prueba de Breusch-Pagan en Stata
 Para desarrollar la prueba de Breusch-Pagan
para identificar le heterocedasticidad en los
residuos, es necesario aplicar el comando
“hettest”
 Esta prueba asume la hipótesis nula de que la

varianza de los errores es constante


(homocedástica).

 regress api00 meals ell emer


 estat hettest
Prueba de White
 Considerando una ecuación de regresión con
término constante y dos variables explicativas

 Y deseamos contrastar las hipótesis


 Los pasos para realizar el contraste son los
siguientes

 Estimar por MCO la ecuación de regresión

 Y obtener sus residuos


 Estimar por MCO la ecuación de la regresión
auxiliar

 Obtenemos el coeficiente de determinación R2

 Calcular el estadístico LM, que sigue una


distribución Chi-cuadrada con p-1 grados de
libertad, donde p es el número de parámetros
de la regresión auxiliar
 La hipótesis H0 se rechaza al nivel de
significación α

 Suele decirse que el test de White es general


porque no se necesita conocer cuales
variables cusan la heterocedasticidad

 Sin embargo, de la ecuación auxiliar se


observa que la forma de heterocedasticidad
es:
 Las hipótesis a contrastar son:

 Bajo H0, la varianza del error es constante;


bajo H1, hay heterocedasticidad del tipo
 La regresión auxiliar incluye como variables
explicativas todas las variables explicativas
del modelo de interés, sus cuadrados y los
productos cruzados, siempre que tales
variables no sean redundantes.

 Por ejemplo si X2i es una variable dicotómica


que tiene valores 0 y 1, entonces y
se dice que es redundante
Homocedasticidad en STATA
 Esta prueba se puede realizar mediante el comando
imtest, white.

 Esta prueba considera la hipótesis nula de que los


errores tienen una varianza constante.

 Aplicamos el comando imtest, white despues de


realizar la regresión

 regress api00 meals ell emer

 estat imtest, white


Soluciones a la heterocedasticidad
 En el modelo MCO se busca minimizar:

 Si las varianzas difieren lo mejor seria asignar


ponderaciones relativamente pequeñas a las
observaciones con varianzas grandes y
mayores ponderaciones a las observaciones
con pequeñas varianzas.
 Esto debido a que las observaciones con
pequeños términos de error proveen más
información sobre el valor de β que en las
observaciones con términos de error grandes.

 En este sentido seria más correcto emplear


un criterio de ponderación de los MCO de la
forma:
MÍNIMOS CUADRADOS
GENERALIZADOS
 En un modelo con heterocedasticidad, la
matriz de varianzas y covarianzas de los
errores tienen la forma

 Que contiene n parámetros


 Para tratar de resolver el problema es posible
suponer que la varianza del error depende de
alguna variable conocida.

 De modo que podemos especificar


 La matriz de varianzas y covarianzas puede
rescribirse como

 En donde podemos definir


 Los remedios para este problema dependerán
de si la heterocedasticidad es conocida o
desconocida.

 En el primer caso, el método de estimación


preferido será el de mínimos cuadrados
generalizados

 En el segundo caso, se optará por los


Mínimos Cuadrados generalizados Factibles
Mínimos cuadrados generalizados
 Considerando el modelo lineal general con
heterocedasticidad

 Donde:

 Es un caso especial del modelo con


perturbaciones heterocedásticas. En este
marco, el estimador es lineal, insesgado,
consistente y eficiente.
Mínimos cuadrados ponderados
 Considerando los errores cuasi-tipificados

 Que cumplen con las hipótesis básicas:


 Media Cero

 Varianza Constante

 Covarianza Cero
 Si transformamos el modelo lineal
obtenemos:

 O bien
 Se puede considerar como un método de
estimación en dos etapas:

◦ Primer etapa: Se transforman las variables en


función del ponderador

◦ Segunda etapa: Se estiman los parámetros por


mínimos cuadrados ordinarios
MÍNIMOS CUADRADOS PONDERADOS
EN STATA
 Para desarrollar este método en STATA es
necesario descargar el comando wls0, por
medio de findit

 findit wls0

 Es necesario conocer la variable que está


impactando la estructura de la varianza y por
lo tanto es posible emplearla como un
ponderador.
 Al aplicar el comando wls0 para calcular los
mínimos cuadrados ordinarios vamos a
emplear la variable meals como ponderador y
su ajuste elevado al cuadrado con la opción
type(xb2)

 wls0 api00 meals ell emer, wvar(meals)


type(xb2)

 estat hettest
ESTIMACIÓN POR MÁXIMA VEROSIMILITUD O
MÍNIMOS CUADRADOS PONDERADOS FACTIBLES
(FEASIBLE WLS)
 La aplicación de los MCP requiere que las
varianzas de los disturbios sean conocidas
para aplicarles un factor de escala.

 Sin embargo, si no somos capaces de


especificar ese tipo de modelo, entonces es
posible emplear un modelo más general con
varianza donde γ contiene p
parámetros desconocidos.
 El logaritmo de verosimilitud (en términos de
(k+p) parámetros desconocidos β y γ) esta
dado por:

 El estimador de Máxima Verosimilitud se


obtiene maximizando l(β, γ), y ese estimador
tiene todas las propiedades óptimas.
 Para los valores dados de γ, los óptimos
valores de β se obtienen por medio de los
MCOP, por medio de , tal que:
  
Como no conocemos las varianzas , será
necesario estimarlas utilizando los valores
ajustados obtenidos por medio de la
estimación de una regresión auxiliar

 Esto es
 Una forma de estimarlo es por medio de un
método en dos etapas.

 En la primera etapa los parámetros de la varianza


son estimados.

 En la segunda etapa se estiman los parámetros de


la regresión β, usando las estimaciones de las
varianzas obtenidas en el primer paso a este
método se le conoce como mínimos cuadrados
ponderados factibles (FWSL).
FWLS en STATA
 Para llevar a cabo este modelo se aplica el
comando glm, que se utiliza para aplicar los
MCG

 glm api00 meals ell emer

También podría gustarte