Está en la página 1de 7

UNIVERSIDAD NACIONAL DE INGENIERÍA

FACULTAD DE INGENIERÍA ECONÓ MICA ESTADÍSTICA Y


CIENCIAS SOCIALES

MÉTODOS ECONOMÉTRICOS I

CONTRASTE DE HETEROGENEIDAD

UNAAPLICACIÓNPARAELCONSUMOYPRODUCCIÓNDEAZÚCAR

Profesor
José Plutarco Saavedra Pacheco

Alumna
Crisóstomo Casasola, Angie 20132228C

2018-II

1
1. Introducción

El supuesto de homoscedasticidad es fundamental para los modelos de


regresión lineal. La homocedasticidad describe una situación en la que el
término de error (es decir, el "ruido" o la perturbación aleatoria en la relación
entre las variables independientes y la variable dependiente) es el mismo en
todos los valores de las variables independientes. La heterocedasticidad está
presente cuando el tamaño del término de error difiere entre los valores de
una variable independiente. El impacto de violar el supuesto de
homoscedasticidad es una cuestión de grado, que aumenta a medida que
aumenta la heterocedasticidad.

Un simple ejemplo bivariado puede ayudar a ilustrar la


heterocedasticidad: imagina que tenemos datos sobre el ingreso familiar y el
gasto en artículos de lujo. Usando la regresión bivariado, usamos el ingreso
familiar para predecir el gasto de lujo. Como se esperaba, existe una
asociación fuerte y positiva entre ingresos y gastos. Al examinar los residuos,
detectamos un problema: los residuos son muy pequeños para valores bajos
de ingresos familiares (casi todas las familias con ingresos bajos no gastan
mucho en artículos de lujo), mientras que existe una gran variación en el
tamaño de los residuos para las familias más ricas (Algunas familias gastan
mucho en artículos de lujo mientras que otras son más moderadas en sus
gastos de lujo). Esta situación representa heterocedasticidad porque el
tamaño del error varía según los valores de la variable independiente.

El problema que presenta la heterocedasticidad para los modelos de


regresión es simple. Recuerde que la regresión de mínimos cuadrados
ordinarios (MCO) busca minimizar los residuos y, a su vez, producir los
errores estándar más pequeños posibles. Por definición, la regresión OLS
otorga igual peso a todas las observaciones, pero cuando existe
heterocedasticidad, los casos con perturbaciones más grandes tienen más
"tirón" que otras observaciones. En este caso, la regresión de mínimos
cuadrados ponderada sería más apropiada, ya que reduce las observaciones
con perturbaciones mayores.

Un problema más serio asociado con la heterocedasticidad es el hecho de


que los errores estándar están sesgados. Debido a que el error estándar es
fundamental para realizar pruebas de significancia y calcular intervalos
de confianza, los errores estándar sesgados conducen a conclusiones
incorrectas sobre la importancia de los coeficientes de regresión. Muchos
programas estadísticos ofrecen una opción de errores estándar robustos para
corregir este sesgo. La regresión ponderada de mínimos cuadrados también
aborda esta preocupación, pero requiere una serie de supuestos adicionales.
Otro enfoque para tratar la heterocedasticidad es transformar la variable
dependiente utilizando una de las transformaciones estabilizadoras de
varianza. Una transformación logarítmica se puede aplicar a variables
altamente sesgadas, mientras que las variables de conteo se pueden
transformar usando una transformación de raíz cuadrada.

2
2. Heterocedasticidad
Definición
El modelo básico de regresión lineal exige, como hipótesis básica, que la varianza de
las perturbaciones aleatorias, condicional a los valores de los regresoras X, sea
constante:

Var (𝜖𝑖 /𝜒𝑖 ) = 𝜎 2

Consecuencias

 Los estimadores MCO siguen siendo insesgados y consistentes.

 Bajo heterocedasticidad, los errores estándar de los estimadores están


sesgados.

 Problema: en presencia de heterocedasticidad los estadísticos habituales


empleados en las pruebas de hipótesis bajo los supuestos de Gauss-Markov ya
no son válidos.

 Como Var (𝜖𝑖 /𝜒𝑖 ) ya no es constante, el estimador MCO ya no es MELI y el


estimador MCO ya no es asintóticamente eficiente, es decir ya no poseen
mínima varianza.

 En presencia de heterocedasticidad es posible hallar estimadores que sean


más eficientes que el estimador MCO, aunque es necesario conocer la forma
de la heterocedasticidad.

3
3. Tipos de Heterocedasticidad
Consideramos los modelos más usados

Modelo Aditivo de la Varianza

Son modelos en los que la varianza de las perturbaciones aumenta o disminuye de forma
proporcional a alguna otra variable o conjunto de variables.
Generalmente se distinguen dos casos:
 En función de la variable dependiente.
 En función de variables exógenas.

Modelo aditivo de la varianza en función de la variable


dependiente

La varianza aumenta al aumentar los valores de Y, o en general de una función de Y.

𝜎𝑡2

𝜎𝑡2 = 𝜎 2 + 𝛼𝑌𝑡
Con 𝛼 > 0

Modelo aditivo de la varianza en función de variables exógenas


La varianza es combinación lineal de unas variables exógenas, que pueden ser alguna o todas
las independientes, o alguna otra variable ajena al modelo.

𝜎𝑡2

𝜎𝑡2 = 𝛼𝑍𝑡
Con 𝛼 > 0

𝑍𝑡
4
4. Contrastes Generales de Heterocedasticidad

Test de Breusch – Pagan - Godfrey

Características

La prueba de Breusch – Pagan sólo verifica la forma lineal de heterocedasticidad, es decir


modela la varianza del error como variables independientes.
Comprueba que la hipótesis nula que las variaciones del error son todas iguales en
comparación con la alternativa de que las variaciones de error son una función de
multiplicativa de una o más variables; un gran Chi cuadrado indicaría que habría
heterocedasticidad.

Metodología

Para ilustrar esta prueba, asumiremos que existe una relación entre la
varianza del error 𝜎 2 y 𝑋𝑖 que puede ser lineal, como para el caso:

𝜎 2 = 𝛿0 + 𝛿1 𝑋1 + ∙ ∙ ∙ +𝛿𝑘 𝑋𝑘 + 𝑣

1. Hipótesis: 𝐻0 ∶ 𝛿0 = 𝛿1 = ∙ ∙ ∙ = 𝛿𝑘 = 0.

Es decir 𝜎 2 es una función lineal de las variables 𝑋𝑖 , Si la hipótesis


nula es cierta entonces 𝜎 2 = 𝑣 ,que es una constante. Si
queremos demostrar la homocedasticidad o la constante de la
varianza de los errores, al hacer estos iguales a cero, esta será
constante.

2. Nivel de significancia: 𝛼 = .05

3. Estimamos el (𝑒̂ 𝑖 ) 2̂ del siguiente modelo por MCO:

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑒𝑖

Donde se sabe que: 𝛽̂ = (𝑋 𝑡 𝑋)−1 𝑋 𝑡 𝑌

4. Ahora definiremos un modelo auxiliar de la siguiente manera

𝑒̂𝑖 2 = 𝛼0 + 𝛼1 𝑋1 + ⋯ + 𝛼𝑘 𝑋𝑘 + 𝜃𝑖

5. De este modelo auxiliar calculamos su coeficiente de


determinación 𝑅 2 .

6. Estadístico de Prueba:

5
2
𝐿𝑀 = 𝑛𝑅 2 ∽ 𝒳𝑑𝑓

Donde df: es el número de variables regresoras, en nuestro caso


son las k variables originales del modelo.
2
7. Regla de Decisión: Si el 𝐿𝑀 > 𝒳𝑑𝑓 entonces se rechaza la hipótesis
nula con un nivel de significancia del .05, caso contrario se acepta
la hipótesis nula.

Test de White
Características

Los test anteriores se ven afectados, bien por la forma funcional, bien por la falta de
normalidad, el test de White sin embargo, no necesita conocer la forma funcional de la
heterocedasticidad, y lo que hace es optar por una aproximación de orden 2 a cualquier forma
funcional.
En ese sentido mejora al test de Breusch – Pagan pues la aproximación es mejor, al tener un
orden superior, para ello considera como variables exógenas de la varianza el conjunto todas
las variables exógenas además de sus productos cruzados.

Para calcular este test existen dos versiones alternativas que son asintóticamente
equivalentes

 La primera versión es un test aproximado, partiendo de la relación lineal entre la


varianza y las variables independientes de la ecuación de varianzas.
 La segunda es una versión del test LM para una forma funcional aditiva de las
variables. Este se conoce como test de Koenker.

En los dos casos la idea básica es hacer una estimación de las varianzas a partir de los residuos
estandarizados, bajo 𝐻0 , mientras que bajo 𝐻1 las varianzas se estiman como funciones de los
productos cruzados de las variables exógenas.

Metodología

1. Hipótesis: 𝐻0 ∶ 𝜎𝑖2 = 𝜎𝑗2 = ∙ ∙ ∙ = 𝜎𝑘2 = 𝜎 2 (Homocedasticidad)

2. Se estima por MCO el modelo original, y se calculan los residuos


MCO al cuadrado como estimadores de la varianza

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + 𝑒𝑖

Donde se sabe que: 𝛽̂ = (𝑋 𝑡 𝑋)−1 𝑋 𝑡 𝑌

3. Ahora definiremos un modelo auxiliar de la siguiente manera

𝑒̂𝑖 2 = 𝛼0 + 𝛼1 𝑋1 + 𝛼2 𝑋2 + 𝛼3 𝑋12 + 𝛼4 𝑋22 + 𝛼5 𝑋1 ∗ 𝑋2 + 𝜃𝑖


6
4. De este modelo auxiliar calculamos su coeficiente de
determinación 𝑅 2 .

5. Estadístico de Prueba:
2
𝐿𝑀 = 𝑛𝑅 2 ∽ 𝒳𝑑𝑓

Donde df: es el número de variables regresoras, en nuestro caso


son las k variables originales del modelo.

Regla de Decisión: Si el 𝐿𝑀 > 𝒳𝑑𝑓


2
entonces se rechaza la hipótesis nula con un nivel de
significancia del .05, caso contrario se acepta la hipótesis nula.

Conclusiones

Hasta ahora se han visto los test genéricos, pero cuando se sospecha cual es la forma funcional
concreta de la heterocedasticidad se puede considerar esa como hipótesis alternativa.
De esta forma el test va a ser más potente si se especifica la función en la hipótesis alternativa

También podría gustarte