Está en la página 1de 32

Entrenamiento Stata 14

Violacin de los supuestos de regresin

Prueba de los Supuestos de M.C.O


1.

Supuesto de linealidad

2.

Supuesto del valor esperado del error

3.

Supuesto de Homocedasticidad

4.

Supuesto de no Autocorrelacin

5.

Supuesto del comportamiento del error

6.

Supuesto de ortogonalidad

7.

Otros problemas
1.

Multicolinealidad

2.

Forma funcional

3.

Omisin de variables importantes

4.

Variables redundantes

5.

Estabilidad de los parmetros

Propiedades de los Coeficientes de M.C.O


Teorema de Gauss Markov:
Lineal: funcin lineal de una variable aleatoria, como la variable dependiente Y en el modelo de regresin.
Insesgamiento: su valor promedio o esperado, es igual al valor verdadero .
Eficiencia: tiene varianza mnima dentro de la clase de todos los estimadores lineales insesgados.
Consistencia: los parmetros estimados por el modelo de M.C.O son consistentes, es decir:

Donde Pr representa la probabilidad y gamma un nmero pequeo seleccionado arbitrariamente y que presenta la
diferencia (distancia) entre el parmetro y el coeficiente estimado. Conforme el tamao de muestra aumente y tiene a
infinito, la probabilidad que el estimador de MCO sea diferente del verdadero valor poblacional. Esta propiedad es una
propiedad asinttica de los estimadores del modelo de M.C.O.

Violacin de los supuestos de regresin


Supuesto 1: el modelo de mnimos cuadrados ordinarios, asume que la relacin entre dos o ms
variables puede ser adecuadamente modelada a travs de una funcin lineal.
Supuesto 2: el valor esperado de los errores es igual a cero:
Supuesto 3: la varianza de los errores es constante (Homocedstico) y, la autocorrelacin entre
errores no contemporneos es cero (no autocorrelacin).

Violacin de los supuestos de regresin


Supuesto 4: la varianza de los errores se distribuye como una normal con
media igual a cero y desviacin estndar a .
Supuesto 5: la covarianza de los errores con las variables independientes es
cero. Es decir, que los errores y las variables exgenas son ortogonales.
Supuesto 6: el numero de observaciones debe ser mayor que el nmero de
parmetros a estimar.
Supuesto 7: debe existir variabilidad en los valores de x, variable
independiente. Tcnicamente la varianza de x debe ser un numero finito
positivo.

Violacin de los supuestos de regresin


Supuesto 8: el modelo de regresin debe ser correctamente especificado, esto
indica que no existe ningn error en el modelo a estimar. La especificacin
incorrecta o la omisin

de una o ms variables importantes, har muy

cuestionable la validez del modelo.


Supuesto 9: No hay relaciones perfectamente lineales entre las variables. No
existe multicolinealidad perfecta.

Violacin de los supuestos de regresin


Supuesto 1: el modelo de MCO asume que la relacin entre la variable dependientes y las variables
independientes puede ser adecuadamente descrita por una ecuacin lineal.
Se recuerda que se pueden tener relaciones no lineales entre las variables que pueden ser
convertida en ecuaciones lineales.
Para estudiar si los datos se ajustan a un modelo lineal se emplea la prueba de anlisis de varianza
que se basa en la prueba F de Fisher. Las hiptesis que se desean probar son las siguientes:

Recordar que el estadstico de prueba es:


prueba es una F(K-1,n-k)

,y el valor critico asociado con esta

Violacin de los supuestos de regresin


Supuesto 2: el segundo supuesto se refiere a que la suma de los errores debe
ser cero. Siempre que se incluya el intercepto, este supuesto siempre ser
satisfecho. Por lo tanto se recomienda incluir el intercepto al momento de
estimar el modelo de M.C.O y despus hacer la prueba de hiptesis
correspondiente para ver si este parmetro estimado es efectivamente
estadsticamente no significativo, es decir, si se puede asumir que es igual a
cero.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Este supuesto asume que la varianza de los errores es
constante y finita. La varianza de cada trmino de perturbacin Ui, condicional a los valores
seleccionados de las variables independientes, es algn nmero constante igual a . De esta
manera, el supuesto de homocedasticidad hace referencia a: igual(homo) dispersin
(cedasticidad). Este supuesto asume que la varianza de los errores es constante y finita.
La Homocedasticiad en un modelo univariado, se puede apreciar mediante un grfico de
dispersin entre la variable exgena (x) y el error estimado.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Razones para que el Trmino de Error no sea Constante
1. Modelos de Aprendizaje de los errores.
2. Comportamiento Aleatorio de los Agentes Econmicos. Consumo diferente,
preferencias diferentes, ingresos diferentes.
3. Mejoramiento de las tcnicas de recopilacin de la informacin.
4. Presencia de datos atpicos. Un dato atpico es una observacin que proviene de
una poblacin distinta a la que genera las dems observaciones de la muestra.
5. Violacin del supuesto de buena especificacin del modelo (omisin de variables
relevantes).
6. Asimetra en la distribucin de una o ms regresoras incluidas en el modelo.
7. Incorrecta transformacin de los datos y una forma funcional incorrecta

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cmo detectar?
a) Naturaleza del Problema
En la informacin de corte transversal que comprende unidades heterogneas, la heteroscedasticidad
puede ser la regla y no la excepcin. Por ejemplo, establecer relaciones entre Ventas y Gasto Publicitario,
Salarios en funcin de los aos de escolaridad, Consumo e Ingreso
b) Mtodo Grfico
Se utiliza cuando no hay informacin a priori o emprica sobre la naturaleza de la heteroscedasticidad. En
la prctica se puede llevar a cabo un anlisis de regresin y luego hacer un examen de los residuos
elevados al cuadrado, para ver si exhiben un patrn sistemtico.
La idea es averiguar si el valor medio estimado de Y esta relacionado sistemticamente con el residuos al
cuadrado.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cmo detectar?
*Prueba formal: Prueba de White
Se trata de observar su los errores estimados siguen algn patrn predeterminado de acuerdo
a los cambios de las variables explicativas, las variables explicativas al cuadrado y a los
productos cruzados de las variables explicativas.
La hiptesis a probar ser la siguiente:

Se puede emplear el F test que seguir una distribucin el LM test que seguir una . El estadstico de prueba la el LM
test, se basa en el de la regresin auxiliar. Su las variables explicativas de esta regresin son significativos el ser alto.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cules son las consecuencias?
La presencia de heterocedasticidad no tiene ningn efecto en los coeficientes
estimados, lo que continuarn siendo insesgados. Sin embargo ya no sern eficientes,
es decir, que no tendrn la mnima varianza entre todos los estimadores insesgados.
Cmo se corrige?
1. Transformar los datos utilizando logaritmos.(Cuidado con valores negativos)
2. Utilizar el mtodo de White, quien derivo la matriz de varianzas y covarianzas
consistente con la presencia de heterocedasticidad.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cmo detectar?
La Heteroscedasticidad no destruye las propiedades de insesgamiento y consistencia de los
estimadores de M.C.O; sin embargo, stos ya no son eficientes, ni siquiera asintticamente.
a. Cuando se conoce : mtodo de los mnimos cuadrados ponderados

b.

Cuando no se conoce hay alguna manera de obtener estimaciones consistentes de las


varianzas y covarianzas de los estimadores de MCO aunque se presente Heterocedasticidad?

Varianzas y errores estndar consistentes con heterocedasticidad de White


Estimacin que puede realizarse de forma que las inferencias estadsticas sean asintticamente vlidas sobre
los verdaderos valores de los parmetros.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cmo corregir?
Errores estndar robustos de White

El procedimiento se puede generalizar al modelo de k variables :

La varianza de todo coeficiente de regresin parcial, por ejemplo se obtiene as:


Donde son los residuos al cuadrado obtenidos de la regresin, y son los residuos al cuadrado proporcionados por la regresin
auxiliar de la regresora sobre las regresoras restantes.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cmo corregir?
Supuestos Razonables sobre el patrn de Heterocedasticidad
Los estimadores obtenidos por el ajuste de varianzas y covarianzas de White pueden no ser tan eficientes
como los obtenidos por mtodos que transforman la informacin. El procedimiento eficiente, MCG, pondera
cada residual cuadrado con el inverso de la varianza condicional de los errores dado la variable.
Supuesto 1: La varianza del error es proporcional a
Supuesto 2: La varianza del error es proporcional a
Supuesto 3: La varianza del error es proporcional al cuadrado del valor medio de Y
Supuesto 4: Comprimir las escalas de medida en las variables. Modelo LOG-LOG

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cmo corregir?
Supuestos Razonables sobre el patrn de Heterocedasticidad
MCG Factibles
En la mayora de los casos, la forma exacta de la heterocedasticidad no es obvia. Es decir, es difcil encontrar la funcin del
comportamiento de la varianza del error. Sin embargo, en muchos casos puede modelarse la funcin y utilizar los datos para
estimar los parmetros desconocidos del modelo.
Hay muchas maneras de modelar la heterocedasticidad:

Procedimientos
1. Realizar la regresin por M.C.O. La variable dependiente en funcin de las independientes y obtener los residuos.
2. Obtener el logaritmo de los residuos al cuadrado.
3. Realizar la regresin del logaritmo natural de los residuos en funcin de las variables independientes.
4. Sacar el antilogaritmo a los valores ajustados
5. Estimar la ecuacin ponderando el residual al cuadrado con 1/

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad. Cmo corregir?
Supuestos Razonables sobre el patrn de Heterocedasticidad
Tener que estimar hi con los mismos datos significa que el estimador de MCGF deja de ser
insesgado. Sin embargo, el estimador de MCGF es consistente y asintticamente ms eficiente
que M.C.O, por lo tanto, tienen estadsticos de prueba con las distribuciones t y F, para muestras
grandes. Si se tiene alguna duda sobre el comportamiento de la varianza especificada en las
ecuaciones, puede utilizarse errores estndar robustos a la heterocedasticidad.
En casos de una fuerte heterocedasticidad, suele ser mejor usar una forma incorrecta de
Heterocedasticidad y emplear MCP que ignorar por completo la heterocedasticidad y usar M.C.O.
Segn Fox (1997), una heterocedasticidad fuerte es cuando la varianza del error ms grande sea
mayor que 10 veces la ms pequea.

Violacin de los supuestos de regresin


Supuesto 3: Homocedasticidad-Conclusiones
Existen dos maneras de actuar en presencia de Heterocedasticidad: estimar los parmetros mediante MCP
o estimarlos mediante M.C.O y utilizar los errores estndar heterocedstico-robustos.
La ventaja de MCP consiste en que son mas eficientes que el estimador de M.C.O, al menos asintticamente. La
desventaja esta en conocer la funcin de la varianza condicional. Si la forma funcional es incorrecta, entonces los
errores estndar calculados mediante rutinas de regresin MCP no son validos, incluso para una muestra grande. No
obstante, se podra aplicar errores robustos con el propsito de estimar un modelo donde la funcin de la varianza
este arbitrariamente mal especificada.
La ventaja de utilizar errores robustos es que dan lugar a inferencias asintticamente vlidas incluso si no se
conoce la forma de la funcin de la varianza condicional. La desventaja es que el estimador de MCO tendr
una mayor varianza que el estimador de MCP, al menos asintticamente.
Conclusin final: Siempre ser buena idea calcular errores estndar y estadsticos de prueba completamente
robustos de la estimacin de MCP.

Violacin de los supuestos de regresin


Supuesto 3: No autocorrelacin. Este supuesto establece que los errores de la
regresin no deben ser serialmente correlacionados, es decir, que los errores
en el periodo i, no deben depender de los errores de cualquier otro periodo j.

Violacin de los supuestos de regresin


Supuesto 3: No autocorrelacin. Qu causa la autocorrelacin de los errores?
La existencia de un patrn estacional.
El uso de una forma funcional incorrecta.
Omisin de variables relevantes.
Cmo se detecta?
El test de Durbin Watson permite determinar la presencia de autocorrelacion de primer
orden, es decir:
La hiptesis son las siguientes:

Violacin de los supuestos de regresin


Supuesto 3: No autocorrelacin. Cmo se detecta?
El test de Breusch-Godfrey sigue la siguiente forma:
La hiptesis son las siguientes:

El test se distribuye como una distribucin chi-cuadrada con m grados de libertad, m es el


nmero de rezagos utilizados en la ecuacin.

Violacin de los supuestos de regresin


Supuesto 3: No autocorrelacin Cules son las consecuencias?
La presencia de autocorrelacin no afecta la propiedad de insesgamiento de los coeficientes. Sin embargo
los parmetros no sern eficientes, esto significa que las inferencias sern incorrectas. En la presencia de
autocorrelacin positiva, los errores estndar sern sesgados hacia abajo, lo que significa que los test
estadsticos sean grandes, lo que a su vez incrementar la probabilidad de rechazar la hiptesis nula siendo
verdadera. Tambin, como la varianza de los errores es menor, el ser mayor.
Como se corrige?
1. Primeras diferencias.
2. Mtodo de Newey-West.
3. Mtodo de Cochrane-Orcutt

Violacin de los supuestos de regresin


Supuesto 3: No autocorrelacin
1. Mtodo de Cochrane-Orcutt
1. Este mtodo se basa en el supuesto que la forma de la autocorrelacin es
conocida o que se puede determinar analizando los datos.
2. Procedimiento
1.

Estimar el modelo.

2.

Determinar la autocorrelacin usando un test.

3.

Si se presenta autocorrelacin se debe evaluar la regresin de los errores en funcin de


su pasado y obtener el valor de p.

4.

Con ese valor p estimar la nueva regresin.

Violacin de los supuestos de regresin


Supuesto 4: Normalidad de los errores. Cmo se detecta?
El test de normalidad de Jarque Bera, tiene las siguientes hiptesis:

El test es dado por:

Violacin de los supuestos de regresin


Supuesto 4: Normalidad de los errores Cules son las causas?
Presencia de estacionalidad en los datos
Presencia de valores extremos
Cmo se corrige?
1.

Hacer caso omiso si se cuenta con una muestra bastante amplia.


(Teorema del limite central)

2.

Incluir variables dicotmicas temporales inclusin de valores extremos.

Violacin de los supuestos de regresin


Otros problemas del modelo de M.C.O: Multicolinealidad
Se presenta cuando hay una alta correlacin entre las variables explicativas
del modelo.
Cmo detectar?
1. Se

observarn

bastantes

altos

acompaados

de

parmetros

estadsticamente no significativos.
2. Evaluar el factor inflador de varianza, a partir de regresiones auxiliares de
la variable independiente en funcin de las independientes.

Violacin de los supuestos de regresin


Otros problemas del modelo de M.C.O: Multicolinealidad Cmo se corrige?
1.

No hacer nada, si la variable que se sospecha tiene multicolinealidad es


significativa, se puede incurrir en un error de especificacin al omitirla.

2.

Expresar el modelo en primeras diferencias.

3.

Eliminar la variables si no es significativa.

Violacin de los supuestos de regresin


Otros problemas del modelo de M.C.O: Forma funcional
Otro posible problema, es que la forma funcional de la regresin (lineal) no sea la
adecuada para capturar la relacin entre la variables dependiente y las independientes.
Cmo se detecta?
Test de Ramsey, esta destinado a probar los errores de especificacin del modelo, los
que se pueden deber a:
Variables omitidas
Formas funcionales incorrectas
Presencia de correlacin entre los errores y las variables independientes.

Violacin de los supuestos de regresin


Otros problemas del modelo de M.C.O: Forma funcional Cmo se detecta?
Test de Ramsey:
La hiptesis de este test son:

El estadstico est dado por:

Violacin de los supuestos de regresin


Otros problemas del modelo de M.C.O: Estabilidad de los parmetros estimados
Se asume que los parmetros estimados son estables en el tiempo. Es decir, que si reestiman los
parmetros despus de cierto tiempo, estos sern los mismos estadsticamente.
La prueba se basa en dividir la muestra en dos y analizar los cambios en los valores de los
coeficientes; esta divisin de muestras est dada por el conocimiento de algn evento importante
que puede haber causado la inestabilidad de los coeficientes. La prueba ms comn es el test de
estabilidad de Chow
La hiptesis es la siguiente:

Miguel Angel Bello


Economista, MBA, CRM.
miguel.bello@software-shop.com