Está en la página 1de 16

Estadística aplicada a la Economía

Tema 1. Modelos e regresión Lineal Simple

Semana 4. Supuestos y fundamentos del método MCO

Fernando Gonzales Fernández


Fundamentos de la estimación MCO

En esta presentación se realizaran algunos supuestos o


fundamentos sobre las variables X y u. Ya que ambas
son determinantes para hallar Y

Y  1   2 X  u

Si no se plantean estos supuestos sobre ambas


variables, no podrá realizarse ningún tipo de inferencia
sobre Y, y lo que es peor sobre los parámetros:

1 y  2
Supuestos Gaussianos

1. El modelo de regresión es lineal en los parámetros


2. Los valores de X son fijos o independientes de la
perturbación
3. El valor medio de ui es igual a cero. E  u / X   0 i i

4. Homocedasticidad o igual varianza de ui .


5. No autocorrelación entre las µ
6. El número de observaciones debe ser mayor que el
de parámetros
7. Variabilidad en los valores de X.

Estos supuestos a primera vista pueden provocar mareos, pero en realidad son bastante
intuitivos.
1. EL modelo de regresión el lineal en los parámetros

Yi  1   2 X i  ui

Yi     X i  ui
1 1
1 2

Yi  1   2 X i  ui
2 5

e x2
Y i
1/ 2
 1   2 X i  ui
1  2 ui
Yi  A X i vi
Los parámetros beta, en los cinco casos tienen coeficiente 1, por lo tanto, se trata de
modelos de regresión lineales en los parámetros, es decir, se cumple el supuesto 1.
¿Porqué el quinto caso es considerado lineal?
1. EL modelo de regresión el lineal en los parámetros

Yi  1   2 X i  ui

Yi     X i  ui
1 1
1 2

Yi  1   2 X i  ui
2 5

e x2
Y i
1/ 2
 1   2 X i  ui
1  2 ui
Yi  A X i vi
El incumplimiento a este supuesto genera modelos no lineales, que no pueden estimarse
mediante MCO, ante ellos surgen métodos de estimación no lineales.
2. Los valores de X son independientes de la perturbación estocástica

Los valores que toma la variable X son NO


estocásticos, es decir no dependen del azar

Yi  1   2 X i  ui
Determinística
No aleatoria Aleatoria

Si X fuera aleatoria, entonces Y dependería de


dos variables aleatorias. Y la Estimación MCO
seria sesgada.
Es decir, la covarianza entre el regresor X y la
perturbación estocástica es 0 cov  , X  0  i j 
El incumplimiento a este supuesto provoca un problema denominado endogeneidad
3. El valor medio de la perturbación es igual a “0”

• Los factores que no están incluidos en el modelo, no


afectan sistemáticamente el valor esperado de Y.
• Los valores positivos de u se cancelan con los valores
negativos, de tal manera que su efecto promedio sobre
Y es cero.
E  ui / X i   0
E  ui   0

El incumplimiento a este supuesto provoca un problema denominado sesgo de


especificación
4. Homocedasticidad.

Independientemente de lo que ocurra con X, la varianza de la


perturbación estocástica es constante
V i    2  E i  E i X i 
2

• y dado el supuesto 3 es equivalente a


E i2    2

vari / X i    2

El incumplimiento a este supuesto provoca un problema denominado heterocedasticidad


Homocedasticidad.

Homocedasticidad (el supuesto) implica igual varianza, no importa en que valor de X me


encuentre, la dispersión será la misma para Y
Heterocedasticidad

Heterocedasticidad es la diferente variabilidad de una variable observada respecto a otra,


por ejemplo el efecto que tienen los ingresos (X) sobre el consumo de un bien (Y) tiene
mucha variabilidad, ya que famlias pudientes tienen en promedio una mayor variabilidad
que familias que están en la línea de pobreza
5. No autocorrelación covi ,  j   0

- No existe tendencia de que los errores asociados a una


observación estén relacionados a los errores de otra
observación (no autocorrelación espacial).
- Si en un momento de tiempo o en un individuo de la
muestra se genera un error positivo, esto no nos da
información alguna sobre si el próximo error será
positivo o negativo.
- Los errores no tienen un patrón de comportamiento
sistemático.
- Si µt y µt-1 están correlacionados, Yt no sólo depende
de Xt, sino también de µt-1

La Autocorrelación es un problema característico de las series de tiempo, aunque también


existe en alguno casos de datos de corte transversal, denominándose Autocorrelación
espacial
No existe autocorrelación

Una manera de observar la no existencia de este problema es analizando la relación entre


las perturbaciones contemporáneas (del presente) vs las perturbaciones rezagadas (con un
lag o rezago de 1 o más periodos). Si esta relación no existe, entonces no se presenta
autocorrelación
Existe autocorrelación

En el gráfico de la izquierda se nota una relación positiva entre ambas variables, y en el


gráfico de la derecha una relación inversa o negativa. En los dos casos existe
autocorrelación, (ya sea positiva o negativa)
6. El número de observaciones (n) debe ser mayor que el número de
parámetros a estimar (k)

• Es decir, para hacer una regresión se debe contar con una buena
muestra
• Un tamaño de muestra grande dependerá del tamaño de la
población y de la variabilidad. Pero mucho depende del
investigador.
• Tener pocos datos provoca regresiones con muchos sesgos.

Antes de realizar una regresión deben observarse detenidamente los datos.


7. Naturaleza de las variables X

• El modelo de MCO requiere que exista una dispersión


entre las X para poder calcular los valores de los
coeficientes, pues si no, éstos serían una cantidad
infinita. (no iguales todos)

Si todos los valores de X son


idénticos, entonces Xi  X

Por lo cual x2


i 0

Y entonces, ˆ2  x y i i

x 2
i

Una variable varía. Una constante es fija, no varía. Entonces la variable X debe de ser
variable antes de hacer una regresión.

También podría gustarte