Está en la página 1de 29

Econometría

Naturaleza del análisis de regresión


• Tipo de datos:
• Serie de tiempo: Conjunto de observaciones sobre los valores de una
variable en diferentes momentos. Tal información debe recopilarse en
intervalos regulares. Problema: Suponen ser estacionarias.
• Cortes transversales: Datos de una o más variables recopilados en el
mismo punto del tiempo.
Introducción: modelo de regresión lineal.
• El modelo que usaremos tiene una variable dependiente, Y, y k regresores: k–1
variables independientes X2, X3, ...Xk y un vector de 1’s asociado al intercepto. La
función de regresión poblacional (FRP) se puede escribir de la siguiente manera:
Supuestos del modelo
1. El modelo es lineal en los parámetros (puede no ser lineal en las
variables).
2. Las observaciones fueron extraídas mediante una muestra
aleatoria.
3. La esperanza de ui es 0 (valores exógenos).

   
Cov ( x j , ui )  E xj E  x j u j / x j   E xj x j E u j / x j   0
Supuestos del modelo
4. Homocedasticidad y no
correlación:
a) Dado X, la varianza de u es
idéntica para todas las
observaciones
b) Ausencia de correlación entre las
perturbaciones, esto es, la
correlación entre ui y uj es igual
cero (los errores no muestran
patrones).
Supuestos del modelo
5. El número de observaciones, n, debe ser mayor que el número de parámetros
a estimar, k (n>k).
6. Variabilidad en X: No todos los valores de X en una muestra dada son idénticos
7. El modelo de regresión está correctamente especificado:
a) Las variables incluidas son las correctas. (Esto es, no faltan ni sobran).
b) La especificación funcional es la correcta (Esto es, se da la linealidad en los
parámetros, y/o en las variables).
8. No hay colinealidad perfecta entre los regresores: no hay relaciones
perfectamente lineales entre las variables explicativas (entre las columnas de
X). Esto implica que el rango de la matriz X es igual a k.
9. El vector u, condicional en X, sigue una distribución normal multivariada:
Resumen supuestos
Línea de regresión poblacional

“Lugar geométrico de las medias condicionales de la variable dependiente para


los valores fijos de la(s) variable(s) explicativa(s)”
Estimadores MCO
• Seleccionar una función de regresión poblacional (FRM) que minimice
los errores muestrales (residuos). Con ello se persigue llegar a una
regresión lo más cercana posible a la poblacional:
Estimadores MCO para k=2
• Minimización de la suma de errores cuadrados. (Ecuaciones Normales)
Propiedades FRM por MCO
• Pasa por las medias muestrales de Y y X.
Propiedad recta FRM por MCO
• Valor medio de Y estimado es igual al valor medio de Y real.
Propiedad recta FRM por MCO
Propiedad recta FRM por MCO
• Valor medio de los residuos igual a 0
Propiedad recta FRM por MCO
• Los residuos (ui) no están correlacionados con Xi.

• Los residuos (ui) no están correlacionados con el valor pronosticado (Yi).


Propiedades de los estimadores MCO.
• Lineales en Y
• Insesgados
• Varianza mínima dentro de los estimadores lineales insesgados
(Teorema de Gauss-Markov).
• Normalidad
Teorema de Gauss-Markov

• “Dados los supuestos del modelo lineal clásico, los estimadores de


mínimos cuadrados tienen mínima varianza, dentro de la clase de
estimadores lineales en Y e insesgados. Es decir, son los mejores
estimadores lineales insesgados (MELI).”
Coeficiente de Determinación
• Se encuentra entre cero y uno. Si es cero, no hay ajuste; si es 1, hay
ajuste perfecto. Si se encuentra entre cero y uno, se puede interpretar
como el porcentaje de la variabilidad en Y explicada por la regresión.
• Es independiente de unidad o escala de las variables.
Coeficiente de determinación
Precisión de los estimadores de MCO
• X (minúscula)=
desviación sobre la
media
• ee=se= error
estándar
• Var= varianza
Precisión de los estimadores de MCO
• Estimador de la verdadera (pero
desconocida) varianza, donde n-2
son los grados de libertad.
(gl= n-k, donde k= n° de estimadores)

• Error estándar de estimación.


Estimación por intervalos y P. de Hipótesis
• B1 y B2 bajo el supuesto de normalidad se distribuye t.

No se conoce  se remplaza por el estimador

 (1)

De forma análoga  (2)

Interpretación= En 95 de cada 100 casos, los intervalos de la ecuación (1) ((2)) contendrán al verdadero
valor de β2 (β1).
Estimación por intervalos y P. de Hipótesis
• Varianza bajo el supuesto de normalidad, sigue distribución chi-cuadrado

Interpretación :Si establecemos límites de confianza a 95% sobre σ2 y afirma a priori que
entre estos límites caerá el verdadero σ2, acertaremos, a la larga, 95% de las veces.
Prueba de Hipótesis

Similar con β1. Para un modelos con dos variables, los g.l. serian igual a (n-2).

β2=0, que significa el testear esto?


Prueba de Hipótesis.
Inferencia del modelo
• Busca determinar si las variables por separado entregan información
significativa, sin embargo no es concluyente
Inferencia del modelo
Inferencia sobre el modelo
• Prueba F: Comprobar que de forma conjunta, las variables explicativas
aportan información a la variable dependiente.
Inferencia del modelo (general)

También podría gustarte