Documentos de Académico
Documentos de Profesional
Documentos de Cultura
APLICADA III
AUTOCORRELACIÓN
x1, x2 , … xk.
La respuesta debe ser una variable continua pero las variables explicativas
pueden ser continuas, discretas o categóricas aunque se deja el manejo de
variables explicativas categóricas para otro curso.
REGRESIÓN LINEAL MÚLTIPLE
Donde:
x1, x2 , … xk , son variables independientes, fijadas y medidas sin error.
β0 , β1 , β2 , . . . βk son parámetros desconocidos. A β0 se le conoce con el
nombre de intercepto, y a los β1 , β2 , . . . βk se les llaman coeficientes de
regresión poblacional.
“ε” es una variable aleatoria no correlacionada y no observable tal que:
𝑦 = 𝑏0 + 𝑏1 𝑥1 + 𝑏2 𝑥2 + 𝑏3 𝑥3 + ⋯ + 𝑏𝑘 𝑥𝑘 + 𝑒
Donde:
A b0 se le conoce con el nombre de intercepto muestral, y a los b1,b2, b3 , ... bk
se les llaman coeficientes de regresión muestral y e es el término del error o
perturbación aleatoria.
TEOREMA
Las estimaciones de mínimos cuadrados de los coeficientes de regresión
múltiple están dadas por:
Además:
𝑏0
𝑏1
𝐵=
⋮
𝑏𝑘
EJERCICIO 1
Sustituyendo
y n=8 en la matriz XTX, se obtiene:
Al sustituir
en XTX, se obtiene:
y por último, reemplazando en:
B = (XTX)-1XTY
Esta ecuación nos permite predecir el precio de venta de una casa de tres
habitaciones (x1) con dos baño (x2).
Es decir una casa con 3 habitaciones y dos baños tienen un precio de 79 100
dólares aproximadamente.
EJERCICIO 2
Los siguientes datos constan del nivel de ventas que obtuvo la empresa “MACHI
SAC” durante cuatro meses del presente año; los gastos de publicidad por
televisión; y los gastos por publicidad en periódicos (todo en miles de dólares):
Los datos siguientes se refieren a las utilidades semanales (en miles de soles)
de 5 restaurantes, sus aforos (en decenas) y el tránsito diario en promedio (en
miles de automóviles) que pasan por sus ubicaciones:
TRANSITO UTILIDAD NETA
AFORO
DIARIO SEMANAL
2 1 3
3 2 4
1 1 2
4 3 5
4 2 2
Donde:
SCR = suma de cuadrados de regresión
SCT = suma de cuadrados total
Donde:
ESTIMACION DE POR MAXIMA VEROSIMILITUD
Además se cumple que:
;
Hallar al coeficiente de determinación y la desviación estándar del ejemplo 1
50907080000 − 50906394166
𝜎= = 292.8
8
PRUEBAS DE HIPÓTESIS
Estas pruebas acerca de parámetros se realizan para medir la adecuación del
modelo. Tal como se vio anteriormente, una prueba de hipótesis requiere que
los términos del error ei del modelo de regresión tengan una distribución normal
e independiente con media cero y variancia 2.
H0 : b1 = b2 = . . . = bk = 0
Ha : Al memos una de las bj es diferente de cero
Rechazar H0 implica que al menos una de las variables independientes
contribuye de manera significativa al modelo.
El estadístico para probar esta hipótesis es el “ F” definido por:
¿CÓMO DETECTARLO?
Los programas “se quejarán” de que no podemos invertir matriz (X’X)
En Eviews aparece el mensaje “near singular matrix”
¿CÓMO CORREGIRLO?
Se deben a errores del investigador al introducir las explicativas.
Al aparecer mensaje de error, corregiremos las explicativas
¿QUÉ PROBLEMAS GENERA EN LA ESTIMACIÓN?
Cuanta mayor relación lineal entre X y el resto mayor varianza de los betas.
Estimación imprecisa e intervalos de confianza muy grandes
SOLUCIONES A LA MULTICOLINEALIDAD
Añadir información extra-muestral
Usar estimadores alternativos a MCO
Eliminar la variable no significativa
1.- INTRODUCCIÓN
Matricialmente
Uno de los supuestos del modelo es X → matriz de rango completo
Esto significa:
• Dos o más columnas de la matriz X informativa son linealmente
independientes.
• No existe relación lineal exacta entre dos o más variables explicativas
(variables ortogonales entre si).
• Las variables explicativas no están altamente correlacionadas.
Cuando existe una relación lineal exacta entre dos o más variables
explicativas del modelo, es decir , como consecuencia
y no existe.
EJEMPLO
Si en el modelo
Se puede expresar:
Donde k es el número de
variables explicativas
t-Student’s
F-estadística
𝑥 2 ji-cuadrada
• El rechazo de normalidad en los errores afecta el valor de los estadísticos de
las pruebas de hipótesis como el t-Student y F. Los valores de los estadísticos
son sensibles a la distribución normal.
Hipótesis alternativa
NO se distribuye
como una normal
ZONA DE
RECHAZO DE H0
5.991
Tercer momento de la distribución: Sesgo o Simetría
Si rho es diferente de cero se puede plantear el caso de que 𝜌 < 0, también 𝜌 >
0. En este contexto Durbin y Watson plantean un estadístico cuya distribución
tenga una hipótesis alternativa con dos alternativas
Durbin y Watson proponen un estadístico cuya distribución
permita manejar dos límites: uno superior y otro inferior
Valores admisibles
para DW
EJEMPLO
Contrastar la existencia de autocorrelación de primer orden
en el modelo: