Documentos de Académico
Documentos de Profesional
Documentos de Cultura
y = β0 + β1x1 + u
Regresión Lineal Simple
• En esta sesión vamos a extender el modelo básico para poder utilizar K variables
explicativas. Es decir, Y ahora depende de k variables más el termino de error:
Función de regresión
poblacional 𝑌 = 𝛽0 + 𝛽1 𝑋1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑢
Función de regresión
muestral
1 𝑋1𝑖 + 𝛽
𝑌𝑖 = 𝛽0 + 𝛽 2 𝑋2𝑖 + ⋯ + 𝛽
𝑘 𝑋𝑘𝑖 + 𝑢ෝ𝑖
Estimación de la Función
de regresión muestral
1 𝑋1𝑖 + 𝛽
𝑌𝑖 = 𝛽0 + 𝛽 2 𝑋2𝑖 + ⋯ + 𝛽
𝑘 𝑋𝑘𝑖
y Observación
yi muestral ŷ = b0 + b1x1 + b2 x 2
<
yi
𝑢𝑖 = (𝑌𝑖 − 𝑌𝑖 )
x2i
x2
x1i La ecuación de mejor ajuste,
<
y, será la que genere la
menor suma de errores
x1
ESTIMACIÓN DEL MODELO DE REGRESIÓN
MÚLTIPLE
• Como podemos inferir del gráfico anterior, podemos generalizar criterios para el
caso de más de una variable explicativa volviendo a plantearnos una pregunta
conocida: ¿Cuál será la ecuación que se ajuste mejor en el espacio dimensional
respectivo al conjunto de datos observados?
• Nuevamente la suma minima de los errores al cuadrado es la mejor opción analítica.
Venta de
Precio Publicidad
Semana pies de
manzana
(S/.) (S/.100) Función de Regresión Muestral del modelo:
1 350 5.50 3.3
2 460 7.50 3.3
Ventas = 𝛽መ 0 + 𝛽መ 1 (Precio) + 𝛽መ 2 (Publicidad)
3 350 8.00 3.0
4 430 8.00 4.5
5 350 6.80 3.0
6 380 7.50 4.0
7 430 4.50 3.0
8 470 6.40 3.7
9 450 7.00 3.5
10 490 5.00 4.0
11 340 7.20 3.5
12 300 7.90 3.2
13 440 5.90 4.0
14 450 5.00 3.5
15 300 7.00 2.7
REGRESIÓN MÚLTIPLE: RESULTADO
Ecuación estimada de regresión múltiple:
SSR 29460.0
R =
2
= = 0.52148
SST 56493.3
INTERPETACIÓN: El 52.1% de la
variación en las ventas es explicada
por la va-riación en los precios y la
publi-cidad
R2 AJUSTADO
n −1
R = 1 − (1 − R )
2 2
n − k − 1
A
R 2A = 0.44172
INTERPRETACIÓN: El 44.2% de la variación
en las ventas es explicada por la variación
en los precios y la publicidad, tomando en
cuenta el número de variables
independientes
DIAGNÓSTICO DEL MODELO: PRUEBA
F (SIGNIFICANCIA GENERAL)
SSR
k MSR
F= =
SSE MSE
n − k −1
Donde: Los grados de libertad de F son:
glnumerador = k
gldenominador = (n – k – 1)
DIAGNÓSTICO DEL MODELO: PRUEBA F
(SIGNIFICANCIA GENERAL)
MSR 14730.0
F= = = 6.5386
MSE 2252.8
Con 2 y 12 grados de Observe que el valor P asociado para
libertad la prueba es menor que 0.05 (5%)
DIAGNÓSTICO DEL MODELO: PRUEBA F
(SIGNIFICANCIA GENERAL)
H0: β1 = β2 = 0; HA: β1 o β2 es diferente de cero
= 0.05 Valor crítico:
glnumerador= 2 F0.05 = 3.885
gldenominador = 12
= 0.05
0 No rechazar H0 Rechazar H0 F
Estadístico de prueba:
bi − 0 (gl = n – k – 1)
t=
sbi k = número de variables independientes (regresores)
DIAGNÓSTICO DEL MODELO:
¿LAS VARIABLES INDIVIDUALES SON
SIGNIFICATIVAS?
H0: βi = 0; HA: βi 0
/2=0.025 /2=0.025
g.l. = 15-2-1 = 12
= 0.05
t/2 = 2.1788 Rechazar H0 No rechazar H0 Rechazar H0
-tα/2 tα/2
0
-2.1788 2.1788
Eviews Resultado:
Coeficientes Error típico Estadístico t Valor p
Note que ambos valores p
Precio -24.97509 10.83213 -2.30565 0.03979
asociados al estadístico son
Publicidad 74.13096 25.96732 2.85478 0.01449
menores al valor de (0.05)
Decisión: Para cada variable se rechaza H0
Conclusión: Hay evidencia suficiente para concluir que cada variable individual (Precio y
Publicidad) afecta a la venta de pies (tienen relación lineal), para un nivel de significancia =0.05
INTERVALOS DE CONFIANZA
PARA LAS PENDIENTES
El intervalo de confianza para la pendiente poblacional β1 (efecto
sobre las ventas de pie respecto a cambios en el precio):
i t / 2 sb i
Donde t tiene
(n – k – 1) g.l.