Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresión
Regresión
REGRESIONES
ANTONIO ALBÁN
REGRESIONES
REGRESIONES
REGRESIONES
REGRESIONES
Ecuación matemática:
Número
aleatorio
Y 0 1 X 1 2 X 2 ... n X n
simple
Múltiple
REGRESIONES
Nota
• Variable dependiente: Nota
en la evaluación
• Variable independiente:
Horas de estudio.
Horas de Estudio
REGRESIONES
Horas de Nota 20
Estudio (X) (Y)
16
4 8
12
N ota
5 10
8
6 12
4
7 14
0
8 16 1 2 3 4 5 6 7 8 9 10
9 18 Horas de Estudio
10 20
Y = 2X
R2 = 1
Coeficiente de Determinación 0 <> 1
Más alto mejor es la capacidad predictiva de X sobre Y
REGRESIONES
Horas de Nota
Estudio (X) (Y)
4 7
5 8.5
6 10
7 11.5
8 13
9 14.5
10 16
11 17.5
12 19 Y = 1.5X + 1
R2 = 1
REGRESIONES
Horas de Estudio Nota
(X) (Y)
12 12
9 10
10 11
14 11
2 9
7 11
16 15
11 11
15 16
8 8
4 9
18 17
12 13
9
10
9
14
Y = 0.654X + 5.081
2 6
17 20
0 4 R2 = 0.8126
8 11
20 18
SUPUESTO DEL MODELO DE REGRESIÓN lINEAL
1. Linealidad R²
2. Independencia
3. Homocedasticidad Residuos
4. Normalidad
5. No- Colinealidad X₁ ̴ X₂
CASO: DISTRIBUIDOR DE AUTOS
• Variables independientes:
• Precio promedio (Miles $)
• Publicidad (Miles $).
REGRESIONES
1. Linealidad
ESPECIFICACIÓN DEL MODELO
• La variable dependiente es la
suma de un conjunto de
elementos:
Modelo de regresión múltiple poblacional:
• El origen de la recta.
Ventas = β0 + β1(Precio) + β2(Publicidad) + ε
• Una combinación lineal
de variables
independientes o
predictoras. Modelo de regresión múltiple muestral:
• Los residuos. Ventasj = b0 + b1(Precioj) + b2(Publicidadj) +
errorj
• El incumplimiento del supuesto
de linealidad = error de
especificación.
Pendientes (bi)
Estiman el cambio en el valor promedio de “y” como bi unidades por cada unidad de
incremento en “xi” manteniendo las otras variables constantes.
Ejemplo: Si b1 = -10, entonces se espera que las ventas promedio (y) se reduzcan en
10 autos por mes por cada $1000 en que se incremente el precio (x1), manteniendo
constante la variable publicidad (x2).
Intercepto (b0)
Estima el valor promedio de “y” cuando todas las variables “xi” son iguales a cero.
MATRIZ DE CORRELACIÓN
Ventas 1
Precio -0.44327 1
Publicidad 0.55632 0.03044 1
• Excel:
• Datos / Análisis de datos / Regresión
ESTIMACIÓN DE LA ECUACIÓN
ESTIMACIÓN DE LA ECUACIÓN
SSR 29460.0
R2 0.52148
SST 56493.3
n 1
R A2 1 (1 R 2 )
n k 1
R 2A 0.44172
• Estadístico de prueba:
SSR
k MSR
F
SSE MSE
n k 1
Donde: Los grados de libertad de F son:
glnumerador = k
gldenominador = (n – k – 1)
DIAGNOSTICO DEL MODELO: PRUEBA F
(SIGNIFICANCIA GENERAL)
MSR 14730.0
F 6.5386
MSE 2252.8
Con 2 y 12 grados de libertad Valor P para
Valor P parala
la prueba
prueba
DIAGNOSTICO DEL MODELO: PRUEBA F
(SIGNIFICANCIA GENERAL)
0 No rechazar H0 Rechazar H0 F
Estadístico de prueba:
b(igl
= n0
– k – 1)
t
sbi
¿LAS VARIABLES INDIVIDUALES SON
SIGNIFICATIVAS?
H0: βi = 0; HA: βi 0
a/2=0.025 a/2=0.025
g.l. = 15-2-1 = 12
a = 0.05
t/2 = 2.1788 Rechazar H0 No rechazar H0 Rechazar H0
-tα/2 0 tα/2
-2.1788 2.1788
2.1788
Excel (Resultado):
Coeficientes Error típico Estadístico t Valor p
Precio -24.97509 10.83213 -2.30565 0.03979
Publicidad 74.13096 25.96732 2.85478 0.01449
Decisión: Para cada variable se rechaza H0
Conclusión: Hay evidencia suficiente para concluir que cada variable in-
dividual (Precio y Publicidad) afecta a la venta de autos, dada
la presencia de la otra para =0.05
INTERVALO DE CONFIANZA PARA
LAS PENDIENTES
SSE
s MSE
n k 1
2. Independencia (Residuos)
INDEPENDENCIA (RESIDUOS)
Los residuos son INDEPENDIENTES entre sí, es decir, los residuos constituyen
una variable aleatoria.
El estadístico Durbin-Watson oscila entre 0 y 4, y toma el valor 2 cuando los
residuos son independientes.
Los valores menores que 2 indican autocorrelación positiva y los mayores que 2
autocorrelación negativa.
Podemos asumir independencia entre los residuos cuando DW toma valores
entre 1,5 y 2,5.
INDEPENDENCIA (RESIDUOS)
REGRESIONES
3. Homocedasticidad (Residuos)
HOMOCEDASTICIDAD (RESIDUOS)
Residuos
Ventas Estimadas
REGRESIONES
4. Normalidad (Residuos)
NORMALIDAD (RESIDUOS)
5. Multicolinealidad
MULTICOLINEALIDAD
1
VIFj
1 R 2j
R2j es el coeficiente de determinación de la regresión de la j ma
variable independiente contra las restantes k – 1 variables
independientes