Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Y X1 X2 X3 X4
Ingreso
Ventas Anuales Número de Número de Antigüedad
personal (miles
(millones de tiendas de automóviles promedio de los
de millones de
dólares) descuento registrados (millones) automóviles
dólares)
37.702 1739 9.27 85.4 3.5
24.196 1221 5.86 60.7 5
32.055 1846 8.81 68.1 4.4
3.611 120 3.81 20.2 4
17.625 1096 10.31 33.8 3.5
45.919 2290 11.62 95.1 4.1
29.6 1687 8.96 69.3 4.1
8.114 241 6.28 16.3 5.9
20.116 649 7.77 34.9 5.5
12.994 1427 10.92 15.1 4.1
a)
Considere la siguiente matriz de correlación. ¿Qué variable individual tiene la correlación más fuerte con la va
dependiente? Las correlaciones entre las variables independientes, tiendas de descuento e ingreso, y entre au
tiendas de descuento, son muy fuertes. ¿Esto puede representar un problema? ¿Cómo se denomina esta cond
Las ventas anuales están fuertemente relacionadas con el ingreso personal y las tiendas de descuento.
Sí representa un problema, pues hay probabilidad de multicolinealidad.
b) En la siguiente tabla se presenta el resultado de la ecuación de regresión de las cinco variables. ¿Qué porcenta
variación se explica mediante la ecuación de regresión?
Resumen
c) Realice una prueba global de hipótesis para determinar si alguno(s) de los coeficientes de regresión no son cer
nivel de significancia 0.05.
𝐻_0:𝛽_1=𝛽_2=𝛽_3=𝛽_4=𝛽_5=0
𝐻_1:𝑁𝑜 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑠𝑜𝑛 𝛽 𝑠𝑜𝑛 0
Como observamos el valor de p es 0.0001<0.05 por lo que rechazamos la hipótesis nula y concluimos que al m
los coeficientes de regresión no es 0.
d) Realice una prueba de hipótesis en cada una de las variables independientes. ¿Consideraría eliminar “tiendas
y “supervisores”? Utilice el nivel de significancia 0.05.
𝐻_0:𝛽_𝑖=0
𝐻_0:𝛽_𝑖≠0
Observando los valores de p de cada variable independientes podemos decir que el número de tienda, el núm
automóviles, la antigüedad y el número de supervisores no son predictores eficacices y se deberían quitar de l
regresión.
e) Se vuelve a correr la regresión, pero ahora sin “tiendas de descuento” y “supervisores”, como se muestra a c
Calcule el coeficiente de determinación. ¿Cuánto cambió R2 a partir del análisis anterior?
Análisis de la varianza
FUENTE GL SS MS F
Regresión 3 1593.66205360772 531.220684536 345.2502544302
Residuos 6 9.23192399228252 1.53865399871
Total 9 1602.8939776
SIN TIENDAS DE DESCUENTO Y SUPERVISORES CON TODAS LAS VARIABLES
Estadísticas de la regresión Estadísticas de la regresión
Coeficiente de corr0.9971160739769 Coeficiente de co 0.997162257355
Coeficiente de det 0.9942404649832 Coeficiente de d 0.994332567494
R^2 ajustado 0.9913606974747 R^2 ajustado 0.987248276861
Error típico 1.2404249266738 Error típico 1.50700808168
Observaciones 10 Observaciones 10
El coeficiente de determinacion a variado en muy poco, lo cual es bueno, pues podemos trabajar con menos v
hace más fácil la interpretación.
f) A continuación se presenta un histograma y un diagrama de tallo y hojas de los residuos. ¿Parece razonable la
normalidad?
g) La siguiente es una gráfica de los valores ajustados de Y (es decir Y), y de los residuos.
¿Observa alguna violación de las suposiciones?
Podemos observar posiciones aleatorias, por lo que podemos decir que las variables estan incorrelacionadas.
Al no haber patrones podemos decir que las varianzas son iguales.
Podemos decir que hay una aparente distribución normal.
X5
Número de
supervisores
9
5
7
5
7
13
15
11
16
10
Antigüedad
0.291
das de descuento.
ntigüedad
p
4.1703282E-07
mos trabajar con menos variables, lo que
as de residuos N=10
7
2
440
24
68
estan incorrelacionadas.