Está en la página 1de 6

PRÁCTICA

Elaborado por: Salazar Salas, Laura Sophia

Y X1 X2 X3 X4
Ingreso
Ventas Anuales Número de Número de Antigüedad
personal (miles
(millones de tiendas de automóviles promedio de los
de millones de
dólares) descuento registrados (millones) automóviles
dólares)
37.702 1739 9.27 85.4 3.5
24.196 1221 5.86 60.7 5
32.055 1846 8.81 68.1 4.4
3.611 120 3.81 20.2 4
17.625 1096 10.31 33.8 3.5
45.919 2290 11.62 95.1 4.1
29.6 1687 8.96 69.3 4.1
8.114 241 6.28 16.3 5.9
20.116 649 7.77 34.9 5.5
12.994 1427 10.92 15.1 4.1

a)
Considere la siguiente matriz de correlación. ¿Qué variable individual tiene la correlación más fuerte con la va
dependiente? Las correlaciones entre las variables independientes, tiendas de descuento e ingreso, y entre au
tiendas de descuento, son muy fuertes. ¿Esto puede representar un problema? ¿Cómo se denomina esta cond

Ventas Tiendas de descuento Automóviles Ingreso


Tiendas de
0.899
descuento
Automóviles 0.605 0.775
Ingreso 0.964 0.825 0.409
Antigüedad -0.323 -0.489 -0.447 -0.349
Supervisores 0.286 0.183 0.395 0.155

Las ventas anuales están fuertemente relacionadas con el ingreso personal y las tiendas de descuento.
Sí representa un problema, pues hay probabilidad de multicolinealidad.

b) En la siguiente tabla se presenta el resultado de la ecuación de regresión de las cinco variables. ¿Qué porcenta
variación se explica mediante la ecuación de regresión?

La ecuación de regresión es:


Ventas=-19.7-0.00063 tiendas de descuento+1.74 automóviles+0.410 ingreso+2.04 antigüedad-0.034 sup

Resumen

Factor de predicción Coeficientes Desviación estándar Razón t p


Constante -19.672 5.422 -3.63 0.022
Número de tiendas -0.000629 0.002638 -0.24 0.823
Número de automóvi 1.74 0.553 3.15 0.035
Ingreso personal (m 0.41 0.04385 9.35 0.001
Antigüedad promed 2.036 0.8779 2.32 0.081
Número de supervi -0.034 0.188 -0.18 0.864
Análisis de la varianza
FUENTE GL SS MS F
Regresión 5 1593.80968416701 318.761936833 140.3573934218
Residuos 4 9.08429343298974 2.27107335825
Total 9 1602.8939776

Se explica de la siguiente manera:


1. Un aumento de las tiendas de descuento disminuye las ventas en un 0.063%.
2. Un aumento de los automóviles aumenta las ventas en un 174%.
3. Un aumento en el ingreso aumenta las ventas en un 41%.
4. Un aumento en la antigüedad aumenta las ventas en un 204%.
5. Un aumento de supervisores disminuye las ventas en 3.4%.

c) Realice una prueba global de hipótesis para determinar si alguno(s) de los coeficientes de regresión no son cer
nivel de significancia 0.05.

𝐻_0:𝛽_1=𝛽_2=𝛽_3=𝛽_4=𝛽_5=0
𝐻_1:𝑁𝑜 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑠𝑜𝑛 𝛽 𝑠𝑜𝑛 0
Como observamos el valor de p es 0.0001<0.05 por lo que rechazamos la hipótesis nula y concluimos que al m
los coeficientes de regresión no es 0.

d) Realice una prueba de hipótesis en cada una de las variables independientes. ¿Consideraría eliminar “tiendas
y “supervisores”? Utilice el nivel de significancia 0.05.

𝐻_0:𝛽_𝑖=0
𝐻_0:𝛽_𝑖≠0

Observando los valores de p de cada variable independientes podemos decir que el número de tienda, el núm
automóviles, la antigüedad y el número de supervisores no son predictores eficacices y se deberían quitar de l
regresión.

e) Se vuelve a correr la regresión, pero ahora sin “tiendas de descuento” y “supervisores”, como se muestra a c
Calcule el coeficiente de determinación. ¿Cuánto cambió R2 a partir del análisis anterior?

La ecuación de regresión es:


Ventas=-18.9+1.61 automóviles+0.400 ingreso+1.96 antigüedad

Factor de Predicción Coeficientes Desviación estandar Razón t P


Constante -18.924 3.636 -5.2 0.002
Número de automóvi 1.6129 0.1979 8.15 0
Ingreso personal (m 0.40031 0.01569 25.52 0
Antigüedad promed 1.9637 0.5846 3.36 0.015

Análisis de la varianza
FUENTE GL SS MS F
Regresión 3 1593.66205360772 531.220684536 345.2502544302
Residuos 6 9.23192399228252 1.53865399871
Total 9 1602.8939776
SIN TIENDAS DE DESCUENTO Y SUPERVISORES CON TODAS LAS VARIABLES
Estadísticas de la regresión Estadísticas de la regresión
Coeficiente de corr0.9971160739769 Coeficiente de co 0.997162257355
Coeficiente de det 0.9942404649832 Coeficiente de d 0.994332567494
R^2 ajustado 0.9913606974747 R^2 ajustado 0.987248276861
Error típico 1.2404249266738 Error típico 1.50700808168
Observaciones 10 Observaciones 10

El coeficiente de determinacion a variado en muy poco, lo cual es bueno, pues podemos trabajar con menos v
hace más fácil la interpretación.

f) A continuación se presenta un histograma y un diagrama de tallo y hojas de los residuos. ¿Parece razonable la
normalidad?

Histograma de los residuos N=10 Diagrama de tallo y hojas de residuos N=10


Unidad de hoja = 0.10
Punto medio Conteo
-1.5 1* 1 -1
-1 1* 2 -1
-0.5 2 ** 2 0
0 2 ** 5 0
0.5 2 ** 5 0
1 1* 3 0
1.5 1* 1 1
1 1
Sí, observamos que los valores presentan una aparente distribución normal.

g) La siguiente es una gráfica de los valores ajustados de Y (es decir Y), y de los residuos.
¿Observa alguna violación de las suposiciones?

Podemos observar posiciones aleatorias, por lo que podemos decir que las variables estan incorrelacionadas.
Al no haber patrones podemos decir que las varianzas son iguales.
Podemos decir que hay una aparente distribución normal.
X5
Número de
supervisores

9
5
7
5
7
13
15
11
16
10

ación más fuerte con la variable


ento e ingreso, y entre automóviles y
mo se denomina esta condición?

Antigüedad

0.291

das de descuento.

variables. ¿Qué porcentaje de la

2.04 antigüedad-0.034 supervisores


p
0.00013972852

es de regresión no son cero. Utilice el

ula y concluimos que al menos uno de

deraría eliminar “tiendas de descuento”

número de tienda, el número de


s y se deberían quitar de la ecuación de

es”, como se muestra a continuación.


rior?

ntigüedad

p
4.1703282E-07
mos trabajar con menos variables, lo que

uos. ¿Parece razonable la suposición de

as de residuos N=10

7
2

440
24
68

estan incorrelacionadas.

También podría gustarte