Está en la página 1de 4

Instituto de Estudios Superiores Administrativos

Catedra de Estadística para Gerentes


Profesor Jose Felipe Prat

Caso 2 GoodBelly
Regresiones múltiples

Lermic Aguilar
CI: V-12.420.212
Para el análisis del caso GoodBelly se ha procedido a trabajar con las herramientas
mediante el modelo de regresión. Estos modelos estudian la relación entre una
variable dependiente y un conjunto de variables independientes o explicativas. La
función de regresión nos dirá cual es la relación funcional de la variable
dependiente con las variables independientes que nos permitirá tener idea general
el comportamiento de la variable dependiente en función de las independientes.
Para ello nos vamos a apoyar de datos obtenidos de :
i) Coeficiente de correlación múltiple
ii) Coeficiente de determinación, el cual aumenta cuando se incluyen
variables independientes en el modelo, y se incrementa hasta cuando
son poco significativas o tienen poca correlación con la variable
dependiente.
iii) El R cuadrado que indica que tan buena es la correlación entre los
grupos de variables
iv) El residuo de la varianza, que es la diferencia entre la variable y la
variable estimada por el modelo aplicado.

Para el análisis se tomaron en cuenta las siguientes variables.


 Unidades vendidas
 Si participo o no un cabezal en la tienda ;
 Si hubo una demostración en la tienda en las últimas 3 semanas (Demo
1-3);
 Representantes de ventas por tienda.
 precio promedio de venta en las tiendas (AverageRetail Price)
 Demostraciones entre las últimas 4 a 5 semanas (Demo 4-5);
 La cercanía de tiendas naturistas o deportivas en 5 millas de las tiendas

El análisis de los datos se comenzó por analizar la correlación mediante la


regresión lineal y regresión múltiple.
a. Existe un coeficiente de correlación múltiple de 82%, el R cuadrado
de 67%, igual que el R cuadrado ajustado, Por su parte el error
estándar es de 63,69; esto indica que la mayoría de los datos se alejan
63 veces de la media.
b. Del análisis de los gráficos residuales, se observa lo siguiente: Para
las variables numéricas existe una cierta dispersión de los datos, por
tanto se observa que los datos muestran heteroscedasticidad.
c. A continuación, pasaremos a estudiar los coeficientes de cada
variable por separado, y determinar cuales tienen la mayor
relevancia:

 Las variables Demo 1-3 y Demo 4-5 pertenecen a la variable


Demo, por lo que la representan información redundante al
modelo.
 En general el resto de los coeficientes son considerablemente
buenos, tienen un valor relativamente alto, lo cual indica que
en principio aportan información relevante al modelo.
 Los intervalos de confianza del modelo se encuentra
comprendido el valor 0 entre y el P-valor de todas es menor de
0,05, lo que explica como tienen alta correlación con la variable
dependiente.
 La variable del precio promedio nos determina que tiene poca
correlación con la variable dependiente, la cual presenta signo
negativo y en consecuencia os indica que a medida que ella
disminuye aumentan las ventas.

Luego de realizar las corridas respectivas de regresiones consideramos que el


mejor modelo es el que incluye únicamente las variables Demo 1-3, Sales Rep y
Endcap; descartamos la variable AverageRetail Price, ya que tiene el P-valor mas
alto entre todas, así como el coeficiente mas bajo, por lo que se puede concluir que
es la variable menos relevante.
Recomendaciones :
1. La presencia de cabezales en las tiendas, representantes de ventas y
demostraciones, son las mas importantes para aumentar las ventas
constantemente
2. Recomendamos realizar estudios desincorporando las variables que no
estuvieron en un nivel de correlación para lograr objeticos de ventas.
3. Realizar un estudio con un lapso mayor de tiempo con las variables,
independientes como es, más cabezales por tiendas y aprovechar el mejor
precio cuando existen vendedores con contacto directo con los clientes

Atentamente,

Lermic Aguilar
Consultor

También podría gustarte