Está en la página 1de 7

Asignatura Datos del alumno Fecha

Inteligencia de Negocio Apellidos:


Aplicada a la Empresa Nombre:

Actividad: Visualizando los resultados del


modelado de datos

Objetivos

Con esta actividad vas a conseguir aprender a visualizar resultados, así como a elegir
cuál es la representación adecuada dependiendo de la conclusión que quiera
obtenerse.

Descripción de la actividad y pautas de elaboración

Usando una fuente de datos aportada por el profesor, se pretende que el


estudiante muestre su destreza para visualizar resultados obtenidos tras el proceso
de modelado de datos.

Free Burn S.A. es una empresa dedicada a la fabricación de productos derivados de


la planta del tabaco. Dentro de sus líneas de negocio destaca la fabricación de
tabaco de calentar, más saludable que los cigarrillos tradicionales con combustión.

Gina Heets, CEO de la organización, está pensando en implementar una campaña de


promoción de la categoría tabaco de calentar, dentro del marco normativo actual.
Para ello, como aún la categoría de tabaco de calentar es muy novedosa y no
© Universidad Internacional de La Rioja (UNIR)
existen datos al respecto, va a analizar el comportamiento del mercado de
cigarrillos. Ella está convencida de que hay zonas en las que las ventas de cigarrillos
observadas no se corresponden con el consumo normal atendiendo a su población
adulta y renta. Para ello, usando datos de 48 provincias en el período 2002-2016

Inteligencia de Negocio Aplicada a la Empresa 1


Tema 3. Actividades
Asignatura Datos del alumno Fecha
Inteligencia de Negocio Apellidos:
Aplicada a la Empresa Nombre:

publicados por el Instituto Nacional de Estadística y el Comisionado para el Mercado


de Tabacos, y con la ayuda de Matlab, un software con gran capacidad de
computación, plantea 720 modelos de regresión (uno por cada provincia y año):

cigarrillos=β 0 + β 1 PIB+ β2 POB 18+¿¿

Gina tiene un Excel con los resultados, pero la realidad es que no puede obtener
ninguna conclusión porque se encuentra con multitud de datos que es incapaz de
resumir. Concretamente, cuenta con una tabla cuyas columnas representan:

Estimación Límite Límite Venta Tasa de ventas R2 del


puntual (1) inferior (2) superior (3) rara (4) raras (5) modelo (6)

(1)Es la estimación puntual que hace el modelo sobre las ventas que deberían
haberse observado en base al PIB y a la población mayor de edad con la que
cuenta cada provincia en cada año.
(2)Es el límite inferior del intervalo de predicción que hace el modelo sobre las
ventas que deberían haberse observado en base al PIB y a la población mayor de
edad con la que cuenta cada provincia en cada año.
(3)Es el límite superior del intervalo de predicción que hace el modelo sobre las
ventas que deberían haberse observado en base al PIB y a la población mayor de
edad con la que cuenta cada provincia en cada año.
(4)Es una variable que puede tomar tres valores:
a. 0 en caso de que la venta observada esté incluida en el intervalo de predicción
estimado. Es decir, en caso de que las ventas de la provincia sean razonables
© Universidad Internacional de La Rioja (UNIR)
atendiendo a su PIB y población adulta.
b. 1 en caso de que la venta observada esté por encima del límite superior del
intervalo de predicción estimado. Es decir, en caso de que las ventas de la
provincia sean superiores a lo que marca su PIB y población adulta.

Inteligencia de Negocio Aplicada a la Empresa 2


Tema 3. Actividades
Asignatura Datos del alumno Fecha
Inteligencia de Negocio Apellidos:
Aplicada a la Empresa Nombre:

c. -1 en caso de que la venta observada esté por debajo del límite inferior del
intervalo de predicción estimado. Es decir, en caso de que las ventas de la
provincia sean inferiores a lo que marca su PIB y población adulta.
(5)Es la tasa de desviación, en porcentaje, de las ventas observadas en caso de que
hayan sido superiores o inferiores a lo razonable (lo que marca la columna 4). Es
decir, si la tasa es del 30 % y en la columna 4 la provincia está marcada con -1,
eso supone que en esa provincia y año se venden un 30 % menos de cigarrillos
de lo razonable.
(6)Mide la bondad del ajuste realizado, cuanto más cercano al 100 %, más fiable es
el modelo planteado.

Haciendo uso de la hoja resultados_ventas_raras.xls (estará disponible a través del


aula virtual), Gina le pide que le resuma la información mediante el uso de técnicas
de visualización:

 Represente un gráfico que permita analizar la evolución temporal del R2 de los


modelos planteados. ¿Son fiables las conclusiones de los primeros años
estudiados?
100% 100% 100%
99%
100% 98%
97%
96%
95%
96%
92%
92% 90%

88%

84%

80%

76%
73%
© Universidad Internacional de La Rioja 72%
(UNIR)
71%
72% 70%

68%

64%
60%
60%
2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016

Inteligencia de Negocio Aplicada a la Empresa 3


Tema 3. Actividades
Asignatura Datos del alumno Fecha
Inteligencia de Negocio Apellidos:
Aplicada a la Empresa Nombre:

Teniendo en cuenta que entre más cercano este al 100% este tendrá más fiabilidad,
entonces podemos concluir que la fiabilidad de los primero años (2002-2006) es
muy baja, a comparación del año 2007 en adelante.

 Represente un gráfico que permita analizar la relación entre la estimación


puntual y el R2. ¿Existe algún patrón de comportamiento destacable?
100%

95%

90%

85%

80%
R2

75%

70%

65%

60%
500 600 700 800 900 1000 1100 1200 1300 1400 1500 1600 1700 1800 1900
ESTIMACION PUNTUAL

si, lo podemos ver en el año 2006 al 2007, notando que aumento la fiabilidad de un
73% a 90% y esta aumenta cada vez acercándose al 100% de fiabilidad al momento
de vender el producto, teniendo en cuenta que cada año la estimación puntual
aumenta 100 unidades.

 Gina piensa que en las tasas de ventas raras de los años 2014, 2015 y 2016 hay
demasiados puntos raros u outliers que distorsionan las conclusiones. Ayúdese
© Universidad Internacional
de de La Rioja
una (UNIR)
representación gráfica y aporte conclusiones acerca de los puntos raros
observados.

Inteligencia de Negocio Aplicada a la Empresa 4


Tema 3. Actividades
Asignatura Datos del alumno Fecha
Inteligencia de Negocio Apellidos:
Aplicada a la Empresa Nombre:

Chart Title

0.07 0.07 0.07 0.08 0.08 0.08 0.08 0.08 0.09 0.09 0.09

 A simple vista, Gina piensa que Girona es la que más peso tiene en el mercado de
cigarrillos, es decir la mayor en tamaño relativo. Utilice las estimaciones
puntuales de 2016 y represente un gráfico que permita comprobar si se cumple
lo que plantea Gina.

17%
32%

13%

38%

Según
© Universidad Internacional las estimaciones
de La Rioja (UNIR) puntuales nos damos cuenta que en el mercado de
cigarrilo la que tiene mayor tamaño relativo es Manizales con un 38% en el año
2016, mientras que Girona tiene un 32%.

Inteligencia de Negocio Aplicada a la Empresa 5


Tema 3. Actividades
Asignatura Datos del alumno Fecha
Inteligencia de Negocio Apellidos:
Aplicada a la Empresa Nombre:

 Gina piensa que las tasas de ventas raras que se muestran en la columna (5) son
un gran indicador para detectar tendencias en las provincias. Por ello, le pide que
realice un gráfico de barras con las tasas de ventas raras del año 2016,
representando en rojas las barras cuyas ventas sean menores a lo estimado y en
verde aquellas barras en las que ocurra lo contrario. No represente en el gráfico
las provincias en las que las ventas son razonables, es decir, cuya columna (4)
toma valor 0. Discuta los resultados obtenidos.

90%

30%

7% 8%
Girona Manizalez Armenia Ibagué

Según esta grafica la provincia donde más hay tendencia es en Manizales ya que
nos muestra que en el años 2016 la venta fue superior en un 7% a las ventas
razonables, a lo contrario con Girona, armenia e Ibagué donde hubo un 30%,90%
y 8% de ventas menor a la venta razonable.

Rúbrica

© Universidad Internacional de La Rioja (UNIR)


Visualizando
Puntuación
los resultados Peso
Descripción máxima
del modelado %
(puntos)
de datos
Criterio 1 Sabe detectar que el gráfico de línea 2 20 %
es el más adecuado para analizar la
evolución temporal (o aporta otra

Inteligencia de Negocio Aplicada a la Empresa 6


Tema 3. Actividades
Asignatura Datos del alumno Fecha
Inteligencia de Negocio Apellidos:
Aplicada a la Empresa Nombre:

solución que sea razonable).


Responde a la pregunta de forma
concreta
Sabe detectar que el gráfico de
dispersión es el más adecuado para
analizar relaciones (o aporta otra
Criterio 2 2 20 %
solución que sea razonable).
Responde a la pregunta de forma
concreta
Sabe detectar que el gráfico de caja
es el más adecuado para detectar
Criterio 3 outliers (o aporta otra solución que 2 20 %
sea razonable). Aporta conclusiones
concretas
Sabe detectar que el gráfico circular
es el más adecuado para tamaños
Criterio 4 relativos (o aporta otra solución que 2 20 %
sea razonable). Responde a la
pregunta de forma concreta
Representa el gráfico de forma clara y
Criterio 5 discute los resultados con 2 20 %
argumentos claros
10 100 %

© Universidad Internacional de La Rioja (UNIR)

Inteligencia de Negocio Aplicada a la Empresa 7


Tema 3. Actividades

También podría gustarte