Está en la página 1de 10

Stage 3

Predictive and prescriptive análisis

Equipo 26
Cinthya Nadenne Cruz Johansen, A00812885
Chantal Villa Arámburo, A01113468
Christian Roberto Huerta García, A00751260
Daniel López Parra, A00967601

Business Intelligence
José Alberto Chávez Luna, PhD.
Arturo González López, MSc.
1. Justification of the use of análisis techniques
Para poder analizar más de cerca el problema presentado, existe una serie de técnicas para
un análisis con mucha más presión, sobre todo cuando se trata de factores numéricos como
en este caso, donde se presentan problemas en los pagos a los vendedores.
La técnica elegida es la que mejor se adecua al problema planteado:
Modelo predictivo con estacionalidad
Puede parecer complejo pues de base se tienen algunas formulas, el objetivo principal de
este tipo de técnicas, es el de obtener estimaciones o pronósticos de valores futuros a partir
de una serie temporal y en base de la información histórica. Al no requerir una
especificación de los factores que determinan el comportamiento de la variable puede ser
una de las mejores opciones, además únicamente se basa en la modelización del
comportamiento sistemático de la serie considerada.
Minería de datos para series temporales. El análisis de datos en las series
temporales, se observan en diferentes instantes de tiempo, y de lugar, destacando el
problema mediante características únicas en el área de los modelos estadísticos. Una serie
de tiempo se considera continua cuando el análisis este hecho de forma continua en el
tiempo. Si las observaciones que dan lugar al análisis se presentan en momentos específicos
es considerada una serie temporal discreta.
El objetivo que destaca el análisis de series temporales es el de obtener datos mediante el
tiempo, que permita realizar predicciones futuras. Se va a lograr estableciendo modelos
probabilísticos hipotéticos que representen a los datos. Posteriormente, se lleva a cabo el
proceso de ajuste, que va desde la estimación hasta la predicción, y finalmente determinar
el resultado mediante un modelo totalmente cierto.

2. Analysis of the information


Mediante un ejemplo que ayuda a entender mejor el tema, se demuestra el análisis de lo que
conlleva utilizar la minería de datos para series temporales.
Ejemplo:
Pronostique el número de visitantes que entrarán en España el próximo año aplicando el
método de predicción no causal adecuado a la variable Viajes del archivo Turivia.sav.
(Universidad de Barcelona, s.f.)
Dado que la serie presenta componente estacional, para poder aplicar el método de alisado
de Winters, en primer lugar, es preciso definir la variable fecha con la secuencia Datos >
Definir fecha.
Con la secuencia Analizar > Series > Suavizado exponencial se accede al cuadro de diálogo
Suavizado exponencial donde se selecciona la variable Viajes y se indica el modelo de
predicción: Winters.
Para determinar las constantes de alisado que minimizan la suma de errores de estimación
al cuadrado es preciso activar el botón Parámetros. Con la opción Búsqueda en rejilla
se puede especificar un intervalo de valores para cada una de las constantes de alisado,
Alfa, Gama y Delta, entre los cuales el sistema determinará aquellos que optimicen la
predicción.
En este caso se mantienen los valores de las constantes de alisado que el sistema
proporciona por defecto.
Se eligen como valores iniciales del alisado los que el sistema proporciona
automáticamente.
Para generar los pronósticos del número de visitantes en el próximo año hay que activar el
botón Guardar y seleccionar la opción Pronosticar hasta e indicar en Año: 2000 y en Mes:
12.
Los resultados que se obtiene son:
Los coeficientes estacionales que el método Winters utiliza para inicializar el alisado son los que se obtienen
aplicando el método de descomposición estacional establecido por defecto en el sistema.

En el editor de datos se han creado 14 nuevos períodos, que van desde noviembre de 1999 a
diciembre de 2000, que recogen los pronósticos de la variable Viajes. Por ejemplo, para los
meses de noviembre y diciembre de 1999, enero, febrero, marzo y abril de 2000 el sistema
pronostica que el número de visitantes será 4.493.515, 4.751.482, 4.171.475, 4.274.225,
5.441.096 y 6.553.431, respectivamente.
(Universidad de Barcelona, s.f.)

3. Interpretation of information
Con los datos obtenidos para la propuesta del DashBoard son los que se pueden utilizar
para una estimación utilizando un modelo predictivo, en este caso eligiendo la minería de
datos para series temporales.
1. Extracción de datos de la herramienta analítica o fuente de datos que consideremos
oportuna. En este caso queremos una estimación mensual, por tanto, sacaremos las
ventas mensuales.
Etiquetas de fila Suma de
Ingresos
ene 8010000
feb 10226000
mar 2045000
abr 14126000
may 20886000
jun 16548000
jul 400000
ago 200000
Total, general 72441000

2. Calcular los índices mensuales para cada año. A través de la media anual de las
ventas, calculando un índice por mes y año. Esto ayudará a equilibrar el impacto de
la estacionalidad de la problemática analizada.

meses Año
2020 2021 2022
enero $ 10,005,000.00 $ 8,010,000.00
febrero $ 15,000,000.00 $ 10,226,000.00
marzo $ 5,000,000.00 $ 2,045,000.00
abril $ 7,576,643.00 $ 14,126,000.00
mayo $ 5,753,000.00 $ 20,886,000.00
junio $ 29,865,986.00 $ 16,548,000.00
julio $ 8,986,134.00 $ 400,000.00
agosto $ 3,874,000.00 $ 200,000.00
Total,
anual $ 86,060,763.00 $ 72,441,000.00

Total, anual $ 86,060,763.00 $ 72,441,000.00


Media anual $ 10,757,595.38 $ 9,055,125.00

Índices
2020 22021 2022 Promedio de los índices

1.13 0.88 0.41 0.81

1.70 1.13 0.37 1.06

0.23 0.23 0.14 0.20

0.86 1.56 1.39 1.27

0.65 2.31 2.43 1.80


3.38 1.83 0.22 1.81

0.05 0.04 0.03 0.04

0.02 0.02 0.02 0.02

3. Hallar un valor ajustado para cada mes en función del promedio de los índices
anteriormente calculados.

meses Año
2020 2021 2022
ene $ 10,005,000.00 $ 8,010,000.00 $ 6,015,000.00
feb $ 15,000,000.00 $ 10,226,000.00 $ 5,452,000.00
mar $ 2,000,000.00 $ 2,045,000.00 $ 2,090,000.00
abr $ 7,576,643.00 $ 14,126,000.00 $ 20,675,357.00
may $ 5,753,000.00 $ 20,886,000.00 $ 36,019,000.00
jun $ 29,865,986.00 $ 16,548,000.00 $ 3,230,014.00
jul $ 400,000.00 $ 400,000.00 $ 400,000.00
ago $ 150,000.00 $ 200,000.00 $ 250,000.00
Total, anual $ 70,750,629.00 $ 72,441,000.00 $ 74,131,371.00
Media anual $ 8,843,828.63 $ 9,055,125.00 $ 14,826,476.40

Promedio de los índices

Enero 0.81

Febrero 1.06

Marzo 0.20

Abril 1.27

Mayo 1.80

Junio 1.81

Julio 0.04

Agosto 0.02
Ventas totales Índice del índice Valor ajustado

Enero $ 10,005,000.00 0.81 $ 12,394,838.71

Febrero $ 15,000,000.00 1.06 $ 14,092,782.88

Marzo $ 2,000,000.00 0.20 $ 10,118,907.33

Abril $ 7,576,643.00 1.27 $ 5,963,974.80

Mayo $ 5,753,000.00 1.80 $ 3,204,169.34

Junio $ 29,865,986.00 1.81 $ 16,523,761.85

Julio $ 400,000.00 0.04 $ 10,310,879.66

Agosto $ 150,000.00 0.02 $ 8,048,700.46

Enero $ 8,010,000.00 0.81 $ 9,923,304.16

Febrero $ 10,226,000.00 1.06 $ 9,607,519.85

Marzo $ 2,045,000.00 0.20 $ 10,346,582.74

Abril $ 14,126,000.00 1.27 $ 11,119,318.68

Mayo $ 20,886,000.00 1.80 $ 11,632,588.35

Junio $ 16,548,000.00 1.81 $ 9,155,405.46

Julio $ 400,000.00 0.04 $ 10,310,879.66

Agosto $ 200,000.00 0.02 $ 10,731,600.61

Enero $ 6,015,000.00 0.81 $ 7,451,769.60

Febrero $ 5,452,000.00 1.06 $ 5,122,256.82

Marzo $ 2,090,000.00 0.20 $ 10,574,258.16

Abril $ 20,675,357.00 1.27 $ 16,274,662.56

Mayo $ 36,019,000.00 1.80 $ 20,061,007.37

Junio $ 3,230,014.00 1.81 $ 1,787,049.06

Julio $ 400,000.00 0.04 $ 10,310,879.66


Agosto $ 250,000.00 0.02 $ 13,414,500.76

4. Obtener ecuación de la línea de tendencia


Finalmente, podemos comprobar el error medio de los datos estimados (dato estimado /
dato real 1).

$40,000,000.00 y = 38156x + 1E+07


$35,000,000.00
$30,000,000.00
$25,000,000.00
$20,000,000.00
$15,000,000.00
$10,000,000.00
$5,000,000.00
$-
Abril

Abril

Abril
Enero

Marzo

Mayo
Junio
Julio

Enero

Marzo

Mayo
Junio
Julio

Enero

Marzo

Mayo
Junio
Julio
Febrero

Agosto

Febrero

Agosto

Febrero

Agosto
Ventas totales Valor ajustado Lineal (Valor ajustado)
4. Reflection
La analítica predictiva es parte sustancial del análisis avanzado que pone a disposición,
distintas técnicas estadísticas mediante la utilización de datos históricos y actuales con el
objetivo de predecir un comportamiento futuro, así como tendencias o conductas con la
utilización de los modelos que se conocen.
La analítica predictiva está teniendo cada vez mayor relevancia dentro de las empresas pues
ayuda a las mismas a verificar con más precisión ciertos comportamientos, sobre todo
cuando se presenta algún problema, y así ayudando más rentable para el futuro, dando
solución a distintos conflictos posibles y evitando futuros en caso de encontrar ciertas
irregularidades.
Para hacer más fácil la interpretación de datos, existen varias herramientas que ayudan al
análisis de los mismos, en este caso se está utilizando Excel para lograr ejemplificar de la
mejor manera, pues deja ver algunas formulas utilizadas y se llega a obtener un mejor
análisis de información si primero se aprende a realizarlo para posteriormente poder utilizar
otro tipo de herramientas. Tal vez optimizando más el trabajo a realizar, obteniendo datos
más precisos, a veces la cantidad de datos es muy grande y pueden llegar algunos mal
entendidos y al utilizar herramientas de análisis además de los modelos ayuda a que este
tenga menos errores y haya menos confusiones pues normalmente los modelos de series de
tiempo representan un solo tipo de patrón estacional, ya sea anual, mensual, trimestral,
aunque realmente en la mayoría de los casos presentados se puede observar una serie de
tiempo con múltiples patrones estacionales, que puede ser algo más complejo pero una vez
teniendo la experiencia suficiente y logrando un entendimiento más enfocado es muy
sencillo lograr analizar cualquier información ante la temporalidad buscada y observada en
la información presentada de acuerdo a los datos históricos que se extraigan de años o
meses anteriores.
Referencias
Universidad de Barcelona. (s.f.). Técnicas de predicción. Obtenido de
http://www.ub.edu/aplica_infor/spss/cap8-5.htm

También podría gustarte