Está en la página 1de 15

Ingeniería Industrial.

91
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Comparación de predicción basada en redes neuronales contra


métodos estadísticos en el pronóstico de ventas
Predictive comparison based in neural network versus statistical methods to forecast sales
Edgar Augusto Ruelas Santoyo; José Antonio Laguna González
Palabras Clave: Pronóstico de ventas, redes neuronales artificiales (RNA)
Key words: Sales Forecast, artificial neural networks (ANN)

RESUMEN ABSTRACT

La intención del presente artículo es realizar la The intention of this paper is to compare and select a
comparación y selección de un método para pronosticar method to forecast sales efficiently, and provide benefits
las ventas de forma eficiente y que beneficie a to organizations offering their products to market
organizaciones que ofrecen sus productos al mercado ya because sales forecasts are an input to the company
que los pronósticos de ventas son datos de entrada a different areas and being inaccurate may cost for the
diferentes áreas de la empresa y de ser imprecisos organization. The study case in this paper was carried
pueden generar gastos para la organización. El caso de out within the company Frugo Products SA de C.V.;
estudio en este artículo fue llevado a cabo dentro de la dedicated to the marketing of food products. The
empresa Productos Frugo S.A. de C.V., dedicada a la methods and methodologies used and then compared to
comercialización de productos alimenticios. Los forecast sales of the aforementioned company are: Hold
métodos y metodologías utilizados y posteriormente Method, Winters, Box Jenkins methodology (ARIMA)
comparados al pronosticar las ventas de la empresa and Artificial Neural Network. The results show that the
antes mencionada son: Método de Hold, Winters, la artificial neural network achieved better performance
metodología Box Jenkins (ARIMA) y una Red Neuronal scored the lowest mean square error, in this way it is
Artificial. Los resultados muestran que la red neuronal possible to establish an appropriate scenario for the use
artificial obtuvo un mejor desempeño logrando el menor of artificial intelligence in the industry.
error cuadrático medio, de esta forma es posible
establecer un panorama adecuado para el uso de la
inteligencia artificial dentro de la industria.

INTRODUCCIÓN materia prima o insumos necesarios para su


producción, o podría generarle un inventario
Los pronósticos de ventas son indicadores de demasiado grande. En ambos casos, el pronóstico
realidades económico-empresariales, básicamente erróneo disminuye las utilidades de la empresa.
en la situación de la industria en el mercado y en la El uso óptimo de los recursos y la creciente
participación de la empresa en ese mercado. El demanda de una mayor variedad de productos,
pronóstico determina qué puede venderse con entre otros, obliga a los fabricantes a realizar
base en la realidad, y el plan de ventas permite que programas de producción más estrictos y flexibles
esa realidad hipotética se materialice, guiando al para poder maximizar el uso de los costosos
resto de los planes operativos de la empresa. La equipos de producción, mano de obra, inversiones
elección e implementación de un método adecuado en materias primas, de forma que se cumplan las
de pronósticos siempre ha sido un tema de gran fechas de entrega a los clientes finales
importancia para las empresas. Se utilizan los minimizando los costos.
pronósticos en el área de compras, marketing, El objetivo principal de los pronósticos se
ventas, etc. Un error significante en el pronóstico transforma entonces en convertirse en la entrada
de ventas podría dejar a una empresa sin la para el resto de los planes operativos. Para realizar

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 92
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

eficientes programas de producción que atiendan usan una estructura en red en la cual los nodos o
la demanda sin incurrir en excesivos costos de neuronas son procesos numéricos que involucran
capital, es deseable un adecuado manejo de la estados de otros nodos según sus uniones. Una
información de ventas con el fin de realizar clase de estos modelos computacionales son las
pronósticos con buen nivel de confianza para redes de neuronas artificiales (HayKin, 2008). Las
todos los departamentos de la empresa. redes neuronales artificiales se han hecho muy
Debido al comportamiento no lineal que presenta populares debido a la facilidad en su uso e
un pronóstico de ventas, las redes neuronales implementación y la habilidad para aproximar
artificiales, ANNs, por sus siglas en ingles cualquier función matemática, además con su
(Artificial Neural Networks) son un excelente marcada habilidad para obtener resultados de
candidato para la predicción de esta estimación. datos complicados e imprecisos, pueden utilizarse
Las ANNs son usadas en modelos y sistemas para extraer patrones y detectar tramas que son
altamente no lineales (Azadeh, 2008). En general muy difíciles de apreciar por humanos u otras
las ANNs son técnicas matemáticas simples técnicas computacionales.
diseñadas para cumplir una gran variedad de Una de las definiciones que se estima más certera
tareas. Hoy en día las ANNs pueden ser de Red Neuronal Artificial es la siguiente: ``Las
configuradas en varios arreglos para desarrollar redes neuronales artificiales son conjuntos de
diversas tareas, tales como, el reconocimiento de elementos de cálculo simples, usualmente
patrones, minería de datos, clasificación y adaptativos, interconectados masivamente en
predicción, entre otras (Vahidinasab, 2008). Las paralelo y con una organización jerárquica que le
ANNs están compuestas de atributos que permite interactuar con algún sistema del mismo
aprenden soluciones en aplicaciones donde se modo que lo hace el sistema nervioso biológico''
necesita un mapeo lineal o no lineal. Algunos de (Kohonen, 1989). Su aprendizaje adaptativo, auto-
estos atributos son: capacidad de aprender, organización, tolerancia a fallos, operación en
generalización y procesamiento en paralelo, estos tiempo real y fácil inserción dentro de la tecnología
atributos hacen que las ANNs puedan resolver existente, han hecho que su utilización se haya
problemas complejos haciendo de esta técnica un extendido en áreas como la biológica, financiera,
método preciso y flexible (Balestrassi, 2009), industrial, medio ambiental, militar, salud, etc.
(Freeman, 1991) y (Rabuñal, 2006). El objetivo del (Hilera y Martinez, 1995). Están funcionando en
presente artículo, se enfoca al uso de redes aplicaciones que incluyen identificación de
neuronales para realizar pronósticos de ventas y procesos (Gonzalez y Martinez, 1998), detección de
contrastar los resultados obtenidos contra fallos en sistemas de control (Aldrich y Van
pronósticos de métodos estadísticos clásicos en Deventer, 1995), modelación de dinámicas no
función de un error cuadrático medio. Suponiendo lineales (Meert y Rijckaert, 1998), control de
que la utilización de un método de pronóstico no sistemas no lineales (Rivals and Personnaz, 2000) y
tradicional, como las redes neuronales, podrá optimización de procesos (Nacimiento y Guardani,
brindar un pronóstico de ventas más acertado en 2000).
comparación a los resultados obtenidos utilizando Investigaciones proponen el uso de redes
un método de pronóstico estadístico tradicional. neuronales artificiales como herramienta eficiente
Trabajo relacionado de pronósticos, ya que no presentan un análisis
Desde la primera mitad del siglo XX se han lineal (Toro et al; 2004) y (Saldaña, 2010). Otra
empezado a desarrollar modelos computacionales parte importante de la investigación que se ha
que han intentado emular el comportamiento del realizado es la caracterización de los métodos para
cerebro humano (McCulloch y Pitts, 1943). Aunque pronósticos ya que la estimación del
se han propuesto una gran cantidad de ellos, todos comportamiento futuro de algunas variables

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 93
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

puede realizarse utilizando diversos métodos de pronósticos. Cada uno de los métodos de
proyección tiene una aplicación de carácter objetivo que debe cumplir la red neuronal es que
especial que hace de su selección un problema de su salida V’ (t), dada por la ecuación
decisión influido por diversos factores, como son, V (t) = F [V(t −k),V(t −k +1),…,V(t −1), t] (1)

la validez y disponibilidad de los datos históricos, Sea lo más cercana posible a V (t). Por lo tanto, se
la precisión deseada del pronóstico, el costo del puede decir que V’ (t) es la estimación de las
procedimiento, los beneficios del resultado, los ventas para el período t.
periodos futuros que se desee pronosticar y el En (Koulouriotis, 2012), se analiza la importancia
tiempo disponible para hacer el estudio entre otros de reducir el nivel de inventario en una
(SapagChain, 2000). Dentro de los métodos de organización a través del pronóstico de ventas,
pronósticos se pueden clasificar en función de su comparando diferentes técnicas entre ellas la
carácter, esto es, aplicando métodos de carácter inteligencia artificial en un ambiente industrial.
cualitativo, modelos causales y modelos de series Los resultados obtenidos muestran que es posible
de tiempo (Nojek et al., 2003). establecer buenos niveles de inventario a través de
De acuerdo con Toro et al., en 2004, es posible los pronósticos realizados por una red neuronal de
entrenar a una red neuronal por medio de los propagación hacia adelante. Bajo ese mismo
niveles de ventas partiendo del siguiente enfoque en (Azadeh, 2012), se presenta una red
algoritmo. Si V (t) es el nivel de ventas del mes t y neuronal difusa para estimar el precio del gas
k el número de períodos (meses) anteriores a usar natural a partir de parámetros con un cierto nivel
en la predicción, se puede decir que el conjunto de de incertidumbre. En (Chang, 2012) establecen un
datos V (t − k), V (t − k +1),…, V (t −1) son los datos mecanismo de prevención sobre el costo de
de ventas de los k meses anteriores. Por lo tanto, el fabricación basado en redes neurona
les artificiales. Dentro de la investigación Después de una breve introducción y análisis del
propuesta en (Nazemi, 2013), se determina que la trabajo relacionado al tema a tratar dentro de la
inteligencia computación a través de una red sección 1, el artículo se organiza como sigue: en la
neuronal resuelve de mejor forma problemas de sección 2, se da una explicación de la metodología
optimización de cartera con comparación con otros a la que se dio seguimiento durante la
modelos. En (Zhai, 2013) y (Sadeghi, 2013), se investigación abordando aspectos como: La
propone el uso de tecnologías de la inteligencia recolección de los datos, Autocorrelación y la
artificial como los sistemas difusos para la descripción de cada método propuesto.
predicción de costos y establecer una planeación Consecutivamente se muestran los resultados
agregada, respectivamente. Ambas obtenidos durante la implementación de cada uno
implementaciones de la inteligencia artificial de los métodos seleccionados, así como la
dentro del sector industrial demuestran las discusión de los resultados obtenidos dentro de las
ventajas de su uso en comparación con métodos secciones 3 y 4 respectivamente. Finalmente, las
tradicionales, propiciando una ventaja competitiva conclusiones se mencionan en la sección 5.
en las organizaciones

METODOLOGÍA pronosticar las ventas dentro de la empresa donde


se llevó el caso de estudio, se debe estar consciente
Para definir la metodología a emplearse se debe
de que el modelo no será único para todas las
considerar que una serie de datos describe su
situaciones dentro de la misma rama industrial, ya
propio comportamiento, por lo que es importante
que el tratamiento de los datos se debe realizar
entender que con los métodos y los pasos
bajo diferentes factores. Es decir la metodología
resultantes de este trabajo se obtendrá una
propuesta está dedicada a la elección del mejor
metodología para elegir los mejores modelos para

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 94
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

modelo de pronóstico y no a encontrar un modelo Recolección de datos


universal. En la figura 1, se describen los pasos En la recolección de datos para pronósticos, se deben de
básicos a seguir en la metodología para obtener los identificar dos claras categorías, de entrada y prueba. La
primera es vital para diseñar y construir el modelo que
pronósticos de ventas:
permita la realización del pronóstico, la segunda igual
de importante, sirve como punto de referencia para
validar el resultado obtenido por el pronóstico, ya que se
está probando la estimación contra la realidad.
Los datos de entrada fueron obtenidos de los registros
históricos de los años 2010 y 2011, los cuales se
convirtieron en los datos de entrada para cada uno de
los métodos de pronósticos, ya construidos dichos
modelos, se procede a la prueba de cada uno de ellos y
se verifica su eficiencia. Los datos o históricos de prueba
fueron las ventas de los años 2012 y 2013, la
concentración de los datos fue realizada mensualmente.
En la tabla 1, se muestra de forma detallada la
información de las ventas necesaria para la evaluación
de los modelos elegidos para el desarrollo de los
pronósticos.

No Año Mes Tiemp Ventas en libras


o (X) (Y)

2012 Enero 1 1,715,363


Si Febrero 2 2,338,955
Marzo 3 1,206,298
Figura 1. Esquema básico de la metodología
Abril 4 1,201,767
empleada en la investigación
Mayo 5 1,046,660
Junio 6 1,884,477
La primera etapa para realizar pronósticos, es la Julio 7 1,282,274
recolección de datos válidos y confiables. Un
Agosto 8 413,025
pronóstico no puede ser más preciso que los datos en
Septiembre 9 970,179
que se basa. Cuando se mide una variable a lo largo
del tiempo, las observaciones en diferentes periodos Octubre 10 1,324,767
con frecuencia están relacionadas o correlacionadas. Noviembre 11 1,221,979
Esta correlación se mide mediante el uso del Diciembre 12
coeficiente de autocorrelación. Posteriormente se 1,106,086
selecciona el método de pronóstico adecuado en 2013 Enero 13 1,784,131
función del patrón que presenten los datos, el tipo de
Febrero 14 2,836,453
serie y la facilidad de aplicación (Makradakis, 1986).
Marzo 15 3,283,337
Además se deben de establecer los parámetros
adecuados para el tipo de pronóstico, este paso fue Abril 16 2,362,562
resuelto mediante experimentación exhaustiva Mayo 17 2,802,633
tomando como variable de respuesta un error Junio 18 1,751,905
cuadrático medio mínimo.
Julio 19 2,496,522
Agosto 20 1,881,808

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 95
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Tabla 1. Histórico de ventas 2012 y 2013. Empresa Productos Frugo S.A. de C.V

Septiembre 21 1,975,181
Octubre 22 2,649,544
Noviembre 23 2,945,026
Diciembre 24 2,329,979

En la figura 2, se muestra un diagrama de dispersión para visualizar la relación que existe entre las ventas
de mes a mes, de esta forma es sencillo observar el comportamiento de los datos.

Figura 2. Representación gráfica de ventas. Microsoft Excel 2010.

Análisis de autocorrelación qué elementos de la serie se encuentran presentes


Para evitar crear ambigüedades a la hora de tomar en ésta. La autocorrelación es la correlación que
una decisión sobre el método más conveniente a la existe entre una variable retrasada con uno o más
hora de realizar los pronósticos, es necesario periodos. Los patrones de datos que incluyen
utilizar una herramienta que permita evaluar el componentes como tendencia, estacionalidad e
comportamiento de la serie y que además irregularidad se pueden estudiar usando el
considere a los elementos que la componen, es enfoque del análisis de autocorrelación. Los
decir, que muestre si la serie es aleatoria, tiene coeficientes de autocorrelación para diferentes
tendencia o un patrón estacional. Una herramienta desfases de tiempo de una variable se emplean
viable y que fue utilizada para el análisis de para identificar patrones en las series de tiempo de
autocorrelación es el autocorrelograma, con él es datos. La ecuación siguiente contiene la fórmula
posible establecer un análisis del patrón de la serie para calcular el coeficiente de autocorrelación (rk)
de datos además de obtener el coeficiente de entre las observaciones Yt y Yt-k, las causales se
autocorrelación, que sin duda permitirá identificar encuentran a k periodos de distancia.

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 96
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

(2) figura 3, se muestra gráficamente que el valor obtenido


para el retraso 1, r1 es de 0.61082, el cual indica que
Donde existe una autocorrelación significativa entre las ventas
r = coeficiente de autocorrelación para un retraso de k del primer mes con las ventas del mes siguiente. En
periodos. general conforme aumente el número de retrasos de
= media de los valores de la serie. tiempo, k, disminuyen los coeficientes de
Yt = observaciones en el periodo t. autocorrelación. De acuerdo a los resultados obtenidos
Yt-k =observaciones de k periodos anteriores o durante autocorrelograma se observa que los datos tienden a
un periodo t-k. caer paulatinamente hacia cero, además que los
Aplicando la ecuación 2, se obtiene el coeficiente de primeros retrasos son bastante diferentes de cero, como
autocorrelación y de esta forma es posible verificar el resultado del análisis de los datos se concluye que está
comportamiento de la serie de tiempo tabla 2. En la presente un patrón tendencial en la serie de tiempo.

Tabla 2. Función de Autocorrelación Autocorrelación de la ventas de brocóli


para cada periodo. 1.0
0.8
Retrasos Función de
0.6
en cada Autocorrelación
0.4
Autocorrelation

periodo 0.2
0.0
-0.2
1 0.610829
-0.4
-0.6
2 0.402748 -0.8
-1.0

3 0.243364 2 4 6 8 10 12 14 16 18 20 22
Lag

4 0.261904 Figura 3. Función de Autocorrelación.


Software estadístico Minitab versión 15.
5 0.093726
Selección del método de pronóstico
6 -0.084612 La selección de la técnica empleada para pronosticar, es
definida en base al análisis de los factores que
7 -0.046443 intervienen en la selección del modelo, en este caso se
buscan modelos adecuados que se ajusten a patrones
8 0.051484 con tendencia. De acuerdo con Hanke y Reistch, en 2006,
los modelos sugeridos a emplearse para realizar los
9 -0.060716 pronósticos son: Suavización exponencial ajustado a la
tendencia, Método de Holt y Suavización exponencial
ajustado para variaciones de tendencia y
estacionalidades, Método de Winters además de la
metodología Box-Jenkins (ARIMA). Estos métodos y
metodologías estadísticas serán comparados contra una
red neuronal artificial la cual no requiere probar un
supuesto de tendencia o estacionalidad en la serie de
tiempo previo a la realización del pronóstico.

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 97
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Método de Holt de suavizamiento α y β pueden seleccionarse de manera


El nivel de la serie de tiempo puede cambiar subjetiva o mediante la minimización de una medida de
ocasionalmente y cuando se usa el suavizamiento error de pronósticos como el error cuadrático medio
exponencial simple es requerido actualizaciones de (MSE) (Hanke y Reistch 2006). En la tabla 3, se muestran
nivel. En algunas ocasiones los datos observados los resultados de la experimentación realizada para
tendrán una tendencia clara en la información que definir los parámetros α y β necesarios para el método
permita anticipar movimientos futuros hacia arriba. Holt.
Cuando este sea el caso, será necesaria una función de Las tres ecuaciones que se utilizan para el método de
pronóstico de tendencia lineal. Dado que las series Holt son:
económicas y de negocios rara vez exhiben una
tendencia lineal fija que evolucione con el tiempo. Una 1.La serie suavizada exponencialmente, o estimado del nivel
aportación de Holt, en 1957, es el desarrollo de un actual:

método de suavizamiento exponencial lineal, el cual (3)


toma en cuenta las tendencias lineales locales en
evolución dentro de una serie de tiempo y puede usarse 2.El estimado de la tendencia:
para generar pronósticos. Cuando se anticipa la (4)
tendencia en la serie de tiempo, se requiere un estimado
de la pendiente y de nivel actual. La técnica de Holt Pronósticos del periodo p en el futuro:
suaviza el nivel y la pendiente de manera directa al usar (5)
diferentes constantes de suavizamiento para cada una.
Dónde:
Éstas proporcionan estimados de nivel y de la pendiente
Lt = nuevo valor suavizado (estimado del nivel actual)
que se adapta a lo largo del tiempo conforme aparecen
α = constante de suavización para el nivel (0 < α <1)
nuevas observaciones. Una de las ventajas de Holt es su
Yt = observación nueva o valor real de la serie en el
flexibilidad al seleccionar los coeficientes que controlan
periodo t
el nivel y la tendencia. Los parámetros requeridos son
β = constante de suavización para el estimado de
Alfa (α) y Beta (β). Alfa se usa para suavizar los datos a
tendencia (0 < β < 1)
fin de eliminar la aleatoriedad. La constante de
Tt = estimado de tendencia
suavizamiento β es como α, a excepción de que se usa
p = periodo a pronosticar en el futuro
para suavizar la tendencia en los datos. Ambas
= pronóstico para periodo p en el futuro
constantes de suavizamiento se usan para promediar los
valores anteriores y, de esta forma, eliminar el fenómeno
aleatorio presente en la serie de tiempo. Las constantes

Método de Winters 1.El nivel de la serie estimado por suavizamiento exponencial:


El método Winters con tres parámetros de
suavizamiento exponencial lineal y estacional, es una
extensión del método de Holt, tiene el potencial de (6)
2.El estimado de la tendencia:
describir mejor los datos y reducir el error del
pronóstico. En el método de Winters se usa una ecuación
adicional para estimar la estacionalidad. En la versión (7)
3.El estimado de la estacionalidad:
multiplicativa del método de Winters, el estimado de la
estacionalidad será como un índice estacional y se (8)
calcula mediante la ecuación del estimado de la
4.Pronóstico del periodo p en el futuro:
estacionalidad. En la tabla 4, se muestran los resultados
(9)
de la experimentación realizada para definir los
parámetros alfa , beta y gama necesarios
Donde
para el método Winters. Las cuatro ecuaciones utilizadas
Lt = nuevo valor suavizado o nivel actual estimado
en el suavizamiento (multiplicativo) de Winters son:
α = constante de suavizamiento para el nivel

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 98
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Yt = nueva observación o valor real en el periodo t St = estimado de estacionalidad


β = constante de suavizamiento para el estimado de p = número de periodo a pronosticarse
tendencia s = longitud de estacionalidad
Tt = estimado de tendencia
= pronóstico para el periodo p en el futuro
= constante de suavizamiento para el estimado de
estacinalidad

Tabla 3. Resultados de la experimentación para definir los


parámetros en el método Holt. Tabla 4. Resultados de la experimentación para definir los
parámetros en el método Winters.

Error
Cuadrático Error
Medio
Cuadrático
0.6 0.1 3938.6882 Medio
0.5 0.1 3969.30554 0.7 0.1 0.4 4034.77
0.7 0.1 3977.204
0.8 0.1 0.4 4057.31
0.8 0.1 4076.29505 0.7 0.2 0.5 4076.02
0.4 0.1 4080.6369
0.7 0.2 0.4 4076.54
0.6 0.2 4218.96766
0.6 0.2 0.4 4109.06
0.9 0.1 4233.51164
0.6 0.2 0.5 4110.78
0.5 0.2 4262.09318
0.7 0.2 4265.64826 0.6 0.1 0.5 4122.04
0.3 0.1 4287.028504 0.7 0.1 0.2 4137.4
0.8 0.2 4389.00711
0.6 0.1 0.4 4142.26
0.4 0.2 4410.060095
0.8 0.1 0.2 4159.72
0.6 0.3 4473.05642
0.5 0.3 4521.391724 0.7 0.2 0.2 4178.85
0.7 0.3 4538.82546 0.7 0.1 0.1 4187.19
0.9 0.2 4584.23129
0.2 0.1 4627.653574
0.6 0.2 0.2 4190.14
0.3 0.2 4670.158746 0.8 0.1 0.1 4203.67
0.8 0.3 4698.33332 0.7 0.2 0.1 4227.35
0.4 0.3 4704.997091
0.5 0.2 0.4 4229.18
0.5 0.5 4941.154883
0.9 0.3 4943.49782
0.5 0.2 0.5 4231.91
0.4 0.4 4957.868414 0.9 0.1 0.4 4232.56
0.2 0.2 5001.967229 0.6 0.2 0.1 4236.58
0.3 0.3 5041.491025 0.6 0.1 0.2 4240.99
0.6 0.6 5145.462445 0.6 0.3 0.4 4273.83
0.1 0.1 5306.60193 0.8 0.2 0.2 4277.29
0.3 0.4 5355.263543 0.7 0.3 0.4 4287.82
0.2 0.3 5470.3474
0.1 0.2 5526.450276
0.7 0.3 0.5 4288.82
0.6 0.3 0.5 4291.12
0.6 0.1 0.1 4292.48
0.8 0.2 0.1 4324.57
0.9 0.1 0.1 4325.9
0.6 0.3 0.2 4342.26
0.5 0.3 0.4 4349.34

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 99
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Método ARIMA autocorrelaciones no pueden desvanecerse con


Los Modelos de Promedio Móvil Autorregresivo rapidez. Si la serie no es estacionaria, con
Integrado, (ARIMA), por sus siglas en inglés, son frecuencia puede convertir a una serie estacionaria
una clase de modelos que tienen la capacidad de al tomar sus diferencias, es decir, la serie es
operar sobre series de tiempo estacionarias o no remplazada por una serie de diferencias. Entonces,
estacionarias. El primer paso en la identificación se especifica un modelo ARIMA para la serie de las
del modelo consiste en determinar si la serie es diferencias. Se debe especificar el grado de
estacionaria, es decir, si la serie de tiempo aparenta diferenciación y el algoritmo de Box-Jenkins
variar alrededor de un nivel fijo. Una serie no convierte los datos en una serie estacionaria y
estacionaria se indica si la serie parece crecer o realizar los cálculos subsecuentes utilizando los
decrecer con relación del tiempo y las
datos convertidos. Una vez obtenida una serie
estacionaria, se debe identificar la forma del i. El conocimiento es adquirido por la red desde su
modelo a utilizar. Este paso se logra mediante la entorno a través de un proceso de aprendizaje.
comparación de los coeficientes de autocorrelación ii.Las fuerzas de las conexiones entre neuronas,
y de autocorrelación parcial se calcularon a partir conocidas como pesos sinápticos, son usadas para
de los datos para las autocorrelaciones y almacenar el conocimiento (Haykin, 2009).
autocorrelaciones parciales teóricas de los diversos La arquitectura de una red neuronal consiste en la
modelos ARIMA (Hanke y Reistch, 2006), por lo organización y disposición de las neuronas en la
tanto de acuerdo a la figura 3 y 4, el modelo red formando capas o agrupaciones de neuronas.
correspondiente es el modelo AR (2). Los parámetros fundamentales son: número de
capas, número de neuronas por capa, grado de
Partial Autocorrelation Function for VENTAS BROCOLI conectividad y tipo de conexión entre neuronas
(with 5% significance limits for the partial autocorrelations)

1.0
(Villanueva, 2002).
0.8
0.6
Redes multicapa: Las redes neuronales artificiales
Partial A utocorrelation

0.4
0.2
0.0
multicapa se forman con un grupo de capas
-0.2 simples en cascada. La salida de una capa es la
-0.4
-0.6 entrada de la siguiente capa. Se ha demostrado que
-0.8
-1.0
las redes multicapa presentan cualidades y
1 2 3 4 5 6 aspectos por encima de las redes de una capa
Lag
simple. Dado que este tipo de redes disponen de
Figura 4. Autocorrelación parcial de la serie de tiempo.
varias capas, las conexiones entre neuronas
Software estadístico Minitab versión 15.
pueden ser del tipo feedforward (conexión hacia
adelante) o del tipo feedback (conexión hacia
Red Neuronal Artificial
atrás). Las redes feedforward son especialmente
Una red neuronal artificial es un procesador
útiles en aplicaciones de reconocimiento o
masivo paralelo formado por unidades simples de
clasificación de patrones. En la figura 5, se muestra
procesamiento que tienen una propensión natural
la estructura general de una red de este tipo. La
para almacenar conocimiento experimental,
figura y nomenclatura se adoptan de (Hagan,
haciéndolo viable para su uso. La red neuronal se
2002).
asemeja al cerebro en dos aspectos:

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 100
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Figura 5. Estructura general de una red neuronal multicapa.

La entrada a la red es el vector p cuya longitud es igual a etapa de aprendizaje debe ser considerada para la
R, W es la matriz de pesos con dimensiones SxR, a y b creación de un modelo neuronal, en esta parte es donde
son vectores de longitud S el cual, representa el número se introducen los datos de entrada a la red neuronal
de neuronas de la red. artificial. La fase de aprendizaje se utiliza para ajustar
La habilidad de la red perceptrón multicapa para los pesos, los cuales inicialmente son valores aleatorios.
aprender a partir de un conjunto de ejemplos, al El valor del error cuadrático medio sirve para evaluar la
aproximar relaciones no lineales, filtrar ruido en los corrección de pesos en cada iteración. Finalmente, la red
datos, etc. hace que sea un modelo adecuado para neuronal artificial aprende el comportamiento de la base
abordar problemas reales, sin que esto indique que son de datos generada por medio de datos introducidos en
las mejores herramientas como aproximadores su capa de entrada.
universales. En la tabla 5, se muestra el esquema de la
red neuronal artificial construida para la realización de Topología de la Red Neuronal Artificial
los pronósticos de ventas, cabe destacar que no existe un
método específico para llegar a la arquitectura de la red, Numero de Neuronas en la capa 19
el parámetro que definió esta arquitectura fue el error oculta
cuadrático medio mínimo al momento de realizar los Tasa de aprendizaje 0.01
pronósticos. La red de neuronas almacena información
en una cadena de interconexiones neuronales por medio
Numero de Iteraciones 4000
de los pesos. La función de transferencia utilizada es la
tangente hiperbólica.
Error objetivo 1x10-5
La arquitectura de diferentes tipos de redes de neuronas
artificiales fue explorada, con el objetivo de encontrar el
diseño idóneo al problema que debemos resolver. Una

RESULTADOS (Ver tabla 4). La metodología ARIMA queda definida


como un modelo AR (2) después de comparar las
Una vez definidos los parámetros y arquitecturas de
autocorrelaciones parciales, y por último la red
los métodos para pronosticar se prueban los métodos
neuronal artificial empleada para la realización de los
seleccionados, para el método de Holt se determina
pronósticos descrita en la tabla 5. Los resultados de la
que los mejores valores de acuerdo a un error
aplicación del método Holt, Winters, metodología
cuadrático medio mínimo son: alfa de 0.6 y beta de
ARIMA y la red neuronal trabajando con sus
0.1 (Ver tabla 3). Prosiguiendo con la misma lógica se
parámetros adecuados para realizar los pronósticos
determina que los mejores parámetros para el método
se encuentran en la tabla 6 y figuras 6, 7, 8 y 9
de Winters son: alfa de 0.7, beta de 0.1 y gama 0.4

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 101
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

respectivamente, las figuras fueron generadas a partir manejo de la información, así que solo es necesario
de Microsoft Excel 2010. Los resultados de los realizar la operación inversa para obtener el valor real
pronósticos se encuentran codificados, lo que consiste arrojado por el método seleccionado.
en dividir el dato real entre diez mil para un mejor

Tabla 6. Resultados de cada técnica de pronóstico.

Año Mes Tie Resultados Pronóstico Pronóstico Valor Valor


mpo en libras (Y) con Método de con Método de pronosticado pronosticado
(X) Holt Winters ARIMA ANN

Enero 1 1,715,363 171.5363 178.839179 181.98444 171.5467


Febrero 2 2,338,955 171.5363 211.109168 177.975959 233.8767
Marzo 3 1,206,298 212.6934 141.548676 216.792561 120.6265
Abril 4 1,201,767 155.673 115.525686 146.288296 120.1961
Mayo 5 1,046,660 130.4632 104.682685 146.006255 112.0354
Junio 6 1,884,477 109.525 150.920626 136.351342 188.4516
2010
Julio 7 1,282,274 156.1541 133.040549 188.502763 128.2219
Agosto 8 413,025 136.998 60.1473986 151.017558 112.0207
Septiembre 9 970,179 71.4389 81.4201135 96.9095954 112.021
Octubre 10 1,324,767 80.1792 116.46938 131.590645 132.4692
Noviembre 11 1,221,979 108.0885 111.896028 153.662611 122.1821
Diciembre 12 1,106,086 113.9314 105.309848 147.264387 112.0911
Enero 13 1,784,131 109.1157 144.671885 140.05042 178.3963
Febrero 14 2,836,453 152.0299 233.219576 182.256547 261.4035
Marzo 15 3,283,337 240.2319 273.193935 247.760216 261.4037
Abril 16 2,362,562 307.6118 233.188298 275.577312 261.4037
Mayo 17 2,802,633 275.0359 239.29389 218.262021 261.4037
Junio 18 1,751,905 288.7235 187.047837 245.65503 175.1843
2011
Julio 19 2,496,522 224.3429 205.024267 180.250581 249.6467
Agosto 20 1,881,808 244.7862 190.72641 226.600602 188.1843
Septiembre 21 1,975,181 212.6843 172.981014 188.336627 197.5163
Octubre 22 2,649,544 204.536 235.303969 194.148796 261.4019
Noviembre 23 2,945,026 245.3636 247.765508 236.12573 261.4032
Diciembre 24 2,329,979 282.3719 230.263633 254.518537 233

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 102
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Figura 6. Ventas reales vs pronóstico con el Método de Holt.

Figura 7. Ventas reales vs pronósticos con el Método de Winter.

Figura 8. Ventas reales vs pronóstico con el Método de ARIMA.

Figura 9. Ventas reales vs pronósticos con la Red neuronal artificial.

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 103
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

Finalmente se llevó a cabo el comparativo y


evaluación de cada una de la los métodos,
considerando el error cuadrático medio para su
evaluación. La finalidad es saber cuál de los
métodos alcanzaría el menor error cuadrático
medio y de esta forma poder probar la hipótesis
planteada sobre la promoción de la inteligencia
artificial como método de pronósticos en las
organizaciones, como resultado se obtuvo que la
red neuronal alcanzó el menor error cuadrático
versus la técnica del método de Hold, método de
Winters y la metodología Box Jenkin (ARIMA). En
la figura 10, se muestran los resultados de la Figura 10. Resultados de la evaluación por el MSE.
evaluación mediante el MSE. Microsoft Excel 2010.

DISCUSIÓN artificial como lo son las redes neuronales


artificiales y los métodos convencionales de
Como se ha mencionado, las empresas requieren pronósticos, esa similitud es la forma en que
de planes de producción que proporcionen una intentan encontrar con éxito los parámetros de
mejor programación de las actividades en cada una operación necesarios en su arquitectura para
de las áreas, para eso requieren de saber con predecir la variable dependiente que en este caso
anticipación cuales pueden ser sus posibles ventas son las ventas. Por otro lado, existen diferencias
en el futuro de forma precisa, ya que dependiendo que propician ventajas de una técnica a otra, las
de esta información, es posible incurrir en graves redes neuronales no requieren ninguna suposición
errores como son: materia prima insuficiente, falta sobre las distribuciones de probabilidad de los
de personal, exceso de materia prima e datos, solo los aprenden, al contrario de muchos
incumplimiento en fechas de entrega lo que genera métodos convencionales de pronósticos, pueden
un incremento de costos de producción. La operar con datos incompletos y analizar datos con
intención de este artículo es encontrar una alta o nula correlación. Una característica
metodología para pronosticar las ventas de la importante en las redes neuronales artificiales
forma más precisa posible y de esta forma hacer empleadas en los pronósticos, es que los datos no
más competitiva a la organización. deben de ser analizados para probar el supuesto
Algunos investigadores de los pronósticos han de tendencia o estacionalidad en la serie de tiempo
notado similitud entre los métodos de inteligencia previo a la realización del pronóstico.

CONCLUSIONES seguir pronosticando, por que parten del supuesto


de que la población siempre tendrán una
Los resultados observados en esta investigación distribución normal.
muestran que los métodos estadísticos para En la red neuronal artificial no se requieren
pronosticar utilizados parten del comportamiento especificar supuestos como la distribución de
de los datos históricos, en estos modelos se supone probabilidad o patrón de comportamiento en la
que el futuro será igual que el pasado, excepto por serie de tiempo para la realización de pronósticos
las variables reconocidas por el modelo. Pero si de forma eficiente, pues el método involucra el
alguna variable cambia, se hacen ineficientes para aprendizaje de las relaciones mediante los

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 104
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

ejemplos proporcionados, que es al contrario de puede observar que las ventas totales durante ese
los métodos convencionales para pronósticos periodo de tiempo equivalen a: 44, 810, 911 libras.
donde se tiene que especificar el patrón de Las ventas pronosticadas mediante la red neuronal
comportamiento de los datos históricos. De artificial son: 44, 560, 866 libras. Lo cual refleja un
acuerdo al error cuadrático medio (MSE) como 99.442% de exactitud de las ventas reales vs
métrica de desempeño, la red neuronal artificial pronóstico con la ANN, lo cual propicia un
presento una mejor práctica a la hora de realizar escenario adecuado para el uso de las redes
pronósticos. neuronales artificiales a la hora de pronosticar
En la fase de prueba llevada a cabo durante ventas dentro la industria.
veinticuatro periodos descritos es la tabla 1, se

REFERENCIAS 12.Hilera J. R.; and Martinez V. J.; Addison-Wesley, (1995).


Redes neuronales artificiales Fundamentos, modelos y
1.Aldrich C. and van Deventer J. S. J., (1995). Comparison of aplicaciones. Iberoamericana S.A, Madrid.
different artificial neural nets for the detection and location of 13.Holt, C.C. (1957). Forecasting trends and seasonals by
gross errors in process systems. Industrial & Engineering exponentially weighted averages, Carnegie. Institute of
Chemistry Research. 34(1):216-224. Technology, Pittsburgh ONR memorandum No. 52.
2.Azadeh, A., Sheikhalishahi, M., Shahmiri S. (2012) A 14.Kohonen T., (1989). Self-organization and associative
hybrid neuro-fuzzy simulation approach for improvement of memory. Springer Verlag. New York.
natural gas price forecasting in industrial sectors with vague 15.Koulouriotis, D., Mantas, G. (2012) Health products sales
indicators. The International Journal of Advanced forecasting using computational intelligence and adaptive
Manufacturing Technology. Springer Link. Volume 62, Issue 1- neuro fuzzy inference systems. Operational Research. Springer
4, pp 15-33. Link. Volume 12, Issue 1, pp 29-43.
3.Azadeh, A.; Ghaderi, S. F.; Sohrabkhani S., (2008). Annual 16.Makridakis S., (1986). The Art and Science of
Electricity Consumption Forecasting by Neural Network in Forecasting. International Journal of Forecasting 2.
high Energy Consuming Industrial sectors. Energy Conversion 17.McCulloch W. S. and W. Pitts (1943). A logical calculus
and Management. Volumen 49, Issue 8, p. 2272-2278. of the ideas immanent in nervous activity. Bulletin of
4.Balestrassi, P.P.; Popova, E.; Paiva, A.P.; Marangon, J.W., Mathematical Biology, 5(4):115-133.
(2009). Design of experiments on Neural Network’s training for 18.Meert K. and Rijckaert M., (1998). Intelligent modelling
nonlinear time series. Forecasting Neurocomputing. in the chemical process industry with neural networks: a case
Volumen72, Issues 4-6, p. 1160-1178. study. Computers and Chemical Engineering. 22:587-593.
5.Chang, P., Lin, J., Dzan, W. (2012) Forecasting of 19.Nascimento C. A. O.; Giudici R., and Guardani R., (1996).
manufacturing cost in mobile phone products by case-based Neural network based approach for optimization of industrial
reasoning and artificial neural network models. Journal of chemical processes. Redes de neuronas artificiales y algoritmos
Intelligent Manufacturing. Springer Link. Volume 23, Issue 3, genéticos. Servicio de Publicaciones Universidad de la Coruña.
pp 517-531. 20.Nazemi, A., Tahmasbi, N., (2013) A computational
6.Freeman, J.; Skapura, D., (1991). Neural Networks intelligence method for solving a class of portfolio optimization
Algorithms, Applications, and Programming Techniques. problems. Soft Computing. Springer Link. Recuperado de
Addison-Wesley, New York. http://link.springer.com/article/10.1007/s00500-013-1186-4.
7.González-García R.; Martínez-Rico R,; and Kevrekidis I. 21.Nojek, S.1.; Britos, P. (2003). Pronosticos de ventas:
G., (1998). Identification of distributed parameter systems: A Comparacion de predicción basada en redes neuronales versus
neural net based approach. Computers and Chemical estadístico. Departamento de Ingeniería Industrial. Instituto
Engineering, 22:965-968. Tecnológico de Buenos Aires.
8.Hagan M. T., Demuth H. B., Beale H. M., (2002). Neural 22.Rabuñal, J. R.; Dorrado, J., (2006). Artificial neural
Network Design, Volumen 10. Campus Pub. Service, University networks in real-life applications. Idea GroupPublishing, USA.
of Colorado Bookstore. 23.Rivals and Personnaz L., (2000). Nonlinear internal
9.Hanke J.; Reitsch A., (2006). Pronósticos en los Negocios, model control using neural networks: application to processes
Octava Edición, Prentice Hall, México. with delay and design issues. IEEE Transactions on Neural
10.Haykin S., (2008). Neural Networks: A Comprehensive Networks. 11(1):80-90.
Foundation. Prentice Hall, NJ, USA. 24.Sadeghi, M., Razavi S., Sadat, S. (2013) A fuzzy grey goal
11.Haykin, Simon (2009). Neural Networks and Learning programming approach for aggregate production planning. The
Machines. New Jersey; Editorial Pearson Prentice Hall. International Journal of Advanced Manufacturing Technology.
Springer Link. Volume 64, Issue 9-12, pp 1715-1727.

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105


Ingeniería Industrial. 105
Actualidad y Nuevas Tendencias Año 7, Vol. IV, N° 12
ISSN: 1856-8327

25.Saldaña, A; Jöns, S. (2010). Pronósticos para el 29.Villanueva E., M. (2002). Las Redes Neuronales
Rendimiento Del Trigo Usando Redes Neuronales Artificiales Artificiales y su Importancia como Herramienta en la Toma de
26.SapagChain (2000). Preparación y evaluación de Decisiones. Trabajo de Investigación (Lic.) Universidad
proyectos. Mc-Graw Hill. Nacional Mayor de San Marcos. Facultad de Ciencias
27.Toro, E; Mejía, D. (2004). Pronóstico de ventas usando Matemáticas. EAP de Investigación Operativa.
redes neuronales. Universidad Tecnológica de Pereira. 30.Zhai, K., Jiang, N., Pedrycz, W. (2013) Cost prediction
28.Vahidinasab, V.; Jadid, S.; Kazemi, A., (2008). Day-ahead method based on an improved fuzzy model. The International
price Forecasting in Restructured Power Systems using Journal of Advanced Manufacturing Technology. Springer
Artificial Neural Networks. Electric Power Systems Research. Link. Volume 65, Issue 5-8, pp 1045-1053.
Volumen 78, Issue 8, p. 1332-1342.

Autores
Edgar Augusto Ruelas Santoyo. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial en el
Instituto Tecnológico de Celaya en 2008 y 2011, respectivamente. Actualmente, estudia un doctorado en el
Posgrado Interinstitucional en Ciencia y Tecnología (PICYT). Profesor en el Departamento de Ingeniería
Industrial, Instituto Tecnológico Superior de Irapuato, Guanajuato, México.
E-mail: edruelas@itesi.edu.mx

José Antonio Laguna González. Graduado en Ingeniería y en la Maestría en Ingeniería Industrial del
Instituto Tecnológico Superior de Irapuato (ITESI) en el 2002 y 2013, respectivamente. Profesor en el
Departamento de Ingeniería Industrial, Instituto Tecnológico Superior de Irapuato, Ext. Abasolo,
Guanajuato, México. Se ha desempeñado en empresas del giro alimenticio y metalmecánico.
E-mail: jolaguna@itesi.edu.mx

Recibido: 07/09/2013 Aceptado: 20/12/2013

Ruelas y Laguna, Comparación de predicción basada en redes neuronales, p. 91-105

También podría gustarte