Está en la página 1de 31

"Año del Bicentenario del Perú: 200 años de Independencia"

INFORME

PRONÓSTICO DE MODELO ARIMA CON CAMBIO BRUSCO,


CASO PRODUCTOS HOUSEHOLD EMPRESA X.

Integrantes: Contreras Muñoz Jerson, Mejia Norabuena Desiré, Monje Meza


Gustavo, Torres Loaiza Henry.
Series de tiempo
Escuela profesional de Ingeniería Estadística
Universidad Nacional de Ingeniería
Docente: Dr. Alipio Ordoñez
Lima,Perú

2021
Resumen

El objetivo del presente trabajo es pronosticar las ventas de productos “HOUSEHOLD”


de la empresa Kimberly-Clarka nivel nacional para el primer y segundo trimestre del
2021. Para este pronóstico se ha utilizado información de los períodos comprendidos
entre el primer trimestre del 2016 hasta el último trimestre del 2020.Los resultados del
análisis ayudarán a comprender las tendencias presentadas en la serie de tiempo.
Además, la predicción permitirá tomar precauciones y crear planes de contingencia ante
una nueva demanda elevada en productos HOUSEHOLD, para así evitar el
desabastecimiento en los diferentes puntos de venta donde se ofrecen estos productos.
Por ello, la finalidad de esta investigación es comprobar si aún existe incertidumbre
sobre lo que pasara con la demanda de éstos productos, debido a que la empresa está
interesada en implementar nuevas estrategias en la producción de estos productos para
así reducir el impacto COVID de la cuarentena.

Abstract
The objective of this work is to forecast sales of “HOUSEHOLD” products of the Kimberly-
Clarka company at the national level for the first and second quarters of 2021. For this
forecast, information has been used from the periods between the first quarter of 2016
until the last quarter of 2020 The results of the analysis will help to understand the trends
presented in the time series. In addition, the forecast will allow taking precautions and
creating contingency plans in the face of a new high demand for HOUSEHOLD products,
in order to avoid shortages at the different points of sale where these products are
offered. Therefore, the purpose of this research is to check if there is still uncertainty
about what will happen to the demand for these products, because the company is
interested in implementing new strategies in the production of these products in order to
reduce the COVID impact of the quarantine.
BORRAR ALGUNAS COSAS DE FUNDAMENTO TEORICO PORQUE ES MUCHO
1. Introducción
El presente informe, está enfocado en el análisis y comparación de los
modelos Box Jenkins para la venta de productos de Cuidado del Hogar
hacia los canales de supermercados en el Perú por una de las empresas
líder en su rubro. Estas metodologías, conocidas también técnicamente
como metodología ARIMA, fueron generadas como un nuevo conjunto de
herramientas de predicción en la década de los 70’s . Este método de
predicción se basa en el análisis de las propiedades probabilísticas o
estocásticas de las series de tiempo en sí mismas, pues una variable Yt
puede ser expresada como una función de sus valores pasados donde no
existe relación causal alguna a diferencia de los modelos clásicos de
regresión. Los pasos para realizar estas metodologías dependen del tipo
de datos, estos deben ser estacionarios; se analizan los gráficos de
correlaciones para conocer cuales serían los posibles órdenes del
modelo, luego se evalúa la adecuación del modelo en la etapa de
validación , y, por último; se mide el error de predicción en el cálculo de
los pronósticos. Una de las principales actividades económicas, sobre la
cual recae gran parte del soporte económico de nuestro país es el sector
del Consumo Masivo la cual tiene una importante presencia en el PBI, el
empleo y otras variables económicas importantes. Perú es el país con la
industria del consumo masivo más desarrollada de América Latina debido
a su diversidad de recursos naturales entre otros.

2. Objetivos

2.1. Objetivo General:


Elegir el mejor modelo de serie de tiempo para poder predecir las
ventas de los productos del hogar de la empresa Kimberly-Clark.

2.2. Objetivos Específicos:


● Analizar una serie de modelos que cumplan con la condición
respectiva dada a la data presentada a la empresa Kimberly-
Clark.
● Calcular los parámetros del mejor modelo elegido mediante un
análisis de AIC.

3. Fundamento Teórico:

3.1. Clasificación descriptiva de las series temporales


Las series temporales se pueden clasificar en:

a) Estacionarias.- Una serie es estacionaria cuando es estable a lo


largo del tiempo, es decir, cuando la media y varianza son
constantes en el tiempo. Esto se refleja gráficamente en que los
valores de la serie tienden a oscilar alrededor de una media
constante y la variabilidad con respecto a esa media también
permanece constante en el tiempo.
b) No estacionarias.- Son series en las cuales la tendencia y/o
variabilidad cambian en el tiempo. Los cambios en la media
determinan una tendencia a crecer o decrecer a largo plazo, por
lo que la serie no oscila alrededor de un valor constante.

3.2. Procesos Estocásticos


Desde un punto de vista intuitivo, un proceso estocástico se describe
como una secuencia de datos que evolucionan en el tiempo. Las series
temporales se definen como un caso particular de los procesos
estocásticos.

a) Proceso estocástico estacionario


Un proceso estocástico se dice que es estacionario si su media
y su varianza son constantes en el tiempo y si el valor de la
covarianza entre dos periodos depende solamente de la
distancia o rezago entre estos dos periodos de tiempo y no del
tiempo en el cual se ha calculado la covarianza.

Sea 𝑋𝑡 una serie de tiempo entonces con estas propiedades:

Donde 𝑦𝑘 la covarianza (o auto covarianza) al rezago k, es la


covarianza entre los valores de 𝑋𝑡 y 𝑋𝑡+𝑘, que están separados k
periodos.
En resumen, si una serie de tiempo es estacionaria, su media,
su varianza y su auto covarianza (en diferentes rezagos)
permanecen iguales sin importar el momento en el cual se
midan; es decir, son invariantes respecto al tiempo.

3.3. Autocorrelación
En ocasiones en una serie de tiempo acontece, que los valores que toma una
variable en el tiempo no son independientes entre sí, sino que un valor
determinado depende de los valores anteriores, existen dos formas de medir
esta dependencia de las variables.

a) Función de autocorrelación (ACF)


La autocorrelación mide la correlación entre dos variables
separadas por k periodos.

La función de autocorrelación simple tiene las siguientes


propiedades:

b) Función de Autocorrelación Parcial (PACF)


La autocorrelación parcial mide la correlación entre dos variables
separadas por k periodos cuando no se considera la dependencia
creada por los retardos intermedios existentes entre ambas.

c) Prueba de Ljung-Box
Esta prueba permite probar en forma conjunta de que todos los
coeficientes de autocorrelación son simultáneamente iguales a
cero, esto es que son independientes, está definida como

donde n tamaño de la muestra, m longitud del rezago.


Ho: Las autocorrelaciones son independientes.
Ha: Las autocorrelaciones no son independientes.

En una aplicación, si el Q calculada excede el valor Q crítico de la


tabla ji cuadrada al nivel de significancia seleccionado, no se
acepta la hipótesis nula de que todos los coeficientes de
autocorrelación son iguales a cero; por lo menos algunos de ellos
deben ser diferentes de cero.

3.4. Procesos Lineales Estacionarios

a) Procesos Autoregresivos AR(p)


Los modelos autoregresivos se basan en la idea de que el valor actual de la
serie, 𝑋𝑡 , puede explicarse en función de p valores pasados 𝑋𝑡−1 , 𝑋𝑡−2 , . . . , 𝑋𝑡−𝑝 ,
donde p determina el número de rezagos necesarios para pronosticar un valor
actual.
El modelo autoregresivo de orden p está dado por:
Expresado en términos del operador de retardos,

donde 𝑡es un proceso de ruido blanco y ∅0 , ∅1 , ∅2 , . . . , ∅𝑝son los parámetros del modelo.

Proceso Autoregresivo de Orden 1: AR(1)


En los procesos AR(1) la variable 𝑋𝑡 está determinado únicamente por el valor pasado, esto es

𝑋𝑡−1

Donde 𝑡 es un proceso de ruido blanco con media 0 y varianza constante 𝜎 2, ∅ es el


parámetro. Recuérdese además que suponemos que el proceso es no anticipante, es
decir, el futuro no incluye en el pasado.

Para verificar que el modelo AR(1) es estacionario para cualquier valor del parámetro, es
necesario probar las siguientes condiciones.

● Estacionario en media:

Para que el proceso sea estacionario, la media debe ser constante y finita en el tiempo,
esto implica que:

Por tanto, para que el proceso sea estacionario el ∅ ≠ 1 parámetro .

● Estacionario en covarianza:
Para que un proceso AR(1) sea estacionario, la varianza tiene que ser constante y finita
en el tiempo:

Dada la autocorrelación del proceso

Bajo el supuesto de que el proceso es estacionario,

Por tanto entonces


Para que un proceso sea estacionario, varianza constante y finita, es necesario que
|∅| < 1
La función de autocovarianza de orden k es:

Por lo que :

Se puede concluir, por lo tanto, que el proceso AR(1) es estacionario si y solo si


|∅| < 1. La función de autocovarianza de un proceso AR(1) estacionario es:

Los coeficientes de autocorrelación de un proceso estacionario AR(1) son:

La función de autocorrelación de un proceso AR(1) estacionario es:

Se puede demostrar fácilmente que la Función de Autocorrelación de un modelo AR(1)


es una función exponencial.

Por lo que :

Una forma alterna de escribir el modelo AR(1) es la siguiente:


1
El cociente podemos expresarlo como un polinomio infinito, esto es:
1−∅𝐿

Sustituyendo se tiene

Por lo que un modelo AR(1) es una versión restringida de un modelo general de medias
móviles.

De los resultados obtenidos podemos señalar como características más relevantes del
modelo como:

- El modelo AR(1) es estacionario siempre que se cumpla |∅| < 1.


- El correlograma, representación gráfica de la función de autocorrelación, tendrá un
comportamiento amortiguado hacia cero con todos los valores positivos, en caso de que
∅ < 0, o bien alternando el signo , comenzando con negativo, si ∅ > 0
- La función de autocorrelación parcial se anula para retardos superiores a uno (el orden
del modelo), coincidiendo, como es norma, este coeficiente de autocorrelación parcial.
8.- Diagrama de flujo del proceso para elegir el mejor modelo
9.- Descripción de los datos.

9.1. Variable de interés:


Para el presente trabajo la variable de interés es la venta en toneladas de
productos de limpieza la cual mide el volumen de venta de la empresa
Kimberly-Clark.

Notación:
● Z t : Venta en toneladas de productos de limpieza.
● t : Periodo de tiempo trimestral desde enero del 2016 hasta diciembre
del 2021, es decir, t = 1,2,…,20.

Apartir de la variable de interés general, la cual es -------------


decidimos ampliar la vista por ----------

9.2. Fuente de información:


Se usará datos reales sobre la venta de productos de limpieza, una de las
categorías que más posicionamiento ha tenido en el mercado peruano, generando
toneladas para una de las empresas de consumo masivo pertenecientes al grupo
Kimberly-Clark.

10. Análisis preliminar


En esta primera parte se analizará el comportamiento de de las ventas en
toneladas de los productos de limpieza. Los datos utilizados se obtuvieron de la nube
de producción.

Figura 1. Gráfico de la serie lineal de las ventas en toneladas de productos de


limpieza desde enero del 2016 hasta diciembre 2020.
10.1. Tendencia
A través del gráfico lineal de las ventas en toneladas de producto de
limpieza en el Perú mostrado en la figura 1, se observa una tendencia moderada
creciente, además en el gráfico notamos que hay una tendencia cambiante , es decir,
no es estacionaria en tendencia. Notamos cierta aleatoriedad. En cierta parte de la
serie de tiempo observamos ciertas bajas en las ventas y esto debido al llamado
‘impacto COVID-19’ que afectó de forma drástica en el mes de Marzo del 2020, debido
a que el país no esperaba ni estaba preparado para tal impase mundial.

10.2 Estación
No existe una marcada estación de trimestre a trimestre desde enero
del 2016 hasta diciembre del 2020.

10.3 Estacionariedad

Figura 2. Gráfico del correlograma de la serie de las ventas en toneladas de productos


de limpieza, Enero 2016 – Diciembre 2020

El gráfico lineal de la serie de tiempo anticipado evidencia la


propiedad de no estacionariedad, pues la tendencia es fiel reflejo de que la media de
la serie no es constante además de ello la varianza de tiempo tampoco es constante.
Si hacemos uso de la transformación, la serie de tiempo se volvería estacionaria, por
ende, es necesaria de aplicar una transformación a la serie de tiempo. El método de
transformación es oportuno ante la no estacionariedad en media, la cual elimina la
tendencia, a través de la diferencia entre cada valor de la serie con su valor anterior
inmediato.
11. Metodología para el ajuste del modelo.
Analizamos la serie transformada, y esto nos permitirá comprobar si la serie de tiempo
se podría convertir en una serie de tiempo estacionaria y así poder examinar dicha
propiedad. Al hacer el análisis obtenemos un 𝜆 = −0.6676984 , con este valor obtenido
podemos realizar una transformación de inversa de raíz cuadrada y esto debido a
estar cercano a -0.5. Al realizar la transformación haremos un análisis exploratorio
comparativo de la serie de tiempo transformada con el 𝜆 dado comparado con la serie
no transformada.

Figura 3. Gráfico (NOSÉ SI VA O NO ESTE GRÁFICO)

La prueba de KPSS para un nivel estacionario, planteamos lo siguiente:


𝐻0 : La serie es estacionaria, no tiene raíz unitaria

Dado que el p-value =0.01 es menor a 0.05 , entonces se dice que rechazamos 𝐻0 por
lo tanto no es estacionaria, por lo cual se procederá a diferenciar la serie.
En el análisis previo de la serie de tiempo comparada encontramos que, a pesar de la
transformación, la serie de tiempo transformada no presenta estacionariedad por lo cual
necesitaremos hacer uso de una diferenciación adicional.
Como mencionamos con anterioridad, la mayor parte de las series de tiempo son no
estacionarias. Es por eso que, para ajustar a una serie de tiempo no estacionaria, es
necesario eliminar la fuerte variación no estacionaria. Si la serie de tiempo en cuestión
no es estacionaria en la media, lo cual implica que la serie presenta en su
comportamiento una tendencia de tipo polinomial no determinista ( no estacionariedad
homogénea), entonces se podría decir que podemos tomar las diferencias de las series
de tal forma de obtener una serie estacionaria.
Notamos que tanto la serie de tiempo no transformada y la serie transformada en sus
ACFs presentan un comportamiento de tendencia leve, esto nos indica en primera
instancia que la serie transformada presenta no estacionariedad al igual que la serie no
transformada. Dado la tendencia presenta en la serie no transformada y transformada.
El modelo tiene una no estacionariedad en media.
ANÁLISIS EXPLORATORIO EN SERIE DE TIEMPO DIFERENCIADA Y
TRANSFORMADA.

Figura 4. Gráfica de la serie de tiempo transformada y diferenciada.


En la figura 4 podemos observar que solo el primer rezago es diferente de cero,
entonces esos tres rezagos de la P ACF son sobresalientes y moderadas al igual que
la serie no transformada. Por lo tanto, concluimos que se debe realizar un modelo
ARIMMA. Realizaremos una prueba KPS para ver si existe una raíz unitaria, si
encontramos dicha raíz concluiremos que es un modelo ARIMA, en caso contrario
estaremos frente a un modelo ARMA.
La prueba de KPSS para Level Stationarity
𝐻0 ∶ La serie es estacionaria, no tiene raíz unitaria.

El valor p-value es 0.1, entonces no se rechaza 𝐻0 , por lo cual se asumirá que la serie
de tiempo es estacionaria.
Entonces dada la presente información, donde la serie de tiempo tiene tendencia y por
las pruebas realizadas previamente, confirmamos que sigue un proceso ARIMA, el
siguiente paso es analizar cual es el mejor modelo ARIMA a seguir.

MODELAMIENTO EXPERTO O AUTOMÁTICO:


Dado que el mejor modelo presentado es ARIMA(2,1,0), nos indica que el mejor
modelo ARIMA presenta dos parámetros, el Autoregresivo (AR) con diferenciación de
orden 1 y no se tiene parámetros para el modelo Medias Móviles (MA)

Debido a que se rechazó 𝐻0 , podemos decir que la serie tiene raíz unitaria y, por ende,
confirmamos que es un MODELO ARIMA. Una vez confirmada por última instancia
que es un modelo ARIMA, se procederá a realizar la diferenciación dada para poder
observar si de esta forma se obtiene una estacionariedad.

Estimación de los parámetros del modelo


df AIC
M1 4 289.4598
M2 3 -241.3272
df AIC
M1 4 293.2375
M2 3 -238.4939

Diagnóstico: Análisis de residuales


Figura 5. Gráfica
Figura 6. Gráfica de

Normalidad de los errores


Realizamos un test de normalidad de los errores que mide la curtosis. Nos muestra
que la serie es óptima y que podremos encontrar buenos pronóstico con el modelo
ARIMA

𝑋2 0.12646
df 2
p-value 0.9387

Pronósticos
Previsión de Lo 95 Hi 95
puntos
2021 Q1 4459.461 3649.340 5269.581
2021 Q2 5775.873 4965.276 6586.469
Breve descripción
Figura 7. Gráfica
F2_E1 MEDIA X95. X95. .1
4459.461 3649.340 5269.581
5775.873 4965.276 6586.469

MODELO AJUTADO POR LA MEDIA MOVIL DOBLE


Dado que en el segundo trimestre del 2020, observamos la existencia de un
outlier. Buscamos analizar que tanto que tanto afecta ee cambio brusco en el
modelo de ventas para productos de limpieza para lo cual se hace un escenario
donde el valor de cambio brusco es reeamplazado por un valor promedio
ajustado usando medias m

También podría gustarte