Está en la página 1de 17

Conclusión

Gracias a los métodos y modelos empleados es posible concluir que el método


de pronostico con menor margen de error, es ARIMA , así mismo, se concluye
que los datos presentados son estacionarios.

Por su parte, al aplicar las diferentes pruebas de normalidad, se concluye que


los datos no siguen una distribución normal, ya que los valores obtenidos de p
son considerablemente menores que los valores de alfa utilizados en las
pruebas correspondientes.

El conocimiento y correcta aplicación de estas herramientas ha permitido


obtener un panorama a futuro sobre los contagios en México de COVID-19, el
correcto análisis de los mismos permitirá tomar medidas preventivas sobre
posibles incrementos, ya que la predicción realizada refleja un aumento de
casos mayor al que se ha registrado históricamente desde febrero del 2020
hasta marzo del 2022, este análisis ha permitido aplicar adecuadamente las
herramientas adquiridas durante la materia.
Universidad Autónoma de Nuevo León
Facultad de Ingeniería Mecánica y Eléctrica
Maestría en Logística y Cadena de Suministro
Ing. Maythe Carrillo Aguilar | 2127031

PLANEACIÓN DE LA DEMANDA Y PRONÓSTICOS

Análisis de los datos registrados de casos de COVID-19 en


México de febrero 2020 a marzo 2022

Introducción
El conjunto de datos en la crisis sanitaria que se presentó desde marzo del
2019, ha permitido obtener una respuesta apropiada y eficaz en cuanto a
los factores que enlentecen o aceleran la transmisión, el registro de estos
datos permite el conocimiento y determinación del patrón de crecimiento
de contagios en los países. Este conjunto de datos se constituye por series
temporales, las cuales recolectan los números de contagios identificados;
el procesamiento de estos permite la adopción de medidas orientadas a la
reducción de contagios, o a la ralentización de los mismos.

Para el análisis de los datos, se emplearon herramientas de pronósticos,


entre las cuales se encuentran, el promedio móvil simple, promedio móvil
ponderado, suavizado exponencial simple, suavizado exponencial doble,
así mismo, se determinaron los errores de estos, utilizando la desviación
media absoluta, el error porcentual medio absoluto, y error cuadrático
medio, posterior a esto se realizó el análisis de los datos aplicando los
intervalos de confianza, así como el modelo autorregresivo integrado de
media móvil y la regresión local Lowess contemplando la siguiente
información:

Promedio móvil simple


Este método permite suavizar los datos históricos calculando el promedio de
los últimos periodos y proyectando el último valor promedio hacia delante.
Cada punto de una media móvil de una serie temporal es la media aritmética
de un número de puntos consecutivos de la serie, donde el número de puntos
es elegido de tal manera que los efectos estacionales y / o irregulares sean
eliminados.
Fórmula Código Rstudio

Resultados

En la gráfica se puede observar en color verde el comportamiento de los


resultados obtenidos en comparación con los datos de contagios en México,
para analizar la fiabilidad del pronostico se realizó el cálculo de los errores del
pronóstico el cual se mostrara en comparativa más adelante.

Promedio móvil ponderado


A comparación del método de promedio móvil simple en le cual se asigna
igual importancia a todos los datos de la demanda pasada, el método de
promedio móvil ponderado permite calcular pronósticos asignando más peso
para los elementos que sean considerados, para el análisis de los datos se
asignaron pesos de: 0.1, 0.3, y 0.6.
Fórmula Código Rstudio

Resultados
En la gráfica se puede observar en color azul los resultados obtenidos con la
formula del promedio móvil ponderado, este método permite reaccionar más
rápido ante los cambios de la demanda, con relación al promedio simple, para
analizar la fiabilidad del pronóstico se realizó el cálculo de los errores del
pronóstico el cual se mostrara en comparativa más adelante.

Suavización exponencial simple


Este método permite predecir qué va a pasar y lo que hace es suavizar la serie
temporal. El objetivo es reducir las fluctuaciones y conseguir observar una
tendencia que a veces no está clara a simple vista, es óptimo para patrones de
demanda aleatorios o nivelados donde se pretende eliminar el impacto de los
elementos irregulares históricos mediante un enfoque en períodos de
demanda reciente.
Fórmula Código Rstudio

Resultados

En la gráfica se puede observar en color naranja los resultados obtenidos con la


formula de suavización exponencial simple, este resultado permite inferir que
los resultados obtenidos siguen estrechamente a los datos.

Suavización exponencial doble


El método de suavizamiento exponencial doble consiste en realizar dos
suavizaciones exponenciales a partir de las cuales se obtiene un pronóstico. El
cálculo consiste en aplicar una expresión a los valores observados en la serie de
tiempo y luego se realiza una segunda expresión a la serie atenuada obtenida
mediante la primera suavización. La técnica de suavizamiento exponencial
doble se usa para pronosticar series de tiempo que tienen tendencia lineal.
Fórmula Código Rstudio

Resultados

Intervalos de confianza
Un intervalo de confianza es un rango de valores, derivado de los estadísticos
de la muestra, que posiblemente incluya el valor de un parámetro de
población desconocido. Debido a su naturaleza aleatoria, es poco probable
que dos muestras de una población en particular produzcan intervalos de
confianza idénticos.

Fórmula Código Rstudio

Resultados

De acuerdo con los resultados obtenidos, permite tener una estimación del
valor real del parámetro poblacional, en este caso para tener el 95% de
confianza, los datos se encuentran entre -11815.28 y 26801.36.
Holt-Winters
Suaviza los datos mediante la suavización exponencial de Holt-Winters. Este
método se utiliza cuando hay tendencia y estacionalidad, siendo estos dos
componentes o aditivos o multiplicativos. El Método de Winters calcula
estimaciones dinámicas para tres componentes: nivel, tendencia y estacional.
Fórmula Código Rstudio

Resultados

Casos de COVID-19

Holt-Winter Fitted

Holt-Winter Fitted
Codigo Rstudio
Promedio móvil integrado autorregresivo (ARIMA)
El modelo ARIMA utiliza las funciones de diferenciación, autocorrelación y
autocorrelación parcial para ayudar a identificar un modelo aceptable, puede
utilizarse para modelar muchas series de tiempo diferentes, con o sin
componentes de tendencia o estacionales y para generar pronósticos.

Código Rstudio

Resultado
Prueba Dickey-Fuller

La prueba ADF (Dickey-Fuller aumentada) es una prueba de significación


estadística, lo que significa que la prueba dará resultados en pruebas de
hipótesis nulas o hipótesis alternativas. Como resultado, se obtendrá un valor
p a partir del cual se realizan inferencias sobre la serie temporal, sea
estacionaria o no. Para estos datos se ha establecido como hipótesis nula: los
datos son no estacionarios y como hipótesis alternativa: que los datos son
estacionarios, por lo cual si el valor de p es menor a 0.05 se rechaza la hipótesis
nula, en caso de que p sea mayor se acepta la hipótesis nula

Código Rstudio
Debido a que el valor de p arrojado por el modelo es menor a .05, se rechaza la
hipótesis nula, por lo cual los datos son estacionarios.

Código Rstudio
Concluyendo con los coeficientes del modelo, el resultado de la prueba
confirma que los datos son estacionarios, así mismo, es posible aplicar
diferentes pruebas de normalidad con los residuales del modelo ARIMA
presentados a continuación.

Jarque Bera Test

La prueba de Jarque Bera utiliza un estadístico de prueba que involucra la


curtosis y la asimetría. Intenta resolver si “Los residuos tienen una distribución
normal”, esta hipótesis nula se rechaza si p≤α.

Código Rstudio

De acuerdo al resultado obtenido, el valor p es considerablemente menor que


alfa=0.05, por lo cual se rechaza la hipótesis nula donde los datos siguen una
distribución normal.

Shapiro-Wilks test
El test de normalidad de Shapiro Wilks tiene por función descartar o confirmar
la hipótesis nula en donde los datos siguen una distribución normal, en esta
prueba se toma una significancia del 5% o 0.05, si el valor de p es mayor a la
significancia la hipótesis se acepta.
Código Rstudio

Como se puede observar, se obtiene el mismo valor de p, por lo cual se rechaza


la hipótesis nula, concluyendo que los datos no siguen una distribución
normal.

Histograma

Un histograma es una gráfica que nos permite observar la distribución de


datos numéricos usando barras. Cada barra representa la frecuencia en que se
observaron datos en un rango determinado.
Código Rstudio

Gráfico Cuantil-Cuantil
Un gráfico Cuantil-Cuantil permite observar cuan cerca está la distribución de
un conjunto de datos a alguna distribución ideal ó comparar la distribución de
dos conjuntos de datos.

Código Rstudio
Se puede observar en el gráfico que la distribución de los datos siguen una
cola larga, y pesada, en donde la mayoría de los datos se concentran al centro
de la gráfica. De esta forma, aplicamos el siguiente código para verificar los
residuales del modelo, y realizar la predicción de los datos.

Código Rstudio

En la gráfica anterior se puede observar el comportamiento de los contagios


en México hacia el 2023, esta predicción se realizo con los residuales del
modelo ARIMA, por lo cual se observan datos negativos.
Lowess
El término Lowess se refiere al "suavizado de diagrama de dispersión
ponderado localmente": el proceso de producir una curva suave que se ajusta a
los puntos de datos en un diagrama de dispersión.
Código Rstudio
Código Rstudio

Código Rstudio

Como se observa en la gráfica los valores mayores de suavizado crean


funciones más suaves, es decir que se mueven menos en respuesta de las
fluctuaciones de datos; así mismo, se puede observar que cuanto menor sea
este valor se aproxima más al ajuste de la función de regresión de los datos.
Cálculo de errores
El cálculo de errores permite tomar decisiones frente a qué método de
pronóstico es el mejor y logran detectar cuando algo en la previsión de la
demanda es irregular, con el objetivo de cambiar el rumbo de las decisiones a
fin tomar las mejores elecciones. El error del pronóstico se basa en sesgados y
aleatorios, el primero es ocasionado por un error constante, por ejemplo una
mala interpretación de la demanda, usar variables incorrectas o con relaciones
equivocadas, y el segundo es aquel que no tiene explicación.

Error cuadratico medio (MSE)


Es una medida de dispersión del error de pronóstico, sin embargo esta medida
maximiza el error al elevar al cuadrado, castigando aquellos periodos donde la
diferencia fue más alta a comparación de otros.

Fórmula Código Rstudio

Error porcentual medio absoluto (MAPE)


Entrega la desviación en términos porcentuales y no en unidades como las
anteriores medidas. Es el promedio del error absoluto o diferencia entre la
demanda real y el pronóstico, expresado como un porcentaje de los valores
reales.
Fórmula Código Rstudio
Desviación media absoluta (MAD)
Mide la dispersión del error de pronóstico o dicho de otra forma, la medición
del tamaño del error en unidades. Es el valor absoluto de la diferencia entre la
demanda real y el pronóstico, dividido sobre el número de periodos.

Fórmula Código Rstudio

Resultados
Método MSE MAPE MAD
Promedio móvil
31718975 78 2867
simple
Promedio móvil
25483376 104 2629
ponderado

SES 26096542 68 2337

SED 41391524 92 2955


Holt-Winters 5018 99 5018
ARIMA 2169 54 1296

Lowess 22226028 48 2147

De acuerdo con los resultados obtenidos por el cálculo de errores se obtiene


que en comparación con los demás métodos, ARIMA cuenta con los datos más
cercanos a los registrados, con un margen de error menor a los demás, pese a
que Lowess tiene menor porcentaje en MAPE, en general ARIMA presenta los
errores más bajos

También podría gustarte