Proyecto Pronosticos Covid

Conclusión
Gracias a los métodos y modelos empleados es posible concluir que el método

de pronostico con menor margen de error, es ARIMA , así mismo, se concluye
que los datos presentados son estacionarios.
Por su parte, al aplicar las diferentes pruebas de normalidad, se concluye que

los datos no siguen una distribución normal, ya que los valores obtenidos de p
son considerablemente menores que los valores de alfa utilizados en las
pruebas correspondientes.
El conocimiento y correcta aplicación de estas herramientas ha permitido

obtener un panorama a futuro sobre los contagios en México de COVID-19, el
correcto análisis de los mismos permitirá tomar medidas preventivas sobre
posibles incrementos, ya que la predicción realizada refleja un aumento de
casos mayor al que se ha registrado históricamente desde febrero del 2020
hasta marzo del 2022, este análisis ha permitido aplicar adecuadamente las
herramientas adquiridas durante la materia.
Universidad Autónoma de Nuevo León
Facultad de Ingeniería Mecánica y Eléctrica
Maestría en Logística y Cadena de Suministro
Ing. Maythe Carrillo Aguilar | 2127031
PLANEACIÓN DE LA DEMANDA Y PRONÓSTICOS
Análisis de los datos registrados de casos de COVID-19 en

México de febrero 2020 a marzo 2022
Introducción
El conjunto de datos en la crisis sanitaria que se presentó desde marzo del
2019, ha permitido obtener una respuesta apropiada y eficaz en cuanto a
los factores que enlentecen o aceleran la transmisión, el registro de estos
datos permite el conocimiento y determinación del patrón de crecimiento
de contagios en los países. Este conjunto de datos se constituye por series
temporales, las cuales recolectan los números de contagios identificados;
el procesamiento de estos permite la adopción de medidas orientadas a la
reducción de contagios, o a la ralentización de los mismos.
Para el análisis de los datos, se emplearon herramientas de pronósticos,

entre las cuales se encuentran, el promedio móvil simple, promedio móvil
ponderado, suavizado exponencial simple, suavizado exponencial doble,
así mismo, se determinaron los errores de estos, utilizando la desviación
media absoluta, el error porcentual medio absoluto, y error cuadrático
medio, posterior a esto se realizó el análisis de los datos aplicando los
intervalos de confianza, así como el modelo autorregresivo integrado de
media móvil y la regresión local Lowess contemplando la siguiente
información:
Promedio móvil simple

Este método permite suavizar los datos históricos calculando el promedio de
los últimos periodos y proyectando el último valor promedio hacia delante.
Cada punto de una media móvil de una serie temporal es la media aritmética
de un número de puntos consecutivos de la serie, donde el número de puntos
es elegido de tal manera que los efectos estacionales y / o irregulares sean
eliminados.
Fórmula Código Rstudio
Resultados
En la gráfica se puede observar en color verde el comportamiento de los

resultados obtenidos en comparación con los datos de contagios en México,
para analizar la fiabilidad del pronostico se realizó el cálculo de los errores del
pronóstico el cual se mostrara en comparativa más adelante.
Promedio móvil ponderado

A comparación del método de promedio móvil simple en le cual se asigna
igual importancia a todos los datos de la demanda pasada, el método de
promedio móvil ponderado permite calcular pronósticos asignando más peso
para los elementos que sean considerados, para el análisis de los datos se
asignaron pesos de: 0.1, 0.3, y 0.6.
Resultados
En la gráfica se puede observar en color azul los resultados obtenidos con la
formula del promedio móvil ponderado, este método permite reaccionar más
rápido ante los cambios de la demanda, con relación al promedio simple, para
analizar la fiabilidad del pronóstico se realizó el cálculo de los errores del
pronóstico el cual se mostrara en comparativa más adelante.
Suavización exponencial simple

Este método permite predecir qué va a pasar y lo que hace es suavizar la serie
temporal. El objetivo es reducir las fluctuaciones y conseguir observar una
tendencia que a veces no está clara a simple vista, es óptimo para patrones de
demanda aleatorios o nivelados donde se pretende eliminar el impacto de los
elementos irregulares históricos mediante un enfoque en períodos de
demanda reciente.
Resultados
En la gráfica se puede observar en color naranja los resultados obtenidos con la

formula de suavización exponencial simple, este resultado permite inferir que
los resultados obtenidos siguen estrechamente a los datos.
Suavización exponencial doble

El método de suavizamiento exponencial doble consiste en realizar dos
suavizaciones exponenciales a partir de las cuales se obtiene un pronóstico. El
cálculo consiste en aplicar una expresión a los valores observados en la serie de
tiempo y luego se realiza una segunda expresión a la serie atenuada obtenida
mediante la primera suavización. La técnica de suavizamiento exponencial
doble se usa para pronosticar series de tiempo que tienen tendencia lineal.
Resultados
Intervalos de confianza
Un intervalo de confianza es un rango de valores, derivado de los estadísticos
de la muestra, que posiblemente incluya el valor de un parámetro de
población desconocido. Debido a su naturaleza aleatoria, es poco probable
que dos muestras de una población en particular produzcan intervalos de
confianza idénticos.
Resultados
De acuerdo con los resultados obtenidos, permite tener una estimación del
valor real del parámetro poblacional, en este caso para tener el 95% de
confianza, los datos se encuentran entre -11815.28 y 26801.36.
Holt-Winters
Suaviza los datos mediante la suavización exponencial de Holt-Winters. Este
método se utiliza cuando hay tendencia y estacionalidad, siendo estos dos
componentes o aditivos o multiplicativos. El Método de Winters calcula
estimaciones dinámicas para tres componentes: nivel, tendencia y estacional.
Resultados
Casos de COVID-19
Holt-Winter Fitted
Holt-Winter Fitted
Codigo Rstudio
Promedio móvil integrado autorregresivo (ARIMA)
El modelo ARIMA utiliza las funciones de diferenciación, autocorrelación y
autocorrelación parcial para ayudar a identificar un modelo aceptable, puede
utilizarse para modelar muchas series de tiempo diferentes, con o sin
componentes de tendencia o estacionales y para generar pronósticos.
Código Rstudio
Resultado
Prueba Dickey-Fuller
La prueba ADF (Dickey-Fuller aumentada) es una prueba de significación

estadística, lo que significa que la prueba dará resultados en pruebas de
hipótesis nulas o hipótesis alternativas. Como resultado, se obtendrá un valor
p a partir del cual se realizan inferencias sobre la serie temporal, sea
estacionaria o no. Para estos datos se ha establecido como hipótesis nula: los
datos son no estacionarios y como hipótesis alternativa: que los datos son
estacionarios, por lo cual si el valor de p es menor a 0.05 se rechaza la hipótesis
nula, en caso de que p sea mayor se acepta la hipótesis nula
Código Rstudio
Debido a que el valor de p arrojado por el modelo es menor a .05, se rechaza la
hipótesis nula, por lo cual los datos son estacionarios.
Código Rstudio
Concluyendo con los coeficientes del modelo, el resultado de la prueba
confirma que los datos son estacionarios, así mismo, es posible aplicar
diferentes pruebas de normalidad con los residuales del modelo ARIMA
presentados a continuación.
Jarque Bera Test
La prueba de Jarque Bera utiliza un estadístico de prueba que involucra la

curtosis y la asimetría. Intenta resolver si “Los residuos tienen una distribución
normal”, esta hipótesis nula se rechaza si p≤α.
Código Rstudio
De acuerdo al resultado obtenido, el valor p es considerablemente menor que

alfa=0.05, por lo cual se rechaza la hipótesis nula donde los datos siguen una
distribución normal.
Shapiro-Wilks test
El test de normalidad de Shapiro Wilks tiene por función descartar o confirmar
la hipótesis nula en donde los datos siguen una distribución normal, en esta
prueba se toma una significancia del 5% o 0.05, si el valor de p es mayor a la
significancia la hipótesis se acepta.
Código Rstudio
Como se puede observar, se obtiene el mismo valor de p, por lo cual se rechaza

la hipótesis nula, concluyendo que los datos no siguen una distribución
normal.
Histograma
Un histograma es una gráfica que nos permite observar la distribución de

datos numéricos usando barras. Cada barra representa la frecuencia en que se
observaron datos en un rango determinado.
Código Rstudio
Gráfico Cuantil-Cuantil
Un gráfico Cuantil-Cuantil permite observar cuan cerca está la distribución de
un conjunto de datos a alguna distribución ideal ó comparar la distribución de
dos conjuntos de datos.
Código Rstudio
Se puede observar en el gráfico que la distribución de los datos siguen una
cola larga, y pesada, en donde la mayoría de los datos se concentran al centro
de la gráfica. De esta forma, aplicamos el siguiente código para verificar los
residuales del modelo, y realizar la predicción de los datos.
Código Rstudio
En la gráfica anterior se puede observar el comportamiento de los contagios

en México hacia el 2023, esta predicción se realizo con los residuales del
modelo ARIMA, por lo cual se observan datos negativos.
Lowess
El término Lowess se refiere al "suavizado de diagrama de dispersión
ponderado localmente": el proceso de producir una curva suave que se ajusta a
los puntos de datos en un diagrama de dispersión.
Código Rstudio
Código Rstudio
Código Rstudio
Como se observa en la gráfica los valores mayores de suavizado crean

funciones más suaves, es decir que se mueven menos en respuesta de las
fluctuaciones de datos; así mismo, se puede observar que cuanto menor sea
este valor se aproxima más al ajuste de la función de regresión de los datos.
Cálculo de errores
El cálculo de errores permite tomar decisiones frente a qué método de
pronóstico es el mejor y logran detectar cuando algo en la previsión de la
demanda es irregular, con el objetivo de cambiar el rumbo de las decisiones a
fin tomar las mejores elecciones. El error del pronóstico se basa en sesgados y
aleatorios, el primero es ocasionado por un error constante, por ejemplo una
mala interpretación de la demanda, usar variables incorrectas o con relaciones
equivocadas, y el segundo es aquel que no tiene explicación.
Error cuadratico medio (MSE)

Es una medida de dispersión del error de pronóstico, sin embargo esta medida
maximiza el error al elevar al cuadrado, castigando aquellos periodos donde la
diferencia fue más alta a comparación de otros.
Error porcentual medio absoluto (MAPE)

Entrega la desviación en términos porcentuales y no en unidades como las
anteriores medidas. Es el promedio del error absoluto o diferencia entre la
demanda real y el pronóstico, expresado como un porcentaje de los valores
reales.
Desviación media absoluta (MAD)
Mide la dispersión del error de pronóstico o dicho de otra forma, la medición
del tamaño del error en unidades. Es el valor absoluto de la diferencia entre la
demanda real y el pronóstico, dividido sobre el número de periodos.
Resultados
Método MSE MAPE MAD
Promedio móvil
31718975 78 2867
simple
Promedio móvil
25483376 104 2629
ponderado
SES 26096542 68 2337
SED 41391524 92 2955

Holt-Winters 5018 99 5018
ARIMA 2169 54 1296
Lowess 22226028 48 2147
De acuerdo con los resultados obtenidos por el cálculo de errores se obtiene

que en comparación con los demás métodos, ARIMA cuenta con los datos más
cercanos a los registrados, con un margen de error menor a los demás, pese a
que Lowess tiene menor porcentaje en MAPE, en general ARIMA presenta los
errores más bajos

Proyecto Pronosticos Covid

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Proyecto Pronosticos Covid

Cargado por

Copyright:

Formatos disponibles

Conclusión

Gracias a los métodos y modelos empleados es posible concluir que el método

Por su parte, al aplicar las diferentes pruebas de normalidad, se concluye que

El conocimiento y correcta aplicación de estas herramientas ha permitido

PLANEACIÓN DE LA DEMANDA Y PRONÓSTICOS

Análisis de los datos registrados de casos de COVID-19 en

Para el análisis de los datos, se emplearon herramientas de pronósticos,

Promedio móvil simple

En la gráfica se puede observar en color verde el comportamiento de los

Promedio móvil ponderado

Suavización exponencial simple

En la gráfica se puede observar en color naranja los resultados obtenidos con la

Suavización exponencial doble

Fórmula Código Rstudio

La prueba ADF (Dickey-Fuller aumentada) es una prueba de significación

Jarque Bera Test

La prueba de Jarque Bera utiliza un estadístico de prueba que involucra la

De acuerdo al resultado obtenido, el valor p es considerablemente menor que

Como se puede observar, se obtiene el mismo valor de p, por lo cual se rechaza

Un histograma es una gráfica que nos permite observar la distribución de

En la gráfica anterior se puede observar el comportamiento de los contagios

Como se observa en la gráfica los valores mayores de suavizado crean

Error cuadratico medio (MSE)

Fórmula Código Rstudio

Error porcentual medio absoluto (MAPE)

Fórmula Código Rstudio

SES 26096542 68 2337

SED 41391524 92 2955

Lowess 22226028 48 2147

De acuerdo con los resultados obtenidos por el cálculo de errores se obtiene

También podría gustarte