Documentos de Académico
Documentos de Profesional
Documentos de Cultura
pronósticos
para la toma
de decisiones
Estadística y series
de tiempo
Tema 6. Patrón de
datos en las series
de tiempo y análisis
de autocorrelación
Una serie de tiempo se basa en una serie de puntos de datos espaciados de manera uniforme (semanal, mensual,
trimestral, tetramensual, etc.). Ejemplos de estos puntos incluyen las ventas semanales de computadoras, los
envíos diarios de una empresa de paquetería, los índices anuales de precios al consumidor, el pronóstico de
lluvias para el siguiente ciclo agrícola, etc.
Ya observamos en el tema pasado que los patrones de datos que incluyen componentes como la tendencia
y la estacionalidad se pueden estudiar si se analizan las series de tiempo. ¿Cómo analizarlas para encontrar
una relación entre estas series de tiempo? Para hacerlo tendremos que emplear un concepto denominado
Autocorrelación.
Pero antes de continuar con las series de tiempo tendremos que revisar primero qué es la correlación entre dos
variables, que es el primer concepto que debemos profundizar antes de comenzar con las series de tiempo.
Antes de definir lo que es una autocorrelación, primero debes saber exponer lo que significa la correlación.
Pensemos en el siguiente ejemplo, seguramente cuando navegas en cualquier red social de repente te salen
ventanas emergentes con alguna publicidad, ¿qué relación tiene la publicidad con las ventas de una empresa?
La siguiente tabla muestra los ingresos de una empresa y su inversión en publicidad. Apliquemos nuestro
concepto al mundo real.
A continuación, se presentan los gastos anuales en publicidad y los ingresos de un restaurante de la localidad:
•¿Qué porcentaje de los ingresos que tenía la empresa en el año 2012 eran destinados a la publicidad de la
misma?
•¿Cómo medirías la relación entre las dos variables? ¿Qué variable quieres explicar, la publicidad o los ingresos
de la empresa?
1. De manera visual, podemos realizar una simple exploración y observar qué pasa con los ingresos de la
empresa a medida que se incrementa el gasto en publicidad. ¿Qué tipo de relación observas? ¿Una relación
positiva, negativa o no hay relación?
2. Para realizar una gráfica abrimos Excel, damos clic en la pestaña insertar, seleccionamos gráfico de
dispersión y obtenemos una gráfica para ambas variables. Agregando como variable Y (los datos del ingreso) y
como variable X (los datos de la inversión en publicidad). De esta forma visualmente podrás descubrir el tipo de
relación que tienen estas dos variables.
c. Hasta la segunda opción hemos empleado herramientas muy básicas, pero existe algo más allá que
me pueda servir para medir la correlación entre las dos variables. A mediados del siglo XIX, Francis
Galton tuvo la preocupación con la relación existente entre personas emparentadas y su altura, algo tan
simple como la relación entre estas variables. No fue hasta 1895 que Pearson resolvió las propiedades
matemáticas del coeficiente de correlación y propuso la fórmula que estudiarás más adelante.
Esta fórmula presenta un resultado que oscila entre -1 pasa por 0 y va hasta 1. Si el signo obtenido en
el coeficiente de correlación es negativo, significa que existe una relación negativa entre dos variables
y, si el signo es positivo, significa que las variables tienen una relación positiva como es el caso que
estamos estudiando del ejemplo de los ingresos y la publicidad del restaurante de la localidad. Pues bien,
al ingresar la fórmula de Excel =COEF.DE.CORREL (celdas de X, celdas de Y), obtendremos el valor de
0.83, ¿qué significa este valor? De acuerdo con la tabla que te muestro a continuación, significa que existe
una fuerte correlación entre los ingresos y los gastos en publicidad.
Eso quiere decir que gastar en publicidad es una muy buena decisión en la empresa. ¿Significa que
todas las empresas tienen que gastar en publicidad?, no. Significa que, para este caso, sí es significativo
invertir en publicidad, en la práctica habrá empresas cuyo gasto en publicidad no es relevante y, por eso,
es importante que tú aprendas estas herramientas y seas capaz de tomar decisiones importantes para
una empresa.
Para comprender con mayor profundidad los rangos de este coeficiente, analicemos el siguiente gráfico:
Esta pantalla se obtuvo directamente del software que se está explicando en la computadora.
Solo para fines educativos.
Entre más cercano, la correlación será más fuerte. Y entre más cercano sea a 0 la correlación será más débil o
prácticamente nula cuando el coeficiente de correlación es 0.
Es decir, si en este caso la publicidad y los ingresos hubieran tenido un coeficiente de correlación de 0.1, por
mencionar un ejemplo, entonces, no habría evidencia suficiente para suponer que invertir en publicidad es
bueno para la empresa.
Ya aprendimos una herramienta sencilla pero poderosa para ver cómo se correlacionan dos variables. Y este
análisis de correlación se puede utilizar para correlacionar dos variables, cualesquiera que sean. ¿Qué otros
ejemplos podríamos suponer? Platícalo con tu profesor en la clase.
Es importante mencionar que estos mismos valores, pero de forma negativa, indican también el tipo de
correlación, pero que en la medida que aumenta una variable, disminuye otra, como sucedió en el caso de las
calificaciones y las faltas.
Coeficiente de correlación
Supongamos que eres el gerente del área de mantenimiento de una empresa muy importante de Autobuses.
Se te ha encargado como gerente, presentar un informe del costo asociado por mantener un autobús y la edad
que tiene dicho vehículo. ¿Es fácil obtener estos datos en la vida real? Claro que sí. Bastará con pedir al área de
mantenimiento los costos por cada autobús en la empresa, y solicitar el número de años que tiene el vehículo,
y con eso construiremos la siguiente tabla.
En la figura anterior, es claro que valores grandes de X corresponden a valores grandes de Y; de allí el valor
positivo de la correlación (0.937673261).
Recuerda que:
Repasemos ahora directamente con la fórmula de Excel y cómo llegamos de forma simple al número que
calculamos de forma manual, primero agregamos en la celda en donde queramos calcular el coeficiente de
correlación la fórmula siguiente =COEF.DE.CORREL.
Como podemos observar, obtuvimos el mismo resultado que cuando lo realizamos de forma manual anteriormente.
¿Cuál de las dos formas te pareció más sencilla?. Pues seguramente con el uso de la tecnología, pero también
es sumamente importante que conozcas cómo realiza los cálculos Excel, ya que si en alguna ocasión, se cortó
el suministro de energía eléctrica y te quedaste sin herramientas tecnológicas, ya desarrollaste la habilidad de
hacerlo manual.
Muy bien, esperamos que se haya comprendido con claridad el concepto de correlación y que seguiremos
abordando de aquí en adelante en el curso.
Bien pues ahora es momento de hablar de la autocorrelación, ahora este término ya no parece tan ajeno a tu
aprendizaje. Pero ¿Qué significa?. En los ejercicios anteriores, abordamos los resultados para dos variables.
¿Qué sucede cuando sólo tenemos una variable y esta variable es una serie de tiempo? Pues bien, lo que
tendremos que hacer, es ver cómo se correlaciona consigo misma a lo largo del tiempo. Pues este es el concepto
de Autocorrelación.
Veamos lo siguiente:
Coeficiente de autocorrelación
Cuando los datos son de series de tiempo, los errores a menudo están correlacionados. Los términos de los
errores que están correlacionados a través del tiempo se dice que están autocorrelacionados o serialmente
correlacionados.
Autocorrelación es la correlación que existe entre una variable cuando se retarda uno o más periodos consigo
misma. Es muy importante tomarlo en cuenta, porque, por ejemplo, volviendo al cuadro anterior de los gastos
de publicidad, muchas de las veces, el gasto de publicidad en enero traerá resultados de ventas hasta febrero
y el éxito de la publicidad en febrero, probablemente se reflejará en las ventas de marzo. Así, generalmente, en
todos los meses del año es probable que exista un desfase de tiempo.
Al omitir los periodos 1 y 9 (debido a que una serie o la otra no tienen valor en ellos), puede calcularse la
correlación entre Yt y Yt - 1 mediante la expresión:
En donde:
rk = coeficiente de autocorrelación para un retardo de k periodos
= media de los valores de la serie
Yt = observación en el periodo t
Yt - k = observación en k periodos anteriores o durante el periodo t-k
Para interpretar la función de autocorrelación se necesita un método para probar cuáles de las autocorrelaciones
rk son estadísticamente diferentes de cero. Una prueba aproximada se presenta enseguida.
Hipótesis:
En el presente caso, puesto que 0.5855 es menor que 2 ⁄ √n = 2 ⁄ √8 = 0.7071, no hay razón para descartar la H0,
es decir, puede concluirse que no existe suficiente evidencia para indicar que la autocorrelación sea diferente
de cero.
Checkpoint
Asegúrate de comprender:
• Los términos correlación y autocorrelación.
Referencias bibliográficas
Newbold. P., Carlson W. ,Thorne. B. (2013). Estadística para Administración y Economía (8a ed.). USA:
Pearson.
Rodríguez, J., Pierdant, A., y Rodríguez, E. (2016). Estadística para administración (2a ed.). México: Patria.