Está en la página 1de 15

Estadística y

pronósticos
para la toma
de decisiones

Estadística y series
de tiempo

Tema 6. Patrón de
datos en las series
de tiempo y análisis
de autocorrelación

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
1
Introducción
Generalmente en los pronósticos se trabaja con datos históricos en un intento por predecir un futuro incierto.
Cada día los administradores toman decisiones sin saber lo que ocurrirá en el futuro. Se ordena el inventario
aunque nadie sabe cómo serán las ventas; se compra nuevo equipo aunque nadie conozca la demanda de los
productos; y se realizan inversiones aunque nadie sabe cómo serán las utilidades. Al seleccionar un método de
pronósticos adecuado para los datos a través del tiempo, uno de los aspectos más importantes a considerar es
la identificación de las distintas clases de patrones en los datos.

Una serie de tiempo se basa en una serie de puntos de datos espaciados de manera uniforme (semanal, mensual,
trimestral, tetramensual, etc.). Ejemplos de estos puntos incluyen las ventas semanales de computadoras, los
envíos diarios de una empresa de paquetería, los índices anuales de precios al consumidor, el pronóstico de
lluvias para el siguiente ciclo agrícola, etc.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
02
Explicación
Hemos visto en el tema 5 los tipos de series de tiempo que existen. ¿Cómo saber que estas series de tiempo
son significativas y pueden servirnos para realizar un pronóstico? A continuación. analizaremos uno de los
conceptos más sencillos pero poderosos en el sentido de ver cómo se relaciona una variable con otra. Hablando
de una serie de tiempo, queremos saber cómo se relaciona esta variable con su pasado, ¿cierto? Imaginemos
que quieres conocer cómo estás el día de hoy, por como tú eras en tu pasado, ¿te parece lógico?

Ya observamos en el tema pasado que los patrones de datos que incluyen componentes como la tendencia
y la estacionalidad se pueden estudiar si se analizan las series de tiempo. ¿Cómo analizarlas para encontrar
una relación entre estas series de tiempo? Para hacerlo tendremos que emplear un concepto denominado
Autocorrelación.

Pero antes de continuar con las series de tiempo tendremos que revisar primero qué es la correlación entre dos
variables, que es el primer concepto que debemos profundizar antes de comenzar con las series de tiempo.
Antes de definir lo que es una autocorrelación, primero debes saber exponer lo que significa la correlación.
Pensemos en el siguiente ejemplo, seguramente cuando navegas en cualquier red social de repente te salen
ventanas emergentes con alguna publicidad, ¿qué relación tiene la publicidad con las ventas de una empresa?

¿Te parece lógico esta pregunta? Pues veamos.

La siguiente tabla muestra los ingresos de una empresa y su inversión en publicidad. Apliquemos nuestro
concepto al mundo real.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
03
Coeficiente de correlación

A continuación, se presentan los gastos anuales en publicidad y los ingresos de un restaurante de la localidad:

Después de haber analizado la tabla, contesta las siguientes preguntas:

•¿A mayores gastos de publicidad se observa un incremento en los ingresos?

•¿Qué porcentaje de los ingresos que tenía la empresa en el año 2012 eran destinados a la publicidad de la
misma?

•¿Cómo medirías la relación entre las dos variables? ¿Qué variable quieres explicar, la publicidad o los ingresos
de la empresa?

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
04
Para poder contestar estas preguntas, podemos ir indagando alguna de las opciones que se presentan a
continuación:

1. De manera visual, podemos realizar una simple exploración y observar qué pasa con los ingresos de la
empresa a medida que se incrementa el gasto en publicidad. ¿Qué tipo de relación observas? ¿Una relación
positiva, negativa o no hay relación?

2. Para realizar una gráfica abrimos Excel, damos clic en la pestaña insertar, seleccionamos gráfico de
dispersión y obtenemos una gráfica para ambas variables. Agregando como variable Y (los datos del ingreso) y
como variable X (los datos de la inversión en publicidad). De esta forma visualmente podrás descubrir el tipo de
relación que tienen estas dos variables.

3. De manera exacta, utilizando la fórmula de correlación de Excel agregando la fórmula. COEF.DE.CORREL,


seleccionamos primero los datos de gastos en publicidad, agregamos una coma y posteriormente agregamos
los datos de los ingresos.
a. De manera visual, lo que observamos es que a medida que se incrementan los gastos en publicidad
también se incrementan los ingresos de la empresa ¿Es suficiente esta interpretación? ¿Te quedas
satisfecho?

b. La gráfica de dispersión también nos mostrará si los datos se relacionan.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
05
En esta segunda forma de presentar la información, observamos con mayor claridad que en la medida que la
empresa invierte en publicidad sus ingresos van aumentando ¿Es suficiente esta gráfica? ¿Podemos hacer algo
más con ello?

c. Hasta la segunda opción hemos empleado herramientas muy básicas, pero existe algo más allá que
me pueda servir para medir la correlación entre las dos variables. A mediados del siglo XIX, Francis
Galton tuvo la preocupación con la relación existente entre personas emparentadas y su altura, algo tan
simple como la relación entre estas variables. No fue hasta 1895 que Pearson resolvió las propiedades
matemáticas del coeficiente de correlación y propuso la fórmula que estudiarás más adelante.

Esta fórmula presenta un resultado que oscila entre -1 pasa por 0 y va hasta 1. Si el signo obtenido en
el coeficiente de correlación es negativo, significa que existe una relación negativa entre dos variables
y, si el signo es positivo, significa que las variables tienen una relación positiva como es el caso que
estamos estudiando del ejemplo de los ingresos y la publicidad del restaurante de la localidad. Pues bien,
al ingresar la fórmula de Excel =COEF.DE.CORREL (celdas de X, celdas de Y), obtendremos el valor de
0.83, ¿qué significa este valor? De acuerdo con la tabla que te muestro a continuación, significa que existe
una fuerte correlación entre los ingresos y los gastos en publicidad.

Eso quiere decir que gastar en publicidad es una muy buena decisión en la empresa. ¿Significa que
todas las empresas tienen que gastar en publicidad?, no. Significa que, para este caso, sí es significativo
invertir en publicidad, en la práctica habrá empresas cuyo gasto en publicidad no es relevante y, por eso,
es importante que tú aprendas estas herramientas y seas capaz de tomar decisiones importantes para
una empresa.

Para comprender con mayor profundidad los rangos de este coeficiente, analicemos el siguiente gráfico:

Esta pantalla se obtuvo directamente del software que se está explicando en la computadora.
Solo para fines educativos.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
06
Conclusión sobre los valores de correlación: En la medida que los valores se acercan a -1 (correlación
negativa) o a 1 (Correlación positiva). La relación entre las dos variables tenderá a ser más fuerte. Es decir,
deseamos que el coeficiente de correlación esté cercano a -1 o a 1.

Entre más cercano, la correlación será más fuerte. Y entre más cercano sea a 0 la correlación será más débil o
prácticamente nula cuando el coeficiente de correlación es 0.

Es decir, si en este caso la publicidad y los ingresos hubieran tenido un coeficiente de correlación de 0.1, por
mencionar un ejemplo, entonces, no habría evidencia suficiente para suponer que invertir en publicidad es
bueno para la empresa.

Ya aprendimos una herramienta sencilla pero poderosa para ver cómo se correlacionan dos variables. Y este
análisis de correlación se puede utilizar para correlacionar dos variables, cualesquiera que sean. ¿Qué otros
ejemplos podríamos suponer? Platícalo con tu profesor en la clase.

Es importante mencionar que estos mismos valores, pero de forma negativa, indican también el tipo de
correlación, pero que en la medida que aumenta una variable, disminuye otra, como sucedió en el caso de las
calificaciones y las faltas.

Es momento de hacer cálculos de forma manual, así que a trabajar.

Coeficiente de correlación

Como ya hemos descubierto anteriormente, ya supimos calcular el coeficiente de correlación con la


fórmula de Excel. Ahora es momento de comprender qué hace la fórmula. Así que manos a la obra,
hagámoslo de forma manual.
El coeficiente de correlación se estima mediante la expresión:

En donde se explica cada uno de los elementos de la fórmula.


r denota el coeficiente de correlación. A veces puede presentarse como R.
n= número de datos a revisar en el problema. Como estamos analizando dos variables, sólo se toma en cuenta
el número de datos de una variable.
X= son los datos de la variable X.
Y= son los datos de la variable Y.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
07
Muy bien, entendamos la fórmula resolviendo el siguiente ejemplo.

Supongamos que eres el gerente del área de mantenimiento de una empresa muy importante de Autobuses.

Se te ha encargado como gerente, presentar un informe del costo asociado por mantener un autobús y la edad
que tiene dicho vehículo. ¿Es fácil obtener estos datos en la vida real? Claro que sí. Bastará con pedir al área de
mantenimiento los costos por cada autobús en la empresa, y solicitar el número de años que tiene el vehículo,
y con eso construiremos la siguiente tabla.

Tabla 1. Costos de mantenimiento por autobús en una empresa de autotransportes.

Autobús Costo de Mantenimiento Anual (S) Y Antigüedad (años) X


1 $ 9,878.50 8
2 $ 7,843.00 5
3 $ 5,416.50 3
4 $ 8,142.00 9
5 $ 12,581.00 11
6 $ 2,576.00 2
7 $ 3,680.00 1
8 $ 7,486.50 8
9 $ 12,063.50 12

Lo primero que realizaremos será un gráfico de dispersión.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
08
En el diagrama de dispersión puede notarse la relación positiva entre ambas variables, como en nuestro
primer ejemplo de los ingresos y la publicidad, sin embargo, puede notarse que, en forma general el costo de
mantenimiento (Y) tiende a incrementarse cuando se incrementa la antigüedad (X) de un autobús. Cuando dos
variables tales como estas en las que sus valores tienden a aumentar o disminuir juntos, se dice que existe una
relación positiva entre las dos variables.

Para obtener el coeficiente de correlación, es conveniente formar la siguiente tabla.


Autobús Costo de Mantenimiento Anual (S) Y Antigüedad (años) X X*Y X2 Y2
1 $ 9,878.50 8 79082 64 97584762.25
2 $ 7,843.00 5 39215 25 61512649
3 $ 5,416.50 3 16249.5 9 29338472.25
4 $ 8,142.00 9 73278 81 66292164
5 $ 12,581.00 11 138391 121 158281561
6 $ 2,576.00 2 5152 4 6635776
7 $ 3,680.00 1 3680 1 13542400
8 $ 7,486.50 8 59892 64 56047682.25
9 $ 12,063.50 12 144762 144 145528032.3
Total $ 69,667.00 59 559647.5 513 634763499

Sustitución de valores en la fórmula para la realización en forma manual:

En la figura anterior, es claro que valores grandes de X corresponden a valores grandes de Y; de allí el valor
positivo de la correlación (0.937673261).

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
09
Qué significa este valor, pues que efectivamente la antigüedad de los autobuses explica muy fuertemente al
costo de mantenimiento de los mismos. Quiere decir que entre más viejo es un autobús, cuesta más mantenerlo.
Lo cuál es lógico. Bien, de esta manera, podemos relacionar con la correlación dos variables cualquiera, hacerle
el análisis de correlación y comprender con profundidad el poder de este indicador.

Recuerda que:

La correlación es una medida de asociación entre dos variables, que


tiene las siguientes propiedades:
1. Es independiente de las unidades de medida utilizadas en las
variables.
2. Valores positivos del coeficiente indican que las variables tienden
a crecer (o decrecer) simultáneamente, y valores negativos indican
que una aumenta cuando la otra disminuye.
3. Toma valores exclusivamente entre -1 y 1.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
10
También puedes hacer uso del Excel

Repasemos ahora directamente con la fórmula de Excel y cómo llegamos de forma simple al número que
calculamos de forma manual, primero agregamos en la celda en donde queramos calcular el coeficiente de
correlación la fórmula siguiente =COEF.DE.CORREL.

Seleccionamos primero la variable X que este caso es la antigüedad:

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
11
Damos clic en la tecla “enter” de nuestro teclado, y listo...

Como podemos observar, obtuvimos el mismo resultado que cuando lo realizamos de forma manual anteriormente.

¿Cuál de las dos formas te pareció más sencilla?. Pues seguramente con el uso de la tecnología, pero también
es sumamente importante que conozcas cómo realiza los cálculos Excel, ya que si en alguna ocasión, se cortó
el suministro de energía eléctrica y te quedaste sin herramientas tecnológicas, ya desarrollaste la habilidad de
hacerlo manual.

Muy bien, esperamos que se haya comprendido con claridad el concepto de correlación y que seguiremos
abordando de aquí en adelante en el curso.

Bien pues ahora es momento de hablar de la autocorrelación, ahora este término ya no parece tan ajeno a tu
aprendizaje. Pero ¿Qué significa?. En los ejercicios anteriores, abordamos los resultados para dos variables.
¿Qué sucede cuando sólo tenemos una variable y esta variable es una serie de tiempo? Pues bien, lo que
tendremos que hacer, es ver cómo se correlaciona consigo misma a lo largo del tiempo. Pues este es el concepto
de Autocorrelación.

Veamos lo siguiente:

Coeficiente de autocorrelación

Cuando los datos son de series de tiempo, los errores a menudo están correlacionados. Los términos de los
errores que están correlacionados a través del tiempo se dice que están autocorrelacionados o serialmente
correlacionados.

Autocorrelación es la correlación que existe entre una variable cuando se retarda uno o más periodos consigo
misma. Es muy importante tomarlo en cuenta, porque, por ejemplo, volviendo al cuadro anterior de los gastos
de publicidad, muchas de las veces, el gasto de publicidad en enero traerá resultados de ventas hasta febrero
y el éxito de la publicidad en febrero, probablemente se reflejará en las ventas de marzo. Así, generalmente, en
todos los meses del año es probable que exista un desfase de tiempo.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
12
Considérese el siguiente ejemplo:

Al omitir los periodos 1 y 9 (debido a que una serie o la otra no tienen valor en ellos), puede calcularse la
correlación entre Yt y Yt - 1 mediante la expresión:

En donde:
rk = coeficiente de autocorrelación para un retardo de k periodos
= media de los valores de la serie
Yt = observación en el periodo t
Yt - k = observación en k periodos anteriores o durante el periodo t-k

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
13
El coeficiente de autocorrelación de retardo 1 (r1), es decir, la autocorrelación entre y Yt y Yt-1, se calcula con la
tabla que se presenta enseguida.

Para interpretar la función de autocorrelación se necesita un método para probar cuáles de las autocorrelaciones
rk son estadísticamente diferentes de cero. Una prueba aproximada se presenta enseguida.

Prueba de hipótesis para los coeficientes de autocorrelación

Hipótesis:

Hipótesis nula: H0 : ρk = 0 (la autocorrelación es igual a cero)


Hipótesis alternativa: Ha : ρk≠ 0 (la autocorrelación es diferente de cero)
Donde ρk es el coeficiente de autocorrelacional poblacional del lapso k.

Estadística de prueba: rk, el coeficiente de autocorrelación muestral del lapso k.


Región de rechazo: A un nivel aproximado de significancia de 0.05 (α ≈ 0.05), se rechaza H0 sí |rk| > 2 ⁄ √n

En el presente caso, puesto que 0.5855 es menor que 2 ⁄ √n = 2 ⁄ √8 = 0.7071, no hay razón para descartar la H0,
es decir, puede concluirse que no existe suficiente evidencia para indicar que la autocorrelación sea diferente
de cero.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
14
Cierre
La autocorrelación es importante, pues en problemas de regresión en los cuales las variables dependientes e
independientes están orientadas hacia el tiempo o son datos de series de tiempo, a menudo es insostenible la
consideración de errores no correlacionados. Por ejemplo, supóngase que se realizó la regresión de las ventas
trimestrales de un producto en relación con los gastos trimestrales en el lugar de venta. Ambas variables son
series de tiempo, y si están correlacionadas positivamente con otros factores como ingreso disponible y tamaño
de población, que no se incluyen en el modelo, entonces es posible que los términos de error en el modelo de
regresión estén correlacionados positivamente sobre el tiempo. Muchos problemas de regresión en economía,
administración y agricultura comprenden errores autocorrelacionados.

Checkpoint
Asegúrate de comprender:
• Los términos correlación y autocorrelación.

• Las etapas de la prueba de hipótesis para autocorrelación.

Referencias bibliográficas
Newbold. P., Carlson W. ,Thorne. B. (2013). Estadística para Administración y Economía (8a ed.). USA:
Pearson.
Rodríguez, J., Pierdant, A., y Rodríguez, E. (2016). Estadística para administración (2a ed.). México: Patria.

Tema 6. Patrón de datos en las series de tiempo y análisis de autocorrelación


Derechos de Autor Reservados. ENSEÑANZA E INVESTIGACIÓN SUPERIOR A.C. (UNIVERSIDAD TECMILENIO )
®
15

También podría gustarte