Está en la página 1de 298

i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 5 — #21

Tema 1

Introducción a la previsión

1.1. Introducción

Cuando afirmamos «nadie puede predecir el futuro», todos pensamos que esa afirmación es
correcta, salvo que creamos en la brujería, la magia o la adivinación. Pero la propia afirmación
es, en sí misma, una predicción. Predicción además incondicional y determinista. Asegura
que no lo podremos hacer, ni ahora, ni en ningún momento, ni en ningún lugar, ni para
ninguna cuestión, ni incluso de forma aproximada. Esta contradicción (predecir que no se
puede predecir), habría que matizarla para que todos estuviéramos realmente de acuerdo con
ella.
Lo cierto, sin embargo, es que todos (incluso los más escépticos) utilizamos previsiones
constantemente y de forma rutinaria en nuestras decisiones más cotidianas. Por ejemplo,
todos hemos utilizado alguna vez la previsión meteorológica (el resumen de temperaturas,
la probabilidad de precipitación, etc.), y en base a ellas hemos decidido la ropa que nos
pondremos ese día. Y es que resulta prácticamente imposible, cuando tomamos cualquier
tipo de decisión (incluso la más trivial), no considerar las alternativas futuras del horizonte
temporal relevante.
Podemos definir la previsión de la siguiente forma.
Predicción, Previsión o Pronóstico
Estimación de un resultado real esperado en un futuro o para una situación determinada.
El ejemplo de la meteorología nos sirve para matizar la definición. Por un lado, está la
temperatura esperada (diaria o en una hora concreta) y por otro la predicción de una situación
determinada, cómo la lluvia. En ocasiones el pronóstico se hace indicando un determinado por-
centaje de probabilidad de un suceso determinado, por ejemplo, «hay un 90 % de probabilidad
de que llueva esta noche».
En definitiva, aunque todos sabemos que el futuro es inescrutable con exactitud y que
no está predeterminado. Todos utilizamos previsiones para tomar decisiones constantemente,
incluso para las cuestiones más triviales. Y lógicamente en la economía y en los negocios
ocurre exactamente lo mismo, los pronósticos son necesarios e ineludibles.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 6 — #22

6 Introducción a la previsión

1.1.1. ¿Por qué predecir?


La previsión es necesaria en muchas situaciones. La decisión de construir otra planta de
generación de energía en los próximos cinco años requiere pronósticos de la demanda futura.
Programar el personal en un centro de llamadas la próxima semana requiere pronósticos de
volúmenes de llamadas. Almacenar un inventario requiere pronósticos de los requisitos de
stock. Las previsiones pueden requerir varios años de anticipación (en el caso de las inversio-
nes de capital) o solo unos minutos antes (para el enrutamiento de las telecomunicaciones).
Cualquiera que sean las circunstancias o los horizontes temporales involucrados, la previsión
es una ayuda importante para una planificación eficaz y eficiente.
Algunas previsiones son más fáciles que otras. La hora del anochecer de mañana se pro-
nostica con mucha precisión. Por otro lado, los números de lotería del próximo fin de semana
no se puede pronosticar con precisión (más allá de que será un número entre el 0 y el 99.999).
La previsibilidad de un evento o cantidad depende de varios factores, que incluyen:

1. Si entendemos los factores que contribuyen a ello.

2. De la cantidad de datos disponibles.

3. Si los pronósticos pueden afectar lo que estamos tratando de pronosticar.

Por ejemplo, los pronósticos de la demanda de electricidad pueden ser muy precisos porque las
tres condiciones generalmente se cumplen. Tenemos una buena idea de los factores que con-
tribuyen. La demanda de electricidad es impulsada principalmente por las temperaturas, con
efectos más pequeños para la variación del calendario, como las vacaciones y las condiciones
económicas. Siempre que haya un historial suficiente de datos sobre la demanda de electri-
cidad y las condiciones climáticas, y que tengamos las habilidades para desarrollar un buen
modelo que vincule la demanda de electricidad y las variables clave, las previsiones pueden
ser notablemente precisas.
A menudo, en el pronóstico, una cuestión clave es saber cuándo se puede pronosticar
con precisión, y cuándo las predicciones serán cómo tirar una moneda al aire. Los buenos
pronósticos capturan los patrones y las relaciones genuinas que existen en los datos históricos,
pero no replican eventos pasados que no volverán a ocurrir. Aprenderemos cómo diferenciar
entre una fluctuación aleatoria en los datos pasados, que se debe ignorar, y un patrón genuino,
que se debe modelar y extrapolar.
En ocasiones se asume erróneamente que las previsiones no son posibles en un entorno
cambiante. Cada entorno está cambiando, y un buen modelo de pronóstico capta la forma en
que las cosas están cambiando. Los pronósticos rara vez suponen que el entorno no cambia. Lo
que normalmente se supone es que la forma en que el ambiente está cambiando continuará en
el futuro. Es decir, un entorno altamente volátil seguirá siendo altamente volátil; un negocio
con ventas fluctuantes seguirá teniendo ventas fluctuantes; y una economía que ha pasado por
auges y quiebras continuará pasando por auges y caídas. Un modelo de pronóstico pretende
capturar la forma en que se mueven las cosas, no solo donde están.
Las situaciones de pronóstico varían ampliamente en sus horizontes de tiempo, factores
que determinan resultados reales, tipos de patrones de datos, y muchos otros aspectos. Los

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 7 — #23

Tema 1 7

métodos de previsión pueden ser muy simples pero efectivos, como usar la observación más
reciente como pronóstico, método ingenuo, o altamente complejo, como redes neuronales o
sistemas econométricos de ecuaciones simultáneas. A veces, no habrá datos disponibles en
absoluto. Por ejemplo, es posible que deseemos pronosticar las ventas de un nuevo producto
en su primer año, pero obviamente no hay datos con los que trabajar. En situaciones como
esta, utilizaremos la previsión cualitativa o basada en la opinión de expertos. La elección del
método depende de qué datos estén disponibles y la previsibilidad de la variable a pronosticar.
Pero vayamos por partes. Antes de embarcarnos en un ejercicio de pronóstico, siempre
debemos considerar el ¿Por qué? Es decir, debemos especificar las razones para generar el
pronóstico, cómo se ajusta a los posibles planes durante el horizonte de planificación y el
tipo de pronóstico que necesitamos. Una vez resueltas las especificaciones, debemos resolver
el ¿Cómo? Mediante un análisis cuidadoso de la información disponible, su valor potencial
para mejorar las decisiones de planificación y el desarrollo de un sistema de previsión para
implementar los pronósticos resultantes. De hecho, ¿Cómo? Es la pregunta que tratamos de
responder a lo largo de la mayor parte de este libro. Finalmente, pero no menos importante,
debemos verificar si el sistema de pronóstico está haciendo el trabajo para el que fue diseñado,
una cuestión que con demasiada frecuencia se ignora.

1.1.2. Pasos básicos en una tarea de previsión


El proceso completo de un programa de previsión bien estructurado requiere el análisis de
los siguientes componentes:
Objetivo o propósito
¿Qué esperamos lograr generando el pronóstico? ¿Qué planes dependen de los resultados
del ejercicio de previsión? Por ejemplo, la demanda global prevista de los automóviles de
una empresa no es lo suficientemente detallada como para planificar una línea de producción.
Habría que responder también a la siguiente cuestión: ¿Cuánto hacia delante tenemos que
predecir? o en términos más técnicos: ¿Cuál es el horizonte de previsión? A su vez, el horizonte
depende de nuestro propósito en la previsión e impulsará la elección del método. Los métodos
que empleamos para el pronóstico a corto plazo considerarán solo los factores que cambian
rápidamente, mientras que los pronósticos a más largo plazo deben tener en cuenta un número
mayor de factores que pueden cambiar durante el período de tiempo de interés. También nos
referimos al origen del pronóstico, el punto en el tiempo a partir del cual comienzan los
pronósticos. El horizonte a menudo afecta a la precisión y la utilidad de un pronóstico. De
hecho, la precisión siempre empeora a medida que aumente el horizonte de previsión.
Información
¿Qué sabemos que puede ayudarnos a pronosticar y cuándo lo sabremos? La información
detallada es útil solo si está disponible de manera oportuna. Los informes financieros de
mañana pueden proporcionar una excelente explicación de los eventos de hoy, pero no sirven
de nada para predecir los precios actuales de las acciones. Del mismo modo, la información es
valiosa solo si tiene un impacto en el procedimiento de proyección anticipada que buscamos
implementar. Los cambios en la población pueden tener un efecto importante sobre las ventas
en diez años a partir de ahora, pero tales cambios tienen lugar a un ritmo relativamente lento
y serían irrelevantes para pronosticar las ventas en los próximos tres meses.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 8 — #24

8 Introducción a la previsión

¿Qué sabemos y cuándo lo sabremos? Un modelo de pronóstico a gran escala puede tener
en cuenta una amplia gama de factores clave, pero si tenemos que esperar varios meses para
que los datos estén disponibles, las previsiones pueden ser demasiado anticuadas para ser
útiles. Por lo tanto, un pronosticador a menudo depende de los indicadores principales, como
el cierre de los niveles de un índice bursátil importante o una encuesta del sentimiento del
consumidor, para señalar los cambios en las condiciones económicas a corto plazo. Estos
factores no proporcionan una descripción de causa y efecto de lo que está sucediendo, pero
pueden proporcionar una evaluación oportuna de los posibles cambios.
Un factor a menudo crítico en la producción de un pronóstico preciso es el conocimiento
de los planes realizados en otras partes de la organización que afectarán la variable a pro-
nosticar. Producir un lanzamiento anticipado de llamadas entrantes a un centro de llamadas
sin información sobre los planes corporativos de marketing en el horizonte generalmente con-
ducirá a pronósticos pobres. Por lo tanto, identificar los factores potencialmente importantes
que afectarán los resultados futuros es un paso importante en el desarrollo de un sistema de
pronóstico.
La distinción entre predicción y explicación a menudo es algo borrosa. Por un lado, po-
demos considerar los llamados pronósticos puros que usan solo la información actualmente
disponible. Por otro lado, una descripción detallada de un proceso (por ejemplo, un modelo
macroeconómico de la economía o un modelo del clima mundial) puede permitirnos responder
preguntas hipotéticas basadas en la comprensión que brinda la descripción detallada. Tales
modelos generalmente requieren más información que los ejercicios de pronóstico puro. Cuan-
do se trata de responder preguntas que suponen un síntoma, es completamente razonable
utilizar datos que están disponibles solo después del hecho, ya que proporcionan una indica-
ción de los posibles efectos de ciertas decisiones de política. También pueden proporcionar una
explicación de los errores de pronóstico que hemos realizado. En este capítulo, nos enfocamos
a los pronósticos puros, aunque algunos de los métodos discutidos en capítulos posteriores
pueden ser útiles en ambos contextos.
Valor o importancia
¿Cuanto vale la previsión? ¿Qué estaríamos dispuestos a pagar para tener un conocimiento
perfecto de un evento futuro? Por ejemplo, un pronóstico del tiempo es útil para un individuo
en el sentido de que puede decidir mejor sobre la vestimenta adecuada. Sin embargo, la mayoría
de nosotros no pagaría mucho por esa información, y no necesitamos saber exactamente la
cantidad de lluvia que caerá.
Por el contrario, el sector agrícola está muy interesado en utilizar pronósticos meteoroló-
gicos para planificar el riego y la siembra de cultivos, y está dispuesto a pagar por pronósticos
más precisos y específicos de cada localidad. En un contexto diferente, considere una empresa
con miles de líneas de productos. Aunque el valor de los pronósticos para una sola línea puede
ser modesto, un sistema de pronóstico efectivo para toda la gama de productos es muy valioso
para tomar decisiones de producción e inventario.
Análisis y modelización
Una vez que el propósito está claro y la información ha sido ensamblada, pasamos al
análisis de los datos. Este proceso incluye el desarrollo de un modelo de pronóstico, que
implicará la consideración de varios enfoques diferentes y la selección final de una de estas

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 9 — #25

Tema 1 9

alternativas. Una vez que se ha seleccionado el modelo y estimados los parámetros, debemos
probar su rendimiento utilizando una muestra de reserva (es decir, datos que se mantienen
en reserva y son independientes de la información utilizada para ajustar el modelo). Por
ejemplo, podríamos tener seis años de cifras de ventas mensuales y usar los primeros cinco
años para ajustar al modelo y mantener el último año como muestra de retención para evaluar
el rendimiento.
Sistema o procedimiento
La mayoría de los ejemplos del libro se refieren a una sola serie de tiempo o problema de
previsión. Sin embargo, las aplicaciones prácticas pueden implicar la predicción simultánea
de miles de artículos (productos, precios de acciones, etc.). Además, una organización puede
generar pronósticos en varios niveles diferentes (por ejemplo, productos individuales, regiones
de venta distintas, ventas semanales o mensuales) con muchas personas involucradas y estas
previsiones deben integrarse en una descripción consistente de las ventas totales como base
para presupuestar, marketing y planificación de producción. Por lo tanto, debemos desarro-
llar un sistema y proceso de pronóstico que sea capaz de satisfacer estas necesidades. Tales
procedimientos generalmente se implementan en el sistema informático de la organización.
Evaluación de la previsión
¿Cómo sabemos si un ejercicio de pronóstico particular es efectivo? La respuesta obvia es
que debemos comparar los resultados pasados con los pronósticos que se hicieron, posiblemente
comparando varios métodos de pronóstico diferentes. Examinamos varios de estos criterios,
los cuales se basan en las diferencias entre los pronósticos y los valores reales. Insistir en el
control del rendimiento del pronóstico puede parecer casi demasiado obvio, pero la evidencia
sugiere que algunas empresas nunca vuelven a comprobar el rendimiento de sus pronósticos.
Si no examinamos los resultados, nunca sabremos si el enfoque utilizado es bueno. Hacer
pronósticos efectivos es tanto un arte como una ciencia, y preguntarse acerca de si hemos
seguido los pasos básicos de una tarea de previsión antes de comenzar el ejercicio de previsión
ayudará a evitar errores costosos.
Seguimiento de errores de pronóstico
Siempre revise el rendimiento del pronóstico. La comprobación ayuda a evitar errores repe-
tidos y conduce a mejores resultados.

1.1.3. Problemas de pronóstico


La previsión implica el uso de los datos actualmente disponibles para hacer declaraciones
sobre posibles desarrollos futuros. Tales datos normalmente surgen como series de tiempo:

SERIES DE TIEMPO
Conjunto de observaciones comparables ordenadas en el tiempo. Los valores pueden refe-
rirse a un punto en el tiempo (el valor actual de cualquier índice de la bolsa, como Dow Jones
o el IBEX 35) o un agregado durante un período de tiempo (las ventas totales del último
mes).
Las series de tiempo usualmente presentan patrones de comportamiento o componentes
como tendencia o estacionalidad que debemos definir.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 10 — #26

10 Introducción a la previsión

Tendencia: una serie temporal contiene una tendencia si muestra movimientos sistemá-
ticos (por ejemplo, aumento o disminución) durante un período prolongado.
Estacionalidad: una serie temporal tiene un componente estacional si muestra un patrón
recurrente con una duración fija y conocida (por ejemplo, meses del año, días de la semana).
Ciclo: una serie temporal tiene un componente cíclico si muestra fluctuaciones algo regu-
lares sobre la tendencia, pero esas fluctuaciones tienen una periodicidad de duración variable
y desconocida, generalmente más de un año (por ejemplo, el ciclo de comercio).

Por lo general, suponemos que las observaciones tienen una periodicidad constante, es
decir que están equiespaciadas en el tiempo. En ocasiones, esta suposición es incorrecta,
pero podemos hacer algunos ajustes a los datos para que sea una aproximación más cercana.
Por ejemplo, los meses del año difieren en longitud, pero generalmente los tratamos como
espaciados por igual. Si la serie de tiempo se refiere a datos como las ventas, podemos usar
las ventas promedio por día durante el mes o las ventas promedio por día de comercio (lo que
permite posibles cierres los domingos y festivos). La serie temporal revisada de esta forma se
ajusta más a la suposición de una periodicidad constante en el tiempo.
Un ejemplo interesante de tales ajustes ocurre con los datos del mercado de valores. La
Bolsa de Madrid generalmente está abierta para operar de lunes a viernes, de 9 a 17 horas,
pero está cerrada los fines de semana y días festivos. Sin embargo, a menudo es posible ignorar
las interrupciones en la negociación y tratar las series de tiempo relacionadas con el precio de
una acción o el volumen de negociación (por ejemplo, el número de acciones negociadas por
hora) que se registran a intervalos regulares iguales.
En este texto, normalmente asumimos que las observaciones se registran a tiempos igual-
mente espaciados y efectivamente ignoramos la distinción entre los datos, ya sea registrados
en un punto en el tiempo o agregados a lo largo del tiempo. Tal paso no plantea problemas
para el desarrollo formal de los métodos de previsión, pero debe tenerse en cuenta en las
aplicaciones.

1.1.4. Procesos aleatorios (estocásticos)


La previsión por su naturaleza implica incertidumbre y expresamos nuestra comprensión
de esta incertidumbre a través del lenguaje de la probabilidad. No pretendemos proporcionar
una guía sobre la probabilidad aquí, hay muchas fuentes que ofrecen tales presentaciones.
Por el contrario, el objetivo es describir cómo se generan los enunciados probabilísticos en el
contexto de los pronósticos basados en series de tiempo.
Las nociones estándar de probabilidad pueden descansar sobre las nociones de eventos
igualmente probables, frecuencias relativas en ensayos repetidos, o como un grado de creencia,
pero ninguna de estas ideas es completamente apropiada para el análisis de series de tiempo.
Una serie temporal típica, como el Producto Interior Bruto (PIB), tiene una observación cada
trimestre que representa el valor observado. El muestreo puede estar involucrado para llegar al
valor final del PIB en un período dado, pero el número informado es único y no está abierto a
ninguna interpretación de muestreo repetido como el que empleamos en estudios transversales.
¿Cómo procedemos? Confiamos en el concepto de probabilidad basada en modelos. Es
decir, formulamos un modelo del proceso que genera las series temporales y derivamos las

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 11 — #27

Tema 1 11

declaraciones probabilísticas de ese modelo. Por supuesto, si el modelo es incorrecto, también


lo serán las evaluaciones de incertidumbre. Por esa razón, a lo largo del libro enfatizamos
la cuidadosa selección del modelo y la verificación de los supuestos subyacentes. Por ahora,
estos problemas no nos conciernen y suponemos que la especificación basada en el modelo es
correcta. En términos bastante generales, podríamos especificar un modelo como:

variable observable = componente conocido + componente desconocido.

Algebraicamente podemos escribir esta expresión en el tiempo t como:

Yt = Ŷt + "ˆt (1.1.1)


Ŷt representa la componente o señal conocida (o predecible), mientras que "ˆt denota el
componente desconocido (error aleatorio o ruido). Típicamente, se supone que el error alea-
torio tiene media cero, es decir que E(Yt ) = Ŷt . Por lo tanto, el punto pronosticado para
la serie será Ŷt y la incertidumbre se expresa mediante "ˆt . Las probabilidades basadas en el
modelo se formulan utilizando las propiedades asumidas del error aleatorio: en muchas oca-
siones asumiremos que los errores se distribuyen normalmente con una varianza constante en
el tiempo y que los errores sucesivos son independientes entre sí. De manera más general,
cualquier especificación de la distribución de los errores proporcionará un marco para hacer
declaraciones sobre la incertidumbre relacionada con los pronósticos puntuales.

1.1.5. Cómo predecir o prever


En la Sección 1.1.2, indicamos los componentes necesarios para generar buenos pronósticos.
La siguiente pregunta es ¿Cómo? Lo que depende en gran medida del análisis de dichos
componentes. Cuando buscamos establecer un sistema de pronóstico, primero debemos brindar
respuestas a las siguientes preguntas:

¿Contamos con los datos necesarios para permitir el uso de métodos estadísticos, o el
proceso de proyección será esencialmente de opinión? En este manual nos centramos en
los métodos estadísticos y el uso de los métodos de opinión quedarán fuera del alcance
de este manual1 .

Si el proceso se basa en la valoración de opiniones, ¿el pronosticador está trabajando


solo o está involucrado en un grupo?

Si el proceso es estadístico, ¿el análisis se basa en una sola serie o son variables explica-
tivas las incluidas en el estudio?

Las respuestas a estas preguntas conducen a una variedad de enfoques posibles, muchos de
los cuales se describen en capítulos posteriores. La secuencia de elecciones y las metodologías
disponibles se resumen brevemente en la Figura 1.1.1.
1
El lector interesado en previsiones de opinión puede ver el capítulo 11 de Ord, K., Fildes, R. y Kourentzes
(2017). Principles of Business Forecasting (2 ed). New York, USA, Wessex Press.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 12 — #28

12 Introducción a la previsión

Figura 1.1.1: Árbol simplificado de la metodología de previsión

¿Existen suficientes
datos cuantitativos?

En caso afirmativo usar


Si no, usar los métodos métodos cuantitativos
de opinión de expertos ¿Hay variables
explicativas disponibles?

Si no, usar los métodos


En caso afirmativo usar
de alisado exponencial
o ARIMA análisis de regresión

1.1.6. La previsión paso a paso


Sobre la base de nuestra discusión de la Sección preliminar 1.1.2, podemos identificar siete
pasos principales en el proceso de pronóstico:

1. Defina el problema de previsión y planificación, el horizonte de pronóstico y decida el


valor del pronósticos.

2. Determine los recursos que se dedicarán a proporcionar los pronósticos.

3. Reúna información relevante, ya sea de una encuesta, de los registros de la compañía, o


de la información generada por otras agencias (por ejemplo, fuentes del gobierno).

4. Realice un análisis inicial de los datos.

5. Seleccione un método de pronóstico apropiado.

6. Genere pronósticos.

7. Evalúe el ejercicio de previsión verificando las previsiones con los resultados reales.

Idealmente, podríamos usar estos siete pasos como una lista de verificación y trabajar con
ellos. Sin embargo, la vida no es tan simple. Aunque podemos estar cómodos con nuestra
definición inicial del problema, es posible que tengamos que revisar nuestra comprensión. El
paso 2 también es importante: los recursos asignados al ejercicio de pronóstico deben ser
acordes con el valor agregado potencial de los pronósticos mejorados. Si hay poco valor para
lograr una precisión del pronóstico mejorada, no tiene sentido usar recursos escasos para ese
propósito. Por el contrario, si el problema es tal que pequeñas mejoras en la precisión tienen

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 13 — #29

Tema 1 13

un gran beneficio, vale la pena gastar sumas considerables. El paso 3 determina si la tarea de
pronóstico es factible: es posible que los datos relevantes no estén disponibles (o de manera
oportuna), por lo que tendríamos que volver a la mesa de trabajo.
Una vez que hayamos completado los pasos 1 a 3, debemos llevar a cabo un análisis inicial
de los datos. Describimos estos pasos con más detalle en este capítulo, pero vale la pena
señalar que el análisis tiene dos propósitos: limpiar los datos y comprenderlos. La limpieza de
los datos implica buscar observaciones inusuales y quizás corregir errores de registro de datos;
identificar los factores que deben tenerse en cuenta, como los patrones estacionales o los días
festivos; asegurándose que los datos sean comparables entre sí y representen el fenómeno de
interés. Por ejemplo, los envíos a mayoristas no representan realmente las ventas. El segundo
componente, la comprensión de los datos, permite la elección del método de pronóstico, así
como proporcionar información sobre la fiabilidad potencial de los pronósticos resultantes.
A veces las observaciones inusuales se producen por un acontecimiento imprevisible, como
los atentados del 11 de septiembre de 2001 en USA. Su efecto se puede medir mediante la
inclusión de variables ficticias (0,1) donde la serie toma valor 0 excepto cuando se produce el
acontecimiento. Cuando sabemos que un acontecimiento cualitativo ha cambiado el compor-
tamiento de un fenómeno objeto de estudio, como la obligatoriedad de utilizar el cinturón de
seguridad o el carnet por puntos si nos referimos al comportamiento del conductor al volante,
utilizamos el mismo procedimiento, una variable binaria con “0” antes del acontecimiento y
“1” después o viceversa.
Una vez que nuestras iteraciones a través de los pasos 1 a 4 estén completas, podemos
pasar a la selección del método, usando los refinamientos de la Figura 1.1.1. Solo en esta etapa
estamos en condiciones de generar pronósticos. Gran parte del resto de este libro trata sobre
los aspectos técnicos de los pasos 5 y 6. El paso final, que no debe pasarse por alto, es evaluar el
proceso de previsión comparando los valores reales con los valores pronosticados. En la etapa
de desarrollo, esto se puede hacer por medio de la llamada muestra de retención o prueba
(fuera de la muestra), es decir, dividimos los datos disponibles en dos partes y luego usamos
solo la primera parte (la muestra de estimación o de entrenamiento) para calibrar el método
de pronóstico. Una vez que todo está configurado, usamos la segunda parte (la muestra de
retención) para verificar el rendimiento del pronóstico. Cuando el sistema de previsión está
en funcionamiento, es esencial realizar controles periódicos del rendimiento. En general, los
siete pasos deben verse como un proceso integrado que opera de manera más fluida a medida
que el pronosticador gana experiencia práctica.
Siempre que sea posible, el desarrollo de un método de pronóstico debe incluir la partición
de los datos en una muestra de estimación (utilizada para estimar los parámetros, etc.) y
una muestra de retención (utilizada para probar el rendimiento del método de pronóstico
propuesto). Una vez que se selecciona el método, la muestra completa se debe usar para
futuros pronósticos.
Finalmente, se debe enfatizar que la previsión no es una operación «de una vez». El
rendimiento del pronóstico debe revisarse periódicamente y se deben realizar cambios en
el sistema cuando el rendimiento sea precario. Para una discusión detallada vea Angrist y
Krueger (1991).

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 14 — #30

14 Introducción a la previsión

1.1.7. Fuentes de datos


La practica totalidad de los departamentos de las distintas administraciones del estado
español (o internacionales como la Unión Europea, la OCDE, el FMI o la ONU) tienen sitios
web disponibles públicamente desde los cuales se pueden descargar datos; por ejemplo, el INE
o el Banco de España. Además, las empresas más importantes tienen sitios web desde los que
se pueden obtener datos sobre sus operaciones generales, aunque estos datos no siempre están
en un formato listo para descargar.
Numerosas bases de datos especializadas que proporcionan series de datos descargables
también están disponibles. Algunas son gratuitas y otros requieren una suscripción personal
o institucional. A continuación se incluyen varias de estas fuentes de particular interés:
Ministerio de Economía, Dirección General de Análisis Macroeconómico2 contiene una
gran cantidad de datos económicos y financieros de España y de otros países.

El Banco de la Reserva Federal de St. Louis mantiene una extensa base de datos de
series macroeconómicas internacionales y de EE. UU. El sitio web se conoce como FRED
(https://fred.stlouisfed.org/).

El sitio web de los Principios de Pronóstico (http://www.forecastingprinciples.com/)


proporciona una variedad de enlaces a otras fuentes y conjuntos de datos.

1.2. Herramientas básicas de previsión


Nosotros supondremos que hay algún tipo de base de datos disponible para construir
predicciones numéricas. En algunas situaciones, los datos pueden estar ya disponibles (por
ejemplo, cifras del gobierno para pronósticos macroeconómicos); en otros casos, los datos pue-
den recopilarse directamente (por ejemplo, cifras de ventas o comportamiento de compra a
partir de registros). Dichos datos pueden estar incompletos o estar sujetos a error, es posible
que no se relacionen directamente con las variables clave de interés y que no estén dispo-
nibles de manera oportuna. Sin embargo, son todo lo que tenemos, y debemos aprender a
comprenderlos y respetarlos.
A nivel conceptual, debemos comprender cómo se compilan los datos y cómo se relacionan
con los problemas de previsión que tratamos de abordar. Debemos establecer desde el principio
que los datos son apropiados para el propósito (el objetivo o propósito de la Sección 1.1.2)
que tenemos en mente, como señalamos anteriormente. Aunque no seguiremos repitiendo este
mensaje capítulo tras capítulo, los problemas de la Sección 1.1.2 siempre deben examinarse
antes de embarcarse en un proyecto de previsión. Luego, debemos examinar los datos para
comprender su estructura, características principales y resumir la información disponible (la
información de la Sección 1.1.2).

1.2.1. Tipos de datos


Los datos pueden ser numéricos, ordenados, categóricos o incluso basados en texto.
2
http://serviciosede.mineco.gob.es/indeco/

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 15 — #31

Tema 1 15

Una encuesta de votantes se refiere a datos transversales en el sentido de que lo que


importa es la variación inherente entre los encuestados. A efectos prácticos, vemos que los
datos se recopilan en el mismo período de tiempo. Por supuesto, los votantes pueden cambiar
de opinión en una etapa posterior, y tales cambios de opinión son una fuente importante de
discrepancias entre las encuestas de opinión y los resultados electorales.
El precio de cierre de una acción, registrado diariamente durante varios meses o incluso
años, representa un ejemplo de datos de series de tiempo. Estamos interesados en el movi-
miento del precio a lo largo del tiempo. Lo mismo se aplica si seguimos los movimientos a lo
largo del tiempo de variables macroeconómicas agregadas como el PIB.
Por consiguiente, los datos pueden ser:

Transversales (a veces también denominados de sección cruzada) si son mediciones en


unidades múltiples, registradas en un solo período de tiempo.

Serie de tiempo si son un conjunto de mediciones comparables registradas de una sola


variable en múltiples períodos de tiempo.

Panel si los datos tienen ambas características, son mediciones transversales que se
repiten a lo largo del tiempo, como los gastos mensuales para una muestra de consumi-
dores.

El siguiente Cuadro muestra el PIB per cápita de las Comunidades Autónomas entre los
años 2011 y 2018, la tabla completa es un panel del PIB. Lo mismo sería, por ejemplo, si
consideramos las compras de una muestra de clientes a lo largo del tiempo.

Datos de panel. PIB per cápita anual por CC.AA. Euros corrientes

Si consideramos el PIB de las Comunidades Autónomas en un mismo año, por ejemplo en


2018, entonces estamos hablando de una serie de datos transversales, ya que todos los valores
están considerados en el mismo periodo de tiempo.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 16 — #32

16 Introducción a la previsión

Ejemplo de variable transversal, PIB per cápita por CCAA en el año 2018

Sin embargo, si consideramos el PIB per cápita de Madrid a lo largo del tiempo, entonces
estamos hablando de una serie temporal.
Ejemplo de serie de tiempo. PIB por cápita de Madrid entre 2011 y 2018

A partir del ejemplo, vemos que una base de datos puede ser de corte transversal, de-
pendiente del tiempo o ambas conjuntamente. (Considere rastrear las intenciones de voto a
lo largo del tiempo o mirar los gastos de consumo para las diferentes provincias españolas).
Aunque la práctica de previsión a menudo implica varias series, como las ventas de diferentes
líneas de productos, los métodos que examinamos tienen el tema común de utilizar los datos
del pasado para predecir los resultados futuros.
A medida que los métodos de captura de datos se han vuelto más sofisticados (por ejemplo,
escáneres en supermercados), ha sido posible desarrollar bases de datos que se relacionen con
individuos, ya sean consumidores o máquinas. La previsión puede incluir el uso de datos
transversales para predecir las preferencias individuales o para evaluar a un nuevo cliente en
función de individuos con características demográficas similares.
Un gerente responsable de una gran cantidad de líneas de productos bien puede afirmar que
«la previsión puede hacerse por computadora, por lo que no hay necesidad de perder tiempo en
la construcción de modelos o exámenes detallados de series individuales». Esta afirmación es a
medias correcta. El ordenador puede de hecho eliminar la mayor parte del trabajo pesado del
ejercicio de pronóstico. Sin embargo, una computadora bien entrenada puede ofrecer un sólido
grupo de pronósticos; mal entrenada, puede crear el caos. Incluso si la tarea en cuestión implica
que se pronostiquen miles de series, no hay sustituto para comprender la estructura general
de los datos, de modo que podamos identificar los procedimientos de pronóstico adecuados.
El gerente puede enfocarse en los productos que están proporcionando resultados inusuales.
Para construir un sistema de pronóstico efectivo, por lo tanto, debemos comprender el
tipo de datos que manejamos. Eso no significa examinar cada serie en detalle, o incluso en

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 17 — #33

Tema 1 17

absoluto, sino más bien mirar una muestra de series para establecer un marco para la previsión
efectiva. Por lo tanto, debemos comprender cuándo y cómo utilizar los métodos de pronóstico,
cómo interpretar los resultados y cómo reconocer sus limitaciones.

1.2.2. Gráficos
Todo lo que observamos secuencialmente a lo largo del tiempo es una serie temporal y solo
consideraremos series de tiempo que se observen a intervalos regulares de tiempo. Las series
de tiempo irregularmente espaciadas también pueden ocurrir, pero no las trataremos aquí.
Por consiguiente, supondremos que los datos se refieren a puntos espaciados en el tiempo (por
ejemplo, precios de cierre diarios del mercado de valores) en períodos de igual duración (por
ejemplo, cada hora, día, semana, mes, trimestre o año). En ocasiones necesitaremos realizar
algunos ajustes, como excluir los fines de semana y días festivos en las series de precios de
acciones, o ajustar la cifra mensual a la cantidad de días de cada mes en vez de suponer que
todos los meses tienen la misma duración.
Por ejemplo, en la Figura 1.2.1 mostramos el índice del comercio al por menor de España
de tres formas: los datos brutos3 (línea continua fina), la serie corregida de calendario 4 (línea
discontinua gruesa) y la serie corregida de estacionalidad y calendario5 (línea de puntos).
Cuando realizamos una previsión debemos tener siempre en cuenta si el efecto calendario
es relevante y realizar los ajustes oportunos para evitar esta fuente de heterogeneidad si es
necesario. Aquí vemos que el efecto calendario es pequeño de manera que podemos considerar
que los meses del año a efectos prácticos como de igual duración (incluso el efecto de la semana
santa parece poco significativo), sin embargo el efecto estacional es muy grande, con mínimos
en febrero y máximos relativos en diciembre y julio.

Figura 1.2.1: Ventas del comercio minorista en España, 2015=100, años 2017 y 2018.

Pero nos estamos adelantando. Lo primero que debemos hacer en cualquier tarea de análisis
3
Datos brutos o sin ajuste.
4
Ajustado para obtener una serie que sea independiente de la longitud del mes o trimestre, de la composición
del número de días hábiles, de fiestas y de la Semana Santa.
5
La desestacionalización consiste en filtrar la serie de los movimientos estacionales tal y como los definimos
al principio de la Sección 1.1.3 de la página 9.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 18 — #34

18 Introducción a la previsión

de datos es representar los datos. Los gráficos permiten visualizar muchas de sus caracterís-
ticas, incluidos patrones, observaciones inusuales, cambios a lo largo del tiempo y relaciones
entre variables. Las características que se ven en los gráficos de los datos deben incorporarse,
en la medida de lo posible, en los métodos de pronóstico que utilizaremos. Así como el tipo
de datos determina qué método de pronóstico usaremos, y qué gráficos son más apropiados.
Los datos de la serie del comercio al por menor en España entre el año 2000 y junio de 2019
los mostramos en la Figura 1.2.2. En línea fina la serie original y en gruesa la serie ajustada
de estacionalidad y calendario.
De nuevo se ve claramente la importancia del componente estacional en la serie, pero la
tendencia se aprecia mejor en la serie desestacionalizada, el máximo se obtiene a mediados de
2007 y el mínimo en julio de 2012. El comercio desestacionalizado muestra un cliclo completo
en el que al final de la serie aún no se ha alcanzado los máximos de 2007, de manera que la
recuperación de la crisis de 2008 aún no se ha alcanzado completamente en junio de 2019, al
menos en el comercio al por menor español.

Figura 1.2.2: Ventas del comercio minorista en España, enero de 2000 a junio de 2019

Mostramos a continuación distintos gráficos que permiten analizar el componente estacio-


nal con más detalle. Los datos visualizados en la Figura 1.2.3 son exactamente los mismos
que los datos brutos de la Figura 1.2.2. Pero ahora, la información mensual de cada año, está
superpuesta año a año. Las gráficas estacionales permiten ver el patrón estacional subyacente
con mayor claridad, y es especialmente útil para identificar los años en los que cambia el pa-
trón estacional. Aquí vemos que el patrón estacional esencialmente no cambia con el tiempo,
con máximo todos los años en julio y diciembre y mínimo en febrero.
También podemos ver el comercio minorista pero utilizando una variable distinta para
cada mes del año, es decir, obtenemos una serie del mes de enero, febrero ... para los años
2000, 2001 ...., tal y como hacemos en la Figura 1.2.4, donde se confirma el máximo del 2007,
el mínimo en 2012 o 2013 y la recuperación posterior pero sin llegar nunca a los máximos de
2007.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 19 — #35

Tema 1 19

Figura 1.2.3: Estacionalidad del comercio al por menor español

Figura 1.2.4: Comercio al por menor español por meses

1.2.2.1. Gráficos de dispersión

Los gráficos de series de tiempo mostrados hasta ahora presentan la evolución de una
o varias series a lo largo del tiempo. Los diagramas de dispersión pueden representar datos
transversales o de series de tiempo: podemos trazar una variable contra otra sin ninguna
implicación de causalidad. Una alternativa es trazar una variable de interés contra una o más
variables explicativas potenciales, para ver hasta qué punto el conocimiento de la(s) variable(s)
explicativa(s) podría mejorar las predicciones de la variable de interés.
Consideremos el comercio al por menor español versus comercio al por menor italiano,
cuyo gráfico reproducimos en la Figura 1.2.5.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 20 — #36

20 Introducción a la previsión

Figura 1.2.5: Comercio al por menor, España versus Italia (2015=100)

Se aprecia una relación positiva entre ambas variables, cuando el comercio italiano es
alto, el español también y viceversa, veremos más adelante que los gráficos de dispersión
son especialmente ilustrativos cuando se contemplan junto con los respectivos coeficientes de
correlación.

1.2.3. Resumen de datos


Los resúmenes gráficos proporcionan información valiosa. Los diagramas de tiempo y los
diagramas de dispersión siempre deben usarse en las primeras etapas de un estudio de pro-
nóstico para ayudar a la comprensión. Al mismo tiempo, debemos reconocer que, aunque los
métodos gráficos proporcionan información cualitativa, a menudo necesitamos algún tipo de
resumen numérico, como el nivel promedio de ventas en el tiempo o la variabilidad en las
proporciones P-G (Precio-Ganancias) en todas las compañías. Estas medidas también son
valiosas para fines de diagnóstico, como veremos más adelante.

1.2.3.1. Notación
Primero debemos elaborar algunas convenciones de notación que utilizaremos a lo largo
del libro:

1. Variables aleatorias y observaciones: cuando hablamos de una observación, es algo


que ya hemos registrado, un número específico o categoría. Por el contrario, cuando
hablamos de observaciones futuras, existe incertidumbre. Por ejemplo, para el precio de
cierre de mañana del Ibex–35 , enfrentamos un rango de posibilidades que se pueden
describir mediante una distribución de probabilidad. Dicha variable, con un conjunto de
valores posibles y una distribución de probabilidad asociada, se conoce como variable
aleatoria. Los textos con una orientación más teórica a menudo usan letras mayúsculas
para indicar las variables aleatorias y las letras minúsculas para las observaciones que
ya se han registrado. Por el contrario, los libros que se aplican más a menudo no hacen

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 21 — #37

Tema 1 21

distinción, sino que se basan en el contexto para dejar clara la diferencia. No haremos tal
distinción y generalmente usaremos la misma notación para las observaciones existentes
y las variables aleatorias.

2. Variables y parámetros: Como acabamos de notar, las variables son entidades que
podemos observar, como ventas o ingresos. Por el contrario, los parámetros contribu-
yen a la descripción de un proceso subyacente (por ejemplo, la media poblacional) y
típicamente no son observables. En general distinguiremos estos conceptos utilizando el
alfabeto romano para las variables observadas (valores de muestra), y las letras griegas
para los parámetros (valores de población). Por lo tanto, la variable que deseamos pro-
nosticar siempre la denotaremos por «Y » y, cuando corresponda, la media de la muestra
será «Ȳ » y su desviación estándar «S». La media de la población correspondiente será
«µ» y su desviación estándar « ».

3. Distribuciones de probabilidad: el concepto de una distribución de probabilidad de


observaciones futuras puede ser un tanto elusivo en un contexto de series temporales;
haremos uso de probabilidades basadas en modelos. Como ejemplo, consideremos los
precios de cierre diarios para una acción como Inditex. Solo hay un Inditex y solo un
precio de cierre por día. Sin embargo, podríamos definir una distribución de probabi-
lidad para futuros precios de cierre, conocida como una distribución predictiva (o de
predicción). Es decir, las probabilidades están asociadas con el conjunto de posibles
precios futuros y se formulan utilizando una descripción basada en el modelo del com-
portamiento pasado de las acciones de Inditex. La «población» (de posibles precios) es
conceptual, ya que solo se registrará un valor real de cada cierre futuro.

1.2.3.2. Medidas de posición


La medida más importante de posición es la media aritmética, usualmente conocida sim-
plemente como media o promedio.

Media aritmética
Dado un conjunto de n valores Y1 , Y2 , ...., Yn , la media aritmética es
n
(Y1 + Y2 + · · · + Yn ) 1X
Ȳ = = Yi , (1.2.1)
n n
i=1

es decir, la suma de las observaciones la dividimos por la cantidad de valores incluidos.

Un caso particular de la media es la media móvil centrada cuyo procedimiento consiste


en calcular la media utilizando «k» valores antes y «k» valores después de cada momento de
tiempo. Su expresión de cálculo, utilizando m valores es

k
1 X
T̂t = Yt+i donde m = 2k + 1, (1.2.2)
m
i= k

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 22 — #38

22 Introducción a la previsión

como se ve, el cálculo está pensado para valores impares. Pero se puede refinar para utilizarlo
con valores pares, cuyo procedimiento lo diferimos a un capítulo más avanzado. Por ejemplo,
la Figura 1.2.6 muestra el comercio al por menor y su media móvil centrada anual.
La media móvil anual centrada suaviza la serie eliminando su componente estacional.
Es similar a la serie desestacionalizada de la Figura 1.2.2 de la página 18, pero presenta el
problema de que se pierden observaciones al principio y al final de la serie, y por ello no se
suele utilizar con este propósito.

Figura 1.2.6: Comercio al por menor español y su media móvil anual

Mediana
Dado un conjunto de n valores Y1 , Y2 , ....Yn . Colocados en orden ascendente, escritas como
Y (1)  Y (2)  ...  Y (n). Entonces la mediana es el valor «medio»:
Si n es impar, n = 2m + 1, y la mediana es Y (m + 1).
Si n es par, n = 2m, y la mediana es 1/2[Y (m) + Y (m + 1)].
La mediana es el valor donde el 50 % de las observaciones son inferiores a él y el 50 %
mayores, la «observación» que está en medio y divide la muestra en dos partes iguales.

Si en vez de dividir la muestra en 2 partes las dividimos en 4, hablamos de cuartiles. Si


en 10, deciles. Y si en 100, percentiles. En ocasiones también se utiliza la expresión (Y )0,5
para denominar a la mediana, (Y )0,1 para el primer decil o (Y )0,01 para el primer percentil.

1.2.3.3. Medidas de dispersión


Una inversión segura es una inversión cuyo valor no fluctúa mucho con el tiempo. De mane-
ra similar, la planificación de inventario es mucho más sencilla si las ventas son prácticamente
las mismas en cada período. Implícita en ambas declaraciones está la idea de que utilizamos
cierta medida de variabilidad para evaluar el riesgo, ya sea de perder dinero o de quedarse sin
stock. Tres medidas de variabilidad son muy usuales: el rango, la desviación absoluta media y
la desviación estándar. La desviación estándar se deriva de la varianza, que también definimos
aquí.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 23 — #39

Tema 1 23

Rango
El rango denota la diferencia entre el valor más grande y el más pequeño en la muestra:

Rango = Y (n) Y (1). (1.2.3)

En ocasiones utilizaremos el rango intercuartílico,

RQ = Q3 Q1 , (1.2.4)
que es la diferencia entre el tercer y primer cuartil, y aglutina el 50 % de las observaciones.
Una forma de visualizar esto es el gráfico de caja (box-plot), un método estandarizado
para representar gráficamente una variable a través de sus cuartiles. Muestra a simple vista la
mediana, los cuartiles y también sus valores atípicos. Una gráfica de este tipo consiste en una
caja rectangular, donde sus lados muestran el recorrido intercuartílico. Este rectángulo está
dividido por un segmento horizontal que indica dónde se posiciona la mediana y por lo tanto
su relación con los cuartiles primero y tercero. Esta caja se ubica a escala sobre un segmento
vertical que tiene como extremos los valores mínimo y máximo de la variable.
En la Figura 1.2.7 mostramos el gráfico de caja de la serie del comercio al por menor,
indicando los valores representativos para este caso concreto.

Figura 1.2.7: Gráfico de caja del comercio al por menor suavizado

Las medidas de dispersión más usuales utilizan los valores en desviaciones a las me-
dias (d) definidas como las diferencias entre cada observación y su media. Por construcción,
la media de las desviaciones a las medias es cero. Para calcular medidas de variabilidad, pode-
mos utilizar los valores absolutos (|d|) o al cuadrado (d2 ). Si usamos los cuadrados, nuestras
unidades de medida son también al cuadrado. Por ejemplo, los ingresos (en €) se convierten

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 24 — #40

24 Introducción a la previsión

en €2 , por lo que revertimos la operación después de calcularlo tomando la raíz cuadrada.


Estas medidas se definen de la siguiente manera:

Desviación media, varianza muestral y desviación estándar


La desviación media absoluta es el promedio de las desviaciones a la media, indepen-
dientemente del signo,
Pn Pn
i=1 Yi Ȳ |di |
DM A = = i=1 . (1.2.5)
n n
La varianza muestral es un promedio de las desviaciones a la media elevadas al cuadrado,
Pn 2 Pn 2
2 i=1 Yi Ȳ i=1 di
S = = . (1.2.6)
n 1 n 1
La desviación estándar es la raíz cuadrada de la varianza muestral6 .
s sP
Pn 2 n 2
i=1 Yi Ȳ i=1 di
S= = . (1.2.7)
n 1 n 1

La varianza muestral o cuasivarianza S 2 está dividida por (n–1) en lugar de n, como


se hace al calcular la varianza, la razón fundamental es que calculada así es un estimador
insesgado de la varianza poblacional, 2 .
Lo podemos argumentar de la siguiente forma: estamos usando desviaciones a la media, y
si solo tuviéramos una observación, su desviación sería necesariamente cero. En otras palabras,
no tenemos información sobre la variabilidad en los datos. Del mismo modo, en una muestra
de 10 desviaciones, si conocemos solo 9, podemos calcular el valor de la décima observación
por el hecho de que las desviaciones deben sumar cero. En efecto, al restar la media de cada
observación, hemos «perdido» una observación. En lenguaje estadístico, esto se conoce como
perder un grado de libertad (gl), y decimos que la varianza se calcula bajo la suposición de que
hay (n–1) grados de libertad. En capítulos posteriores, perdemos en ocasiones varios gl, y
la medida de la variabilidad cambiará en consecuencia. De esta forma el ajuste, al considerar
solo los gl, obtenemos el beneficio de que la varianza de la muestra es un estimador insesgado
de la varianza poblacional, cómo ya dijimos en el párrafo anterior.
Veamos un ejemplo sencillo de cálculo de estas medidas de posición y dispersión.

Ejemplo 1. El PIB per cápita de las CCAA españolas


La Tabla 1.1 muestra el PIB per cápita de las CCAA españolas en 2018 ordenado de menor a
mayor. Como ya discutimos en la Sección 1.2.1, se trata de una variable de corte transversal o de
sección cruzada.
El rango se calcula restando el valor máximo (Madrid), del mínimo (Extremadura).

Rango = 34, 9–18, 2 = 16, 7.


6
S da mayor peso a las observaciones más extremas elevándolas al cuadrado, y se puede demostrar que
S > DM A siempre que DM A sea mayor que cero.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 25 — #41

Tema 1 25

Tabla 1.1: PIB per cápita español por CCAA en 2018 (miles de €)

Como vemos, el rango es muy sencillo de calcular, pero tiene el problema de ser muy sensible a
los valores extremos. Vulnerabilidad que lo suele hacer inadecuado para la mayoría de los propósitos
de previsión. En la última fila de la Tabla 1.1 calculamos la suma de cada columna.
La media del P IBpc de las CCAA es

(18, 2 + 19, 1 + · · · + 34, 9) 431, 1


ȲP IB = = = 25, 4.
17 17

Tenemos 17 CCAA ordenadas de menor a mayor y como n es impar, tenemos que la mediana
es directamente la que ocupa el orden (m + 1):
n = 2m + 1, despejando m tenemos:
m = n 2 1 = 8,
mediana = (P IBP C )0,5 = Y (m + 1) = Y (9) = YCAN T = 23, 8.
Podemos comprobar que el P IBP C de Cantabria deja 8 Comunidades con menor P IBP C y 8
con mayor P IBP C .
Siguiendo el mismo procedimiento de la mediana, podemos dividir la serie en 4 partes y calcular
los valores de los correspondientes cuartiles.
El primer cuartil es aquel que deja ¼ de la muestra con menor P IBP C . Como es impar el
valor de m o Comunidades con menos P IB del primer cuartil son [(17 1) · 1/4 = 4], es decir
el primer cuartil lo marca el valor que deja 4 Comunidades por debajo, Q1 = (P IBP C )0,25 =
Y (5) = YM U R = 21, 1.
El segundo cuartil divide la muestra en 2/4 partes y coincide con la mediana, el valor de m es
ahora [(17 1) · 2/4 = 8]. En consecuencia, el segundo cuartil es Q2 = (P IBP C )0,5 = Y (9) =
YCAN T = 23, 8.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 26 — #42

26 Introducción a la previsión

Y en el tercer cuartil, el valor de m es [(17 1) · 3/4 = 12], que deja 12 CCAA con menos
P IBP C , Q3 = (P IBP C )0,75 = Y (13) = YARA = 28, 6. El rango intercuartílico, en definitiva, es

RQ = Q3 Q1 = (P IBP C )0,75 (P IBP C )0,25 = 28, 6 21, 1 = 7, 5.

En la cuarta columna del Cuadro 1.1 calculamos las diferencias a la media, por ejemplo, para
Extremadura la diferencia es YEXT ȲP IB = 18, 2 25, 4 = 7, 2. En la quinta columna,
calculamos las diferencias a la media en valor absoluto y, en la sexta, las diferencias al cuadrado.
Aplicando la expresión 1.2.5 tenemos que la diferencia media absoluta es,
Pn
Yi Ȳ 72, 6
DM A = i=1 = = 4, 3.
n 17
La varianza muestral, expresión 1.2.6,
Pn 2
2 i=1 Yi Ȳ 423, 2
S = = = 26, 4.
n 1 16
Y el error estándar, expresión 1.2.7,
p p
S= S2 = 26, 4 = 5, 1.

1.2.3.4. Evaluar la variabilidad


La afirmación de que P IBpc tienen una desviación estándar de 5,1 (miles de €) transmite
poco sobre la variabilidad inherente en los datos de las Comunidades Autónomas españolas.
Para producir un marco de referencia más estándar, podemos utilizar los valores de la normal
estandarizada. Dada una media muestral Ȳ y una desviación estándar S, definimos los valores
estandarizados para las observaciones, también conocidos como valores Z, como

(Yi Ȳ ) di
Zi = = . (1.2.8)
SY SY
Cada desviación respecto a la media se divide por la desviación estándar. Se deduce que
los valores Z tienen media nula y desviación estándar igual a 1. Siguiendo nuestro ejemplo
simple, en la penúltima columna hemos calculado los valores estandarizados. Por ejemplo,
para el caso de Extremadura (Cuadro 1.1), calculamos el valor de la siguiente manera,

P IBEXT P IB dEXT ( 7, 2)
ZEXT = = = = 1, 4.
S S 5, 1

Los valores Z aún no nos brindan mucha información hasta que proporcionemos un marco
de referencia. Utilizamos valores Z de forma usual para examinar los errores de previsión
procediendo en tres pasos:

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 27 — #43

Tema 1 27

1. Verificar que la distribución observada de los errores sea aproximadamente normal.

2. Si se cumple la suposición, relacionamos el valor Z con las tablas normales (disponible en


el Apéndice que se suministra junto con el presente libro). A modo de ejemplo podemos
ver algunos valores clave:

a) La probabilidad de |Z| > 1, 64 es aproximadamente 0,10 (o del 10 %).


b) La probabilidad de |Z| > 1, 96 es aproximadamente 0,05 (aproximadamente del
5 %).
c) La probabilidad de que |Z| > 2, 17 es aproximadamente 0,01 (aproximadamente
1 %).
d ) La probabilidad de que |Z| > 3 es aproximadamente 0,0026 (aproximadamente un
3 por 1000).

3. Crear un gráfico de serie de los residuos (y/o valores Z), cuando corresponda, para
determinar si alguna observación parece ser extrema.
En esta etapa, no perseguimos el uso sistemático de valores Z, excepto para reconocer que
cada vez que el Z valor sea mayor que 3 en términos absolutos, la observación es atípica,
porque la probabilidad de que ocurra es menor que 3 por 1000 (si la distribución es aproxi-
madamente normal). A menudo, valores tan grandes significan que algo inusual ha sucedido,
y nos referimos a este tipo de observaciones como valores atípicos. En estudios transversales,
a veces es admisible simplemente eliminar tales observaciones (por ejemplo, un informe de un
hombre con estatura de 3 m es, sin duda, un error de registro). En la predicción de series
de tiempo, deseamos conservar la secuencia completa de valores y debemos investigar más de
cerca, a menudo encontrando circunstancias especiales (por ejemplo, una huelga, mal tiempo,
una promoción de ventas especial o la Gran Depresión de 2008), que no habíamos reconoci-
do previamente. Los valores atípicos indican la necesidad de más exploración, no el rechazo
rutinario.
En el Cuadro 1.1 vemos que el valor Z máximo en términos absolutos (ZM AD = 1, 9) está
muy alejado de 3, de manera que concluimos que no tenemos valores atípicos.
Alternativamente podemos utilizar el rango intercuartílico como medida de dispersión,
expresión 1.2.4 de la página 23, y considerar como valores atípicos aquellos que superen el
intervalo siguiente:

(Q1 1, 5 · RQ; Q3 + 1, 5 · RQ). (1.2.9)


Tal y como se hace en el diagrama de caja (Figura 1.2.7 de la página 23) cuyos resultados
(valores atípicos) son similares a los considerados con las variables estandarizadas (Z).
Para el caso del P IBpc del Ejemplo 1 serían atípicos todos los valores que se encuentren
fuera del siguiente intervalo
(Q1 1, 5 · RQ; Q3 + 1, 5 · RQ) = (21, 1 1, 5 · 7, 5; 28, 6 + 1, 5 · 7, 5)
= (21, 1 11, 25; 28, 6 + 11, 25) = (9, 85; 39, 85).
De manera que, como ya vimos anteriormente, en este caso no hay observaciones atípicas.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 28 — #44

28 Introducción a la previsión

Además del diagrama de caja, también se utilizan habitualmente los histogramas


para representar gráficamente la variable de interés (donde se viasualizan los intervalos de
observaciones en el eje de abcisas – eje horizontal– y las frecuencias, absolutas o relativas, en
el de ordenadas – eje vertical–).
Representamos el histograma, el diagrama de caja y los estadísticos principales del Ejemplo
1 en la Figura 1.2.8

Figura 1.2.8: PIB per cápita de las CCAA 2018: Histograma y diagrama de caja y estadísticos
principales.

Resumen numérico
media SY mı́n Q1 mediana Q3 máx
25, 359 5, 1427 18, 200 21, 050 23, 800 29, 700 34, 900

Si nos fijamos en el histograma vemos que la cola derecha es más larga, con 8 CCAA entre
20 y 25 mil €. La mediana (23,8) es menor que la media (25,4) ratificando la asimetría de la
distribución. Que la cola derecha sea más larga se aprecia también en el diagrama de caja.
Como no hay datos atípicos, menores de 9,85 o mayores de 39,85, los extremos del diagrama
de caja coinciden con el máximo y el mínimo. Finalmente, en el cuadro inferior se muestran
los estadísticos principales del P IBP C de las CCAA en 2018.

1.2.3.5. Correlación

En la sección anterior, produjimos resúmenes numéricos para complementar el análisis


gráfico de la Sección 1.2.2. Ahora desarrollamos un estadístico que realiza una función similar
a los diagramas de dispersión del Epígrafe 1.2.2.1 de la página 19. El coeficiente de correlación.
Pero antes de definirlo formalmente examinamos la Figura siguiente, donde reproducimos
6 gráficos.
En el gráfico a) cuando Y aumenta también lo hace X y viceversa. Ambas variables están
positiva y perfectamente correlacionadas.
En el gráfico b) cuando Y aumenta X desciende y viceversa. Ambas variables están nega-
tiva y perfectamente correlacionadas.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 29 — #45

Tema 1 29

En el gráfico c) cuando Y aumenta también lo hace X pero de forma aproximada y no


exacta (y viceversa). Ambas variables están positiva pero no perfectamente correlacionadas.
En el gráfico d) cuando Y aumenta X disminuye pero de forma aproximada y no exacta
(y viceversa). Ambas variables están negativa pero no perfectamente correlacionadas.
En el gráfico e) cuando Y aumenta no se aprecia relación con X, ni siquiera aproximada
(y viceversa). Ambas variables no están correlacionadas.
En el gráfico f) Y y X están perfectamente correlacionadas pero de forma no lineal.

Correlaciones o dependencia estadística lineal entre X e Y


a) Correlación positiva exacta b) Correlación negativa exacta

c) Correlación positiva no exacta d) Correlación negativa no exacta

e) No correlación f) Correlación exacta no lineal

Coeficiente de correlación
La correlación muestral entre X e Y se define como
Pn
i=1 Xi X̄ Yi Ȳ
rXY = qXn Xn . (1.2.10)
2 2
Xi X̄ Yi Ȳ
i=1 i=1

El numerador representa la suma de productos cruzados de las desviaciones respecto de


la media, y los términos del denominador son la raíz cuadrada de las sumas de cuadrados

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 30 — #46

30 Introducción a la previsión

de los dos conjuntos de desviaciones a las medias (las correlaciones estimadas en general las
denominaremos rXY o también ⇢ˆXY ).

Cuando dividimos el denominador por (n 1), los dos términos dentro del signo de la raíz
cuadrada se convierten en las varianzas muestrales de X e Y respectivamente; Por lo tanto,
al tomar la raíz cuadrada, el denominador representa el producto de las dos desviaciones
estándar SX y SY . El numerador dividido por (n 1) se conoce como la covarianza muestral
entre X e Y , denotada por SXY . Por lo tanto, la correlación puede escribirse como
SXY
rXY = . (1.2.11)
SX S Y
Se puede demostrar que el valor del coeficiente de correlación está acotado entre 1 y -1
( 1  rXY  1). Si es positivo (gráficos a y c), cuando aumenta X también lo hace Y . Por
el contrario, si es negativo cuando aumenta X (gráficos b y d), disminuye Y . En general, el
valor absoluto de r disminuye a medida que la relación (sea positiva o negativa) se debilita.
La correlación mide la asociación lineal entre las variables X e Y y no recoge la asociación no
lineal (gráfico f).
Ejemplo 2. Correlación del IBEX�35 con el tiempo, año 2018
El Cuadro siguiente muestra el valor del índice IBEX�35 (variable Y ) en el momento del
cierre del último día de cada mes durante el año 2018. La variable X es el número del mes. La
tabla muestra los cálculos detallados para determinar la correlación entre el Índice y el tiempo.
Una hoja de cálculo podría configurarse fácilmente para realizar los cálculos directos tal y como
hacemos en el Cuadro, pero todos los paquetes de software estándar calculan los coeficientes de
correlación rutinariamente.
IBEX�35, fecha de cierre mesual, año 2018

Por lo tanto,
SXY = 17876 = 1625, 09,
q 11
143
SX = = 3, 61, y
q 11
SY = 2905307,08
11 = 513, 92, entonces
SXY 1625,09 1625,09
rXY = SX SY = p p
13· 264118,83
= 3,61·513,92 = 0,877.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 31 — #47

Tema 1 31

El ejemplo muestra una alta correlación negativa para el IBEX�35 con el tiempo durante
2018. En la Figura 1.2.9 se visualiza claramente una tendencia negativa en las cotizaciones con el
tiempo (gráfico de dispersión).

Figura 1.2.9: IBEX�35 mensual (2018), datos al cierre del mes

A menudo nos encontraremos con múltiples variables de interés y queremos buscar relacio-
nes entre ellas. Entonces podemos combinar diagramas de dispersión con la respectiva matriz
de correlaciones como hacemos a continuación con el comercio al por menor alemán, italiano,
y francés respecto al español.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 32 — #48

32 Introducción a la previsión

Podemos ver que el comercio al por menor español está poco correlacionado con el francés
(gráfico superior derecho, correlación de -0,20), el inglés (gráfico inferior derecho, correlación
de 0,05) o el alemán (gráfico superior izquierdo, correlación del 0,22), y sin embargo muy
correlacionado con el italiano (gráfico inferior izquierdo, correlación del 0,76). Todo ello se
visualiza tanto en la matriz de correlaciones como en los gráficos (relación positiva en el
gráfico inferior izquierdo y difusa en el resto).

1.2.3.6. Autocorrelación
Así como la correlación mide la extensión de una relación lineal entre dos variables, la
autocorrelación mide la relación lineal entre una serie temporal y sus valores retardados.
Denominando rk al coeficiente de autocorrelación con k retardos, rk mide la relación entre
Yt y Yt k .

Coeficiente de autocorrelación
El valor de la autocorrelación muestral con k retardos se calcula como
PT
Yt Ȳ Yt k Ȳ
rk = t=k+1 PT 2 , (1.2.12)
t=1 Yt Ȳ

donde T es la longitud de la serie de tiempo. Si consideramos Yt y Yt k como dos variables

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 33 — #49

Tema 1 33

diferentes, la interpretación del coeficiente de autocorrelación es exactamente la misma que


hicimos con el coeficiente de correlación.

Ejemplo 3. Autocorrelación de las ventas anuales de El Corte Inglés.


La Tabla 1.2 muestra las ventas anuales de la compañía (variable Yt ) y las ventas retardadas
un periodo (variable Yt 1 ). Además se muestran los cálculos detallados para obtener la autocorre-
lación con un desfase o retardo (r1 ). No obstante, los paquetes de software estándar calculan los
coeficientes de autocorrelación rutinariamente.
En efecto, simplemente dividiendo la suma de la penúltima columna entre la última, obtenemos

Tabla 1.2: Cifra de negocios de El Corte Inglés (millones de € )

el coeficiente de autocorrelación con un desfase o retardo,


PT
Yt Ȳ Yt 1 Ȳ 18817366
r1 = t=2PT 2 = = 0, 7035.
26747093
t=1 Yt Ȳ

La Figura 1.2.10 muestra la cifra de negocios de El Corte Inglés: ingresos crecientes hasta 2007,
fuerte caída hasta 2013, consecuencia de la Gran Depresión, y recuperación más amortiguada y
sin llegar en ningún momento al máximo de 2007. En definitiva, no se aprecia una tendencia clara
durante este periodo.

Cuando los coeficientes de autocorrelación con desfases crecientes (por ejemplo: r1 , r2 , ..., ri )
se muestran conjuntamente, los denominaremos función de autocorrelación (FAC).
En la Figura 1.2.11 mostramos la función de autocorrelación (FAC) de las ventas
de El Corte Inglés.
Las líneas discontinuas del gráfico (Figura 1.2.11) indican si las autocorrelaciones son
significativamente diferentes de cero. Esto lo explicamos más adelante.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 34 — #50

34 Introducción a la previsión

Figura 1.2.10: Ventas de El Corte Inglés en millones de €

Figura 1.2.11: Función de autocorrelación de las ventas de El Corte Inglés

Cuando los datos tienen una tendencia, las autocorrelaciones para los primeros retardos
tienden a ser grandes y positivas porque las observaciones cercanas en el tiempo también son
cercanas en tamaño. Por lo tanto, el FAC de las series temporales tendenciales tiende a tener
valores positivos que disminuyen lentamente a medida que aumentan los retardos. Cuando
los datos son estacionales, las autocorrelaciones serán mayores para los retardos estacionales
(en múltiplos de la frecuencia estacional) que para otros retardos. Cuando los datos son tanto
de tendencia como estacionales, veremos una combinación de los dos efectos. Veamos dos
ejemplos con tendencia para ver esto con más claridad.

Ejemplo 4. Ventas de Inditex


La Figura 1.2.12 muestra las ventas de Inditex. Claramente la serie presenta una tendencia
creciente a lo largo de toda la serie. Por tanto, esperamos que la función de autocorrelación
presente valores positivos que decrecen lentamente a medida que aumentan los retardos.
La Figura 1.2.13 muestra los primeros 5 retardos de la FAC, las autocorrelaciones descienden
lentamente y los 5 retardos son positivos y significativos (puesto que están por encima de la línea

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 35 — #51

Tema 1 35

Figura 1.2.12: Ventas anuales Inditex (millones de €)

discontinua) lo que contrasta con la FAC de El Corte Inglés, Figura 1.2.11, sin una tendencia clara
y donde el segundo retardo ya no es significativo.

Figura 1.2.13: Función de Aucorrelación de Inditex

Ejemplo 5. Producción de leche


La Figura 1.2.14 muestra la producción mensual de leche en España entre enero de 2010 y
diciembre de 2017. La serie presenta tendencia creciente y estacionalidad.
Y su FAC la podemos visualizar en la Figura 1.2.15.
La disminución lenta en el FAC a medida que aumentan los retardos se debe a la tendencia
(solo a partir del retardo 27 las autocorrelaciones empiezan a no ser significativas), mientras que
la forma «escalonada» se debe a la estacionalidad (con picos en los retardos estacionales: 12, 24
. . . ).

1.2.3.7. Ruido Blanco


Las series temporales que no muestran autocorrelación se denominan «ruido blanco» o
puramente aleatorias. En la Figura 1.2.16 mostramos un ejemplo de una serie ruido blanco
con distribución N (0, 1)7 y la correspondiente FAC en la Figura 1.2.17.
7
Distribución normal con media nula y varianza unitaria.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 36 — #52

36 Introducción a la previsión

Figura 1.2.14: Producción de leche en España

Figura 1.2.15: FAC de la producción de leche en España

En el Gráfico de la serie (Figura 1.2.16) vemos una variable muy irregular con varianza
y media constante. Esperamos que cada autocorrelación sea cercana a cero. Por supuesto, no
serán exactamente iguales a cero ya que hay variación aleatoria. Para que una serie sea ruido
p
blanco, al menos el 95 % de los picos de la FAC deben estar dentro de los valores ±2/ T
donde T es la longitud de la serie de tiempo. Es común trazar estos límites en un gráfico de la
FAC (líneas discontinuas de la Figura 1.2.17). Si uno o más picos grandes están fuera de estos
límites, o si sustancialmente más del 5 % de los picos están fuera de estos límites, entonces la
serie probablemente no es ruido blanco. p
En este ejemplo, con T = 100, los límites están en ±2/ 100 = ±0, 2. Todos los coeficientes
de autocorrelación se encuentran dentro de estos límites, y por tanto no son significativos, lo
que confirma que los datos son compatibles con un proceso ruido blanco o puramente aleatorio.

1.3. Transformaciones usuales utilizadas para predecir


1.3.1. Transformaciones y ajustes
El ajuste de los datos a menudo puede conducir a un modelo de pronóstico más simple. Ve-
remos cuatro tipos de ajustes: ajustes de calendario, ajustes de población, ajustes de inflación
y transformaciones matemáticas (como las diferencias, tasas de variación o logaritmos). El
objetivo de estos ajustes y transformaciones es simplificar los patrones en los datos históricos
eliminando las fuentes de variación conocidas o haciendo que el patrón sea más uniforme en

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 37 — #53

Tema 1 37

Figura 1.2.16: Serie aleatoria generada por ordenador con distribución N (0, 1)

Figura 1.2.17: FAC de una serie puramente aleatoria

todo el conjunto de datos. Los patrones más simples generalmente conducen a pronósticos
más precisos.

1.3.1.1. Ajustes de calendario


Algunas de las variaciones observadas en los datos estacionales pueden deberse a simples
efectos de calendario (como vimos en la Figura 1.2.1 de la página 17). En tales casos, gene-
ralmente es mucho más fácil eliminar la variación antes de ajustar un modelo de pronóstico.
Veamos un ejemplo sencillo.

Ejemplo 6. Ajuste de calendario para la producción de leche.


La Figura 1.3.1 muestra las producción de leche mensual (gráfico superior) y su media diaria
(gráfico inferior), lo que se consigue simplemente dividiendo el total mensual por el número de días
del mes correspondiente.
Observe cuánto más simple es el patrón estacional en la gráfica de producción diaria promedio
en comparación con la gráfica de producción mensual. Al observar la producción diaria promedio
en lugar de la producción mensual, eliminamos efectivamente la variación debido a las diferentes
duraciones de los meses del año. Los patrones más simples generalmente son más fáciles de modelar
y conducen a pronósticos más precisos.

Se puede hacer un ajuste similar al del ejemplo para los datos de ventas cuando varía el

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 38 — #54

38 Introducción a la previsión

Figura 1.3.1: Producción de leche mensual y su media diaria

número de días con comercio en cada mes. En este caso, las ventas por día laboral se pueden
modelar en lugar de las ventas totales de cada mes.

1.3.1.2. Ajustes de población

Cualquier dato que se vea afectado por los cambios en la población podemos ajustarlos
para proporcionar datos per cápita (como hicimos, por ejemplo, para comparar el PIB per
cápita de las CCAA planteado en el Ejemplo 1 de la págna 24. Es decir, considere los datos por
persona (o por cada mil personas, o por cada millón de personas) en vez del total. Por ejemplo,
si estudia el número de camas de hospital en una región en particular a lo largo del tiempo,
los resultados son mucho más fáciles de interpretar si elimina los efectos de los cambios en
la población considerando el número de camas por cada mil personas. Luego puede ver si ha
habido aumentos reales en el número de camas o si los aumentos se deben enteramente a los
aumentos de la población. Es posible que aumente el número total de camas, pero disminuya
el número de camas por cada mil personas. Esto ocurre cuando la población aumenta más
rápido que el número de camas de hospital.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 39 — #55

Tema 1 39

1.3.1.3. Ajustes de inflación


Los datos que se ven afectados por el valor del dinero es mejor ajustarlo por la inflación
antes de realizar el modelo de previsión. Por ejemplo, el coste medio de una vivienda nueva
habrá aumentado en las últimas décadas debido a la inflación. Por esta razón, las series
temporales financieras generalmente se ajustan de modo que todos los valores se expresen
en valores en euros de un año en particular. Por ejemplo, los datos del precio de la vivienda
pueden establecerse en euros del año 2015. Para hacer estos ajustes, se usa un índice de precios.
Si Z2015 es el índice de precios del año 2015 = 100 y Yt el precio original de la vivienda en el
año t, entonces Xt = Yt /(Z2015 /100) da el precio ajustado de la vivienda en valores de euros
del año 2015. Los índices de precios a menudo son construidos por agencias gubernamentales.
Para bienes de consumo, un índice de precios común es el índice de precios al consumidor (o
IP C).

1.3.2. Transformaciones matemáticas


1.3.2.1. Diferencias y tasas de crecimiento
Examinamos las cifras de producción anual de pinturas y barnices en España (1975-2018)
que se muestra en la Figura 1.3.2, sus estadísticas descriptivas principales las reproducimos
en el Cuadro siguiente.
Estadísticos principales: producción anual de pinturas y barnices
media SY mı́n Q1 mediana Q3 máx
80, 06 29, 54 19, 67 56, 32 80, 06 102, 65 133, 94
¿Qué significa el promedio de 80, 06 para las ventas de pinturas? Tales niveles eran típicos
del año 1996–97, pero el «promedio» en una serie con fuerte tendencia como esta tiene poco
o ningún significado. Ciertamente, usar la media o la mediana para pronosticar la producción
del próximo año no tendría ningún sentido.

Figura 1.3.2: Producción anual de pinturas y barnices en España

¿Cómo deberíamos lidiar con una serie que revela una fuerte tendencia? El lenguaje co-
tidiano nos proporciona una pista, hablamos del rendimiento de una inversión, un aumento

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 40 — #56

40 Introducción a la previsión

en las ventas de la empresa respecto del año anterior o el cambio porcentual en el PIB. Este
enfoque es en parte una cuestión de conveniencia; algunas ideas se comunican más fácilmente
usando cambios (porcentuales) en lugar de cifras sin procesar. Por lo tanto, podemos con-
siderar el crecimiento del 2 % del PIB como razonable, el 1 % como anémico y el 6 % como
insostenible. La misma información transmitida en euros sería difícil de comprender.
Desde la perspectiva de la previsión, hay dos razones más para considerar tales alternativas:

1. Debido a que estamos examinando los cambios, el pronóstico se relaciona directamente


con el valor observado anteriormente; tales pronósticos son poco probables que estén
fuera del objetivo.

2. Los niveles medios en términos de cambios absolutos o cambios porcentuales suelen ser
más estables y más significativos que los promedios calculados a partir de la serie original
o en niveles.

El cambio en el nivel absoluto de una serie de un período al siguiente se conoce como la


(primera) diferencia de la serie y se escribe como

Yt = Yt Yt 1, (1.3.1)
en ocasiones también se utiliza d en vez de para indicar la primera diferencia.
En el momento t + 1, el valor anterior, Yt , ya es conocido. Si el pronóstico de la diferencia
lo escribimos como \ Yt+1 . El pronóstico para el período t + 1 de la serie original, Ŷt+1 , se
convierte en

Ŷ t+1 = Yt + \
Yt+1 . (1.3.2)
Es decir, el pronóstico final de la serie original es el nivel anterior más el pronóstico de
cambio.
Del mismo modo, la tasa de crecimiento en el tiempo se escribe como

Yt Yt 1
GYt = · 100. (1.3.3)
Yt 1

La expresión 1.3.3 también define el rendimiento de un período de una inversión, dado


el precio de apertura, Yt . Una vez que se ha predicho la tasa de crecimiento, denotada por
\
GY t+1 , el pronóstico para el próximo período, Ŷt+1 , es
!
\
GY t+1
Ŷt+1 = Yt 1 + . (1.3.4)
100
En las Figuras 1.3.3 y 1.3.4 se muestran las primeras diferencias y los incrementos por-
centuales de la producción de pinturas y barnices.
Las diferencias muestran un comportamiento mucho más estable que la serie original si
hacemos abstracción de los primeros años, de mayor crecimiento, y de la Gran Depresión,
con una fuerte caída. Exactamente el mismo comentario lo podemos hacer sobre la serie en
porcentaje.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 41 — #57

Tema 1 41

Figura 1.3.3: Primeras diferencias de la producción de pinturas y barnices en España

Figura 1.3.4: Producción de pinturas y barnices en porcentaje

En el Cuadro siguiente reproducimos las estadísticas descriptivas principales de la serie en


diferencias y tasas de variación.

Estadísticos principales. Producción de pinturas y barnices. Tasa de variación y diferencias


media SY mı́n Q1 mediana Q3 máx
dif erencias 2, 08 6, 04 27, 14 0, 65 2, 68 5, 65 14, 35
% de 4, 63 12, 23 21, 34 0, 87 3, 21 6, 36 72, 94
Si consideramos más probable que las diferencias se mantengan estables (o los porcentajes
de variación) y que no se produzcan acontecimientos como la Gran Depresión en el próxi-
mo futuro, o los fuertes crecimientos del principio, entonces una opción razonable es realizar
previsiones a partir de la media de las diferencias o de las tasas de variación utilizando las
expresiones 1.3.2 y 1.3.4 tal y como hacemos en la Tabla 1.3. Es decir para el caso de las dife-
rencias simplemente sumamos el incremento medio, 2,08, al último valor y así sucesivamente.
En el caso de la tasa incrementamos el porcentaje medio, 4,63 %, al último año (multiplicando
por 1,0463) y así sucesivamente. La Figura 1.3.5 muestra gráficamente ambas previsiones y la
serie original.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 42 — #58

42 Introducción a la previsión

Tabla 1.3: Previsión de Producción de Pinturas y Barnices para (2019 -2023)

Figura 1.3.5: Producción de pinturas y previsión de la diferencia y tasa media

PREGUNTA DE DISCUSIÓN: Para calcular las diferencias y sus tasas medias hemos tenido
en cuenta todos los datos ¿cree que esta es la mejor forma de realizar la previsión bajo los
supuestos establecidos?
Cuando la serie presenta estacionalidad, como en el caso del comercio al por menor (Figura
1.2.2 de la página 18), la primera diferencia regular (expresión 1.3.1) es menos estable que la
primera diferencia estacional (o diferencia interanual), definida como

s Yt = Yt Yt s, (1.3.5)
donde s se refiere al desfase estacional (s = 4 si los datos son trimestrales, 12 si son mensuales,
etc). Utilizamos también en ocasiones ds en vez de s para indicar la primera diferencia
estacional.
En el momento t + s, el valor anterior, Yt , ya es conocido. Si el pronóstico de la diferencia
lo escribimos como \ Yt+s . El pronóstico para el período t + s de la serie original, Ŷt+s , se
convierte en

Ŷ t+s = Yt + \
Yt+s . (1.3.6)

Es decir, el pronóstico final de la serie original es el nivel anterior más el pronóstico de


cambio estacional.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 43 — #59

Tema 1 43

Del mismo modo, la tasa de crecimiento estacional (o tasa de crecimiento interanual)


en el tiempo se escribe como

Yt Yt s
Gs Y t = · 100. (1.3.7)
Yt s

Una vez que hemos pronosticado la tasa de crecimiento estacional, denotada por G\
s Yt+s ,
el pronóstico para el próximo período, Ŷt+s , es

!
G\
s Yt+s
Ŷt+s = Yt 1+ . (1.3.8)
100

Veamos un ejemplo.

Ejemplo 7. Comercio al por menor en España, pronóstico a partir de las tasas de


variación estacionales
En la Figura 1.3.6 mostramos el comercio al por menor español en tasas de variación
interanual (línea fina) y la media móvil centrada anual (trazo grueso).

Figura 1.3.6: Comercio al por menor español. Tasas de variación interanual

Si hacemos abstracción de la fuerte caída (en forma de «W») de la Gran Depresión entre
los años 2007 y 2013 (zona sombreada), los valores son positivos y relativamente estables sin
que se aprecie el componente estacional de la serie original (Figura 1.2.6 de la página 22).
El Cuadro siguiente presenta las estadísticas descriptivas principales de la serie en tasas
de variación estacionales.
Estadísticos principales. Comercio al por menor. Tasa de variación interanual
media SY mı́n Q1 mediana Q3 máx
% de 12 0, 18508 4, 6533 15, 377 3, 3230 0, 93903 3, 3013 7, 7546
Si nos fijamos de nuevo en el gráfico, vemos que si no tenemos en cuenta la Gran Depresión,

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 44 — #60

44 Introducción a la previsión

las tasas8 de variación son positivas y sin embargo la media ( 0, 13996) es negativa9 , por ello
nosotros utilizaremos la mediana (0,93903).
Aplicando la expresión 1.3.8 tenemos que
!
G\s Yt+s
Ŷt+s = Yt 1 + = Yt · 1, 0093903.
100
En la Figura 1.3.7 mostramos el gráfico de la serie original y la previsión.

Figura 1.3.7: Comercio al por menor español y pronóstico a partir de la tasa mediana inter-
anual

1.3.2.2. La transformación logarítmica (log)


La transformación logarítmica, ln(Yt ), es muy usual y se realiza con el objetivo de convertir
el crecimiento exponencial (o proporcional) en crecimiento lineal.
Para convertir de nuevo a las unidades originales, usamos su función inversa (o trans-
formación inversa), denominada «exp» o función exponencial, por lo que tenemos que Yt =
exp [ln(Yt )].
La (primera) diferencia de los logaritmos presenta la siguiente relación:

ln(Yt )
[ln (Yt )] = ln(Yt ) ln(Yt 1) =. (1.3.9)
ln(Yt 1 )
La transformación a menudo tiene el beneficio secundario de estabilizar la varianza, al
igual que el uso de las tasas de crecimiento. De hecho, las diferencias del logaritmo y la tasa
de crecimiento producen resultados similares, si las variaciones son pequeñas10 .
8
Desde luego la probabilidad de una Gran Depresión en los próximos años (justo después y aún sin recu-
perarnos del todo de ella) era un acontecimiento muy improbable, pero los cisnes negros existen, y la crisis
del coronavirus que estamos padeciendo cuando escribimos estas páginas lo demuestra, quizás este es un buen
momento para volver a reflexionar sobre los primeros párrafos de este capítulo (página 5)
9
Alternativamente podríamos haber eliminado las observaciones de la Gran Depresión y volver a calcular
los estadísticos principales. Lo dejamos para un ejercicio del final del capítulo.
10
Ya que d [ln(x)] = dx
x
⇡ [ln(x)] = xx .

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 45 — #61

Tema 1 45

Si generamos un pronóstico de la diferencia del ln, por ejemplo ln(Y \ t+1 ), entonces el
pronóstico para la serie original requiere que invirtamos la transformación utilizando la función
exponencial. Dado el valor del periodo anterior, Yt , el pronóstico para el período t + 1 se
convierte en11
h i
Ŷt+1 = Yt exp \ ln (Yt ) . (1.3.10)

Ejemplo 8. Transformación logarítmica para la previsión de Inditex


Las ventas de Inditex presentan una tendencia creciente en toda la serie (Figura 1.2.12 de la
página 35). La Figura 1.3.8 muestra los gráficos de la serie en logaritmos (izquierda) y su diferencia
(derecha).
La serie en logaritmos muestra una tendencia clara, pero su diferencia es más estable, aunque

Figura 1.3.8: Ventas de Inditex en log y su primera diferencia

también con tendencia negativa pero más amortiguada. Los estadísticos principales de esta última
serie (diferencias de los logaritmos) los mostramos en la Tabla 1.4.
La primera diferencia de los logaritmos de la serie evidencia una tendencia negativa, en este

Tabla 1.4: Estadísticos principales de Inditex, primera diferencia de los logaritmos.


media SY mı́n Q1 mediana Q3 máx
ln (ventas) 0, 14764 0, 065391 0, 031432 0, 096719 0, 14397 0, 19442 0, 28295

sentido la media tiene muy poco valor predictivo, además el último dato coincide con el mínimo
de la serie (0, 031432). Por consiguiente, tiene sentido pensar en este último como una buena
aproximación a las ventas del próximo año12 . No obstante, este pronóstico puede ser demasiado
optimista, puesto que la pendiente negativa de la serie puede estar sugiriendo crecimientos futuros
cada vez menores) sobre todo si realizamos una previsión de más de un paso adelante (más de un
año).
11
Cuando x es pequeño, exp(x) ⇡ 1 + x, lo que ayuda a explicar por qué la tasa de crecimiento y el análisis
de la transformación del logaritmo a menudo producen resultados similares.
12
En el siguiente Epígrafe examinamos algunos de los métodos simples o ingenuos de previsión, como considerar
el último valor conocido como la mejor previsión.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 46 — #62

46 Introducción a la previsión

En la Figura 1.3.9 vemos el gráfico de la serie original, la previsión y la tabla con el cálculo
detallado de las previsiones realizadas.

Figura 1.3.9: Previsión, incremento de la diferencia del logaritmo de las ventas de Inditex

Cuando las series presentan estacionalidad podemos utilizar la diferencia estacional (o


interanual) de los logaritmos que presenta la relación:

ln(Yt )
s [ln (Yt )] = ln(Yt ) ln(Yt s) = . (1.3.11)
ln(Yt s )

Si generamos un pronóstico de la diferencia estacional del ln, por ejemplo s \ ln(Yt+s ), en-
tonces el pronóstico para la serie original requiere que invirtamos la transformación utilizando
la función exponencial. Dado el valor del periodo anterior, Yt , el pronóstico para el período
t + s se convierte en
h i
Ŷt+s = Yt exp s\ ln (Yt ) . (1.3.12)

Veamos un ejemplo.

Ejemplo 9. Viajeros alojados en hoteles


La Figura 1.3.10 muestra los viajeros alojados en hoteles, con periodicidad mensual, entre
los años 1999 y 2018 en millones de personas, su media móvil centrada (gráfico izquierdo) y su
componente estacional (gráfico derecho).
En el gráfico izquierdo observamos que predomina el fuerte componente estacional que au-
menta con el transcurrir del tiempo, lo que impide visualizar la tendencia general claramente. Por
eso hemos incluido su media móvil centrada, en ella vemos una tendencia creciente clara que solo
se ha roto durante la Gran Depresión de 2008 (gris en el gráfico). En 2014, final de la crisis, los
viajeros alojadas han alcanzado ya el nivel de 2008.
El gráfico de la derecha muestra los mismos datos pero destacando su componente estacional.
El máximo se produce en agosto y el mínimo en enero todos los años. De manera que los viajeros
van aumentando de enero hasta agosto, y disminuye hasta el próximo enero y así sucesivamente.
La Figura 1.3.11 muestra las serie en logaritmos (izquierda) y su diferencia estacional (derecha).

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 47 — #63

Tema 1 47

Figura 1.3.10: Viajeros alojados en hoteles en España. 1999.1 - 2018.12

Figura 1.3.11: Viajeros alojados en hoteles en logaritmos y su diferencia estacional

Si comparamos las series de viajeros original (gráfico izquierdo de la Figura 1.3.10) con la serie
en logaritmos (gráfico izquierdo de la Figura 1.3.11) observamos que la transformación logarítmica
ha conseguido eliminar el incremento del componente estacional con el transcurrir del tiempo y
ahora la variación estacional se mantiene aproximadamente igual a lo largo de la serie.
En el gráfico derecho (Figura 1.3.11) podemos observar la diferencia estacional en logaritmos
y su media móvil anual para visualizar mejor la tendencia de la serie. Ahora la serie es mucho más
estable, se aprecia la gran depresión con mayor claridad (en forma de «W») y un fuerte crecimiento
justo antes de la Gran Depresión, el componente estacional se ha diluido en gran medida pero no
dejan de apreciarse como saltos anuales que parecen relacionados con el componente estacional.
Desde el punto de vista de la previsión podemos explorar dos opciones:
1. Considerar la media o la mediana de la serie de las diferencias interanuales en logaritmos o,
alternativamente,
2. Considerar las medias o medianas de cada mes de forma individual.
Bajo el primer supuesto, empezamos el análisis mostrando los estadísticos principales de las
diferencias interanuales de las viajeros alojados en hoteles en logaritmos (Tabla 1.5).
En este caso media y mediana son muy similares (0, 031 y 0,037) si somos más optimistas
podemos seleccionar la mediana (0, 037). No obstante si nos fijamos de nuevo en el gráfico (Fi-
gura 1.3.11), podemos observar que la serie termina reduciendo su crecimiento y por esta razón
elegiremos la media para realizar el pronóstico (0,031047).

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 48 — #64

48 Introducción a la previsión

Tabla 1.5: Viajeros alojados en hoteles en España. Diferencias interanuales en logaritmos


media SY mı́n Q1 mediana Q3 máx
12 ln (Yt ) 0, 031 0, 062 0, 22 0, 00057 0, 037 0, 066 0, 279

Utilizando la expresión 1.3.12 tenemos que

h i
Ŷt+s = Yt exp \
s ln (Yt ) = Yt exp [0, 031047] = Yt · 1, 031534.

La serie original y el pronóstico lo podemos observar en la Figura 1.3.12.

La opción 2, considerar las medias o medianas de cada mes de forma individual, la podemos

Figura 1.3.12: Viajeros alojados en hoteles. España. Serie original y previsión

analizar a partir de la Figura 1.3.13 donde mostramos los diagramas de caja de cada mes y sus
respectivas medias y medianas.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 49 — #65

Tema 1 49

Figura 1.3.13: Gráficos de caja mensual. Viajeros alojados en hoteles (España)

Los diagramas de caja muestran medias muy similares (representadas por una cruz dentro de
cada caja), todas cercanas a 0, 03.
La variabilidad, sin embargo, presenta diferencias notables entre los diferentes meses con rangos
intercuartilicos (RQ) muy distintos entre sí. Abril es el mes con mayor variabilidad y agosto el más
estable. Las medianas son normalmente mayores que sus respectivas medias excepto abril, julio
y octubre. Además la mediana también presenta más variabilidad intermensual, con máximo en
marzo, 0, 065, y mínimo en abril, 0, 014.
En definitiva, si lo que queremos es realizar la previsión a partir de las respectivas medias,
entonces la previsión realizada anteriormente es muy similar puesto que la media está en ese
entorno (0, 03).
Si elegimos para el pronóstico la mediana, entonces las diferencias de crecimiento entre los
meses son mayores. Es decir, aplicando la expresión 1.3.12, la previsión por ejemplo para el año
2019 sería la siguiente:

Ŷ2019,01 = Y2018,01 exp [0, 040] ,

Ŷ2019,02 = Y2018,02 exp [0, 036] ,

...

Ŷ2019,12 = Y2018,12 exp [0, 045] ,

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 50 — #66

50 Introducción a la previsión

en el año 2020 procedemos de la misma forma, considerando las observaciones pronosticadas en


2019 como datos observados.
En la Figura 1.3.14 mostramos las dos previsiones realizadas.
En conjunto, ambos pronósticos, son muy similares. Sobre todo durante el primer año. Con el

Figura 1.3.14: Previsiones viajeros alojados en hoteles (España)

transcurso del tiempo el crecimiento de la previsión basada en la mediana muestra cada vez mayor
crecimiento y la forma estacional se va diferenciando, sobre todo en los meses de marzo y abril.

1.3.3. Algunos métodos de pronóstico simples o ingenuos


Algunos métodos de pronóstico son muy simples pero sorprendentemente efectivos. En
esta Sección veremos tres métodos que utilizaremos como referencia.
Pero ya vimos que la media o la mediana junto con algunas transformaciones (diferen-
cias, porcentajes o logaritmos) nos pueden proporcionar pronósticos sencillos pero razonables.
Ambos procedimientos los podríamos haber incluido también en esta misma sección puesto
que se encuentran en esta misma categoría.

1.3.3.1. Método ingenuo


Los pronósticos13 ingenuos son aquellos que simplemente se configuran como el valor de
la última observación conocida.

ŶT +h|T = YT , (1.3.13)

donde, ŶT +h|T , nos indica que la previsión de h periodos de tiempo hacia adelante, condicio-
nado o conocidas las T observaciones de la muestra, t = 1, 2, ..., T , es YT o, lo que es lo mismo,
la última observación conocida.
13
De forma más técnica, podemos decir que el método de pronóstico ingenuo tiene su origen en el proceso
camino aleatorio, cuyo modelo es Yt = Yt 1 + "t , donde "t es ruido blanco (veáse la Sección 1.2.3.7 de la página
35). Un paseo aleatorio se caracteriza porque la mejor previsión futura es el último valor conocido.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 51 — #67

Tema 1 51

Este planteamiento funciona especialmente bien para series económicas y financieras. De


hecho lo utilizamos en el Ejemplo 8 de la página 45, cuando decidimos utilizar el último valor
conocido de las diferencias en logaritmos de las ventas de Inditex.

1.3.3.2. Método ingenuo con deriva


Cuando la serie presenta tendencia podemos utilizar el método ingenuo con deriva,

ŶT +h|T = ah + YT , (1.3.14)

donde «a» es el crecimiento medio por unidad de tiempo o deriva, ah = h(YT Y1 )/(T 1).

1.3.3.3. Método ingenuo estacional


Si los datos presentan estacionalidad, entonces podemos presentar el método ingenuo de
forma similar, pero considerando el pronóstico como el último dato de la misma estación
(trimestre, mes o semana).

ŶT +h|T = YT +h sn , (1.3.15)

donde s es el período estacional (12 para meses, 4 en trimestres), n el número años hacia
adelante (n = 1, 2, ...) y h los pasos hacia adelante. Por ejemplo, con datos mensuales, el
pronóstico para todos los valores futuros de junio es igual al último valor observado en junio.
Lo mismo se aplica para otros meses o trimestres, y para otros períodos estacionales.

Ejemplo 10. Ventas de El Corte Inglés


En la Tabla 1.6 mostramos los estadísticos principales de la series (que podemos visualizar en
la Figura 1.2.10 de la página 34). La última observación fue de 15.783 millones de €. La primera
observación coincide con el mínimo, 13.000 millones de €.
El pronóstico del método ingenuo con deriva es

Tabla 1.6: Estadísticos principales, ventas El Corte Inglés


media SY mı́n Q1 mediana Q3 máx
Ventas 15519 1292, 9 13000 14532 15612 16384 17990

YT Y1 15783 13000
ŶT +h|T = ah + YT = h + YT = h + 15783 = h · 173, 938 + 15783.
T 1 17 1

La Figura 1.3.15 muestra la serie original y cuatro pronósticos sencillos o ingenuos: La media
(15.519), la mediana (15.612), el método ingenuo (15.783) y el ingenuo con deriva.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 52 — #68

52 Introducción a la previsión

Figura 1.3.15: Ventas de El Corte Inglés y previsión

1.4. Cómo evaluar la precisión del pronóstico


1.4.1. Residuos muestrales (o errores dentro de la muestra).
Los procesos estocásticos los introdujimos en la Sección 1.1.4 de la página 10 y siguientes,
aquí incidimos en ese mismo tema.
Los residuos en un modelo son los que quedan después de ajustar un modelo, de manera
que no es una predicción propiamente dicha sino la diferencia entre la serie observada y la
ajustada por el modelo. Los residuos son iguales a la diferencia entre las observaciones y los
valores ajustados correspondientes

"ˆt = Yt Ŷ t . (1.4.1)
Los residuos son útiles para verificar si un modelo ha capturado adecuadamente la in-
formación en los datos. Un buen método de pronóstico arrojará residuos con las siguientes
propiedades:

1. Los residuos no están correlacionados. Si hay correlaciones entre residuos, entonces


hay información restante en los residuos que se debe usar en los pronósticos.

2. Los residuos tienen media cero. Si los residuos tienen una media distinta de cero,
entonces las previsiones son parciales o sesgadas.

Se puede mejorar cualquier método de pronóstico que no satisfaga estas propiedades. Sin
embargo, eso no significa que los métodos de pronóstico que satisfagan estas propiedades no
se puedan mejorar. Es posible tener varios métodos de pronóstico diferentes para el mismo
conjunto de datos, todos los cuales satisfacen estas propiedades. Comprobar estas propiedades
es importante para ver si un método está utilizando toda la información disponible, pero no
es una buena manera de seleccionar un método de pronóstico.
Si cualquiera de estas dos propiedades no se cumple, entonces el método de pronóstico
se puede modificar para obtener mejores pronósticos. Ajustar el sesgo es fácil: si los residuos
tienen una media m, entonces simplemente agregue m unidades a todos los pronósticos y se

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 53 — #69

Tema 1 53

resuelve el problema de sesgo. Reparar el problema de correlación es más difícil, y no vamos


a abordarlo hasta que veamos capítulos más avanzados.
Además de estas propiedades esenciales, es útil (pero no necesario) que los residuos también
tengan las dos propiedades siguientes.

Los residuos tienen variación constante.

Los residuos se distribuyen normalmente.

Estas dos propiedades facilitan el cálculo de los intervalos de predicción (que veremos más
adelante, en este mismo capítulo). Sin embargo, un método de pronóstico que no satisfaga estas
propiedades no necesariamente se puede mejorar. A veces, la aplicación de una transformación
en logaritmos puede ayudar con estas propiedades, pero de lo contrario generalmente hay poco
que se puede hacer para garantizar que sus residuos tengan una variación constante14 y una
distribución normal. En cambio, es necesario un enfoque alternativo para obtener intervalos
de predicción. Nuevamente, no abordaremos cómo hacer esto hasta más adelante.

Ejemplo 11. Pronosticar el Índice de la Bolsa (IBEX�35), precio de cierre mensual


La idea de paseo aleatorio se asocia con la hipótesis de mercado eficiente (donde los inversores
no pueden obtener beneficios de los rendimientos de las acciones más allá de descontar los costes
de las transacciones y ajustar el riesgo). Por ello se sostiene en muchas ocasiones que la previsión
de la bolsa (Figura 1.4.1) se ajusta bastante bien a la predicción ingenua que vimos en el Epígrafe
1.3.3.1.
Los residuos obtenidos al pronosticar esta serie utilizando el método ingenuo (ˆ
"t = Yt Ŷt =

Figura 1.4.1: Ibex�35 (1987–2018)

Yt Yt 1 ), la Figura 1.4.2 muestra estos errores.


Mostramos el histograma de la serie de las primeras diferencias del Ibex�35 y la comparamos
con la normal en la Figura 1.4.3.

14
La transformación de Box-Cox tiene como caso particular los logaritmos y la veremos en capítulos más
avanzados.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 54 — #70

54 Introducción a la previsión

Figura 1.4.2: Primeras diferencias del Ibex�35 (1987–2018)

Figura 1.4.3: Histograma de los residuos del método ingenuo aplicado al Ibex�35. Ibex�35.
(1987-2018)

Los residuos de modelo ingenuo (o las diferencias del Ibex�35) muestran mayor apuntamiento
que la normal (mayor altura) y colas más largas, de manera que no podemos decir que la variable
se comporte como una normal.

La función de autocorrelación (véase el Epígrafe 1.2.3.6 de la página 32) la reproducimos en


la Figura (1.4.4).

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 55 — #71

Tema 1 55

Figura 1.4.4: Función de autocorrelación de los residuos del Ibex�35

Estos gráficos muestran que el método ingenuo produce pronósticos que parecen dar cuenta
de toda la información disponible. La media de los residuos es cercana a cero y no existe una
correlación significativa, aunque la distribución tenga mayor apuntamiento que la normal.

1.4.2. Errores de pronóstico (o errores fuera de la muestra)


Es importante evaluar la precisión del pronóstico con pronósticos genuinos. En consecuen-
cia, el tamaño de los residuos no es una indicación confiable de cuán grandes pueden ser
los verdaderos errores de pronóstico. La precisión de los pronósticos solo se puede determinar
comparando el comportamiento del modelo con datos no usados en el ajuste del modelo (fuera
de la muestra utilizada en la estimación).
Es una práctica común separar los datos disponibles en dos partes, datos de entrenamien-
to y prueba, donde los datos de entrenamiento se utilizan para estimar cualquier parámetro
de un método de pronóstico y los datos de prueba para evaluar su precisión. Debido a que
los datos de prueba no se utilizaron para determinar las predicciones del modelo, estos de-
ben proporcionar una indicación de la confianza sobre la bondad del modelo para realizar
pronósticos.
El tamaño del conjunto de prueba suele ser aproximadamente el 20 % de la muestra total,
aunque este valor depende del tamaño de la muestra y el horizonte a pronosticar. El conjunto
de prueba idealmente debe ser al menos tan grande como el horizonte de pronóstico máximo
requerido. Se deben tener en cuenta los siguientes puntos.

Un modelo que se adapte bien a los datos en la estimación no garantiza necesariamente


un buen pronóstico.

Siempre podemos obtener un ajuste perfecto si utilizamos un modelo con suficientes


parámetros.

Ajustar demasiado un modelo a los datos es tan malo como no identificar los patrones
sistemáticos de los datos.

1.4.3. Medidas de precisión de pronósticos


Una pregunta clave en cualquier intento de previsión es cómo evaluar y medir su rendimien-
to. Las medidas de rendimiento son de particular valor cuando seleccionamos un procedimiento

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 56 — #72

56 Introducción a la previsión

de pronóstico, ya que podemos comparar alternativas y elegir el método con el mejor historial.
Luego, una vez que el método se usa de manera regular, necesitamos medidas similares para
decirnos si las predicciones mantienen su nivel histórico de precisión. Si un conjunto particu-
lar de pronósticos no está funcionando adecuadamente, se necesita una intervención gerencial
para que las cosas vuelvan a encarrilarse.
La generación de pronósticos y la selección de un método preferido ocupan la mayor
parte del libro. Los pronósticos meteorológicos que aparecen en los medios no están dirigidos
a un público en particular, y no hay ninguna razón para suponer que los pronósticos de
temperatura tengan un sesgo inherente. Sin embargo, esperamos que tales pronósticos (y esto
es típicamente cierto para todos los pronósticos) sean menos precisos a medida que aumenta
el horizonte temporal (en este caso, el número de días por delante).
En un sentido general, es útil referirse a un pronóstico para el período T + h como ŶT +h ,
donde informamos tanto del período que se pronostica como el número de períodos antes de
la fecha en que se realizó el pronóstico (h). De esta manera los valores serán eventualmente
comparados, por ejemplo, con el valor observado en el período 14, Y14 , con los valores previstos
para esa fecha, Ŷ13+1 , Ŷ12+2 , etc. El formato general se muestra en el Cuadro siguiente.

Estructura de pronósticos para 1, 2, 3, ... Períodos futuros

Obtenidos los pronósticos y los valores reales con los cuales compararlos, ¿cómo deberían
hacerse las comparaciones? En principio, los criterios utilizados deben reflejar la función de
pérdida del responsable de la toma de decisiones (por ejemplo, minimizar el costo, alcanzar
un cierto nivel de servicio al cliente), pero tal información puede no estar disponible o las
previsiones pueden usarse para múltiples propósitos. En estas circunstancias, debemos desa-
rrollar criterios de propósito general que puedan usarse en una variedad de circunstancias. Un
enfoque natural es observar las diferencias entre los valores observados y los pronosticados y
usar su promedio como medida de la bondad de la previsión, como veremos más adelante.

"ˆT +h|T = YT +h ŶT +h|T , (1.4.2)

donde los datos de entrenamiento están dados por Y1 , ..., YT y los datos de prueba están dados
por {YT +1 , Y T +2 , ...}.
Tenga en cuenta que los errores de pronóstico son diferentes de los residuales de dos
maneras. Primero, los residuos se calculan en el conjunto de entrenamiento mientras que los
errores de pronóstico se calculan en el conjunto de prueba. En segundo lugar, los residuos se
basan en previsiones de un solo paso, mientras que los errores de previsión pueden implicar
pronósticos de varios pasos adelante.
Estos términos de error observados se pueden usar para definir indicadores del rendimiento
del pronóstico.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 57 — #73

Tema 1 57

La forma más simple de medir la variabilidad en el rendimiento del pronóstico es examinar


el error absoluto (EA), definido como el valor del error independientemente de su signo y
expresado como

EA = |ˆ
"T +h|T | = |YT +h ŶT +h|T |. (1.4.3)

Por lo tanto, si generamos un pronóstico de ŶT +h|T = 100, el error absoluto es 10 siempre
que el valor real sea 90 o 110.
El Error Medio Absoluto (EM A) y el Error Cuadrático Medio (ECM ) miden la variabi-
lidad en términos absolutos, mientras que el Porcentaje del Error Absoluto Medio (P EM A)
lo hace en términos relativos.
U de Theil o alguna de sus variantes es uno de los estadísticos más utilizados para evaluar
la precisión de la predicción. Es un criterio establecido desde hace mucho tiempo que se usa
ampliamente en econometría. Nosotros utilizaremos una variante relacionada con la propuesta
por el autor en 196615 que compara con el método ingenuo (en el denominador). Cuanto menor
sea su valor, mejor es la predicción. Puede tener valores superiores a la unidad, lo que indica
peor pronóstico que el método ingenuo.

Error Medio:
Pn0 ⇣ ⌘
Pn0
YT +h ŶT +h|T
h=1 h=1 "
ˆT +h|T
EM = = . (1.4.4)
n0 n0
Porcentaje de error medio:
⇣ ⌘
n0
X YT +h ŶT +h|T n 0
100 100 X "ˆT +h|T
P EM = = 0 . (1.4.5)
n0 ŶT +h|T n ŶT +h|T
h=1 h=1

Error absoluto medio:


Pn0 Pn0
h=1 YT +h ŶT +h|T "ˆT +h|T
h=1
EM A = = . (1.4.6)
n0 n0
Porcentaje de error medio absoluto:

n 0 n 0
100 X YT +h ŶT +h|T 100 X "ˆT +h|T
P EM A = 0 = 0 . (1.4.7)
n ŶT +h|T n ŶT +h|T
h=1 h=1

Error cuadrático medio (no recomendado):


Pn0 ⇣ ⌘2 Pn0
h=1 YT +h ŶT +h|T ˆ2T +h|T
h=1 "
ECM = = . (1.4.8)
n0 n0
Raíz del error cuadrático medio:
15
A veces denomina U2 para distinguirla de la propuesta por el mismo autor en 1961, y que nosotros
utilizamos en Econometría y Predicción, 2017, p. 149.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 58 — #74

58 Introducción a la previsión

v
uP 0 ⇣ ⌘2 s
u n P n0
t h=1 YT +h ŶT +h|T ˆ2T +h|T
h=1 "
RECM = = . (1.4.9)
n0 n0
U de Theil�s contra el método ingenuo:
v
uP 0 ⇣ ⌘2
u n
u h=1 YT +h ŶT +h|T
t , (1.4.10)
Pn0
h=1 (YT +h YT ) 2
y para series estacionales
v
uP 0 ⇣ ⌘2
u n
u h=1 T +h Y Ŷ T +h|T
t , n = número de años hacia adelante. (1.4.11)
Pn0
h=1 (YT +h YT +h sn )2

Podemos realizar los siguientes comentarios:

1. El P EM A debe usarse solo cuando Y > 0; la U no están tan restringida.

2. Se usa el RECM porque el ECM implica errores al cuadrado. Al tomar la raíz cuadrada
restauramos las unidades originales y la interpretación es más sencilla.

3. La RECM da mayor peso a los errores grandes (absolutos). Se puede demostrar que
RECM EM A para cualquier conjunto de m pronósticos.

4. Los absolutos siempre igualan o exceden el valor de la medida, por lo tanto, EM A


EM y P EM A P EM . Los valores que son cercanos en magnitud sugieren un sesgo
sistemático en los pronósticos.

5. P EM , P EM A y U están libres de escala y, por lo tanto, se pueden usar para realizar


comparaciones entre series múltiples calculando la media, primero sobre una serie indi-
vidual y luego promediando sobre una serie de series relacionadas. Las otras medidas
dependen de la escala y no se pueden usar para hacer tales comparaciones sin una escala
adicional.

Debido a que los errores a menudo son no normales o no simétricos, la mediana se usa a
menudo en su lugar u otras medidas de posición. Esto no cambia la interpretación de las
medidas como «la precisión promedio».
En definitiva, las dos medidas dependientes de la escala más comunes se basan en los
errores absolutos o los errores al cuadrado y son EM A y RECM .
Las medidas basadas en errores porcentuales tienen la desventaja de ser infinitas o inde-
finidas si Yt = 0 para cualquier valor en el período de interés, y tienen valores extremos si
alguno está cerca de cero. Otro problema con el porcentaje de errores es que suponen que la
unidad de medida tiene un cero significativo. Por ejemplo, un error porcentual no tiene senti-
do cuando se mide la precisión de los pronósticos de temperatura en las escalas Fahrenheit o

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 59 — #75

Tema 1 59

Celsius, porque la temperatura tiene un punto cero arbitrario. También tienen la desventaja
de que imponen una penalización más pesada a los errores negativos que a los positivos.

Ejemplo 12. Producción de juguetes


Con los datos de la producción de juegos y juguetes en España entre 2009 y junio de 2019
(2015 = 100), dividiremos la muestra en dos partes. La primera de estimación, hasta junio de
2017, y la segunda de prueba, julio de 2017 hasta junio de 2019. Es decir, utilizaremos 2 años
completos de prueba. La Figura 1.4.5 muestra la serie original y las previsiones a la media, ingenua
e ingenua estacional.
La Tabla 1.8 muestra los valores originales, las previsiones y sus respectivos errores. A partir

Figura 1.4.5: Producción de juguetes (2015 = 100) y pronósticos (Media, Ingenuo e I. Estacional)

de ellos podemos calcular las distintas medidas de precisión de la Tabla 1.7.

Tabla 1.7: Producción de juguetes (2017.7 - 2019.6), medidas de precisión, pronósticos simples o
ingenuos

Es obvio por el gráfico que el método ingenuo estacional es el mejor para estos datos. A
veces, diferentes medidas de precisión llevarán a resultados diferentes en cuanto a qué método de
pronóstico es mejor (aquí solo pasa con el error medio y el porcentaje del error medio, y solo porque
se compensan los errores negativos con los positivos). De manera que, en este caso, los resultados
apuntan al método ingenuo estacional como el mejor de los tres métodos para este conjunto de
datos.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 60 — #76

60 Introducción a la previsión

Tabla 1.8: Producción de juguetes: 2017.7 a 2019.6, datos observados y previsiones

1.4.4. Predicciones de origen móvil

Una versión más sofisticada de los conjuntos de entrenamiento/prueba son las predicciones
de origen móviles. En este procedimiento, hay una serie de conjuntos de prueba (o fuera
de la muestra), cada uno de los cuales consiste en una única observación. El conjunto de
entrenamiento correspondiente son las observaciones que ocurrieron antes de la observación
que forma el conjunto de prueba. Por lo tanto, no se pueden usar observaciones futuras para
construir el pronóstico.
Es decir, a partir del origen pronosticado T , con las observaciones T + m disponibles,
generamos pronósticos sucesivos (un paso adelante) en los orígenes de tiempo T, T + 1, T +
2, ..., T + m 1, haciendo m pronósticos sucesivos. Este proceso se conoce como previsión de
origen móvil. El error de pronóstico de un paso adelante en el tiempo T + i se puede denotar
por "ˆT +i = YT +i ŶT +i . Donde simplemente hemos sustituido la h por i para denotar que
ahora las predicciones son solo de un paso adelante.
Todas las expresiones utilizadas en el epígrafe anterior se pueden manejar también para
determinar la precisión de la previsión de origen móvil [expresiones 1.4.4 a 1.4.11], aunque los
resultados serán diferentes puesto que aquí las previsiones normalmente serán de un solo paso
adelante.
Una buena forma de elegir el mejor modelo de pronóstico es encontrar el modelo con el
RECM más pequeño calculado mediante predicciones de origen móvil.
En ocasiones, los pronósticos de un solo paso pueden no ser tan relevantes como los pro-
nósticos de varios pasos adelante. En este caso, podemos realizar el pronóstico de origen móvil,
pero con h pasos adelante.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 61 — #77

Tema 1 61

1.4.5. Intervalos de Predicción


Hasta ahora, nuestra discusión se ha centrado en pronósticos puntuales, es decir, observa-
ciones futuras para las cuales informamos un único valor de previsión. Para muchos propósitos,
los gerentes parecen sentirse más cómodos con una sola figura. Sin embargo, tal confianza en
un solo número a menudo está fuera de lugar.
Considere, por ejemplo, la generación de pronósticos de ventas quincenales. Nuestro mé-
todo podría generar un pronóstico de 500 unidades para la próxima quincena ¡El gerente, que
planifica la venta de exactamente 500 unidades, y nunca considera la posibilidad de vender
más o menos unidades es ingenuo y probablemente se convierta en un exgerente bastante
rápido! ¿Por qué? ¡Porque la demanda de la mayoría de los productos es intrínsecamente va-
riable! Algunas quincenas verán las ventas por debajo del nivel de pronóstico, y algunas por
encima. Cuando las ventas no llegan al pronóstico del punto, la empresa incurrirá en costes de
mantenimiento por inventario no vendido o puede tener que destruir existencias perecederas.
Cuando las ventas hubieran excedido las previsiones puntuales, la empresa no solo perdería
ventas, sino que los clientes decepcionados podrían irse a otro lado en el futuro. La mejor
opción de nivel de inventario dependerá de los costos relativos de la pérdida de ventas y el
exceso de inventario, que se describen mediante la distribución estadística de posibles ventas,
es decir, la distribución predictiva. La selección del mejor nivel de inventario en este caso
se conoce como el problema del vendedor de noticias, ya que se formuló originalmente en el
contexto de la venta de periódicos. Nuestro propósito aquí no es profundizar en los detalles,
que se pueden encontrar en la mayoría de los textos de gestión sino más bien enfatizar el papel
fundamental que desempeña la distribución predictiva en tales casos.
Si conocemos las magnitudes (relativas) de los costes de las ventas perdidas y del exceso
de inventario, podemos definir una función de coste general y luego seleccionar el nivel de
inventario para minimizar costes.
En ocasiones, estos costes son difíciles de evaluar y el gerente preferirá garantizar un
cierto nivel de servicio. Por ejemplo, supongamos que deseamos satisfacer la demanda el 95
por ciento del tiempo. Luego, debemos agregar un stock de seguridad al pronóstico puntual
para asegurarnos de que la probabilidad de un desabastecimiento no supere el 5 por ciento.
Hay dos enfoques principales para este problema:

Suponer que la distribución predictiva de la demanda sigue la distribución normal (aun-


que tal suposición es, en el mejor de los casos, una aproximación y debemos verificarla).

Usar una distribución de error empírico basada en los errores observados.

1.4.5.1. Usando la distribución normal

Si asumimos que el error estándar de previsión ( h o ee) tiene distribución normal y


conocida, podemos usar el punto superior del 95 por ciento de la distribución normal estándar
(cuyo valor es 1, 645. Todos los programas al uso calculan rutinariamente los valores de tablas
de la distribución normal y del resto de distribuciones usuales). Por lo tanto, el nivel de stock
apropiado es

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 62 — #78

62 Introducción a la previsión

M edia + 1,645 · h. (1.4.12)


La media en este caso es el pronóstico puntual. Por lo tanto, si el pronóstico es de 500,
con un ee (o ˆh ) asociado de 30, el administrador podría almacenar 500 + 1, 645 · 30, o 550
unidades para alcanzar el nivel deseado de servicio al cliente.
La expresión 1.4.12 es un ejemplo de un intervalo de predicción unilateral (o de una sola
cola): la probabilidad es 0,95 de que la demanda sea igual o inferior a 550, bajo el supuesto de
que nuestro método de pronóstico es apropiado para las ventas de ese producto en particular.
Típicamente, el es desconocido y debe estimarse16 a partir de la muestra que se utilizó para
generar el pronóstico puntual.
En muchas aplicaciones de pronóstico, el uso de intervalos de predicción a dos colas es
más común. Al unir estos ingredientes, definimos el intervalo de predicción de dos colas como
el 100(1 ↵) por ciento de confianza de la siguiente manera:

ŶT +h|T ± Z↵/2 · ˆ h . (1.4.13)


Aquí, Z↵/2 denota el 97,5 % superior 100(1 ↵/2) puntos porcentuales de la distribución
normal (los valores de tablas más usuales a dos colas son los de 95, 90 y 80 %. Cuyos valores
de tablas son respectivamente 1, 96; 1, 65 y 1, 28).
Intervalos de predicción de un paso adelante
Al pronosticar un paso adelante, el error estándar de la distribución del pronóstico (ˆh
o ee) es casi igual que los errores estándar de los residuos (ˆ" ). De hecho, los dos errores
estándar son idénticos si no hay parámetros estimados, como es el caso del método ingenuo.
Para los métodos de pronóstico que involucran parámetros de estimación, el error estándar
de la distribución del pronóstico es ligeramente mayor que el error estándar residual, aunque
esta diferencia a menudo se ignora, es decir, se considera que

ŶT +1|T ± Z↵/2 · ˆ1 ⇡ ŶT +1|T ± Z↵/2 · ˆ" , (1.4.14)


donde ˆ" ⇡ RECM calculado en el periodo de estimación,
v
uP ⇣ ⌘2
u T
t t=1 Yt Ŷt
ˆ" ⇡ RECM = , (1.4.15)
T k 1
k es el número de parámetros estimados en el modelo de pronóstico.
Intervalos de predicción de múltiples pasos
Una característica común de los intervalos de predicción es que aumentan en longitud
a medida que aumenta el horizonte de pronóstico. Cuanto más adelante prevemos, más in-
certidumbre se asocia con el pronóstico y, por lo tanto, más amplios son los intervalos de
predicción. Es decir, h generalmente aumenta con h (aunque hay algunos métodos de pro-
nóstico no lineales que no tienen esta propiedad).
16
Técnicamente si estimamos , entonces los intervalos de confianza se ditribuyen como una t de student,
pero si T es grande no hay diferencia en los valores de tablas.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 63 — #79

Tema 1 63

Para producir un intervalo de predicción, es necesario tener una estimación de ˆh . Como


ya se mencionó, para las predicciones en un solo paso (h = 1), la desviación estándar residual
proporciona una buena estimación de la desviación estándar pronosticada ˆ1 . Para pronósticos
de múltiples pasos, se requiere un método de cálculo más complicado. Estos cálculos suponen
que los residuos no están correlacionados.
Para los métodos de pronósticos simples o ingenuos que vimos en el Epígrafe 1.3.3, es
posible derivar matemáticamente la desviación estándar prevista bajo el supuesto de residuos
no correlacionados. Si ˆh denota la desviación estándar de la distribución del pronóstico de h
pasos adelante, y ˆ" es la desviación estándar residual, entonces podemos usar las siguientes
expresiones.

Predicción mediante el valor medio

r
1
ˆh = ˆ" 1+ . (1.4.16)
T

Predicción ingenua

p
ˆh = ˆ" h. (1.4.17)

Predicción ingenua estacional

p
ˆh = ˆ" h/s. (1.4.18)

Predicción ingenua con deriva

s ✓ ◆
1+h
ˆh = ˆ" h . (1.4.19)
T

Podemos ver que cuando h = 1 y T grande, estas expresiones convergen el mismo valor
aproximado, ˆ" .

Reproducimos, Figuras 1.4.6 y 1.4.7, la previsión del método ingenuo e ingenuo estacional,
el intervalo de confianza y la serie original.
Si comparamos los intervalos de confianza de ambos métodos (previsión ingenua e ingenua
estacional) vemos que en el segundo caso, Figura 1.4.7, los intervalos de confianza crecen muy
rápidamente a medida que crece el horizonte de predicción.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 64 — #80

64 Introducción a la previsión

Figura 1.4.6: Producción de juguetes. Previsión ingenua estacional e intervalos de confianza

Figura 1.4.7: Previsión ingenua e intervalos de confianza (80, 90 y 95 %)

1.4.5.2. Intervalos de predicción empírica (bootstrapped )


Cuando una distribución normal para los errores de pronóstico es una suposición poco
razonable, una alternativa es usar la distribución empírica de los residuos, asumiendo solo que
los errores de pronóstico no están correlacionados.
Podemos definir error de pronóstico como "ˆt = yt ŷt|t 1 . O, escrito de otro modo tenemos
que

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 65 — #81

Tema 1 65

yt = ŷt|t 1 + "ˆt .
Entonces podemos simular la siguiente observación de una serie de tiempo usando

yT +1 = ŷT +1|T + "ˆT +1 ,


donde ŷT +1|T es el pronóstico de un paso y "ˆT +1 es el error futuro desconocido. Suponiendo
que los errores futuros serán similares a los errores pasados, podemos reemplazar "ˆT +1 por
muestreo de la colección de errores que hemos visto en el pasado (es decir, los residuos).
Añadiendo la nueva observación simulada a nuestro conjunto de datos, podemos repetir el
proceso para obtener

yT +2 = ŷT +2|T + "ˆT +2 ,


donde "ˆT +2 es otro sorteo de la colección de residuos. Continuando de esta manera, podemos
simular un conjunto completo de valores futuros para nuestra serie temporal.
Haciendo esto repetidamente, obtenemos muchos futuros posibles. Entonces podemos cal-
cular los intervalos de predicción calculando percentiles para cada horizonte de pronóstico.
El resultado se denomina intervalo de predicción «bootstrap» o empíricos. El proceso nos
permite medir la incertidumbre futura utilizando solo los datos históricos.
Intervalos de predicción con transformaciones
Si se ha utilizado una transformación, entonces el intervalo de predicción se debe calcular
en la escala transformada, y los puntos finales se transformarán de nuevo para dar un intervalo
de predicción en la escala original. Este enfoque conserva la cobertura de probabilidad del
intervalo de predicción, aunque ya no será simétrico en torno al pronóstico del punto.

Ejercicios
1. Las temperaturas mensuales promedio para Madrid, España, de enero de 1988 a di-
ciembre de 2017 se dan en TemperaturaMediaMadrid.xls (Fuente: Agencia Estatal de
Meteorología, AEMET). Dibuja la serie temporal y crea una gráfica estacional durante
los últimos cuatro años de la serie. Comente los resultados.

2. Las cifras mensuales de Ventas minoristas de UK, de enero de 2000 a junio de 2019,
se dan en ComercioAlPorMenorUK.xls. Dibuja la serie temporal y crea una gráfica
estacional durante los últimos cuatro años de la serie. Comente los resultados.

3. La siguiente tabla contiene datos sobre los accidentes con víctimas sufridos en las carre-
teras españolas (DgtAccidentes.xls) entre 1993 y 2017. "AccidentesConVictimas" repre-
senta el número de accidentes con víctimas en el año, "TotalParque" denota el número
de vehículos en funcionamiento, y la columna final, es la proporción que define el número
de accidentes por cada 1000 vehículos. Muestre los incrementos de fin de año con respec-
to al año anterior. Trace cada una de las tres series de tiempo. ¿El nivel de accidentes
parece estar cambiando con el tiempo? Si es así, ¿de qué manera?

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 66 — #82

66 Introducción a la previsión

4. Un inversor tiene una cartera que consiste en tenencias en nueve acciones, con los si-
guientes resultados:

-7,0 -2,7 1,9 5,7 6,4 7,8 12,1 17,8 19,2

a) Calcule las estadísticas de resumen (media, mediana, DMA y S).

b) Justo antes del cierre de las operaciones en la última sesión comercial del año, la
compañía que reportó la caída del 7,0 por ciento se declaró en quiebra, por lo que
el retorno se convierte en -100 por ciento. Recalcule los resultados y comente sus
hallazgos.

c) ¿Son las simples estadísticas resumidas relevantes para este inversor? ¿Cómo mo-
dificaría los cálculos, si es que lo haría?

5. Para los datos de temperatura (TemperaturaMediaMadrid.xls) del Ejercicio 1, calcule las


estadísticas resumen (media, mediana, DMA y S) en general y para cada mes. Comente
sus resultados. ¿Tiene sentido calcular estadísticas de resumen en todos los valores, en
lugar de mes a mes? Explique por qué o por qué no.

6. Calcule las estadísticas de resumen (media, mediana, DMA y S) para cada una de
las variables enumeradas en el Ejercicio 3 (DgtAccidentes.xls). ¿Estos números son un
resumen sensato de las condiciones de seguridad? Explique por qué o por qué no.

7. En julio de 2017, Funcas presentó el siguiente panel de previsiones de la economía


española para los años 17 y 18.

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 67 — #83

Tema 1 67

Panel de previsiones de la economía española

CUADRO 1
PREVISIONES ECONÓMICAS PARA ESPAÑA - JULIO 2017
Variación media anual en porcentaje, salvo indicación en contrario
Consumo Consumo Formac. bruta FBCF maquinaria FBCF Demanda
PIB
hogares público de capital fijo y bienes equipo Construcción nacional
2017 2018 2017 2018 2017 2018 2017 2018 2017 2018 2017 2018 2017 2018
Analistas Financieros Internacionales (AFI)............................. 3,2 2,8 2,8 2,6 0,8 0,7 3,7 4,0 4,9 4,4 3,0 4,2 2,5 2,4
Axesor..................................................................................... 3,1 2,8 2,2 2,0 1,0 2,0 4,6 4,5 5,0 4,1 4,3 4,9 2,5 2,6
BBVA....................................................................................... 3,3 2,8 2,7 2,4 0,8 1,9 4,4 4,8 5,1 4,6 3,7 4,7 2,6 2,7

Bankia..................................................................................... 3,3 3,0 2,6 2,5 1,1 1,0 4,8 4,7 5,7 5,0 4,1 4,7 2,7 2,7
CaixaBank............................................................................... 3,1 2,5 2,3 2,1 0,7 0,8 4,5 3,7 5,7 3,8 3,5 3,6 2,4 2,2
Cámara de Comercio de España............................................. 3,1 2,8 2,7 2,4 0,8 0,9 4,0 4,0 4,5 5,6 3,4 3,0 2,5 2,4

Cemex..................................................................................... 3,1 2,5 2,5 2,3 1,0 1,0 4,2 3,9 4,1 4,0 4,4 4,2 2,5 2,3
Centro de Estudios Economía de Madrid (CEEM-URJC)......... 3,1 2,7 2,8 2,5 1,4 1,6 3,2 3,0 3,6 3,4 3,1 2,9 2,7 2,4
Centro de Predicción Económica (CEPREDE-UAM)................ 3,0 2,5 2,4 2,1 1,2 1,3 4,5 4,2 5,9 4,8 3,7 4,0 2,6 2,4

CEOE...................................................................................... 3,2 2,7 2,6 2,4 0,4 0,7 4,2 3,5 5,3 4,2 3,1 2,9 2,4 2,2
Funcas..................................................................................... 3,2 2,8 2,5 2,4 0,8 0,7 4,8 5,2 5,2 5,3 4,5 5,1 2,5 2,5
Instituto Complutense de Análisis Económico (ICAE-UCM)..... 3,1 2,8 2,9 3,3 1,2 1,0 3,7 4,3 4,5 5,3 3,3 4,0 2,6 2,8
Instituto de Estudios Económicos (IEE).................................... 3,3 2,7 2,8 2,1 0,8 0,7 4,8 4,8 6,0 6,2 3,5 3,6 2,9 2,6

Intermoney............................................................................... 3,0 2,5 2,8 2,4 0,8 1,0 3,9 2,9 5,1 3,7 2,7 2,1 2,6 2,2
Repsol..................................................................................... 3,3 3,0 2,3 2,2 1,0 2,1 4,9 4,9 6,4 6,3 3,9 3,9 2,6 2,7
Santander................................................................................ 3,2 2,7 2,2 2,1 0,8 1,0 5,4 4,7 7,3 4,9 3,9 4,7 2,9 2,6
Solchaga Recio & asociados.................................................... 3,1 2,7 2,7 2,2 1,0 0,9 4,0 4,0 4,8 4,7 3,7 4,5 2,6 2,4

CONSENSO (MEDIA).................................................................................. 3,1 2,7 2,6 2,4 0,9 1,1 4,3 4,2 5,2 4,7 3,6 3,9 2,6 2,5
Máximo................................................................................... 3,3 3,0 2,9 3,3 1,4 2,1 5,4 5,2 7,3 6,3 4,5 5,1 2,9 2,8
Mínimo.................................................................................... 3,0 2,5 2,2 2,0 0,4 0,7 3,2 2,9 3,6 3,4 2,7 2,1 2,4 2,2
Diferencia 2 meses antes (1)...................................................................... 0,3 0,2 -0,1 0,2 0,0 0,0 1,0 0,6 1,4 0,5 0,6 0,5 0,2 0,3
- Suben (2)............................................................................................... 16 15 5 10 5 7 17 13 15 13 15 14 12 15
- Bajan (2)................................................................................................ 0 1 9 3 8 4 0 2 1 2 1 2 3 1
Diferencia 6 meses antes (1)...................................................................... 0,7 -- 0,2 -- -0,3 -- 0,9 -- 0,6 -- 0,8 -- 0,3 --
Pro memoria:
Gobierno (julio 2017)............................................................... 3,0 2,6 2,6 2,4 0,8 0,7 3,9 3,6 4,2 3,5 3,9 4,0 -- --
Banco de España (junio 2017)................................................ 3,1 2,5 2,7 2,0 0,8 0,8 3,7 4,6 3,6 5,1 4,0 4,9 -- --
CE (mayo 2017)...................................................................... 2,8 2,4 2,5 2,0 0,9 0,8 3,4 3,9 3,9 3,7 3,0 3,9 2,4 2,2
FMI (abril 2017)....................................................................... 2,6 2,1 2,6 2,1 0,7 0,7 3,1 2,7 -- -- -- -- 2,3 2,0
OCDE (marzo 2017)............................................................... 2,5 2,2 2,2 1,6 0,9 1,2 3,6 4,7 -- -- -- -- 2,3 2,2
(1) Diferencia en puntos porcentuales entre la media del mes actual y la de dos meses antes (o seis meses antes).
(2) Número de panelistas que modifican al alza (o a la baja) su previsión respecto a dos meses antes.

Teniendo en cuenta que según el INE el crecimiento del PIB fue del 3,0 % en 2016, 2,9
en 2017 y el 2,4 en 2018.

a) Analice la precisión de los pronósticos del panel para el caso de BBVA, CEOE,
Funcas y de Consenso.
b) Compare los resultados con el método ingenuo (camino aleatorio).
c) Comente los resultados.

8. Los ingresos anuales de Apple se dan en AppleIngresos.xls. Produzca un gráfico de series


de tiempo para esta variable y para su crecimiento porcentual. ¿La media y la mediana
son útiles en estos casos? Explique por qué o por qué no.

9. Use los datos de TemperaturaMediaMadrid.xls para generar pronósticos con 12 meses


de anticipación; es decir, el pronóstico previo corresponde al valor del mismo mes del
año anterior, para 1989-2017. Calcule EM, EMA, RECM y U para estos pronósticos.
Repita el análisis, esta vez usando los promedios mensuales calculados en el Ejercicio 5
como pronóstico. Y si utilizamos la mediana en vez de la media

a) ¿Qué conjunto de pronósticos parece funcionar mejor?


b) ¿Es justa la comparación? (Sugerencia: ¿Qué sabes y cuándo lo sabes?).
c) ¿Cuáles son los intervalos de confianza de las distintas previsiones?

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 68 — #84

68 Introducción a la previsión

10. Presentamos cuatro series de tiempo y debajo cuatro diagramas de ACF (autocorrela-
ción).

1 2 3 4

a b c d

Debe hacer coincidir cada gráfico de tiempo de la primera fila con uno de los diagramas
ACF de la segunda fila.
11. ¿Son las siguientes afirmaciones verdaderas o falsas? Explique su respuesta.
a) Los buenos métodos de pronóstico deberían tener residuos distribuidos normalmen-
te.
b) Un modelo con pequeños residuos dará buenos pronósticos.
c) La mejor medida de precisión del pronóstico es PEMA.
d ) Si su modelo no prevé bien, debería hacerlo más complicado.
e) Elija siempre el modelo con la mejor precisión de pronóstico medido en el conjunto
de prueba.
12. Considere la compra de viviendas trimestral en España, de 2004 al primer trimestre
de 2019 (CompraVentasViviendaEspña.xls). Consederemos Las provincias de Madrid,
Barcelona, Valencia, Sevilla, Zaragoza, Málaga, Murcia, Palma de Mallorca, Las Palmas
de Gran Canaria, Bilbao y Alicante.
a) Produzca algunos gráficos de los datos de cada provincia para familiarizarse con
ellos.
b) Divida las series de cada provincia en un conjunto de entrenamiento y un conjunto
de prueba, donde el conjunto de prueba son los dos últimos años de datos.
c) Intente usar varios métodos de referencia para pronosticar el conjunto de entrena-
miento y comparar los resultados en el conjunto de prueba. ¿Qué método lo hizo
mejor?

i i

i i
i i

i i
“maestro_EyP_Revision006b” — 2021/1/10 — 20:53 — page 69 — #85

Tema 1 69

d ) Verifique los residuos de su método preferido. ¿Se parecen al ruido blanco?

i i

i i

También podría gustarte