Está en la página 1de 18

repositorio.uptc@uptc.edu.

co
Artículo No. 10

Estimación del flujo vehicular a través de series


de tiempo
Caso: Arcabuco, Sáchica y Crucero
ESTIMACIÓN DEL FLUJO VEHICULAR A TRAVÉS DE
SERIES DE TIEMPO
Caso: Arcabuco, Sáchica y Crucero
Especialización en Estadística

, Sandra Johana Cascante Carreño1,a , Tutor: Reinaldo Alarcón Guarín2,b


1 Escuela de Posgrados, Seccional Duitama, Universidad Pedagógica y Tecnológica de Colombia, Duitama,
Colombia
2 Escuela de Posgrados, Seccional Diutama, Universidad Pedagógica y Tecnológica de Colombia, Duitama,
Colombia

Resumen
El análisis de series de tiempo y la predicción de flujo vehicular son temas centrales de investigación
en la movilidad vial. En el presente artículo, se estudian los principales aspectos sobre tránsito vehicular,
series de tiempo y lenguaje R para el computó estadístico.

En esta investigación se presenta el análisis del flujo vehicular por estación, categoría y el correspon-
diente pronóstico semanal de los volúmenes de tránsito para la categoría I, con base en las series históricas
del Instituto Nacional de Vías y la base de datos realizada a través de éstos, en la malla vial de Boyacá,
para las estaciones Sáchica, Arcabuco y Crucero; los cuales permitieron estimar el Tránsito Futuro de 40
semanas posteriores.
Palabras clave: Series de tiempo, flujo vehicular, tránsito promedio, transito absoluto, ARIMA..

Abstract
The analysis of time series and the prediction of vehicular flow are central themes of investigation
in the road mobility. In this article, we study the main aspects of vehicular traffic, time series and R
language for statistical computing.

This research presents the analysis of the vehicular flow by station, category and the corresponding
weekly forecast of the traffic volumes for category I, based on the historical series of the INVIAS and
the database made through these, in the road network of Boyacá, for the Sáchica, Arcabuco and Crucero
stations; Which allowed to estimate the Future Transit of 40 weeks later.
Key words: Time series, vehicular flow, average transit, absolute transit, ARIMA.

1. Introducción
En la actualidad hablar de movilidad, transito vial o flujo vehicular es de gran importancia, teniendo en
cuenta que posee características o requisitos necesarios para la planeación, control, proyección y operación
de carreteras, calles y obras complementarias dentro del sistema de transporte. El objetivo del análisis del
a Matemático. Especialista(e) en Estadística. Docente catedra Universidad Pedagógica y Tecnológica de Colombia Tunja.

E-mail: sandra.cascante@uptc.edu.co
b Mg. En Estadística. Licenciado en Matemáticas y Estadística. Docente planta Universidad Pedagógica y Tecnológica de

Colombia. email
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

flujo vehicular y pronóstico con series de tiempo, es dar a conocer la metodología o técnica que conlleva al
pronóstico del volumen de tránsito futuro y así poder realizar la descripción probabilística de las distribucio-
nes estadísticas empleadas en proyectos, controles de tránsito, planeación y control de los valores de trafico
futuro, teniendo en cuenta las variaciones de los volúmenes de tránsito y las actividades no constantes e
intermitentes como lo son: vacaciones, trabajo, estudio, semanas de recesos, entre otras.

Por lo tanto, el objeto de estudio consistió en la realización de un análisis estadístico descriptivo y la apli-
cación de modelos matemáticos, los cuales permitieron la estimación del volumen de tránsito futuro semanal,
a partir de los consolidados de tránsito y recaudo de las estaciones Arcabuco, Sáchica y Crucero.

Los pronósticos, o predicciones, son herramientas esenciales en cualquier proceso de toma de decisiones.
?El análisis de series de tiempo, es un método cuantitativo que se utiliza para determinar patrones de com-
portamiento en los datos recolectados a través del tiempo. En consecuencia, las series de tiempo ayudan al
manejo de la incertidumbre asociada con los acontecimientos futuros? (Levin y Rubin 2004). El modelamiento
de series de tiempo ha sido un área de creciente interés para muchas disciplinas, en la que muchos esfuerzos
se han dedicado para el desarrollo de nuevos métodos y técnicas.

Realizando un recorrido histórico se pone en manifiesto el papel que ejerce las series de tiempo, las cuales
se introdujeron a partir del siglo XIX. En 1970, Box y Jenkins desarrollaron un cuerpo metodológico destinado
a identificar, estimar y diagnosticar modelos dinámicos de series temporales (Cáceres, Martín y Martín 2014).

Clement Juglar (1819-1905) fue el primero en utilizar las series de tiempo de un modo sistemático. Pero es
más conocido el trabajo de Mitchell (1927). Chow (1960) fue el primero en evaluar los efectos de cambios es-
tructurales en modelos de regresión, la contribución más importante es la de Andrews (1993) quien considera
un análisis comprensivo del problema de pruebas, para evaluar la presencia de cambios estructurales basado
en el establecimiento de valores críticos (Banerjee, 1992) y (Chu, 1996) (Cáceres, Martín y Martín 2014).

Atkinson, Koopman y Shephard (1997) desarrollan métodos orientados a la detección de cambios de nivel
y estimación de parámetros en un modelo ARIMA (Autoregressive Integrated Moving Average) basado en
el procedimiento de diagnóstico para modelos de regresión múltiple. Altissimo y Corradi (2003) proponen
pruebas para cambios en la media de la secuencia normal de variables. Noriega y de Alba (2001) y Marriott
y Newbold (2000) estudian la estimación del número de cambios en la media de la secuencia de variables,
usando un criterio de información bayesiano. Chu y White (1992) desarrollan una prueba para un cambio en
una función de la tendencia. En el mismo contexto, Maekawa (1997) estudia el problema permitiendo que
los errores sean no estacionarios (integrados). Lumsdaine y Papell (1997) y Clemente et al (1998) consideran
un contraste de raíces unitarias teniendo en cuenta dos cambios estructurales en la función de la tendencia
(Hernández, Rodríguez y Álvarez 2014).

Para la planificación vial se utilizan modelos de asignación y distribución de tránsito; los cuales se ali-
mentan de la obtención de estimativos confiables y las demandas pronosticadas de los volúmenes vehiculares
que circularan en el futuro. Según James Cárdenas (Grisales, 2007) Por lo general, la asignación es de tipo
probabilístico con base en una función de utilidad que toma en cuenta el tiempo de recorrido, las tarifas, los
costos de operación, las características geométricas, y los volúmenes actuales y su composición.

En el presente trabajo, el foco de investigación esta propuesto en las proyecciones a corto plazo en un
horizonte de 40 semanas, ajustando un modelo estadístico de series de tiempo (ARIMA) para el respectivo
pronóstico del trafico futuro; no se evaluará a largo plazo, dado que estos modelos, utilizados como referente,
no tienen un buen ajuste en las proyecciones de largo alcance (Castillo 2006).
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

2. Referente Conceptual

Los estudios sobre volúmenes de tránsito se realizan con el propósito de obtener datos reales relacionados
con el movimiento de vehículos sobre secciones específicas dentro del sistema vial, dichos datos se expresan en
relación con el tiempo y de su conocimiento se hace posible el desarrollo de metodologías que permite estimar
de manera razonable, la calidad del servicio que el sistema presta a los usuarios en las diferentes carreteras.
A continuación, se denominan algunas definiciones esenciales para el desarrollo del artículo, tomadas de
los documentos ?Volúmenes y Costos de Operación 2014-2015"(Invias 2012).

2.1. Volúmenes de Tránsito Absoluto:

Es el número total de vehículos que pasan durante un lapso de tiempo determinado (años, meses, semanas
o días). Estos volúmenes sirven para determinar patrones de viajes sobre áreas geográficas, estimar gastos
de operación vehicular, indicar las variaciones y tendencias de los volúmenes de tránsito. Dependiendo de
la duración del lapso de tiempo se clasifican en: Volúmenes de tránsito anual (TA), Volúmenes de tránsito
mensual (TM), Volúmenes de tránsito semanal (TS) y Volúmenes de tránsito diario (TD).

2.1. Volúmenes de Tránsito Promedio:

Es el número total de vehículos que pasan durante un período de tiempo determinado, dado en días
completos igual o menor a un año y mayor que un día, dividido entre el número de días del período. Ayudan
a la detección y medición de la demanda actual en las vías, evaluar lujos de tránsito actuales con respecto al
sistema vial.

2.2. Alcance de los Pronósticos y Toma de Decisiones:

Todo pronóstico tiene asociado un alcance, ya sea de corto, mediano o largo plazo. Estos pronósticos están
sujetos al tipo de decisión que se desea tomar o de acción en desarrollo. A mayor alcance del pronóstico, mayor
es el nivel de incertidumbre que se debe enfrentar (Castillo 2006).

Tipo de Pronostico Alcance


Corto Plazo Días / Semanas / Meses
Mediano Plazo Trimestres / Semestres / Un Año
Largo Plazo 2 Años en adelante

2.3. Series de Tiempo

Serie de registros realizados en diversos periodos de tiempo. Se llama Series de Tiempo a un conjunto
de observaciones sobre valores que toma una variable (cuantitativa) en diferentes momentos de tiempo. Los
datos se pueden comportar de diferentes formas, en los cuales se pueden presentar tendencias, ciclicidad, no
tener forma definida, aleatoriedad o variaciones estacionales. Las observaciones de una serie de tiempo están
denotadas por Y1 , Y2 , ?, YT , donde Yt es el valor tomado por el proceso en el instante t (Ríos 2008).

Los modelos de series de tiempo tienen un enfoque netamente predictivo y en ellos los pronósticos se
elaborarán sólo con base al comportamiento pasado de la variable de interés. Estas pueden ser analizadas con
una finalidad descriptiva o explicativa, las cuales pretenden probar estadísticamente la existencia de relacio-
nes dinámicas causa-efecto entre variables y reducir el grado de incertidumbre sobre el futuro a partir del
conocimiento del pasado. Como afirma Markridakis (Hernández, Rodríguez y Álvarez 2014) ?aunque nada
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

permanezca igual, la historia se repite a sí misma en algún sentido; para la predicción, se asume un princi-
pio de estabilidad o de continuidad, que implica que algunos aspectos del pasado se mantendrán en el futuro.?

Para comprender el modo en que una serie de tiempo puede ser útil, en primer lugar, se identifican los
tipos de modelos de series de tiempo, posteriormente se determinan los componentes de una serie de tiempo
y se realiza la correspondiente predicción.

2.4. Modelos de Series de Tiempo:

Una serie de tiempo es un conjunto ordenado de observaciones de los valores que toma una variable en
diferentes momentos. Podemos distinguir dos tipos de Modelos de Series de Tiempo: modelos deterministas
y modelos estocásticos (Pindyck, Rubinfeld et al. 2001) (Gujarati y Porter 2003).

2.4.1. Modelos Deterministas:

Son métodos de extrapolación en los que no se hace referencia a las fuentes o a la naturaleza de la
aleatoriedad subyacente en la serie. Un ejemplo de modelos deterministas son los modelos de promedio móvil
en los que se calcula el pronóstico de la variable a partir de un promedio de los ?n? valores inmediatamente
anteriores.

1
Promedio Movil (n = 12) : yt+1 = (yt + yt−1 + · · · + yt−11 ) (32)
12

2.4.2. Modelos Estocásticos:

Se basan en la descripción simplificada del proceso aleatorio subyacente en la serie. Es decir, se asume que
la serie observada y1 , y2 , ?, yt , se extrae de un grupo de variables aleatorias con una cierta distribución conjunta
difícil de determinar, por lo que se construyen modelos aproximados que sean útiles para la generación de
pronósticos. La serie podrá ser estacionaria o no estacionaria.

2.4.3. Serie no Estacionaria:

Es aquella cuyas características de media, varianza y covarianza cambian a través del tiempo. Sin embargo,
en muchas ocasiones, si dicha serie es diferenciada una o más veces la serie resultante será estacionaria
(procesos no estacionarios homogéneos).
Es aquella cuya media y varianza no cambian a través del tiempo y cuya covarianza sólo es función del
rezago. Gracias a estas características podremos modelar el proceso subyacente a través de una ecuación con
coeficientes fijos estimados a partir de los datos pasados.

M edia : E(Yt ) = E(Yt+m ) ∀ t, m (33)


V arianza : σ(Yt ) = σ(Yt+m ) ∀ t, m (34)
Covarianza : cov(Yt , Yt+k ) = cov(Yt+m , Yt+m+k ) ∀ t, m, k (35)

2.5. Componentes de una Serie de Tiempo

Se dice que una serie de tiempo puede descomponerse en cuatro componentes básicos (cinco si se considera
una constante llamada nivel). Un modelo clásico de series de tiempo, presume que la serie Yt( t = 1)T puede
ser expresada como la suma o el producto de sus componentes (Velasco y del Puerto García 2009).

M odelo Aditivo : Yt = Tt + Et + Ct + εt (36)


Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

M odelo M ultiplicativo : Yt = Tt + Et + Ct + εt (37)

Estos componentes no son directamente observables, por lo que únicamente se pueden obtener estimaciones
de ellos (Hernández, Rodríguez y Álvarez 2014) . Estos cuatro componentes son:

2.5.1. Componente 1, Tendencia (T):

Representa el comportamiento a largo plazo. Esta puede ser definida como el cambio de la media a lo
largo de un extenso período de tiempo. Cuando el objetivo es formular un modelo, y el componente tendencial
no es observable, puede aproximarse su comportamiento por medio de la obtención de una tendencia global.
Este método trata en general de encontrar una función del tiempo que se caracterice por su regularidad,
alisamiento y continuidad, de modo que pueda describir movimientos monótonos y suaves de la magnitud
estudiada. El comportamiento del proceso {Yt }(t=1)T puede modelarse mediante una Tendencia Lineal:

Yt = Tt + εt , donde Tt = α + βt (38)

El parámetro, β representa el crecimiento de la tendencia en una unidad de tiempo. α representa la


ordenada en el origen, es decir, el valor de la tendencia en el instante t = 0. Estos parámetros pueden ser
estimados por mínimos cuadrados ordinarios o por máxima verosimilitud.

Otras tendencias como: Tendencia Polinómica, Tendencia exponencial, Tendencia Potencial, Tendencia
Logarítmica, Tendencia Inversa O Recíproca, Tendencia Logarítmica Recíproca, Tendencia Logística, Curva
De Gompertz (Hernández, Rodríguez y Álvarez 2014).

2.5.2. Componente 2, Estacionalidad (E):

Las variaciones estacionales son fluctuaciones más o menos periódicas de periodo igual o inferior al año.
Como se trata de patrones regulares son útiles al pronosticar el futuro. Este tipo de variación se define como
un movimiento repetitivo y predecible alrededor de la línea de tendencia. Con el fin de detectar la variación
estacional, los intervalos de tiempo necesitan medirse en unidades pequeñas, como días, semanas, meses o
trimestres.
Para el estudio de la variación estacional, se consideran tres razones principales:

X Establecer el patrón de cambio pasado. Proporciona una forma de comparar dos intervalos de tiempo.

X Proyectar los patrones pasados al futuro. En el caso de decisiones de largo alcance, el análisis de
tendencia puede resultar adecuado. Pero para decisiones a corto plazo, la habilidad de pronosticar
fluctuaciones estacionales a menudo es esencial.

X Una vez establecido el patrón estacional existente, podemos eliminar sus efectos de la serie de tiempo.
Este ajuste nos permite calcular la variación cíclica que se lleva a cabo (Levin y Rubin 2004).

Algunos métodos sencillos que permiten la eliminación de las variaciones estacionales son:

X Método de las relaciones de las medias por estación respecto a la tendencia.

X Método de las diferencias/razones a las medias móviles.

X Método de las diferencias estacionales.

Cuando se elimina el efecto de la variación estacional de una serie de tiempo, se desestacionaliza la serie
(Cáceres, Martín y Martín 2014)
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

2.5.3. Componente 3, Ciclo (C):

La variación cíclica se caracteriza por oscilaciones o fluctuaciones periódicas más o menos regulares al-
rededor de la tendencia con una larga duración, aunque también puede considerarse el caso de ciclos cuyos
factores no son claros y fijos. El componente cíclico, Ct , puede modelarse como una onda armónica simple,
donde el parámetro R es la amplitud o semiamplitud del ciclo, los ángulos ω y α expresados en radianes, re-
presentan la frecuencia o periodo del ciclo y el desplazamiento de fase en una fracción del ciclo que transcurre
en una unidad de tiempo t (Cáceres, Martín y Martín 2014).

Ct = Rcos(ωt − α) (39)

2.5.4. Componente 4, Aleatorio (ε ∼ N (0, σ)):

Son movimientos erráticos que no siguen un patrón específico y obedecen a causas diversas. Este compo-
nente es prácticamente impredecible. Estos comportamientos representan todos los tipos de movimientos de
una serie de tiempo que no son tendencia, variaciones estacionales ni fluctuaciones cíclicas.

2.5.5. Modelamiento de Series No Estacionarias

El modelo de caminata aleatoria consta de un δ (drift constante) y una perturbación εt (error) que es una
variable aleatoria con distribución normal, media cero, varianza constante y covarianza cero; a este proceso
ε1 , ε2 , ... se le denomina Ruido Blanco.

Yt = δ + Yt−1 − εt (40)

En un modelo de caminata aleatoria, la varianza de Yt aumenta a través del tiempo, lo que es propio
de un proceso no estacionario. Cuando una serie se comporta como una caminata aleatoria se dice que ésta
presenta raíz unitaria (Castillo 2006)

2.5.6. Modelamiento de Series Estacionarias

z Modelos de Media Móvil M A(q) :

Yt = µ + εt + θ1 εt−1 + θ2 εt−2 + · · · + θq εt−q (41)

En los modelos de media móvil, el proceso se representa como una suma ponderada de errores actuales
y anteriores. El número de regazos del error considerados (q) determina el orden del modelo de media
móvil.

z Modelos Autorregresivo AR(p) :

Yt = δ + φ1 yt−1 + φ2 yt−2 + · · · + φp yt−p + εt (42)

En los modelos autorregresivos, el proceso se representa como una suma ponderada de observaciones
pasadas de la variable. El número de regazos (p) determina el orden del modelo autorregresivo.

z Modelos Mixtos Autorregresivos ? Media Movil ARM A(p, q) :

Yt = δ + φ1 yt−1 + φ2 yt−2 + · · · + φp yt−p + εt + θ1 εt−1 + θ2 εt−2 + · · · + θq εt−q (43)

En estos modelos, el proceso se representa en función de observaciones pasadas de la variable y de los


valores actuales y rezagados del error. El número de rezagos de la variable de interés (p) y el número
de rezagos del error (q) determinan el orden del modelo mixto.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

z Modelos Autorregresivos Integrados de Promedio Móvil, ARIM A(p, d, q) :


Para la correcta identificación del Modelo ARIMA representativo de una serie se hace necesario:
Primero: Determinar el grado de homogeneidad u orden de integración de la serie. Para determinar el
orden de integración se utilizan herramientas como el correlograma y tests de raíz unitaria (Enders 2004).
Segundo: Determinar el orden de las partes de promedio móvil y autorregresivas del modelo.
Tercero: Evaluar el modelo construido. Un buen modelo tendrá un buen ajuste (coeficiente de determi-
nación cercano a la unidad) y arrojará residuos que se comportarán como ruido blanco (Castillo 2006).

2.5.7. Lenguaje R para el Análisis y Modelamiento de Series de Tiempo

En relación al programa R, su lenguaje está orientado a la exploración, modelación y construcción de


gráficos entre otras opciones de datos. Por su amplia colección de paquetes, permite que el usuario interactué
de forma transparente, ya que las llamadas se realizan a funciones genéricas, las cuales determinan interna-
mente que método debe ser usado dependiendo de la clase de objetos a las que pertenecen sus argumentos y
así poder realizar posteriores análisis (Velasquez Henao, Olaya Morales, Cardona y Jaime 2011).

2.5.8. Funciones Disponibles para el Análisis y la Predicción de Series de Tiempo

El lenguaje R ha sido utilizado intensivamente para ilustrar diferentes metodologías de análisis y predic-
ción de series de tiempo. Las funciones disponibles para este análisis se encuentran agrupadas en paquetes
desarrollados por diferentes autores. Los paquetes deben ser cargados manualmente en cada sesión.
Los principales paquetes para el análisis y predicción de series de tiempo se encuentran en el listado de la
Tabla 47. En la Tabla 48 se exponen las funciones principales para el desarrollo de un modelo explicativo o
predictivo de series de tiempo (Velasquez Henao, Olaya Morales, Cardona y Jaime 2011) (R Core Team 2015).

Tabla 47: Paquetes principales para el análisis de series de tiempo en R.

Paquetes Descripción
FinTS Funciones, datos y ejemplos del libro ?Analysis of Financial Time Series"
Stats Paquete base con funciones estadísticas básicas.
Uroot Contrastes de raíces unitarias para series de tiempo con componentes periódicas.
Forecast Métodos y herramientas para analizar predicciones de series de tiempo.
Lmtest Colección de pruebas para la verificación diagnóstica en modelos de regresión lineal.
Trend Funciones y datos para el análisis de series de tiempo.
Tseries Análisis de series temporales y finanzas computacionales.
Car Funciones y conjuntos de datos para la aplicación de regresión.
finTS Análisis de la serie de tiempo financiero.
Nortest Cinco pruebas para probar la hipótesis compuesta de la normalidad.
Hwwntest Proporciona métodos para probar si las series temporales son consistentes con el ruido blanco.
timeSeries Genera y modifica objetos ?timeSeries?.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

Tabla 48: Funciones para la realización de pronóstico de series de tiempo con sus respectivos test.

Función Característica
Ts Crea un objeto time-series
KPSS.test Calcula la estadística de prueba de Kwiatkowski-Phillips-Schmidt-Shin.
adf.test Calcula la prueba de Dickey-Fuller aumentada.
pp.test Calcula la prueba de Phillips-Perron.
cs.test Realiza la prueba de tendencia no paramétrica de Cox y Stuart.
terasvirta.test Calcula la prueba de Teraesvirta para la no linealidad.
CH.test Esta función calcula la estadística de Canova-Hansen.
Stl Descomponer una serie de tiempo en componentes estacionales, de tendencia e irregulares usando loess.
AutocorTest Prueba Ljung-Box para la autocorrelación.
Acf Calcula y traza estimaciones de la función de autocovariancia o autocorrelación.
Pacf Función utilizada para las autocorrelaciones parciales.
ArchTest Prueba de heteroscedasticidad condicional autorregresiva (ARCH)
lillie.test Prueba de Lilliefors (Kolmogorov-Smirnov) para la hipótesis compuesta de normalidad.

3. Metodología

El desarrollo del trabajo de aplicación parte de una base de datos. La población objeto de estudio, se
construyó a partir de informes físicos y magnéticos suministrados por el Instituto Nacional de Vías (INVIAS
- Tunja) los cuales contienen las series históricas desde enero de 2014 hasta julio de 2016 para la malla vial
de Boyacá, en las estaciones (Arcabuco, Sáchica y Crucero); a partir de estos, se generó la base de datos para
el correspondiente análisis estadístico descriptivo y la aplicación de modelos matemáticos, que permitieron
estimar los volúmenes de transito futuro por medio de series de tiempo.

Como los modelos de series de tiempo poseen un enfoque netamente predictivo y en ellos los pronósticos
se elaborarán sólo con base al comportamiento pasado de la variable de interés; dentro del proyecto, se reali-
zó una investigación tanto descriptiva como correlacional. Se realizó la caracterización para cada estación
específica, con un enfoque cuantitativo obteniendo altos niveles de objetividad, el pronóstico se realizó para
la categoría I semanal en las estaciones.

Para la recopilación y análisis de la información, fue necesario organízar los informes por año, mes, día
y categoría vehicular. Por lo tanto, las bases de datos están compuestas por los aforos diarios, semanales y
mensuales para cada categoría vehicular, (I: Automóvil, Campero, Campero Pick-UP, Microbús; II: Buseta,
Bus, Bus Metropolitano; III: Camión 2 ejes, IV: Camión 3 - 4 ejes, Tracto camión; V: Camión 5 ejes o más,
Eje Grúa, Eje Remolque y Eje Adicional).

Para el pronóstico de los volúmenes de tránsito futuro, la primera fase del proceso consistió en un análisis
exploratorio de los datos, donde se evidenció la existencia de patrones de viaje determinados.

La segunda fase tuvo como propósito la descripción grafica de los datos recolectados en cada estación,
realizando la respectiva serie de tiempo para la categoría I.

En la tercera fase, se procedió a realizar los test para las respectivas validaciones de estacionariedad,
tendencia, linealidad en media y season para el modelo de series de tiempo.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

La cuarta fase, o fase final, consistió en la utilización de la Metodología De Box-Jenkins. Los pasos
básicos de esta metodología son (Castillo 2006):

1. Verificar la estacionariedad de la serie. Si esta no es estacionaria, diferenciarla hasta alcanzar estacio-


nariedad.
2. Identificar un modelo tentativo.
3. Estimar el modelo.
4. Verificar el diagnóstico. (si este no es adecuado, volver al paso 2).
5. Usar el modelo para pronosticar.

4. Resultados
En la figura 44, Se ilustra las diferentes estaciones de conteo de la malla vial de Boyacá, Colombia. En
este caso, dentro del área de estudio, se trata de analizar las variaciones de los volúmenes vehiculares con
base en las series históricas proporcionadas por el INVIAS.

Figura 44: Área de estudio. Estaciones Sáchica, Arcabuco, Crucero. Fuente INVIAS, 2012.

En la tabla 49 y teniendo en cuenta las características que conforman las bases de datos, se muestra los
volúmenes de tránsito vehicular diario, semanal, mensual, aforo mínimo, medio y máximo para las categorías
vehiculares I, IE, II, IIE, III, IV, V, Eje Grúa, Eje Remolque y Eje Adicional correspondientes a las estaciones
Arcabuco, Sáchica y Crucero.

Se evidencia que el máximo volumen vehicular se presenta en la categoría I en las tres estaciones; de la
categoría III en adelante, tráfico pesado, el mayor flujo vehicular se encuentra en la estación de Crucero.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

Tabla 49: Resumen del flujo vehicular Arcabuco, Sáchica y Crucero. Fuente la Autora, 2017

ARCABUCO
MINIMO PROM MAXIMO MINIMO PROM MAXIMO MINIMO PROM MAXIMO
CAT. I 442 1658 8295 6079 11708 34336 41041 59294 100701
CAT. II 81 787 1205 2926 5406 6433 17164 23290 26564
CAT. III 2 65 141 229 446 677 1188 1902 2550

SEMANAL

MENSUAL
DIARIO

CAT. IV 0 51 152 134 370 758 508 1482 2642


CAT. V 0 259 462 869 1811 2391 3187 7765 8914
E. G. 0 0 7 0 4 15 8 18 33
E. R. 0 0 14 0 3 20 5 18 43
E. A. 0 0 11 0 5 31 7 25 59
SACHICA
MINIMO PROM MAXIMO MINIMO PROM MAXIMO MINIMO PROM MAXIMO
CAT. I 141 1750 8594 4707 13827 33929 38638 63355 105860
CAT. II 28 432 723 1058 2915 3713 10679 12727 15311
CAT. III 0 20 106 25 174 372 261 718 1145
SEMANAL

MENSUAL
DIARIO

CAT. IV 0 0 56 7 37 170 67 162 438


CAT. V 0 8 64 23 55 230 119 243 511
E. G. 0 0 5 0 1 6 0 3 10
E. R. 0 0 4 0 1 7 0 5 16
E. A. 0 0 1 0 0 2 0 0 3
CRUCERO
MINIMO PROM MAXIMO MINIMO PROM MAXIMO MINIMO PROM MAXIMO
CAT. I 99 853 4480 2677 6164 18944 18955 32295 129529
CAT. IE 40 369 772 1951 2556 2942 9182 11232 32976
CAT. II 5 503 748 1242 3536 4343 7329 15607 47258
CAT. IIE 0 223 326 1187 1539 1713 3339 6738 19474
SEMANAL

MENSUAL
DIARIO

CAT. III 0 70 192 195 516 1036 577 2226 6927


CAT. IV 0 87 191 12 629 1081 674 2762 7069
CAT. V 0 134 266 20 971 1355 1264 4371 11338
E. G. 0 0 11 0 5 14 12 22 79
E. R. 0 0 13 0 4 27 2 24 95
E. A. 0 1 10 0 9 32 5 50 95
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

Figura 45: Aforo Semanal Arcabuco, Sáchica y Crucero. Fuente la Autora, 2017.

En la Figura 45 se muestran las series históricas de los volúmenes de tránsito semanales para cada estación
categoría vehicular I.
En ellas se evidencian tres de las componentes principales de las series de tiempo, tendencia, estacionalidad
y ciclicidad. Para la verificación de las cuatro componentes, se realizan las correspondientes pruebas de
hipótesis en las cuales arrojaron los siguientes resultados teniendo en cuenta una significancia del 5 %:

X Para Estacionalidad se utilizaron los test (dickey fuller (aumentado, adf.test), phillip perron (pp.test)
y KPSS.test), los cuales arrojaron que las estaciones Arcabuco y Crucero son no estacionarias, por el
contrario, la serie de Sáchica presenta estacionalidad por lo que se procede a desestacionalizarla. La
serie desestacionalizada se muestra en la Figura 46.

Figura 46: Serie desestacionalizada Sáchica. Fuente la Autora, 2017.


Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

X Se observó que existe tendencias en las series de tiempo para las tres estaciones Arcabuco, Sáchica y
Crucero.

X Las series de las tres estaciones en estudio poseen ciclicidad, éstas se juzgaron con los test de canova
Hansen y hegy test.

X Para verificar que no existe aleatoriedad, se realiza la prueba de hipótesis de linealidad en media con
terasvirta.test, con el cual se concluye que ninguna de las tres series posee linealidad en media.

Estas pruebas de hipótesis se realizaron con el objetivo de efectuar las correspondientes validaciones para
el modelo, obteniendo gráficamente la descomposición de las 3 series en sus 3 componentes principales (Figura
47).

Figura 47: Descomposición de las series Sáchica, Arcabuco y Crucero. Fuente Autora, 2017

Siguiendo la metodología de Box-Jenkins, se seleccionó el mejor modelo, donde se estimaron los corres-
pondientes coeficientes y se procedió a efectuar el análisis de los residuos (diferencia entre el valor real y el
valor previsto por el modelo), verificando la presencia de un comportamiento estacionario o de ruido blanco.
El esquema general del modelo se evidencia en la ecuación 12 (Jaramillo Ayerbe, González Gómez, Núñez Ca-
brera, Portilla, García y Heriberto 2007).

El valor de la variable de interés yt (Volumen de Flujo vehicular por estación) en el instante t, se expresa
en función de sus valores previos y de valores aleatorios ε presentes y anteriores con coeficientes φi y θi que
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

se determinan numéricamente ajustando el modelo a la serie. La estimación de los modelos se realizó con la
ayuda del software R y se muestran es la figura 48, estos son:

Arcabuco: Forecast para ST L + ARIM A(2, 0, 3) con media distinta de cero.

yt = 14145.4014 + 1.6535y(t−1) − 0.8947y(t−2) + εt − 1.0585ε(t−1) + 0.1264ε(t−2) + 0.4927ε(t−3) (44)

Sáchica: Forecast para ST L + ARIM A(0, 0, 5) con media distinta de cero.

yt = εt − 0.5992ε(t−1) − 0.1166ε(t−2) + 0.0816ε(t−3) + 0.0949ε(t−4) − 0.3538ε(t−5) (45)

Crucero: Forecast para ST L + ARIM A(0, 0, 5) con media distinta de cero.

yt = 7244.2720 + εt + 0.8471ε(t−1) + 0.6191ε(t−2) + 0.5354ε(t−3) + 0.5313ε(t−4) + 0.3532ε(t−5) (46)

Figura 48: Pronostico de las series Sáchica, Arcabuco y Crucero. Fuente Autora, 2017

Teniendo los modelos estimados para cada una de las estaciones, se realizó las correspondientes validacio-
nes posterior al modelo, estas se realizan en los residuales con tres test (AutoCorrelación, Heterocedasticidad
y Normalidad), los cuales se muestran en la Figura 49.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

Figura 49: Autocorrelograma para las series Sáchica, Arcabuco y Crucero. Fuente Autora, 2017

Con el test de Box-Ljung, se comprobó la no existencia de AutoCorrelación entre los residuales, ARCH
LM-test demostró que los modelos no tienen efecto ARCH, es decir no hay heterocedasticidad, ahora, para
la normalidad se efectuó el test de Lilliefors (Kolmogorov-Smirnov). Cada uno de estas pruebas de hipótesis
se realizó en cada modelo para los tres aforos semanales, en la Figura 50 se muestra las series observadas y
las series ajustadas para cada una de las estaciones.

Figura 50: Serie observada, Serie Ajustada para las estaciones Sáchica, Arcabuco y Crucero. Fuente Autora 2017.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

5. Conclusiones y Recomendaciones
De los informes suministradas por el INVIAS para la malla vial de Boyacá, se obtuvo la base de datos
de los consolidados totales de aforos diarios. A partir de estos, se construyeron los aforos semanales y
mensuales para el periodo comprendido entre enero de 2014 hasta julio de 2016.
Con el correspondiente análisis descriptivo se obtuvo: promedio, mínimo, máximo y volumen de transito
absoluto de los conteos, para cada categoría vehicular y estación, encontrándose que la categoría I es
la de mayor flujo vehicular.
Las pruebas de hipótesis muestran un ajuste satisfactorio para el pronóstico de series de tiempo con un
modelo ARIMA, para el pronóstico semanal de la categoría I en las tres estaciones en estudio.
Con lo anterior y teniendo en cuanta las características de las bases de datos y la toma de la información, es
adecuado el pronóstico y modelamiento de series de tiempo para la obtención de resultados satisfactorios
que cumplan con las expectativas.
Finalmente, Se recomienda seguir el estudio de las series mensuales y diarias mediante la técnica de series
de tiempo.

Referencias Bibliográficas
Anderson, S. y Sweeney, D. (2003), ‘Williams.(2008)’, Estadística para administración y economía .
Cáceres, J., Martín, G. y Martín, F. (2014), ‘Introducción al análisis univariante de series temporales econó-
micas’, España: Delta .
Castillo, C. I. F. (2006), Proyección del precio del cobre:¿ Herramientas de inteligencia computacional o series
de tiempo?, PhD thesis, Tesis para optar al grado de magíster en gestión de operaciones. Universidad
de Chile.
Enders, W. (2004), ‘Applied econometric time series, by walter’, Technometrics 46(2), 264.
Grisales, J. C. (2007), ‘El volumen de tránsito atraído y desarrollado en carreteras de colombia. un caso real’,
Revista de Topografía AZIMUT 1, 41–52.
Gujarati, D. N. y Porter, D. C. (2003), ‘Basic econometrics. 4th’, New York: McGraw-Hill .
Hernández, J. J. C., Rodríguez, C. G. M. y Álvarez, F. J. M. (2014), Introducción al análisis univariante de
series temporales económicas, Delta Publicaciones Universitarias.
Invias (2012), VOLUMENES DE TRANSITO 2010 2011, (INVIAS).
Jaramillo Ayerbe, M., González Gómez, D. E., Núñez Cabrera, M. E., Portilla, G. E., García, L. y Heriberto,
J. (2007), ‘Análisis de series de tiempo univariante aplicando metodología de box-jenkins para la predic-
ción de ozono en la ciudad de cali, colombia’, Revista Facultad de Ingeniería Universidad de Antioquia
(39), 79–88.
Kazmier, L. J., Kazmier, A. J. y Mata, A. D. (1993), Estadística aplicada a la administración ya la economía,
McGraw-Hill,.
Levin, R. I. y Rubin, D. S. (2004), Estadística para administración y economía, Pearson Educación.
Ochoa Setzer, G. A. y Saldívar del Ángel, R. (2012), Administración Financiera correlacionada con las NIF,
Mexico: Mc Graw-Hill.
Perdomo, M. (2000), ‘Death in Traffic Accidents, Colombia, year 2000’, Instituto Nacional de Medicina Legal
y Ciencias Forenses - INMLCF .
Pindyck, R. S., Rubinfeld, D. L. et al. (2001), Econometria, McGraw-Hill Interamericana.
Aplicaciones Estadísticas. Socialización de Experiencias. ISSN 2619 - 2888

R Core Team (2015), R: A Language and Environment for Statistical Computing, R Foundation for Statistical
Computing, Vienna, Austria.
*http://www.R-project.org/
Robles, D., Ñañez, P. y Quijano, N. (2009), ‘Control y simulación de tráfico urbano en colombia: Estado del
arte’, Revista de ingeniería (29), 59–69.
Ríos, G. (2008), ‘Series de tiempo’, Universidad De Chile, Facultad De Ciencias Físicas y Matemáticas .
Sarmiento, E. M. (2013), ‘Predicción con series de tiempo y regresión’, Panorama 2(4).
Velasco, M. G. y del Puerto García, I. M. (2009), Series temporales, Universidad de Extremadura, Servicio
de Publicaciones.
Velasquez Henao, J. D., Olaya Morales, Y., Cardona, F. y Jaime, C. (2011), ‘Time series analysis and
forecasting in energy markets using the r language’, DYNA 78(165), 287–296.

También podría gustarte