Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ABSTRACT
The objective of this research is to demonstrate that the time series are an excellent tool for
modeling of data traffic on networks Wimax. To achieve this goal we used the Box-Jenkins
method, which is described in this article. The traffic modeling Wimax through correlated
models such as time series allow you to adjust much of the dynamic behavior of the data in an
equation, and based on this estimate future values of traffic. This is an advantage for planning
_____________________________________________________________________________________
Recebido em/Manuscript first received: 23/10/2008 Aprovado em/Manuscript accepted: 30/12/2008
Endereo para correspondncia/ Address for correspondence
Cesar Augusto Hernndez Suarez, Distrital University, Bogot D.C., Colmbia, Ingeniero Electrnico de
la Universidad Distrital F. J. C. de Bogot, Colombia. Especialista en Interconexin de Redes y Servicios
Telemticos de la Universidad Manuela Beltrn. Magster en Ciencias de la Informacin y las
Comunicaciones de la Universidad Distrital, y actualmente adelanta estudios de maestra en Economa en
la Universidad de los Andes. Docente de planta en la Universidad Distrital F. J. C. en el rea de circuitos
digitales, sistemas inteligentes y teleinformtica. Pertenece a los grupos de investigacin: Internet
Inteligente y ARMOS de la Universidad Distrital. E-mail: cahernandezs@udistrital.edu.co
Octavio Jos Salcedo Parra, Distrital University, Bogot D.C., Colmbia, Ingeniero de Sistemas de la
Universidad Autnoma de Colombia en 1994, Magster en Teleinformtica de la Universidad Distrital
Francisco Jos de Caldas. Magster en Economa de la Universidad de los Andes. Hace estudios de
Doctorado en Informtica con nfasis en Sociedad del Conocimiento en la Universidad Pontificia de
Salamanca. Director y fundador del Grupo de Investigacin Internet Inteligente. Director de la Revista de
Ingeniera y Docente de la Universidad Distrital. E-mail: octavionetworking@gmail.com
Luis Fernando Pedraza Martnez, Military University, Bogot D.C., Colmbia, Ingeniero Electrnico de
la Universidad Distrital F. J. C. de Bogota, Colombia. Magster en Ciencias de la Informacin y las
Comunicaciones de la Universidad Distrital F. J. C. Docente de planta de la Universidad Militar Nueva
Granada en el rea de las telecomunicaciones. E-mail: pedrazaluis2001@yahoo.es
506
RESUMEN
El objetivo de esta investigacin es demostrar que las series de tiempo son una excelente
herramienta para el modelamiento de trfico de datos en redes Wimax. Para lograr este objetivo
se utiliz la metodologa de Box-Jenkins, la cual se describe en este artculo. El modelamiento
de trfico Wimax a travs de modelos correlacionados como las series de tiempo permiten
ajustar gran parte de la dinmica del comportamiento de los datos en una ecuacin y con base en
esto estimar valores futuros de trfico. Lo anterior es una ventaja para la planeacin de
cobertura, reservacin de recursos y la realizacin de un control ms oportuno y eficiente en
forma integrada a diferentes niveles de la jerarqua funcional de la red de datos Wimax. Como
resultado de la investigacin se obtuvo un modelo de trfico ARIMA de orden 18, el cual realiz
pronsticos de trfico con valores del error cuadrtico medio relativamente pequeos, para un
periodo de 10 das.
Palabras clave: ARIMA, Correlacin, Modelo de trfico, Serie de tiempo, Red de
comunicaciones.
INTRODUCCION
R. Gest. Tecn. Sist. Inf. /JISTEM Journal of Information Systems and Technology Management, Brazil
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
507
Por tanto los modelos de trfico a travs de series de tiempo son beneficiosos
para: la planeacin de cobertura, reservacin de recursos, monitoreo de la red, deteccin
de anomalas, y produccin de modelos de simulacin ms exactos, en la medida en que
pueden pronosticar el trfico en un tiempo de escala determinado. (Papadopouli, 2004).
En la planeacin, para futuras necesidades de cualquier sistema, la exactitud en
el pronstico de trfico, es realmente importante para definir capacidad futura requerida
y planear los cambios. Un modelo de series de tiempo bastante exacto podra predecir
varios aos hacia el futuro, cuya habilidad es una ventaja para la planeacin de futuros
requerimientos. (Fillatre, 2003).
En el presente documento se busca:
Desarrollar un modelo estadstico que permita estimar pronsticos futuros de trfico
en redes Wimax a travs del modelamiento en series de tiempo.
Evaluar los diferentes modelos actuales ms utilizados para el pronstico de trfico,
relacionados con series de tiempo.
A continuacin se desglosaran cada uno de los pasos realizados durante la
investigacin a fin de construir el modelo de trfico para una red de datos Wimax.
2
Extraccin de la Serie
508
datos se capturaron como una variable de paquetes por segundo y se tomaron 889
muestras que corresponden a un poco ms de 9 das con un intervalo de una muestra
cada 15 minutos.
Netflow Analyzer es una herramienta de software basada en Web que permite el
monitoreo del ancho de banda de cualquier red. Los datos son exportados de los
dispositivos de enrutamiento hacia el Analizer Network Traffic el cual reporta el ancho
de banda utilizado en tiempo real a travs de la red monitoreada. Debido a su carcter
de herramienta de software basada en Web, permite la monitorizacin remota de
cualquier red a travs de los dispositivos de red (como Routers) que se encuentren
configurados en este software.
A pesar de haberse extrado 889 datos de trfico los modelos se desarrollaran
nicamente con los 672 primeros (correspondientes a los siete primeros das), los datos
restantes se utilizaron para comparar y evaluar los pronsticos de cada una de las series.
(Fillatre, 2003).
2.2
Preprocesamiento de la Serie
R. Gest. Tecn. Sist. Inf. /JISTEM Journal of Information Systems and Technology Management, Brazil
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
509
6400
TRAFICO_REAL
5600
4800
4000
3200
2400
1600
800
0
15
16
17
January
18
19
20
21
22
23
24
2.3
510
-1.49785
R. Gest. Tecn. Sist. Inf. /JISTEM Journal of Information Systems and Technology Management, Brazil
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
511
6000
DTRAFICO_REAL
4000
2000
0
-2000
-4000
-6000
15
16
17
18
19
20
21
January
Funcion de Autocorrelacion
FAC ( q )
1.00
FA C
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
0
10
15
20
25
30
35
40
45
50
1.00
FA CP
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
0
10
15
20
25
30
35
40
45
50
512
(1)
Ahora que se tiene un fuerte candidato, hay que estimar sus parmetros. En la
prctica esta es una labor de cmputo, aqu se debe escoger el paquete a usar, para este
estudio se eligi el software RATS (Por encima inclusive del Software Eviews) por la
flexibilidad que ofrece y por su gran potencialidad y estimacin de mxima
verosimilitud.
Lo usual es, pasar de la estimacin inicial al anlisis de los residuos, aqu se
vuelve a buscar picos pero ahora en los residuos. Estos picos revelan trminos que uno
debe incluir en la nueva formulacin del modelo ARIMA que se volver a estimar. Este
ciclo de re-especificacin dinmica termina cuando los residuos ya no presentan
correlaciones (picos) y en ese momento se puede decir que son residuos son ruido
blanco. (Box, 1976), (Jones, 1978), (Makridakis, 1997).
Realizando lo anterior en el software RATS se obtuvo la primera estimacin de
parmetros del modelo, es decir los coeficientes del modelo ARIMA que se presentan
en la ecuacin 2, y cuyos valores se listan en la ecuacin 2.
Z t = 0.385785636 Z t 2 + 0.546189772 Z t 22 + at
+ 0.451619226 at 2 0.504850197 at 22
(2)
R. Gest. Tecn. Sist. Inf. /JISTEM Journal of Information Systems and Technology Management, Brazil
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
513
6400
TRAFICO_MODELADO
5600
4800
4000
3200
2400
1600
800
0
-800
15
16
17
18
19
20
21
January
1.00
FAC
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
0
10
15
20
25
30
35
40
45
50
1.00
FACP
0.75
0.50
0.25
0.00
-0.25
-0.50
-0.75
-1.00
0
10
15
20
25
30
35
40
45
50
514
Z t = 0.092467147 Z t 6 0.090197053 Z t 10
+ 0.093022957 Z t 18 + at 0.978862096 at 1
(3)
0.009496113 at 10 0.009945630 at 18
6400
TRAFICO_MODELADO
5600
4800
4000
3200
2400
1600
800
0
15
16
17
18
19
20
21
January
Con el fin de realizar una comparacin subjetiva entre los datos estimado por el
modelo desarrollado en la ecuacin 3 y los datos de trfico reales, se muestra la figura 7,
donde las trazas azules indican los datos de trfico estimados y las negras los reales.
6400
TRAFICO_REAL
TRAFICO_MODELADO
5600
4800
4000
3200
2400
1600
800
0
15
16
17
18
19
20
21
January
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
515
Z t = 0.90995170 Z t 1 0.74409755 Z t 2
0.627510 Z t 3 0.5740204 Z t 4 0.5230094 Z t 5
0.551627 Z t 6 0.4832262 Z t 7 0.4072993 Z t 8
(4)
6400
TRAFICO_MODELADO
5600
4800
4000
3200
2400
1600
800
0
-800
15
16
17
18
19
20
21
January
6400
TRAFICO_REAL
TRAFICO_MODELADO
5600
4800
4000
3200
2400
1600
800
0
-800
15
16
17
18
19
20
21
January
516
(5)
3250
TRAFICO_MODELADO
3000
2750
2500
2250
2000
1750
1500
1250
15
16
17
18
19
20
21
January
6400
TRAFICO_REAL
TRAFICO_MODELADO
5600
4800
4000
3200
2400
1600
800
0
15
16
17
18
19
20
21
January
RESULTADOS
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
517
correlacin entre los residuales para ninguno de los tres modelos desarrollados por lo
que entonces la pregunta seria cual escoger? (Brillinger, 2001).
Debido a lo anterior se analizaran otros criterios a parte del anlisis residual para
seleccionar adecuadamente un modelo:
Criterio de calidad de ajuste.
Criterio de parsimonia.
Criterios estadsticos.
3.1.1 Calidad de Ajuste
La calidad de ajuste de un modelo esta definida como la suma de los cuadrados
de los residuos dividida por el tamao de la muestra, y su objetivo es medir la habilidad
del modelo para reproducir los datos de la muestra, es decir verifica que tan parecida es
la serie modelada con la real. (Guerrero, 2003).
En la Tabla 1 se muestran los valores de la calidad de ajuste para cada modelo
desarrollado.
Tabla 1. Calidad de ajuste de los modelos
desarrollados.
Modelo
Desarrollado
Modelo
ARIMA
Modelo ARI
Modelo
IMA
Calidad
Ajuste
171,4137326
20489,69984
976512,583
de
3.1.2 Parsimonia
La idea de parsimonia es que un buen modelo tiene pocos parmetros ya que ha
capturado las propiedades intrnsecas de la serie que se analiza, un modelo complicado
con demasiados parmetros es un modelo sin parsimonia. Desde este punto de vista, el
modelo ARI que se obtuvo anteriormente es un modelo sin parsimonia, debido a la gran
cantidad de parmetros que presenta (en total 18 parmetros) en contraste con el modelo
ARIMA (en total 6 parmetros) y el modelo IMA (en total 2 parmetros).
Se podra concluir que el modelo IMA es el que presenta mayor parsimonia,
inclusive mayor a la del modelo ARIMA. Sin embargo este criterio siempre deber ser
el ltimo que utilice para seleccionar un modelo, debido a su carcter cualitativo y no
cuantitativo como si lo es el criterio de calidad de ajuste y los que se describen a
continuacin.
3.1.3 Criterios Estadsticos
A pesar de poder seleccionar un modelo adecuado a partir de los criterios de
anlisis de residuos, calidad de ajuste y parsimonia, se calcul tambin varios criterios
estadsticos que permitieran realizar objetivamente un anlisis comparativo entre los
Vol.5, No. 3, 2008, p. 507-525
518
Mode
lo
ARI
MA
Mode
lo
ARI
Model
o IMA
Error
Cuadrtico
Medio
0,124
859%
15,66
4319
%
1284,1
22643
%
Desviacin
Estndar
en
Valor
Absoluto
1,213
379%
13,97
9571
%
122,17
8100%
Coeficiente de
Correlacin
0,999
92493
9
0,991
10978
6
0,4454
68898
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
519
Model
o
ARIM
A
Model
o
ARI
Model
o
IMA
Error
Cuadrtico
Medio
2,2665
23%
26,098
772%
1366,1
44832
%
Desviacin
Estndar
en
Valor Absoluto
5,9327
70%
21,842
614%
131,17
3949%
Coeficiente de
Correlacin
0,9981
36212
0,9817
0719
0,3822
41697
Calidad
Ajuste
4306,2
78315
29074,
16568
10442
23,598
de
CONCLUSIONES
520
RECOMENDACIONES
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
521
522
R. Gest. Tecn. Sist. Inf. /JISTEM Journal of Information Systems and Technology Management, Brazil
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
523
524
Modelo de trafico wimax basado en series de tiempo para pronosticar valores futuros de trafico
525
modeling and control. En: IEEE Transactions on systems, man, and cybernetics. Vol.
15, 1985.
TANENBAUM, Andrew S. Redes de Computadoras. Cuarta Edicion. Mxico:
Prentice Hall, 2003.
WILLINGER W.; PAXON V. y TAQQU M. S. "Self-similarity and heavy tails:
structural modeling of network traffic". En: A practical guide to heavy tails:
statistical techniques and applications. Birkhauser, Boston. 1998; p. 27-53.
XIAOQIAO, Meng; STARSKY, Wong; YUAN, Yuan, y SONGWU, Lu.
Characterizing flows in large wireless data networks. En: ACM/IEEE international
conference on mobile computing and networking. Philadelpia. 2004.