Está en la página 1de 0

UNIVERSIDAD NACIONAL ABIERTA

VICERRECTORADO ACADEMICO
AREA DE INGENIERIA
CARRERA DE INGENIERIA DE SISTEMAS

















PRONOSTICO DE MATRICULA DE ASIGNATURAS SIN PRE-
REQUISITOS MEDIANTE MODELOS BASADOS EN SERIES DE TIEMPO













Autor: Mirna Liliana Gonzlez Gonzlez, C.I. V-
10.790.445
Tutor Acadmico: Ing. Edgar Gonzlez, C.I. V-6.524.564
Asesor Empresarial: Lic. Celeste Longa, C.I. V-9.095.088
Caracas, Centro Local Metropolitano
J unio, 2005


UNIVERSIDAD NACIONAL ABIERTA
VICERRECTORADO ACADEMICO
AREA DE INGENIERIA
CARRERA DE INGENIERIA DE SISTEMAS
















PRONOSTICO DE MATRICULA DE ASIGNATURAS SIN PRE-
REQUISITOS MEDIANTE MODELOS BASADOS EN SERIES DE TIEMPO













Trabajo de grado presentado ante la
Universidad Nacional Abierta por
Mirna Liliana Gonzlez Gonzlez .
del Centro Local Metropolitano para
optar al ttulo de Ingeniero de
Sistemas
Caracas, J unio de 2005


RESUMEN

El presente Trabajo de Grado se fundamenta en el pronstico de la
matrcula de alumnos a inscribirse en las asignaturas sin pre-requisitos de
todas las carreras del Centro Local Metropolitano de la Universidad Nacional
Abierta, mediante la aplicacin de algoritmos basados en series de tiempo.
La data utilizada en este pronstico es la suministrada por la Unidad
de Computacin del Centro Local Metropolitano, la cual posee un histrico
desde el primer semestre del ao 1995 hasta la actualidad.
Una vez determinado los modelos a utilizar con base en nuestro
estudio, se hace uso de la tecnologa web, y de programas de software libre
para desarrollar una aplicacin computacional, donde de una manera sencilla
y eficiente se logre obtener el resultado de aplicar dichos modelos
matemticos.
Con esto hemos garantizado, la adecuacin y mantenimiento posterior
de la herramienta resultado del presente trabajo.

Palabras clave:
Pronstico, series de tiempo, anlisis clsico, modelos Arima.

NDICE

Pg
Introduccin.. 1
Captulo I: El Problema.. 3
1.1Planteamiento del problema. 6
1.2 Formulacin del problema 6
1.3 Objetivos. 6
1.3.1 Objetivo General: ... 6
1.3.2 Objetivos especficos. 6
1.4 J ustificacin de la Investigacin. 7
1.5 Limitaciones 7
Captulo II: Marco Terico. 8
2.1 Antecedentes de la Investigacin... 8
2.2 Bases Tericas.. 10
2.2.1 Definiciones Bsicas.. 10
2.2.2 Series temporales... 19
2.2.2.1 Anlisis Clsico de series temporales.. 24
2.2.2.2 Procesos de Box-J enkins.. 50
2.2.2.3 Modelo Espectral. 55
2.2.2.4 Modelo UCARIMA... 58
2.2.2.5 Modelo ARCHI. 59
2.2.2.6 Modelo de Cointegracin 59
2.2.2.7 Modelo AFRIMA.. 60
2.2.2.8 Modelo del Caos.. 60
2.3. Formulacin del Modelo.. 61
Capitulo III marco metodolgico... 65
3.1 Nivel de Investigacin:.. 65
3.2 Diseo de la investigacin:.. 65
3.3 Poblacin y Muestra: 66

3.4 Tcnicas e Instrumentos de Recoleccin de Datos:. 66
3.5 Tcnicas de procesamiento de Datos 67
3.6 Anlisis de los Datos.. 71
Captulo IV Resultados.. 75
4.1 Software desarrollado.. 75
4.1 Datos de entrada.. 76
4.1 Salida de la simulacin 77
Conclusiones 80
Recomendaciones.. 82

Bibliografa 83
Anexos.. 84
A: Grfica de todas las series
B: Instalacin del EasyPHP
C: Manual de MySQL FRONT
D: Instalacin de Promatric V1.0
E: Manual de usuario de Promatric V1.0
F: Datos suministrados por el Centro Local Metropolitano
G: Decreto 3390 Uso del Software Libre



INTRODUCCIN

Debido a lo cambiante de la realidad, siempre ha existido la
necesidad de hacer pronsticos. El ser humano, consciente y temeroso de la
incertidumbre, siempre ha buscado la forma de enfrentar el porvenir tomando
decisiones que condicionen y afecten su futuro propio y el de las
organizaciones donde se involucra.
Las tcnicas de pronstico han evolucionado considerablemente a lo
largo del tiempo, desde la intuicin, pasando por las tcnicas basadas en la
experiencia del pronosticador, hasta llegar a las ms sofisticadas que utilizan
modelos matemticos.
Casi cualquier organizacin, grande o pequea, pblica o privada,
utiliza el pronstico ya sea implcito o explicito, debido a la necesidad de
planear, en forma responsable, la forma de enfrentar las condiciones futuras
de las cuales se tiene un conocimiento imperfecto. Quienes tienen a su cargo
la responsabilidad de tomar las decisiones, lo harn mejor si tienen una base
que las soporte de manera adecuada. Adems, la necesidad de hacer
pronsticos cruza todas las lneas funcionales al igual que todo tipo de
organizaciones.
Las herramientas modernas de pronstico, junto con la capacidad de
la computadora se han hecho indispensables para las organizaciones que
operan en el mundo moderno, al punto de que muchas decisiones
importantes estn soportadas por los resultados que arrojan estas
predicciones, incluso con mucho tiempo de anterioridad.
Una de las razones de ms peso para justificar el pronstico, es la
administracin de recursos. Si se tuviera conocimiento previo de la
ocurrencia de ciertas situaciones, los recursos pudieran ser mejor

administrados, sin incurrir en deficiencias ni en excesos que pudieran afectar
la organizacin incluso a niveles caticos. En funcin de la imposibilidad de
tener conocimiento exacto de lo que ocurrir en el futuro, el pronstico es la
nica herramienta.
El propsito de este Trabajo de Grado es precisamente establecer un
pronstico que permita a la Universidad Nacional Abierta, aunque sea en
forma parcial, enfrentar de manera mas eficiente la planificacin de sus
recursos para el prximo semestre. Especficamente, este trabajo pretende
realizar el pronstico de la matricula de alumnos a inscribirse en las
asignaturas sin pre-requisitos de ingreso del Centro Local Metropolitano,
utilizando algoritmos de anlisis de series de tiempo.
El proyecto est integrado esencialmente por cuatro captulos: en el
primero se establece y delimita claramente el problema a tratar, junto con los
objetivos que se persiguen y la justificacin y limitaciones del proyecto. En el
segundo se detalla todo el marco terico en el que se basa la solucin del
mismo, as como los antecedentes y la definicin de los trminos bsicos. El
captulo tres ubica la investigacin dentro del nivel y diseo correspondiente
y establece la forma de conseguir y adaptar los datos antes de comenzar su
manipulacin. El captulo cuatro muestra los resultados obtenidos despus
de la simulacin, con su consecuente informacin de pronstico, que es el
objeto primordial de toda la investigacin.


CAPITULO I
EL PROBLEMA


1.1 Planteamiento del problema
La Universidad Nacional Abierta (UNA), fundada en 1977, es pionera
en educacin a distancia en Venezuela. En realidad es el nico instituto
formal del pas cuyo sistema educativo es completamente a distancia. El
objetivo de la Universidad es llevar la educacin superior a todos los
rincones del pas, bajo una metodologa que se caracteriza por la separacin
fsica entre los alumnos y los profesores y la construccin de conocimientos
relevantes, mediante la utilizacin de medios instruccionales indirectos que
facilitan el aprendizaje individual y estimulan la capacidad y la creatividad de
los alumnos, permitindoles adelantar estudios universitarios de alta calidad,
independientemente de su ubicacin geogrfica y sin apartarse de sus
obligaciones laborales y familiares.
Adems del Nivel Central, donde se gerencian los aspectos
acadmicos, logsticos y administrativas de la Universidad, la UNA cuenta, a
todo lo largo del territorio nacional, con 67 ubicaciones, 22 de las cuales son
Centros Locales ubicados en capitales de estado y 45 son Unidades de
Apoyo ubicadas en poblaciones aledaas. Los Centros Locales han
transitado a lo largo de un importante proceso que les ha permitido
evolucionar operativamente hasta constituir verdaderos centros acadmicos,
de investigacin y extensin que, manteniendo relaciones estrechas con el
Nivel Central, son capaces de planificar actividades acadmicas, gerenciar
aspectos administrativos y brindar atencin y apoyo a los requerimientos de
los estudiantiles y de las comunidades.
Operativamente, el Nivel Central se encarga de todo el proceso
acadmico, administrativo y logstico a nivel global, mientras que los Centros
Locales y Unidades de Apoyo se encargan de la interaccin con el
estudiante.

Al inicio de cada perodo de estudio (rgimen semestral), el estudiante
se inscribe de acuerdo a las asignaturas que haya elegido y satisfaga los
requisitos, con lo cual es provisto de un material de auto instruccin y un
documento explicativo de la forma de evaluacin de cada asignatura, los
objetivos a lograr y la forma de hacerlo, de acuerdo a la correspondencia
entre los objetivos y el contenido del material de auto instruccin; adems de
un calendario donde se establecen las fechas de presentacin de pruebas y
los objetivos evaluables. Oportunamente, la Universidad publica las
direcciones de los Centros donde se aplicarn las pruebas.
En la fecha prevista para cada prueba, la Universidad despliega toda
una logstica destinada a la aplicacin de la evaluacin a nivel general en
todo el pas a la misma hora. Para ello, contrata centros de estudio (colegios,
liceos) y distribuye los alumnos de acuerdo a su ubicacin. Estudiantes que
por razones de cualquier tipo, se encuentren fuera de sus centros habituales,
pueden gestionar la presentacin de su prueba en cualquier centro a nivel
nacional. Dada la cantidad de estudiantes que maneja la Universidad, se
contratan tambin Supervisores de Pruebas, los cuales se encargan de velar
por la correcta aplicacin de las mismas.
Obviamente, para el xito de sus actividades, la Universidad requiere,
durante el semestre en curso, la planificacin objetiva de recursos para el
prximo semestre, estimando el volumen de una serie de actividades dentro
de las que se encuentran la reproduccin del material de auto instruccin, la
contratacin del personal para atender las pruebas, la tramitacin de los
locales para la presentacin de exmenes, etc. La estimacin de todos estos
recursos tanto materiales como humanos, que sern empleados el prximo
semestre en atender la operatividad de la universidad, est muy ligada a la
cantidad de alumnos que se inscribirn en las diferentes asignaturas
ofertadas en las carreras que ofrece la institucin. Sin embargo, el obvio

desconocimiento de esta matrcula, hace que en muchas oportunidades la
estimacin de recursos no sea la ptima, pudiendo incurrir en situaciones
como falta de material de auto instruccin para determinadas materias,
insuficiencia del personal para atender las pruebas, o situaciones igualmente
graves como el gasto excesivo de recursos que no se llegan a utilizar,
incluyendo la obsolescencia o dao del material de auto instruccin por el
tiempo. Cabe igualmente destacar que la planificacin debe hacerse por
Centro Local, ya que cada uno tiene sus caractersticas propias.
En particular, es posible lograr una estimacin objetiva de las
matrculas de ciertas asignaturas, dado que dependen de variables
conocidas, como alumnos aprobados de las materias pre-requisito segn la
oferta, alumnos reprobados de semestres anteriores, etc. Sin embargo, las
asignaturas que no tienen pre-requisitos de inscripcin, las cuales pueden
ser inscritas por cualquier estudiante de la carrera que lo desee, requieren
otro tipo de tratamiento, debido a que su inscripcin est supeditada slo a
la decisin del estudiante, pudiendo interferir sobre ello una gran cantidad de
factores que objetivamente se tornan inmanejables.
Sobre esta variable matrcula (para cada asignatura) de las materias
sin pre-requisitos, los nicos datos certeros que posee la Universidad, son
las estadsticas de registros de semestres anteriores, aspecto sobre el cual
se basa este Trabajo de Grado, en la manipulacin de esos datos para lograr
un pronstico cientfico de la matrcula de las mencionadas asignaturas
haciendo uso del conocimiento que se tiene de su comportamiento pasado.

1.2 Formulacin del problema
Cul ser la matrcula de las asignaturas sin pre-requisitos de todas
las carreras de la Universidad Nacional Abierta del Centro Local

Metropolitano para un semestre dado, teniendo en consideracin el
comportamiento pasado de dichas matrculas?

1.3 Objetivos
1.3.1 Objetivo General:
Pronosticar la matrcula de alumnos a inscribirse en un semestre
determinado en cada una de las materias de todas las carreras de la
Universidad Nacional Abierta del Centro Local Metropolitano que no tengan
ningn pre-requisito para su inscripcin, mediante el desarrollo de modelos
matemticos basados en series de tiempo.

1.3.2 Objetivos especficos
Recolectar y analizar los datos histricos de matrcula de la Universidad
en el Centro Local Metropolitano.
Determinar los modelos en series de tiempo en funcin del histrico de
cada asignatura.
Adaptar los modelos obtenidos al caso especfico del Centro Local
Metropolitano.
Validar los modelos definitivos mediante reproduccin del histrico.
Programar la aplicacin computacional para correr los modelos
desarrollados.

1.4 Justificacin de la Investigacin

El presente Trabajo de Grado es conveniente para la Universidad
Nacional Abierta debido a que pone a disposicin una herramienta confiable,
basada en una investigacin cientfica, que le servir de punto de partida
para la asignacin de recursos destinados a la operatividad de sus
actividades para el prximo semestre, en las asignaturas sin pre-requisitos
de todas las carreras que ofrece como institucin en el Centro Local
Metropolitano. La Investigacin tambin es viable debido a que se cuenta con
todas las herramientas necesarias para llevarla a cabo.

1.5 Limitaciones
De acuerdo a las investigaciones preliminares realizadas sobre el
problema a tratar, las limitaciones que pueden influir en el resultado final de
este Trabajo de Grado o que pueden restringir su efectividad son las
siguientes:
La inconsistencia de los datos: Los datos han sido suministrados de dos
fuentes: la Unidad de Computacin y el rea de Matemtica, siendo que
entre ellos hay algunas diferencias leves. Se han tomado slo los de la
Unidad de Computacin por ser los ms completos y se realizar el
trabajo partiendo de stos.
Solamente se tomarn en cuenta los datos del Centro Local
Metropolitano.





CAPITULO II
MARCO TERICO

2.1 Antecedentes de la Investigacin
Para el Centro Local Metropolitano la estimacin de la matrcula ha
sido un problema que ha venido atacndose con diversas herramientas que
van desde utilizar la matrcula del semestre inmediato anterior, el promedio
de los dos o seis ltimos semestres, hasta el uso de herramientas basadas
en modelos de regresin, utilizadas actualmente en el rea de Matemtica
del Centro Local.
Estudios similares de pronstico de matrcula basados en series de
tiempo se han realizado en instituciones extranjeras como la Universidad de
la Repblica (UDELAR) en Uruguay
1
. En la literatura revisada no se
encontraron evidencias de casos concretos de uso de modelos para efectos
de pronstico de matrcula, sin embargo, si se ha utilizado el modelo para
otros fines de pronstico, tales como aplicaciones hidrolgicas,
meteorolgicas y economtricas
El gobierno venezolano, en la actualidad, ha realizado su pronstico
de matrcula de alumnos de la Educacin Bolivariana (alumnos a todos los
niveles en las distintas instituciones pblicas) para el perodo 2004-2005,
utilizando las estadsticas de matrcula de los aos anteriores, tomando como
base el incremento interanual promedio
2
. La siguiente tabla muestra la
estimacin de la matrcula de alumnos de educacin media calculada
mediante este mtodo:


1
http://www.rau.edu.uy/sui/Publicaciones/algunosTopicos/doc_tr3.pdf
2
www.me.gob.ve/sistema_de_educacion_bolivariana


Estimado de la Matrcula estudiantil para el
perodo escolar 2004-2005 Fecha: 27-06-05
Entidad Federal
Estimado Cargado Diferencia
DTTO. CAPITAL 523831 390937 132894
AMAZONAS 42407 36471 5936
ANZOATEGUI 400547 317838 82709
APURE 150556 123711 26845
ARAGUA 453259 188894 264365
BARINAS 227663 189684 37979
BOLIVAR 420174 251648 168526
CARABOBO 588724 375788 212936
COJEDES 92126 70282 21844
DELTA AMACURO 48838 38822 10016
FALCON 272940 208639 64301
GUARICO 223042 63010 160032
LARA 486961 326407 160554
MERIDA 237550 171309 66241
MIRANDA 677166 372042 305124
MONAGAS 259009 160381 98628
NVA. ESPARTA 124520 97405 27115
PORTUGUESA 256061 154579 101482
SUCRE 278994 130215 148779
TACHIRA 321952 256687 65265
TRUJILLO 207541 162780 44761
YARACUY 178240 119128 59112
ZULIA 960376 580625 379751
VARGAS 87278 18141 69137
Total Cargado 7519753 4805423 2714330
TablaN 1 Estimacin de la matrcula de Educacin Media Venezolana
Fuente: http://planteles.me.gob.ve/estimadoalumno2.php



2.2 Bases Tericas
2.2.1. Definiciones Bsicas
2.2.1.1 Proceso estocstico
Se llama Proceso estocstico al conjunto de variables aleatorias X
t

cuya distribucin vara de acuerdo a un parmetro, generalmente el tiempo.
{Xt}, t= 0, 1...,
La variable tiempo t toma valores en un subconjunto de los nmeros
enteros positivos. Las variables aleatorias X
t
toman valores en un conjunto
que se denomina espacio de estados, el cual esta compuesto por todos los
resultados posibles.
Existen algunos casos especiales de procesos estocsticos:
Proceso estacionario: Cumplen con las condiciones de
estacionariedad (ver definicin mas adelante)
Proceso de Markov: Cuya evolucin solo depende del estado actual,
sin tomar en cuenta los estados anteriores.
Proceso de Gauss: En el que toda combinacin lineal de variables es
una variable de distribucin normal.
Proceso de Poisson : Es un proceso donde el nmero de sucesos en
dos intervalos siempre es independiente, la probabilidad de que un
suceso ocurra en un intervalo es proporcional a la longitud del
intervalo y la probabilidad de que ocurra ms de un suceso en un
intervalo muy pequeo es 0.
Proceso de Gauss-Markov: Son procesos que satisfacen al mismo
tiempo, las condiciones de los procesos de Gauss y de Markov.

Proceso de Bernoulli: Donde cada intento tiene slo dos resultados
posibles. La probabilidad del resultado de cualquier intento permanece
fija en el tiempo. Los intentos son estadsticamente independientes.

2.2.1.2 Ruido Blanco
Se llama ruido blanco a una sucesin de variables aleatorias con
distribucin normal, esperanza nula, varianza constante y no
correlacionadas (Novales, 1991).
Para algunos autores, las variables no deben tener necesariamente
distribucin normal, en cuyo caso las suponen independientes en el tiempo
(covarianza nula) en vez de no correlacionadas.

2.2.1.3 Variable aleatoria
Una variable aleatoria se define como el resultado numrico
de un experimento aleatorio. Matemticamente, es una aplicacin
que da un valor numrico a cada suceso en el espacio de los
resultados posibles del experimento.

2.2.1.4 Procesos estacionarios
Un proceso estocstico es estacionario si para todo entero m >0, los
conjuntos de variables aleatorias
t1 t2 t3 tm
{Y , Y , Y ... Y };
tm
Y =Observaciones de la serie en los momentos tm

tienen la misma distribucin de probabilidad, independientemente del valor
del tiempo t (Novales, 1990).
Esto quiere decir, que un conjunto determinado de variables aleatorias
del proceso estocstico, tiene la misma distribucin que cualquier otro
conjunto de m variables aleatorias extradas del mismo proceso. Un ejemplo
de proceso estacionario es el ruido blanco, por ser una sucesin de variables
aleatorias de igual distribucin e independientes a lo largo del tiempo.
La estacionariedad implica que la esperanza y la varianza son iguales
para todas las variables
tm
Y

Figura N 1 Proceso estacionario de ruido blanco
Fuente: http://www.ccee.edu.uy

2.2.1.5 Series de tiempo estacionarias
Una serie se puede definir como estacionaria si cumple las siguientes
caractersticas:
La tendencia es lineal (la esperanza de todas las variables
tm
Y son
iguales). Algunos autores se refieren a estas series como sin
tendencia.

Es homocedstica, es decir, la variabilidad se mantiene constante a lo
largo de la serie.
Serie Homocedstica
0
5
10
15
1 2 3 4 5 6 7 8 9 10 11 12 13

Figura N 2 Serie Homocedstica
Fuente: elaboracin propia


Serie Heterodstica
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9 10 11 12 13

Figura N 3 Serie Heterocedstica
Fuente: elaboracin propia

No tiene ciclos estacionales, lo cual implica que, si la serie no es
anual, no existen perodos de comportamientos tpicos durante ciertas
pocas del ao. Las series anuales normalmente no presentan ciclos
estacionales, sin embargo, podran determinarse ciclos estacionales
cada cierto perodo de aos. La serie homocedstica de la figura N 2
no tiene ciclos estacionales, pero la siguiente, descrita en meses tiene
un claro ciclo de estacionalidad:


Figura N 4 Temperatura en Madrid
Fuente: www.espaahoy.com

La estructura de dependencia se mantiene constante, es decir si una
observacin influye sobre la siguiente, esto siempre ocurre. Esta
condicin es importante para modelar la serie, pues si el fenmeno
que genera la serie cambia, es imposible que podamos prever la
evolucin de la serie.
La influencia de las observaciones de los valores de la serie sobre las
siguientes, disminuye con el tiempo.

2.2.1.6 Estacionariedad en sentido dbil
La estacionariedad en sentido estricto es poco aplicable a las series
temporales ya que se tiene una sola observacin de cada una de las
distribuciones de probabilidad que componen el proceso en cada perodo de
tiempo. En la prctica, se aplica ms bien la estacionariedad en sentido dbil
o de segundo orden como lo llaman algunos autores, lo que implica que
todos sus momentos de primer y segundo orden son independientes del
tiempo, es decir, Un proceso es estacionario en sentido dbil (o de 2 orden)
si y solo si para todo t se cumple:
Media constante

Varianza constante
La covarianza entre dos observaciones
t
Y y
t-k
Y ,
t t-k
COV(Y ,Y ),
depende solamente de la distancia k que haya entre ellas.
La siguiente es una serie estacionaria en media y varianza:

Figura N 5 Consumo de Gasolina en Espaa
Fuente: http://www.uam.es

2.2.1.7 Covarianza y correlacin
Los conceptos de covarianza y correlacin implican dos maneras de
medir la relacin entre dos variables aleatorias. Sean X e Y variables
aleatorias (discretas o continuas), la covarianza entre X e Y, denotada
[ ] COV X, Y
XY
, est dada por:
[ ] ( )( ) [ ] ,
x y x y
COV X Y E X Y E XY

= =


(1)
donde
x
es la media de X y
y
es la media de Y
Una covarianza alta implica un alto grado de dependencia entre X e Y
(sea negativa o positiva). Una covarianza cercana a cero implica poca
dependencia entre X e Y. El problema de la covarianza es que es sensible a
la escala de medicin de las variables involucradas, por ejemplo, si una
variable se mide en millones de bolvares, la covarianza aumentara en esa

misma medida. Luego, es posible tener covarianzas altas y no
necesariamente una alta dependencia entre las variables. Al mismo tiempo
es posible tener una covarianza cero y las variables no ser independientes.
La correlacin evita este problema ya que calcula la relacin entre las
variables de acuerdo a un coeficiente expresado entre -1 y 1. Un coeficiente
de correlacin nulo, significa que no hay correlacin lineal entre las dos
variables. Se calcula segn la siguiente ecuacin:
[ ]
x y
x y
E XY
r
S S

=
(2)

Donde
x
S y
y
S son la desviacin tpica de las variables X e Y.

2.2.1.8 Autocorrelacin
La Autocorrelacin es la correlacin consecutiva de series de tiempo
igualmente espaciadas entre sus miembros. Algunos autores utilizan los
trminos correlacin rezagada, y persistencia para referirse a la
autocorrelacin. A diferencia de los datos estadsticos que son muestras
aleatorias que nos permiten realizar anlisis estadsticos, las series de
tiempo son generalmente autocorrelacionadas, haciendo posible la
prediccin y el pronstico.

2.2.1.9 Funcin de Autocorrelacin (FAC)
Es una funcin real que mide la correlacin que existe entre los
valores de la serie temporal en distintos instantes de tiempo. Su objetivo es
determinar como se influyen las observaciones de la serie separadas un

numero de perodos determinados. De esta forma, la funcin de
autocorrelacin ser una sucesin de nmeros denotados por:
1 2 3
, , ... ...
k

Por ejemplo, si se quiere medir el factor de correlacin de las
observaciones de la serie Y entre el instante t y el instante anterior t-1, es
decir,
t
Y y
t-1
Y , se est hablando del coeficiente de autocorrelacin de primer
orden y viene dado por:

t t-1
1
t t-1
Cov(Y ,Y )
=
Var(Y )Var(Y )
(3)

Si se supone estacionariedad en la serie
1
( ) ( )
t t
Var Y Var Y

= , luego

t t-1
1
t
Cov(Y ,Y )
=
Var(Y )
(4)

En general, para k perodos, se tiene

t t-k
1
t
Cov(Y ,Y )
=
Var(Y )
(5)
Una FAC cercana a cero indica que no existe efecto de una
observacin con otra separada k perodos. Una FAC cercana a 1 indica una
alta influencia de una observacin sobre la otra.

2.2.1.10 Funcin de Autocorrelacin Parcial (FACP)
Esta funcin responde a la misma idea que la FAC, pero a diferencia
de sta, mide la correlacin entre dos observaciones de la serie, ajustada por
el efecto de los perodos intermedios. Por ejemplo, parte de la correlacin
que pueda detectarse entre dos valores de de la serie Y en los tiempos t y t-

2, (
2
,
t t
Y Y

) es debida a que ambas variables estn correlacionadas con el


valor de la variable en t-1.

2.2.1.11 Hiptesis de los componentes subyacentes (HCS)
La HCS expone que una serie temporal
t
Y puede descomponerse en
todos o alguno de los siguientes elementos: tendencia (T), ciclo (C),
estacionalidad (E) e irregularidad (I), que estos elementos se estiman por
separado y luego se combinan de forma conveniente para modelar el
comportamiento de la serie.

2.2.1.12 Outlier
Es aquella observacin que tiene un comportamiento muy diferente
con respecto al resto de los datos, frente al anlisis que se desea realizar
sobre ellos. Esto implica, que dada una serie de datos, existen algunos que
se diferencian sustancialmente del resto y cuya ocurrencia puede deberse a
causas muy especficas, no normales en el comportamiento de la serie,
razn por la cual deben ser revisados con detenimiento. Por ejemplo,
teniendo una serie de datos que guarda la altura promedio de los nios en
edad preescolar, durante varios aos, y los valores oscilan entre 0,75mt y 1
mt., conseguir un valor en la serie de 1,5mt puede ser considerado como
outlier y debe ser investigado para determinar si es correcta tal magnitud o si
se debe a un error.




2.2.1.13 Mtodo de los mnimos cuadrados
Es el mtodo de estimacin mas usado comnmente para ajustar una
serie de puntos de datos a ecuaciones de curvas conocidas. La sumatoria del
cuadrado de las distancias Dnentre la curva conocida y los datos originales,
es una medida de la bondad de ajuste de la curva, es decir, mientras mas
pequeo sea este valor, mejor es el ajuste de la curva.
Una tal curva se dice que ajusta los datos en el sentido de mnimos
cuadrados y se llama curva de mnimos cuadrados. As pues, una recta con
esa propiedad se llama recta de mnimos cuadrados, una parbola se llama
parbola de mnimos cuadrados, etc.(Spiegel, 1990)
Recta de mnimos cuadrados
Por este mtodo se ajusta un conjunto de puntos
1 1
(X , Y ) ,
2 2
(X , Y )a una
recta cuya ecuacin tiene la forma

0 1
Y a a X = + (6)

0
a y
1
a se calculan, resolviendo en forma simultnea las siguientes
ecuaciones:


0 1
Y a N a X = +

(7)

2
0 1
XY a X a X = +

(8)


2.2.2 Series temporales
Los fenmenos sociales pueden ser estudiados estadsticamente
teniendo en cuenta su evolucin en el tiempo. La cantidad de alumnos que
se inscriben semestralmente en cada materia del pnsun de estudios de

cualquier carrera en cualquier universidad puede ser concebida como uno de
estos fenmenos.
En el caso que nos compete, la Universidad Nacional Abierta, y
seguramente en todas las universidades, la matrcula de algunas materias
depende mayormente de factores que pueden medirse (pre-requisitos de
ingreso, repitencias, etc.) y por lo tanto pueden estimarse usando mtodos
ms concretos, sin embargo, para otras materias la matrcula depende de
muchos factores y situaciones complejas que sera muy difcil abarcar por
completo y an cuando se pudiera, sera muy difcil medirlas. Este es el caso
de las asignaturas sin pre-requisitos (tpicamente en los primeros semestres),
donde la matrcula no exhibe necesariamente un patrn determinado.
El siguiente, es un ejemplo de la matrcula de una asignatura en un
perodo de tiempo. Muestra la cantidad de alumnos inscritos por semestre.
Semestre Matrcula
1995-1 1007
1995-2 1061
1996-1 1127
1996-2 1416
1997-1 1119
1998-1 1376
1998-2 487
1999-1 755
1999-2 1603
2000-1 1169
2000-2 1117
2001-1 1339
2001-2 1178
2002-1 909
2002-2 1126
2003-1 1154
2003-2 759
2004-1 1869
2004-2 1521
Tabla N2: Matrcula de alumnos de la asignatura Lengua y Comunicacin I.
Fuente: Unidad de Computacin CLM.


La figura N 6 muestra la grfica de los datos de la tabla N 2, donde
puede observarse el comportamiento de la serie entre 1995 y 2004.
Lengua y Comunicacin I (102)
0
200
400
600
800
1000
1200
1400
1600
1800
2000
1
9
9
5
-
1
1
9
9
6
-
1
1
9
9
7
-
1
1
9
9
8
-
2
1
9
9
9
-
2
2
0
0
0
-
2
2
0
0
1
-
2
2
0
0
2
-
2
2
0
0
3
-
2
2
0
0
4
-
2
Serie1

Figura N 6 Matrcula de la asignatura 102
Fuente: Elaboracin propia

En estos casos, el estudio puede ser enfocado desde dos puntos de
vista: un punto de vista que estudia el comportamiento pasado de la variable
de estudio por ella misma (univariado) o un enfoque que utiliza una serie de
variables que permitan describir el mismo comportamiento (multivariado). El
primer enfoque puede ser incluido en el anlisis estadstico que se denomina
Anlisis de Series Temporales.
Una Serie Temporal est formada por un conjunto de valores
obtenidos de observaciones referentes al mismo fenmeno, realizadas en
una sucesin de momentos de tiempo, normalmente a intervalos iguales
(Sierra, 1994).
El anlisis del comportamiento de una variable basado en Series de
Tiempo, es con frecuencia bastante prctico, dado que se enfoca en estudiar

la evolucin de la variable en el tiempo, sin tomar en cuenta las causas que
la generaron ni los factores que influyeron en dicha evolucin.
El estudio de series temporales ha sido un punto importante de estudio
en las ciencias economtricas, siendo muchos los autores que han trabajado
en ese sentido desde comienzos del siglo pasado.
El anlisis clsico, o modelo de descomposicin, ya utilizado en la
dcada de los treinta, sigue teniendo vigencia debido a su sencillez, aun
cuando han surgido muchos otros mtodos que lo han complementado e
incluso intentado desplazar.
Los modelos conocidos como macroeconomtricos, cuyo estudio
tuvo auge entre los aos cincuenta-sesenta, se basaban en el uso de
ecuaciones simultneas para la descripcin y el pronstico de ciertos
fenmenos tanto econmicos como sociales. Estos modelos llegaron a tener
ms de cien ecuaciones, lo cual fue posible de manipular gracias a la enorme
ayuda de la informtica que les permita hacer clculos de forma ms rpida.
Adicionalmente, y gracias a la estabilidad econmica que existi durante ese
tiempo, los resultados hicieron pensar que se haba conseguido el modelo
ptimo. Sin embargo, el surgimiento de la explosin petrolera, las crisis
inflacionarias, el desempleo y otras situaciones inesperadas mostraron la
incapacidad de estos modelos para representar la realidad del momento.
Un enfoque diferente para abordar las series de tiempo, lo introdujeron
en la dcada de los aos 70, G.E.P. Box, profesor de estadstica de la
Universidad de Wisconsin, y G.M. J enkins, profesor de Ingeniera de
Sistemas de la Universidad de Lancaster, en sus trabajos sobre el
comportamiento de la contaminacin en la baha de San Francisco, que

resultaron en los modelos ARIMA
3
, los cuales permitieron establecer mejores
mecanismos para el pronstico de las series temporales, convirtindose
rpidamente en un clsico. Tambin son conocidos como modelos Box-
J enkins y su metodologa fue de gran ayuda para simplificar los pronsticos
sobre series de tiempo, basndose en la estructura de correlaciones de la
propia serie.
Estos modelos lineales univariantes, con pocos parmetros a estimar,
proporcionaron mejores predicciones que los complicados modelos
macroeconomtricos y pusieron en entredicho la utilidad de los mismos.
Varios estudios comparativos realizados para la fecha, confirmaron esa idea.
Esto provoc una cierta divisin entre los econmetras, por un lado, los
partidarios de los mtodos de series temporales, acusaban a los modelos
multiecuacionales de no ser capaces de explicar la realidad econmica, y
defendan la mayor simplicidad y eficacia de los modelos ARIMA, por otro
lado, los partidarios de los modelos economtricos, se defendan acusando a
los modelos uniecuacionales de series de tiempo de no suministrar
informacin de las causas de variacin de la variable dependiente, lo que los
invalidaba para efectuar ciertos anlisis econmicos.
Ante las nuevas perspectivas de la econometra, iban a la par los
estudios de series temporales., adems de la utilizacin de los modelos
ARIMA y la metodologa Box-J enkins, se aadieron los modelos estructurales
de series temporales, los cuales son una especie de sntesis entre el
planteamiento tradicional de descomposicin y la metodologa de Box-
J enkins, en el sentido de que cada componente se modela como un proceso
ARIMA.

3
Los modelos ARMA (autorregresivos y de media mvil), haban sido ya propuestos por Yule (1921, 1926) y Wold
(1938)

Actualmente nadie cuestiona la utilidad de la metodologa ARIMA para
el modelaje economtrico, y se mantiene vigente el anlisis clsico de
descomposicin, con algunas variantes en la estimacin de sus parmetros.
La vigencia de ambas metodologas queda reflejada en el hecho de que la
mayora de los libros de texto de econometra, incluyen de preferencia slo
estos mtodos, sin embargo, una gran cantidad de metodologas han surgido
para complementar las existentes e incluso han surgido teoras que proponen
enfoques totalmente diferentes. En el resto del documento se analizaran las
ms conocidas

2.2.2.1 Anlisis Clsico de series temporales
El mtodo clsico de anlisis de series temporales, tambin llamado
por algunos autores mtodo de descomposicin o mtodo de extraccin de
seales, supone que la serie de tiempo est compuesta por cuatro
parmetros que pueden ser estimados individualmente para luego establecer
un modelo que permita pronosticar el comportamiento futuro de la serie, as
como explicar el comportamiento pasado.
El primer paso obligatorio para la descomposicin de la serie es
establecer la consistencia de los datos. La serie debe cumplir con las
siguientes caractersticas:
Debe estar completa, es decir, no deben faltar valores en perodos
intermedios
Datos considerados como outliers, deben ser revisados para determinar si
se deben a condiciones atpicas cuya probabilidad de ocurrencia futura
sea muy baja


Una vez establecida la consistencia de los datos, y partiendo de la
grfica de la serie, se pueden distinguir, de acuerdo a este mtodo cuatro
componentes principales:
1. Un componente que se mantiene en el tiempo, cuyo comportamiento
es el mismo a lo largo de todos los valores de la serie. Esto significa
por ejemplo que a simple vista se puede observar que la grfica de la
serie tiene tendencia a subir, bajar o mantenerse estable. Por ejemplo:

Figura N 7: Indice de Actividad Econmica
http://ciberconta.unizar.es/leccion/seriest/100.HTM

Este componente es denominado Tendencia ( T ) por casi todos los autores.
2. Un componente cclico, cuyos valores estn alrededor de la
Tendencia, generalmente de poca duracin. Este componente es un
valor que se repite a lo largo de la serie y dependiendo del tamao de
sta (numero de observaciones) podra no ser tan fcil de observar, de
hecho es la componente ms difcil de determinar, refleja movimientos
oscilatorios por encima y por debajo de la tendencia de la serie y se
debe principalmente a los periodos de prosperidad y de depresin. La
siguiente grfica muestra una serie con un claro ciclo de crecimiento y
decrecimiento:


Figura N8: Ciclos de operatividad debido a alteraciones de presin y temperatura
Fuente: www.aeportugal.pt.

3. Un componente estacional, que representa cortas variaciones que
pueden repetirse peridicamente cada cierto perodo de tiempo, lo
cual puede representar situaciones temporales tanto tpicas como
atpicas de la estructura de los datos que se est observando. Estos
valores pueden ser notados a simple vista, por ejemplo picos de
incremento, disminucin o variacin aleatoria similar cada cierto
nmero de perodos. Las variaciones estacionales se refieren
normalmente a periodicidades anuales, con lo cual, si solo se tienen
datos anuales, estos valores son nulos. Sin embargo, pueden existir
variaciones estacionales, dependiendo de los datos, a cualquier
intervalo de tiempo

Figura N 9: Componente Estacional
http://ciberconta.unizar.es/leccion/seriest/100.HTM

4. Un componente irregular, formado por variaciones aleatorias que no
tienen una representacin definida ni un patrn de ocurrencia. Este
valor puede representar las situaciones atpicas que suelen estar
presentes en todos los fenmenos sociales y que no pueden
predecirse ni medirse de ninguna forma determinista. Pueden deberse
a sucesos de azar tales como huelgas, inundaciones, elecciones, etc.
y aunque se supone que dichas variaciones pierden su influencia en el
tiempo, cabe la posibilidad de que sean tan intensos que den lugar a
nuevos movimientos cclicos o de otro tipo.

Estos cuatro componentes tienen su correspondencia en los factores
que lgicamente podran interesar del fenmeno en estudio y que aislndolos
podran permitir tanto explicar el comportamiento del mismo, como
pronosticar su comportamiento futuro.
El anlisis exige que la serie cronolgica sea descompuesta en sus
cuatro componentes para que sean estudiados por separado y luego se
relacionen de acuerdo a un modelo determinado. Los modelos que se utilizan
generalmente son dos, el aditivo y el multiplicativo dependiendo de la
interaccin entre los componentes de la serie, aunque existen autores que
promueven el uso de un tercer modelo llamado mixto que es una
combinacin de los dos anteriores

Modelo Aditivo
En este modelo se supone que cualquier valor Y de la serie temporal
es la suma de los cuatro componentes y puede calcularse de la siguiente
forma:

Y = T +C +E +I
(9)
Los componentes de la serie se suponen no relacionados entre si,
esto significa que no hay dependencia de un componente con otro. La
dependencia existe si la variacin de un componente implica la variacin de
otro u otros componentes.
Algunos autores consideran que a menos que existan relaciones
claramente definidas, las series deben considerarse siempre aditivas, ya que
las relaciones que no estn bien delimitadas pueden ser tomadas como
irrelevantes para el desarrollo del modelo.

Modelo Multiplicativo
En este modelo se supone que cualquier valor Y de la serie temporal
es el producto de los cuatro componentes y puede calcularse de la siguiente
forma:
Y = T * C * E * I
(10)

En el modelo multiplicativo los componentes tienen alguna
dependencia entre ellos, lo cual hace que la variacin de uno implique la
variacin de los otros. Tiende a ser el ms utilizado debido a que no siempre
se sencillo establecer esta independencia. Para algunos autores solo existe
el modelo multiplicativo, debido a que parten del hecho de que siempre existe
alguna relacin dependiente entre los componentes de la serie de tiempo,
aun cuando no se muestre a simple vista, otros establecen que la relacin
puede estar encubierta por la componente irregular.

Modelo Mixto
En este modelo se supone que cualquier valor Y de la serie temporal
es el producto de los tres componentes T, E y C pero la componente irregular
I es un componente independiente. Esto implica que el modelo a seguir es el
siguiente:
Y = T * C * E +I
(11)
En el cual se est asumiendo que existen relaciones de dependencia
entre 3 de los componentes de la serie excepto para el componente irregular.

Eleccin del modelo
Para elegir el mejor modelo no existe un mtodo determinado, ya que
no se tiene informacin a priori que permita escogerlo, sin embargo, Arellano
(2001) recomienda el llamado mtodo de los Coeficientes de Variacin (CV),
que consiste en, una vez determinada la tendencia, calcular la tabla de
residuos para ambas series, eliminando la tendencia. Esto significa:
Si el modelo es aditivo, la serie con los efectos de tendencia removidos,
se representa con:
t t t
R Y T = ; 1,2... t n =
(12)
Anlogamente, si el modelo es mixto o multiplicativo, la siguiente
ecuacin representa la serie, una vez removidos los efectos de tendencia
t
t
t
Y
W
T
=
(13)
Luego se deben ordenar las series de residuos por perodos, calcular
la media por cada perodo y elegir una estacin determinada (la misma para

cada perodo en ambas series). El CV se calcula dividiendo el valor de la
estacin determinada entre la media de cada perodo. Por ejemplo:

Perodo 1 2 K Promedio STD C.V.
Estacin Fila Fila Fila
1 W(1) W(5) W(4k-3)
) 1 ( W

S
1
) 1 (
1
W
S

2 W(2) W(6) W(4k-2)
) 2 ( W

S
2

) 2 (
2
W
S

3 W(3) W(7) W(4k-1)
) 3 ( W

S
3

) 3 (
2
W
S

4 W(4) W(8) W(4k)
) 4 ( W

S
4

Tabla N 3: Residuos del modelo aditivo
Fuente: http://ciberconta.unizar.es/leccion/seriest/100.HTM

Perodo 1 2 K Promedio STD C.V.
Estacin Fila Fila Fila
1 R(1) R(5) R(4k-3)
) 1 ( R

S
1
) 1 (
1
R
S

2 R(2) R(6) R(4k-2)
) 2 ( R

S
2

) 2 (
2
R
S

3 R(3) R(7) R(4k-1)
) 3 ( R

S
3

) 3 (
2
R
S

4 R(4) R(8) R(4k)
) 4 ( R

S
4

Tabla N 4: Residuos del modelo Mixto/Multiplicativo
Fuente: http://ciberconta.unizar.es/leccion/seriest/100.HTM

El modelo a elegir, ser aquel cuya variacin sea menor en trminos
de valor absoluto.
La eleccin entre el modelo mixto y el multiplicativo depender de la
experiencia del investigador, ya que puede suponer o no, de acuerdo al caso
que est estudiando, que la componente irregular est correlacionada con el
resto de los valores de la serie.

Deteccin y correccin de outliers

Existen procedimientos especficos para detectar y corregir los
outliers. El mtodo ms usado para la deteccin de outliers se basa en fijar
intervalos o regiones tales que fuera de ellas, las observaciones sean
posiblemente outliers y consideradas como tales. Este mtodo est basado
en la desigualdad de Tchebychev
4
:
{ }
2
1
f Xi : |Xi - Xj| <kS 1
k

(14)
Donde k es un valor decidido por el investigador y significa la mayor
distancia que la variable puede estar alejada de su media. Generalmente
toma valores enteros. S es la desviacin tpica. La eleccin de k significa
Se deduce que en el intervalo
( )
X - kS, X +kS se encuentran al menos
el
2
1
100*(1 )%
k
de las observaciones. As si kes tal que
2
1
1
k
es prximo
a 1, observaciones fuera de
( )
X - kS, X +kS pueden ser declaradas como
outliers. Por ejemplo, si k=3, el intervalo
( )
X - 3S, X +3S contiene al menos
el 88.88% de las observaciones.
Para la correccin de outliers, el mtodo mas usado en el caso de
series temporales es el de interpolacin lineal entre el valor anterior y el
siguiente.
Existen otros mecanismos como el de recorte y reemplazamiento que
se emplean tanto para la deteccin como la correccin de outliers. En el
primero se eliminan de los datos los valores mas pequeos y los ms
grandes luego de lo cual se calculan la media y la desviacin tpica
recortada, esto permite decidir cuales son datos outliers y cuales no. Con el

4
Pafnouti Lvovitch Tchebychev. Matemtico ruso (1821-1894)

reemplazamiento se sustituyen los valores ms pequeos por el menor valor
y los ms grandes, por el mayor valor de la serie no considerados como
outliers.
Es de notar que para las series de tiempo, la eficacia de su anlisis
depende en gran medida de la veracidad de sus datos, luego, esto debe ser
tomado en cuenta en el sentido de que una serie con muchos valores que
deben ser corregidos (en relacin con la cantidad de datos), probablemente
no suministre un pronstico adecuado.
Ejemplo prctico: Si tomamos la serie expresada en la tabla N2:
Semestre Matrcula
1995-1 1007
1995-2 1061
1996-1 1127
1996-2 1416
1997-1 1119
1998-1 1376
1998-2 487
1999-1 755
1999-2 1603
2000-1 1169
2000-2 1117
2001-1 1339
2001-2 1178
2002-1 909
2002-2 1126
2003-1 1154
2003-2 759
2004-1 1869
2004-2 1521

Podemos observar a simple vista que no existen datos para el
semestre 1997-2. Siendo una situacin real, lo primero sera investigar si la
causa se debe a un error humano o realmente no existe el dato. En este
ltimo caso, se procede a interpolar el mencionado dato por el mtodo de
interpolacin lineal:

Se toman los datos de la tabla donde se desea interpolar el valor
Y 1997-1 1998-1
X 1119 1376
El valor deseado es el semestre 1997-2, que en la tabla representa el
semestre 6, luego aplicando la frmula (5), tenemos:
1376 1119
(6) 1119 *(6 5)
7 5
f

= +

=1248
Con esto se completa la serie y se puede comenzar el anlisis.
Y 1997-1 1997-2 1998-1
X 1119 1248 1376

Estimacin de los componentes de la serie
La estimacin de los diferentes componentes de la serie puede
hacerse de varias formas teniendo en cuenta parmetros como tamao de la
serie, tipo de informacin almacenada en los datos, estructura, etc. El empleo
de alguna tcnica en particular debe realizarse con base en estos parmetros
y tomando en cuanta tambin la experiencia, ya que no existe una forma
estndar de realizar la seleccin.

Estimacin de la Tendencia
Para estimar la tendencia las tcnicas ms conocidas son las de los
semipromedios, la de los promedios mviles y la de los mnimos cuadrados.
Tcnica de los semipromedios: Consiste en dividir la serie cronolgica en
dos partes, de ser posible iguales, calcular la media aritmtica de ambas
partes, situar los dos puntos hallados en el grfico de la serie y unirlos
mediante una lnea recta, que se supone la Tendencia buscada. Se aplica
cuando la tendencia es lineal o aproximadamente lineal.

Ejemplo prctico: Tomando en cuenta la serie de la tabla N2 (despus
del ajuste de outliers) primero se divide en dos partes la serie y se
calculan las medias aritmticas de cada una:

Semestre Matrcula Semestre Matrcula
1995-1 1007 2000-1 1169
1995-2 1061 2000-2 1117
1996-1 1127 2001-1 1339
1996-2 1416 2001-2 1178
1997-1 1119 2002-1 909
1997-2 1248 2002-2 1126
1998-1 1376 2003-1 1154
1998-2 487 2003-2 759
1999-1 755 2004-1 1869
1999-2 1603 2004-2 1521
Media 1119.9 Media 1214, 1
Tabla N 5: Matrcula de alumnos de la asignatura Lengua y Comunicacin I.
Fuente: Unidad de Computacin UNA

Mediante una grafica se pueden posicionar ambas medias en
cada punto central de la serie (en este caso se puede ubicar el centro
indistintamente entre los semestres 1997-1 y 19972 en la primera
parte y 2002-1 2002-2 en la segunda parte) y trazar una lnea recta
que permita establecer la tendencia, sin embargo, para efectos de
clculo es mas preciso realizar un anlisis como el que sigue:
En diez semestres (desde 1997-1, hasta 2002-1 se puede notar
que ha habido un incremento de 1214,1-119,9 =94,2 alumnos, es
decir, un incremento de 94,2/10 = 9,42 semestral. Sabiendo esto,
podemos calcular los valores de tendencia para todos los semestres,
de la siguiente forma: El semestre 1996-2 (un perodo antes de la
media) viene dado por 1119,9 9,42 =1110,48, el anterior (1996-1)
ser igual a 1119,9 2*9.42= = 1101.06 y as sucesivamente. Los
semestres posteriores a la media sern 1119,9 +9,42 (1997-2) 1119,9

+ 2 *9,42 (1998-1) . La grfica de la siguiente figura muestra una
aproximacin de lo anterior:
0
200
400
600
800
1000
1200
1400
1600
1800
2000
1
9
9
5
-
1
1
9
9
6
-
1
1
9
9
7
-
1
1
9
9
8
-
1
1
9
9
9
-
1
2
0
0
0
-
1
2
0
0
1
-
1
2
0
0
2
-
1
2
0
0
3
-
1
2
0
0
4
-
1

Figura N.10 Aplicacin del Mtodo de los Semipromedios
Fuente: Elaboracin propia

Tcnica de los promedios mviles: Esta tcnica permite seguir de cerca la
evolucin de la serie, aunque se pierden los aos del extremo superior e
inferior y en ocasiones no es posible ajustar a una curva conocida (Sierra,
1994).
Se determinan en la serie los perodos de tres o cinco aos, segn
convenga (se pueden combinar los perodos), luego se calculan los
totales mviles correspondientes. Para ello, se suman los totales del
perodo completo y el resultado se centra en el ao intermedio del perodo
tomado (ao 2 si es de 3 aos o ao 3 si es de 5 aos), seguidamente se
descarta el primer ao y se repite el procedimiento con los siguientes
aos de acuerdo al periodo establecido, hasta el ltimo valor. Por ltimo,
cada total se divide por el nmero de aos que comprenda el perodo,
obteniendo los promedios o medias mviles buscadas. El siguiente
grfico muestra un promedio mvil a tres aos de la serie de la Tabla N2.


0
200
400
600
800
1000
1200
1400
1600
1800
2000
1
9
9
5
-
1
1
9
9
5
-
2
1
9
9
6
-
1
1
9
9
6
-
2
1
9
9
7
-
1
1
9
9
7
-
2
1
9
9
8
-
1
1
9
9
8
-
2
1
9
9
9
-
1
1
9
9
9
-
2
2
0
0
0
-
1
2
0
0
0
-
2
2
0
0
1
-
1
2
0
0
1
-
2
2
0
0
2
-
1
2
0
0
2
-
2
2
0
0
3
-
1
2
0
0
3
-
2
2
0
0
4
-
1
2
0
0
4
-
2
Figura N 11 Aplicacin del Mtodo de los Promedios Mviles
Fuente: Elaboracin propia

Tcnica de los mnimos cuadrados: Consiste en buscar por el
procedimiento de los mnimos cuadrados, la ecuacin de la recta,
curva parablica, exponencial, logartmica, etc. que mejor se ajuste al
conjunto de valores de la serie. Una vez hallada la ecuacin, se
pueden determinar los valores de tendencia para cada momento.
(Sierra, 1994). La siguiente figura muestra un ejemplo del ajuste de
los datos de la tabla N2 a una recta de mnimos cuadrados:
Ttulo del grfico
0
500
1000
1500
2000
1
9
9
5
-
1
1
9
9
6
-
1
1
9
9
7
-
1
1
9
9
8
-
1
1
9
9
9
-
1
2
0
0
0
-
1
2
0
0
1
-
1
2
0
0
2
-
1
2
0
0
3
-
1
2
0
0
4
-
1


Figura N.12 Aplicacin del Mtodo de los Promedios Mviles
Fuente: Elaboracin propia

Estimacin de las variaciones estacionales

Las tcnicas ms usadas son la tcnica del porcentaje promedio, la
tcnica del porcentaje promedio mvil y la tcnica del porcentaje de
tendencia.
Tcnica del porcentaje promedio: Los valores de cada mes se
expresan como porcentajes de la media anual. Por lo tanto, la suma
de los porcentajes de todos los meses debe ser igual a 1200, en el
caso de que la serie tenga valores mensuales, 400 en caso de que
sean valores trimestrales y as sucesivamente. De nos ser as, deben
multiplicarse por la proporcin adecuada para que se produzca ese
ajuste. Luego de obtenido el ndice mensual de varios aos, se forma
un ndice comn obteniendo su media. Siguiendo con el ejemplo de la
tabla N2, lo primero es reordenar la serie en perodos anuales, para
luego calcular la media:

Ao Semestre 1 Semestre 2 Suma
1995 1007 1061 1034
1996 1127 1416 1271,5
1997 1119 1248 1183,5
1998 1376 487 931,5
1999 755 1603 1179
2000 1169 1117 1143
2001 1339 1178 1258,5
2002 909 1126 1017,5
2003 1154 759 956,5
2004 1869 1521 1695
Tabla N 6: Datos reordenados por perodos
Fuente: Elaboracin propia


Seguidamente, se expresan los valores de cada mes como
porcentajes de la media anual

Ao Semestre 1 Semestre 2 Suma
1995 97,39 102,61 200
1996 88,64 111,36 200
1997 94,55 105,45 200
1998 147,72 52,28 200
1999 64,04 135,96 200
2000 102,27 97,73 200
2001 106,40 93,60 200
2002 89,34 110,66 200
2003 120,65 79,35 200
2004 110,27 89,73 200
Tabla N 7: Datos expresados como porcentajes de la media anual
Fuente: Elaboracin propia

Afortunadamente, la suma de los porcentajes anuales es 200 (lo
deseado, dado que es una serie semestral), por lo tanto no es
necesario hacer ningn ajuste. En caso de que as fuera, un
procedimiento como el siguiente servira para lograrlo:
Si se tiene por ejemplo:
2004 110 87 197

Multiplicando 110 y 87 por 200/197 tenemos los nuevos valores
ajustados que ahora si suman 200:
2004 111.68 88.32 200

El ltimo paso es calcular el ndice comn con la media de cada
semestre en todos los aos:
1 2
ndices Estacionales 102,13 97,87


Tcnica del porcentaje promedio mvil: Consiste en calcular primero el
promedio mvil de doce meses para los datos originales, y luego el
promedio mvil de dos meses para centrar los resultados en el centro
del mes a que se refieren y no entre dos meses. Luego los datos
originales se expresan como porcentajes del valor que corresponda al
promedio mvil centrado de doce meses. Esta tcnica es la ms
usada, por ser ms satisfactoria matemticamente. Para dar un mejor
ejemplo de este mtodo se requiere una serie mensual mas que una
semestral como la que se ha venido ejemplificando. La siguiente serie
hipottica permitir demostrar el mtodo:
Mes Vuelos Mes Vuelos
Enero 178 J ulio 186
Febrero 175 Agosto 146
Marzo 120 Septiembre 161
Abril 165 Octubre 119
Mayo 132 Noviembre 170
J unio 135 Diciembre 185
J ulio 145 Enero 168
Agosto 168 Febrero 133
Septiembre 196 Marzo 144
Octubre 137 Abril 179
Noviembre 155 Mayo 198
Diciembre 152 J unio 164
Enero 178 J ulio 198
Febrero 163 Agosto 175
Marzo 172 Septiembre 129
Abril 165 Octubre 137
Mayo 139 Noviembre 163
J unio 195 Diciembre 169
Tabla N 8: Tabla Hipottica con valores mensuales
Fuente: Elaboracin propia

Calculando primero un promedio mvil de 12 meses y luego otro de 2
meses se tiene:

Mes P. mvil Mes P. mvil
Enero J ulio 164,50
Febrero Agosto 162,83
Marzo Septiembre 160,42
Abril Octubre 159,83
Mayo Noviembre 162,88
J unio Diciembre 164,04
J ulio 154,83 Enero 163,25
Agosto 154,33 Febrero 164,96
Septiembre 156,00 Marzo 164,83
Octubre 158,17 Abril 164,25
Noviembre 158,46 Mayo 164,71
Diciembre 161,25 J unio
Enero 165,46 J ulio
Febrero 166,25 Agosto
Marzo 163,88 Septiembre
Abril 161,67 Octubre
Mayo 161,54 Noviembre
J unio 163,54 Diciembre
Tabla N 9: Promedio centrado a 12 meses
Fuente: Elaboracin propia

Dividiendo cada valor real entre su correspondiente promedio mvil y
expresndolo en porcentajes:

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
93,65 108,86 125,64 86,62 97,82 94,26
107,58 98,05 104,96 102,06 86,05 119,24 113,07 89,66 100,36 74,45 104,37 164,04
112,78 102,91 80,63 87,36 108,98 120,21
Tabla N 10: Tcnica del Promedio Mvil
Fuente: Elaboracin propia

Calculando el promedio y ajustando los valores se tienen finalmente
los ndices estacionales para cada mes:

Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
92,594 107,63 124,22 85,641 96,715 93,201
104,45 93,089 101,9 99,089 83,54 115,76 109,78 87,051 97,44 72,284 101,33 159,26
110,41 100,75 78,933 85,526 106,69 117,69

107,43 96,919 90,417 92,308 95,116 116,73 101,19 97,34 110,83 78,963 99,025 126,23
Tabla N 11: ndices Estacionales
Fuente: Elaboracin propia

Tcnica del porcentaje de tendencia: En esta tcnica se procede
eliminando de los datos el componente de la tendencia expresando los
resultados de cada mes como porcentajes de los valores de tendencia
mensuales. Se halla la media de las cantidades obtenidas para el
mismo mes dentro de cada ao como porcentaje de los valores de
tendencia mensuales. Utilizando la serie de la tabla N2, junto con el
clculo de la tendencia ya realizado por el mtodo de los mnimos
cuadrados, podemos reagrupar por semestre para tener lo siguiente
Ao Semestre 1 Semestre 2
Matrcula Tendencia Matrcula Tendencia
1995 1007 1082,22 1061 1091,64
1996 1127 1101,06 1416 1110,48
1997 1119 1119,9 1248 1129,32
1998 1376 1138,74 487 1148,16
1999 755 1157,58 1603 1167
2000 1169 1176,42 1117 1185,84
2001 1339 1195,26 1178 1214,1
2002 909 1223,52 1126 1232,94
2003 1154 1242,36 759 1251,78
2004 1869 1261,2 1521 1270,62
Tabla N 12: Datos de Matrcula y Tendencia reagrupados por semestre
Fuente: Elaboracin propia

Aqu se hallan los valores de cada mes expresados como porcentajes
de la tendencia (ver tabla N13) Y luego se ajustan los valores
dependiendo de la suma por perodo, los resultados son mostrados en
la tabla N 14.





Ao Semestre 1 Semestre 2 Suma
1995 93,05 97,19 190,24
1996 102,36 127,51 229,87
1997 99,92 110,51 210,43
1998 120,84 42,42 163,25
1999 65,22 137,36 202,58
2000 99,37 94,19 193,56
2001 112,03 97,03 209,05
2002 74,29 91,33 165,62
2003 92,89 60,63 153,52
2004 148,19 119,71 267,90
Tabla N 13: Valores como porcentaje de Tendencia
Fuente: Elaboracin propia

Ao Semestre 1 Semestre 2 Suma
1995 97,82 102,18 200,00
1996 89,06 110,94 200,00
1997 94,97 105,03 200,00
1998 148,04 51,96 200,00
1999 64,39 135,61 200,00
2000 102,67 97,33 200,00
2001 107,17 92,83 200,00
2002 89,72 110,28 200,00
2003 121,01 78,99 200,00
2004 110,63 89,37 200,00
Tabla N 14: Datos ajustados del porcentaje de Tendencia
Fuente: Elaboracin propia

Slo resta promediar cada perodo para conseguir los ndices
estacionales:
1 2
Indices Estacionales 69,81 70,19

Estimacin de las variaciones cclicas e irregulares
Aqu hay que hacer una distincin entre si se usan valores anuales o
mensuales. En el primer caso, los datos generalmente no contienen

variaciones estacionales y por lo tanto se deben dividir o restar los datos
entre los valores de tendencia, de acuerdo al modelo elegido.
Modelo aditivo: Y T C I = +
Modelo Multiplicativo/Mixto: / * Y T C I =
En el segundo caso se deben dividir o restar los datos de las
estimaciones de tendencia y estacional, esto da como resultado el producto
C*I, procurando eliminar luego la componente irregular utilizando un
promedio mvil. Los resultados se dan en porcentajes.
El componente cclico y el regular, en la prctica tienden a ser
inspeccionados primero para determinar su influencia real en la serie, de esta
forma, si el producto C*I, expresado en porcentajes no supera un cierto
criterio establecido (por ejemplo 5%, entonces puede asumirse como 1 y
eliminarse de la serie, de esta forma la serie puede ser expresada como
Modelo aditivo: Y T E = +
Modelo Multiplicativo/Mixto: * Y T E =
Si la contribucin de estos componentes (cclicos e irregulares) es
considerable, entonces el procedimiento consiste en eliminar los
componentes de tendencia y estacional, luego suavizar la serie con un
promedio mvil, con lo cual el resultado sera el componente cclico. Este
componente debe ser estudiado en detalle para luego construir ndices de la
misma forma que los ndices estacionales.
La estimacin del componente irregular, se hace ajustando los valores
originales segn los valores de tendencia, estacionales y cclicos
encontrados. Esto se hace dividiendo o restando sucesivamente de los datos
originales, los valores de T, E y C.

Un ejemplo prctico de aplicacin lo tenemos determinando los
componentes cclicos e irregulares de los datos de la tabla N2, a quienes ya
le fueron calculados los componentes de tendencia en prrafos anteriores.
Recopilando nuevamente los datos tenemos:

Datos
Originales
T E
1995-1 1007 1082,22 102,13
1995-2 1061 1091,64 97,87
1996-1 1127 1101,06 102,13
1996-2 1416 1110,48 97,87
1997-1 1119 1119,9 102,13
1997-2 1248 1129,32 97,87
1998-1 1376 1138,74 102,13
1998-2 487 1148,16 97,87
1999-1 755 1157,58 102,13
1999-2 1603 1167 97,87
2000-1 1169 1176,42 102,13
2000-2 1117 1185,84 97,87
2001-1 1339 1195,26 102,13
2001-2 1178 1214,1 97,87
2002-1 909 1223,52 102,13
2002-2 1126 1232,94 97,87
2003-1 1154 1242,36 102,13
2003-2 759 1251,78 97,87
2004-1 1869 1261,2 102,13
2004-2 1521 1270,62 97,87
Tabla N 15: Componentes de Tendencia y Estacional
Fuente: Elaboracin propia

Donde T fue hallada por el mtodo de los semipromedios y E por el
mtodo del porcentaje promedio.
Asumiendo un modelo multiplicativo, los indices C*I puden verse
calculados en la tabla N 16.
Graficando el componente C*I podemos observar que si existen
variaciones cclicas e irregulares considerables (Ver figura N 13), por lo cual,
haciendo un promedio mvil de 3 semestres podemos suavizar las

variaciones irregulares y quedarnos con el componente cclico nicamente
(pueden seguir existiendo variaciones irregulares, aunque en menos escala).


Datos
Originales
T E Y/T Y/TS=C*I
1995-1 1007 1082,22 102,13 93,05 91,11
1995-2 1061 1091,64 97,87 97,19 99,30
1996-1 1127 1101,06 102,13 102,36 100,23
1996-2 1416 1110,48 97,87 127,51 130,28
1997-1 1119 1119,9 102,13 99,92 97,84
1997-2 1248 1129,32 97,87 110,51 112,91
1998-1 1376 1138,74 102,13 120,84 118,32
1998-2 487 1148,16 97,87 42,42 43,34
1999-1 755 1157,58 102,13 65,22 63,87
1999-2 1603 1167 97,87 137,36 140,34
2000-1 1169 1176,42 102,13 99,37 97,30
2000-2 1117 1185,84 97,87 94,19 96,24
2001-1 1339 1195,26 102,13 112,03 109,69
2001-2 1178 1214,1 97,87 97,03 99,13
2002-1 909 1223,52 102,13 74,29 72,75
2002-2 1126 1232,94 97,87 91,33 93,31
2003-1 1154 1242,36 102,13 92,89 90,95
2003-2 759 1251,78 97,87 60,63 61,95
2004-1 1869 1261,2 102,13 148,19 145,11
2004-2 1521 1270,62 97,87 119,71 122,30
Tabla N 16: Componentes de Tendencia, Estacional y Ciclico-Irregulares
Fuente: Elaboracin propia


La Grafica de la figura N 15 muestra la serie suavizada donde se
puede observar un ciclo de aproximadamente 10 semestres. Un ciclo
completo puede observarse desde el semestre 1988-2 hasta el 2003-1. Con
esta informacin procedemos a calcular los ndices cclicos de manera similar
a como se calcularon los ndices estacionales.

0,00
20,00
40,00
60,00
80,00
100,00
120,00
140,00
160,00
1
9
9
5
-
1
1
9
9
5
-
2
1
9
9
6
-
1
1
9
9
6
-
2
1
9
9
7
-
1
1
9
9
7
-
2
1
9
9
8
-
1
1
9
9
8
-
2
1
9
9
9
-
1
1
9
9
9
-
2
2
0
0
0
-
1
2
0
0
0
-
2
2
0
0
1
-
1
2
0
0
1
-
2
2
0
0
2
-
1
2
0
0
2
-
2
2
0
0
3
-
1
2
0
0
3
-
2
2
0
0
4
-
1
2
0
0
4
-
2

Figura N.13 Variaciones cclicas e irregulares
Fuente: Elaboracin propia

0
20
40
60
80
100
120
1
9
9
5
-
1
1
9
9
6
-
1
1
9
9
7
-
1
1
9
9
8
-
1
1
9
9
9
-
1
2
0
0
0
-
1
2
0
0
1
-
1
2
0
0
2
-
1
2
0
0
3
-
1
2
0
0
4
-
1

Figura N.14 Variaciones cclicas
Fuente: Elaboracin propia

Luego, retomando los datos originales, ordenndolos de acuerdo a los
ciclos encontrados, se tiene entonces la informacin de la tabla N 17. Es de
notar que una vez establecidos los ciclos, pueden colocarse en el orden

deseado, siempre y cuando se respete el nmero de perodos que lo
componen.

Sem1 Sem2 Sem3 Sem4 Sem5 Sem6 Sem7 Sem8 Sem9 Sem10 Media
487 755 1603 1169 1117 1339 1178 909 1126 1154 1083,70
1007 1061 1127 1416 1119 1248 1376 1193,43
759 1869 1521 1383,00
Tabla N 17: Datos reorganizados de acuerdo al ciclo
Fuente: Elaboracin propia
Los datos ajustados, junto con el ndice cclico se muestran en la tabla N 18.

Sem1 Sem2 Sem3 Sem4 Sem5 Sem6 Sem7 Sem8 Sem9 Sem10 Suma
44,94 69,67 147,9 107,9 103,1 123,6 108,7 83,88 103,9 106,49 1000
0 0 0 84,38 88,9 94,43 118,6 93,76 104,6 115,30 700
54,88 135,1 110 0 0 0 0 0 0 0,00 300
49,91 102,4 128,9 96,12 95,99 109 113,7 88,82 104,2 110,89
Tabla N 18: Datos ajustados e ndices cclicos
Fuente: Elaboracin propia
Los datos de los componentes T, E y C se pueden resumir en la tabla
N 19.
Finalmente, teniendo tres de los cuatro componentes, se pueden
calcular las variaciones irregulares, ajustando la serie con los valores de T, E
y C. Esto implica dividir los valores originales de la serie por T, E y C.
Normalmente estos valores, aunque se expresen en porcentajes, suelen ser
bastante pequeos. Los datos completos pueden verse en la tabla N 20.
Es fcilmente observable que multiplicando los valores calculados de
T, E, C e I podemos reproducir los datos originales. Por ende, la eleccin de
los mtodos para estimar las componentes, es notoriamente importante a la
hora de descomponer cualquier serie.




Datos
Originales
T E C
1995-1 1007 1082,22 102,13 49,91
1995-2 1061 1091,64 97,87 102,40
1996-1 1127 1101,06 102,13 128,95
1996-2 1416 1110,48 97,87 96,12
1997-1 1119 1119,9 102,13 95,99
1997-2 1248 1129,32 97,87 109,00
1998-1 1376 1138,74 102,13 113,68
1998-2 487 1148,16 97,87 49,91
1999-1 755 1157,58 102,13 102,40
1999-2 1603 1167 97,87 128,95
2000-1 1169 1176,42 102,13 96,12
2000-2 1117 1185,84 97,87 95,99
2001-1 1339 1195,26 102,13 109,00
2001-2 1178 1214,1 97,87 113,68
2002-1 909 1223,52 102,13 88,82
2002-2 1126 1232,94 97,87 104,24
2003-1 1154 1242,36 102,13 110,89
2003-2 759 1251,78 97,87 49,91
2004-1 1869 1261,2 102,13 102,40
2004-2 1521 1270,62 97,87 128,95
Tabla N 19: Componentes de Tendencia, Estacional y Cclico
Fuente: Elaboracin propia
Pronstico de la serie.
De acuerdo a como se haya decidido el modelo, el pronstico de un
valor de la serie para un momento determinado estar determinado por ste.
De esta forma, si se eligi el modelo aditivo, una vez establecidos los
parmetros de composicin de la serie, y estimada la tendencia para el
perodo n+1, se escoge el ndice estacional y el ndice cclico calculados de
los perodos correspondientes, y para el caso del componente irregular, se
puede tomar un valor promedio del obtenido en la serie de datos. Se pueden
pronosticar varios perodos si se desea.
Retomando nuevamente el ejemplo de la tabla N2, se puede
pronosticar el semestre 2005-1 mediante el siguiente clculo:

Se estima la Tendencia para el semestre 2005-1, la cual resulta de
sumar 9,42 (el crecimiento intersemestral) al ltimo valor de Tendencia
calculada, siendo el resultado 1280, 04.
Dado que es el semestre 1, el ndice estacional correspondiente es
102,13.
El componente cclico correspondiente es 96.12
El componente irregular promedio es 0,01
Aplicando el mtodo multiplicativo, se obtiene como resultado
1256,58, equivalente a 1257 estudiantes a inscribirse en el semestre
2005-1 en la asignatura Lengua y Comunicacin I.


Datos
Originales
T E C I
1995-1 1007 1082,22 102,13 49,91 0,02
1995-2 1061 1091,64 97,87 102,40 0,01
1996-1 1127 1101,06 102,13 128,95 0,01
1996-2 1416 1110,48 97,87 96,12 0,01
1997-1 1119 1119,9 102,13 95,99 0,01
1997-2 1248 1129,32 97,87 109,00 0,01
1998-1 1376 1138,74 102,13 113,68 0,01
1998-2 487 1148,16 97,87 49,91 0,01
1999-1 755 1157,58 102,13 102,40 0,01
1999-2 1603 1167 97,87 128,95 0,01
2000-1 1169 1176,42 102,13 96,12 0,01
2000-2 1117 1185,84 97,87 95,99 0,01
2001-1 1339 1195,26 102,13 109,00 0,01
2001-2 1178 1214,1 97,87 113,68 0,01
2002-1 909 1223,52 102,13 88,82 0,01
2002-2 1126 1232,94 97,87 104,24 0,01
2003-1 1154 1242,36 102,13 110,89 0,01
2003-2 759 1251,78 97,87 49,91 0,01
2004-1 1869 1261,2 102,13 102,40 0,01
2004-2 1521 1270,62 97,87 128,95 0,01
Tabla N 20: Componentes de Tendencia, Estacional, Cclico e Irregular
Fuente: Elaboracin propia



2.2.2.2 Procesos de Box-Jenkins
El anlisis de series temporales basado en el trabajo de Box y J enkins
propone una metodologa de trabajo rigurosa para tratar las series a travs
de modelos dinmicos que se conoce como metodologa Box-J enkins o
metodologa ARIMA.
Los modelos ARIMA, Modelos Autorregresivos Integrados de Medias
Mviles de orden p, d, q, o abreviadamente ARIMA (p,d,q), estn basados
en estudios anteriores, realizados por Yule (1921, 1926) y aseveradas por
Wold (1938), no es ms que un modelo ARMA (p,q) aplicado a una serie
integrada de orden d, I (d), es decir, a la que ha sido necesario diferenciar d
veces para eliminar la tendencia.

Tipos de Procesos de Series Temporales- Ecuaciones de Yule-Wold
Si se tiene una Serie Temporal, es interesante descubrir si existe
algn patrn de comportamiento de la serie, de manera de poder hacer
predicciones.
Cuando se habla de procesos, se est suponiendo que es una forma
de generar series de nmeros. La idea es conseguir el proceso que mejor
genere nuestra serie de datos, teniendo en cuenta que tambin podra estar
generada por varios procesos. Los tipos de procesos a revisar son los
siguientes:
Procesos Autoregresivos (AR)
Procesos de Medias Mviles (MA)
Modelos Autoregresivos y de Medias Mviles (ARMA)





Procesos Autoregresivos (AR)
Se puede definir un modelo AR de orden p, tambin escrito AR(p),
como
1 1 2 2 3
3 ...
t t t t p t p t
Y Y Y Y Y

= + + + + (15)

Es decir, se escribe
t
Y (valor de la serie en el momento t), en funcin
de valores pasados de la propia serie y se incluye en la ecuacin un trmino
de perturbacin o error
t
que se supone se comporta como ruido blanco.
Ejemplo: Si se intenta explicar la evolucin de las ventas de la
empresa SSC Sistemas, mediante un proceso autorregresivo, se podra
expresar como sigue:
Las ventas de la empresa este ao (Ventast) dependen directamente
de las ventas de los dos ltimos aos segn la relacin de ventas:
1 2
0.8* 0.5*
t t t
Ventas Ventas Ventas

= +
En este caso puede decirse que la serie de ventas sigue un proceso
autoregresivo de orden 2, cuyos coeficientes son
1 2
0.8; 0.5; 0
t
= = =

Con ayuda de una hoja de clculo, se puede generar, a partir de los
dos primeros datos aleatorios, una columna de nmeros que sigan un
proceso AR(2). El resultado se da en el siguiente cuadro:



Ao Ventas
2003 Bs 763.192,92
2004 Bs 219.993,06
2005 Bs 557.590,91
2006 Bs 556.069,26
2007 Bs 723.650,86
2008 Bs 856.955,32
2009 Bs 1.047.389,69
2010 Bs 1.266.389,41
2011 Bs 1.536.806,37
2012 Bs 1.862.639,80
2013 Bs 2.258.515,03
2014 Bs 2.738.131,92
2015 Bs 3.319.763,05
Tabla N 21 : Pronstico de ventas de la empresa SSC Sistemas C.A
Fuente: SSC Sistemas y Suministros

Graficando esta tabla, tenemos:
0
1000000
2000000
3000000
4000000
5000000
6000000
7000000
1 2 3 4 5 6 7 8 9 10 11 12 13
Ventas
Ao

Figura N 15 Pronstico de ventas de la empresa SSC Sistemas C.A
Fuente:SSC Sistemas y Suministros C.A.

Obviamente, esto sera el resultado final de una investigacin donde
se ha determinado, primero que estamos ante un proceso AR(2) y luego, se

han estimado los parmetros
1 2
, ,
t
. El reconocimiento de este tipo de
procesos se hace con base en su FAC y FACP.
En la prctica, estos procesos, se hallan de orden 1 2. A medida que
el orden del proceso (p) es mas grande, la estimacin de los parmetros se
complica porque involucra muchos mas datos de los observados por la
variable.

Procesos de Medias Mviles (MA)
Un modelo de los denominados de medias mviles es aquel que
explica el valor de una determinada variable en un perodo t en funcin de un
trmino independiente y una sucesin de errores correspondientes a
perodos precedentes, ponderados convenientemente. Estos modelos se
denotan normalmente con las siglas MA, seguidos, como en el caso de los
modelos autorregresivos, del orden entre parntesis. As, un modelo con q
trminos de error MA(q) respondera a la siguiente expresin:

1 1 2 2 3 3
...
t t t t t q t q
Y

= + + + + + +
(16)
Donde
t
es ruido blanco
Un modelo de medias mviles puede obtenerse a partir de un modelo
autorregresivo sin ms que realizar sucesivas sustituciones.
Suponiendo que se desea modelar el precio de un producto agrcola
en un contexto no inflacionario y se dispone de una serie cuya periodicidadad
corresponde al ciclo de cultivo del producto. Un ejemplo del modelo que
podra describir este producto es:

1
10 0.8
t t t
Y

= + +
Obviamente ya se ha determinado la media del proceso , el
coeficiente
1
y la distribucin del ruido blanco.

Procesos Autoregresivos y de Medias Mviles (ARMA)
En el anlisis emprico de series temporales, es frecuente encontrar
representaciones que tienen una componente autoregresiva y una
componente de medias mviles, estos modelos se denotan como
ARMA(p,q), donde p y q denotan los componentes autorregresivos y de
medias mviles respectivamente.
Normalmente estos modelos no se encuentran en rdenes superiores
a los que usualmente se hallan en modelos AR y MA.
La formulacin general del un proceso ARMA, denotada por
ARMA(p,q) viene dada por:


1 1 2 2 3 1 1 2 2 3 3
3 ... ...
t t t p t p t t t t q t q
Yt Y Y Y Y

= + + + + + + + + +
(17)

Su FAC y su FACP sern combinacin de ambos procesos y tendrn la
siguiente estructura:
FAC: Los primeros q coeficientes de la FAC vendrn establecidos por
la parte MA. A partir del momento q se producir un decrecimiento de
los coeficientes vendr dado por la estructura AR.

FACP: Los primeros coeficientes de la FACP vendrn establecidos
por la parte AR. A partir del momento p se producir un decrecimiento
de los coeficientes que vendr dado por la estructura MA.

Modelos ARIMA
En los puntos anteriores (modelos AR, MA, y ARMA) hemos supuesto
que se satisfacen las caractersticas para que el proceso sea estacionario,
sin embargo, encontramos en muchas situaciones, series que no lo son,
como es el caso de las series de datos econmicos, que suelen
caracterizarse por ser claramente no estacionarias, en cuyo caso no es
posible utilizar dichos modelos en forma inmediata.
Para estos casos, existen procedimientos que permiten, tomando las
primeras o segundas diferencias de la serie, obtener series que son
estacionarias o simplemente no son no estacionarias en forma obvia.
Los modelos ARIMA, son modelos realizados para este tipo de series,
en los cuales se transforma la serie original para formar otra serie que si
satisfaga las condiciones para aplicar los procedimientos de los procesos
estudiados anteriormente, luego de lo cual , se recuperan las predicciones
para la serie original, con base en las predicciones elaboradas con la serie
transformada.

2.2.2.3 Modelo Espectral
Se demuestra que cualquier proceso peridico se puede modelar, con
la precisin deseada, mediante series de trminos de funciones senoidales
(seno y coseno), lo que se conoce como series de Fourier, y se denomina
espectro a la representacin de las amplitudes, en el eje de las Y, que

constituyen los diferentes trminos de la serie para toda la gama de
frecuencias (eje de las X).
La idea bsica del anlisis espectral es que un proceso estacionario
t
Y puede ser descrito como la suma de movimientos de seno y coseno de
diferente frecuencia y amplitud. La meta es determinar cuales son los ciclos
de diferentes frecuencias importantes para describir el comportamiento de
t
Y . Estos ciclos pueden ser de corto o largo plazo, por lo que no se realiza
una descomposicin de la serie en la forma usual de tendencia, ciclo,
estacionalidad y componente irregular, sino que en su lugar se descompone
la serie en la totalidad de frecuencias existentes.
Adems, es importante resaltar el hecho de que el anlisis espectral
no depende de un modelo para generar resultados. Este analiza la serie en
forma puramente matemtica y no est basado en ninguna teora acerca de
los procesos que definen las series. Por esto se requiere una gran cantidad
de datos para utilizar esta tcnica (se recomienda al menos 100
observaciones).
En la siguiente figura se muestra una imagen tpica del espectro de
frecuencias de una serie, en el que se representa en el eje de las Y la
amplitud y en el de las X la frecuencia, y partiendo de la estimacin directa
del espectro a partir de los datos (esquina superior izquierda), se va
refinando mediante procedimientos de alisado y nos permite en este caso
detectar la presencia de un factor de periodicidad para la frecuencia en torno
del valor 1.



Figura N 16: Modelo Espectral
Fuente: http://www.bccr.fi.cr/ndie/Documentos/COMPENDIO%20N%B01.PDF

Las principales ventajas que posee esta tcnica son:
No es necesario eliminar los componentes irregular y estacional de
las series para estudiar su comportamiento.
Analiza relaciones econmicas con ms detalle de lo que los
mtodos tradicionales de construccin de modelos economtricos
son capaces. Describe las fluctuaciones de los ciclos econmicos
de una serie de tiempo en forma ms correcta, por cuanto
considera todo el comportamiento histrico de la serie en estudio y

no slo sus picos y valles. Es un mtodo matemticamente ms
riguroso y general que los modelos ARIMA,
Puede utilizarse para series con cualquier tipo de periodicidad.
Las desventajas son:
Las series de tiempo deben ser estacionarias. Transformar una
serie puede alterar el espectro de la serie bsica.
Utiliza nicamente las frecuencias de Fourier, que son aquellas
que contienen un nmero completo de ciclos desde la primera
hasta la ltima observacin. Por ello, las frecuencias particulares
utilizadas dependen de la extensin de las series y es enteramente
posible que un ciclo importante en los datos no sea tomado en el
anlisis. Si se conoce la existencia de la periodicidad de la serie y
se quiere mostrar claramente, entonces la extensin de la serie
debe ser un mltiplo de esa periodicidad
El mtodo espectral requiere ms datos (sobre 100 observaciones)
que otros tcnicas, debido a que no utiliza la muestra en forma
eficiente.
Es un modelo no terico, en el sentido de que no responde a
alguna teora econmica.

2.2.2.4 Modelo UCARIMA
La metodologa UCARIMA (unobserved components ARIMA) asume
que tanto la serie observada como los componentes inobservables
responden a modelos ARIMA, cmo veremos la estimacin de los mismos no
consiste ms que en la aplicacin de filtros de caractersticas adecuadas. La
ventaja que aporta este mtodo est ligada a la estimacin-especificacin

previa de un modelo a la serie observada lo que resuelve los problemas de
adecuacin del filtrado a la naturaleza de las series. De manera adicional,
este mtodo permite la obtencin de medidas estadsticas de confianza
sobre la estimacin, as como efectuar predicciones sobre los componentes.
El modelo UCARIMA coincide en que las series temporales pueden
ser descompuestas de acuerdo con las especificaciones de la Hiptesis de
los componentes subyacentes (HCS) basada en modelo ARIMA. Segn la
HCS una serie temporal Y , puede descomponerse en cuatro elementos:
Tendencia (T), Ciclo (C) , Estacionalidad (E) e Irregularidad (I) segn un
esquema aditivo o multiplicativo.

2.2.2.5 Modelo ARCHI
Desarrollado por Robert F. Ingle (premio Nobel compartido 2003)
permite analizar series de tiempo con volatilidad temporal. Es usado
intensivamente en el campo de las finanzas para replicar la volatilidad del
precio de los activos en el tiempo. El modelo plantea que la varianza de las
series de precios evoluciona de acuerdo a un proceso autorregresivo,
generalmente lineal. La aplicacin de este mtodo es comn en la evaluacin
del riesgo de activos financieros. Est basado en la metodologa de Box-
J enkins.

2.2.2.6 Modelo de Cointegracin
Clive W.J . Granger ( premio Nobel compartido 2003), desarroll el
mtodo para analizar series de tiempo con tendencias comunes
(cointegracin). Este mtodo explora las series de tiempo para detectar
relaciones de largo plazo que encierran sentido econmico. Con frecuencia
se encuentran relaciones estadsticas entre variables econmicas no
estacionarias

2.2.2.7 Modelo AFRIMA
Propuestos por Granger, J oyeux (1980) y Hosking (1981). Los
modelos ARFIMA permiten modelizar procesos con dependencias a largo
plazo. Para ello aprovechan el concepto de procesos fraccionarios
introducidos por Mandelbrot y Van Ness (1968). Existen mltiples estudios
sobre modelizacin ARFIMA de mercados financieros.

2.2.2.8 Modelo del Caos

Un planteamiento distinto al de los procesos estocsticos es el que
presenta a las series temporales no como originadas por un proceso
estocstico, sino como un proceso determinista. El desarrollo de la teora del
caos propiciado en los aos 70, gracias a las contribuciones de autores como
Ruelle, Takens, Lorenz, Li, Yorke, May, Feigenbaum y Mandelbrot,
proporciona una explicacin terica alternativa para la existencia de sistemas
dinmicos con comportamientos irregulares sin necesidad de recurrir a las
variables aleatorias.
El paso definitivo de los sistemas dinmicos caticos tericos al
anlisis de series temporales fue propuesto por Packard, Crutchfield, Farmer
y Shaw en 1980. La idea de estos fsicos era que todo el sistema dinmico
podra estudiarse a travs de una sola variable, pues la historia de sta
guardara informacin sobre el resto del sistema. Una versin formalizada
matemticamente de dicho concepto se conoce como el teorema de Takens,
desarrollado por este en 1981, sobre el que est construido el anlisis
catico de las series temporales.

En los aos 80 se desarrollan dentro de la fsica toda una serie de
herramientas para diferenciar series temporales aleatorias de series
temporales caticas. Estas herramientas han tenido xito para detectar
comportamientos caticos en campos tan dispares como la fsica, la qumica
o la medicina.

2.3. Formulacin del Modelo
Del anlisis realizado, surgen muchas expectativas sobre cual
metodologa se debe usar para tratar las series de datos que le competen a
este trabajo, sin embargo, dada la estructura de la informacin que se tiene,
es posible ver con claridad muchas ventajas que representa el mtodo
clsico sobre los otros mtodos.
La sencillez de uso del mtodo.
El hecho de que el fenmeno estudiado es un fenmeno social ms
que econmico. Los mtodos como el de Box-J enkins, y todos los que
se basan en l, son recomendados para situaciones principalmente
econmicas, pero aunque pueden usarse para otros casos tanto
sociales como fsicos, qumicos, ambientales, etc., su verdadera
fortaleza est en las series econmicas. El mtodo clsico es un
mtodo que hace bastante abstraccin del origen de los datos.
No se tiene una gran cantidad de perodos en los datos de las series
para justificar el uso de algunos modelos como el espectral, por
ejemplo, que requiere una gran cantidad de datos.
Facilidad de programacin.


Para tomar la decisin sobre la mejor estimacin de los parmetros de
la serie, el primer paso depender de la grfica de todas las series que se
tienen.
Para efectos de estimacin de la tendencia se debe elegir entre los
tres mtodos existentes: el mtodo de los promedios mviles, el mtodo de
los semipromedios y el mtodo de los mnimos cuadrados, de acuerdo al que
represente mejor la tendencia aplicando el mtodo de la bondad de ajuste, el
cual consiste en buscar la curva cuya suma del cuadrado de las desviaciones
Dn entre la curva original ya la curva estimada sea menor.
Para estimar la estacionalidad se emplear el mtodo del porcentaje
promedio, debido a que es el que mejor se ajusta. El porcentaje promedio
mvil no se usar debido a que mayormente es til para series con valores
mensuales y en nuestro caso, las series solo tienen valores semestrales. El
mtodo del porcentaje de tendencia se descart tambin debido a que si
existen variaciones grandes, los ndices estacionales pueden contener
variaciones cclicas e irregulares
Con respecto a la estimacin del ciclo, ser necesario la determinacin
del modelo a a ser usado (el aditivo, el multiplicativo o el mixto). La mejor
forma es aplicar el mtodo de variacin de los coeficientes (CV) a los datos
obtenidos y luego determinando el mejor modelo entre el aditivo y el
multiplicativo o mixto.
Si resultase mejor el mtodo multiplicativo mixto se debe usar el
multiplicativo por dos razones primordiales:
Es ms fcil de manipular.
No existe certeza real de que la componente irregular de las series
sea un parmetro absolutamente desligado del resto de los
parmetros de la serie.

Una vez determinado el modelo que va a ser empleado, deben
dividirse o restarse los valores de la serie de los componentes Tendencia y
Estacional para lograr un residuo C*I C+I segn convenga. Estos residuos
sern evaluados para determinar su incidencia sobre la serie. Si el valor de
esta incidencia no supera el 5% se pueden obviar estos componentes.
De no haber incidencia de los residuos sobre la serie, se debe asumir
este valor como uno para el caso del modelo multiplicativo, con lo cual la
serie quedar descrita por el producto T * E se tendr por nulo (valor 0)
para el caso del modelo aditivo, siendo entonces la serie descrita por la suma
T+E.
Si existe incidencia de los residuos sobre la serie, se suaviza la con
una media mvil corta de 3 perodos para eliminar la componente irregular,
con lo que se tendr entonces la componente cclica pura. Esta componente
debe ser evaluada para determinar si existen ciclos, aunque sea aproximado,
luego de lo cual se determinarn de la misma forma que el componente
estacional.
Determinado el componente cclico, se ajustan los datos originales de
la serie por los valores calculados de T, S y C para aislar la componente
irregular.
Teniendo ya descrita completamente la serie, se puede hacer la
prediccin del perodo n+1, de acuerdo al siguiente procedimiento:

Siguiendo el mismo esquema de la Tendencia calculada, se estima el
valor de sta para el perodo n+1, dependiendo del mtodo utilizado.
Se ubica el ndice estacional calculado para ese perodo (semestre 1 o
semestre 2) de acuerdo al perodo a predecir.

De acuerdo a la evaluacin que se haya hecho sobre la incidencia de
los residuos cclico-irregulares se determina si el modelo va a incluir o
no estos componentes.
En caso afirmativo se puede emplear directamente el componente
cclico-irregular C*I C+I.
Teniendo a mano todos los componentes de la serie, pronosticar el
perodo n+1 no es ms que aplicar las ecuaciones 7 u 8 dependiendo
del modelo ms conveniente.
Pronosticar perodos superiores a n+1, es decir n+2, n+3 etc. es
posible tomando en cuenta que se incluiran en la serie, los valores
pronosticados y se reutilizaran para calcular de nuevo el pronstico.

La validacin del modelo se realizar una vez que se tengan los valores
reales, semestre a semestre, el algoritmo se ir recalculando para arrojar,
aparte del valor pronosticado, la desviacin con respecto al valor real. Con
esto, se podr evaluar fcilmente la funcionalidad del modelo.









CAPITULO III
MARCO METODOLGICO

En esta parte del documento, se mostrar informacin detallada acerca de
cmo se aplicaron los conceptos desarrollados en el marco terico para la
ejecucin de la investigacin, as como tambin ubicar la investigacin en el
marco de estudio que le corresponde.

3.1 Nivel de Investigacin:
Esta investigacin es de tipo explicativa, dado que pretende establecer
el comportamiento de las variables matrcula de alumnos ubicada en el
contexto especfico del Centro Local Metropolitano de la Universidad
Nacional Abierta.

3.2 Diseo de la investigacin:
Dado que los datos provienen directamente de la realidad donde
ocurren, es decir, son datos primarios que no han sido manipulados ni
controlados, se puede decir que estamos en presencia de una investigacin
de campo.
Es intensiva, dado que se est estudiando un caso particular cuyo
marco se encuentra centrado en el Centro Local Metropolitano de la
Universidad Nacional Abierta, lo cual imposibilita su generalizacin a
universidades u otros mbitos similares.

El diseo de campo utilizado es el post-facto ya que se utilizan datos
ya ocurridos sin posibilidad de manipular las variables independientes.
Adicionalmente, la investigacin tambin es documental, porque
involucr la el anlisis e interpretacin de informacin obtenida
primordialmente de fuentes bibliogrficas documentales tanto impresas como
electrnicas. Adicionalmente, tambin se tomaron en cuenta los trabajos
realizados con anterioridad con respecto al tema en el Centro Local
Metropolitano.

3.3 Poblacin y Muestra:
La Poblacin en estudio sern todos aquellos estudiantes inscritos con
anterioridad en las asignaturas sin prerrequisitos del Centro Local
Metropolitano de la Universidad Nacional Abierta. En este caso la muestra es
igual a la poblacin.

3.4 Tcnicas e Instrumentos de Recoleccin de Datos:
Los datos fueron generados por la Unidad de Computacin del Centro
Local Metropolitano de la Universidad Nacional Abierta, quienes son los
responsables de mantener y controlar este tipo de informacin para uso
interno de la Universidad. Fueron entregados en formato digital, en archivos
con formato texto (extensin .txt), donde se incluyen por semestre los
alumnos inscritos, los regulares y los repitientes en cada asignatura.
La figura N 16 muestra el detalle de uno de los archivos obtenidos
para el semestre 1997-1 con la relacin estadstica por asignaturas emitida
por la Unidad de Computacin. La informacin contenida en estos archivos
debe ser depurada para dejar solamente lo necesario y no recargar el

sistema de informacin que debe manipularlos con datos que no van a ser
necesarios.

Figura N 24: Archivo con datos de la matrcula semestral por asignatura
Fuente: Centro Local Metropolitano U.N.A

3.5 Tcnicas de procesamiento de Datos
Los archivos obtenidos en formato texto, fueron depurados para
mantener slo los datos necesarios. Para ello se realiz el siguiente
procedimiento:
Se borr el encabezado de los archivos para dejar solamente informacin
de la matrcula. La figura N 17 muestra un ejemplo del archivo sin
encabezado, solamente con los datos necesarios para continuar su
exportacin hacia la aplicacin Microsoft Excel.

Se abrieron los archivos con la aplicacin Microsoft Excel y se ajustaron
las columnas para lograr la tabulacin exacta de los datos

Figura N:17 Archivos sin encabezado
Fuente: Elaboracin propia



Figura N 18: Paso1 del Asistente de importacin de Excel
Fuente: Elaboracin propia


Figura N 19: Paso2 del Asistente de importacin de Excel
Fuente: Elaboracin propia

Los archivos importados en Microsoft Excel fueron consolidados en uno
solo, teniendo en cuenta las siguientes consideraciones:
o Algunas asignaturas, como Matemtica I (cdigo 100) fueron
reemplazadas por otras, con lo cual los datos aparecen nulos a partir
de un semestre determinado.
o Nuevas asignaturas fueron creadas para reemplazar algunas otras.
Por ejemplo la asignatura Matemtica I, cdigo 177, luego, no tiene
valores para semestres anteriores a su creacin.

o Algunas asignaturas, como Procesos Estocsticos, cdigo 322, fueron
ofertadas solo en algunos semestres, por ende no aparece en todos
los archivos suministrados. Fue necesario ajustar el espacio necesario
en el archivo consolidado para mantener la integridad de los datos.
El archivo consolidado en Excel fue guardado como consolidado.txt bajo
el formato archivo separado por tabulador, con lo cual se facilita su
exportacin hacia la herramienta de gestin de Base de Datos My SQL.
Luego para importarlo desde My SQL, se utiliza la sentencia
LOAD DATA INFILE 'C:/Archivos de programa/EasyPHP1-
8\\tmp\\php94.tmp' INTO TABLE `dataoriginal` FIELDS TERMINATED
BY'

Figura N 20 Importacin de Datos a MySQL desde MySQL Front.
Fuente: Elaboracin propia. 2005


Adicionalmente, se filtraron las asignaturas sin pre-requisitos, para tener
solamente la informacin importante para el estudio. Este procedimiento
se realiz manualmente con base en la oferta acadmica de todas las
carreras.
3.6 Anlisis de los Datos
El anlisis de los datos para desarrollar los modelos de series de
tiempo adaptados a los datos de la matrcula que nos compete, parte de la
grfica de todas las series cronolgicas. No se tomaron en cuenta las
asignaturas que ya no estaban vigentes y las que fueron creadas a posteriori
se analizaron solamente con los datos que se tienen.
Es de notar que los datos indican la falta de informacin en un
semestre (1997-2) para todas las asignaturas, el cual no se realiz por
razones que no debido a que es requisito indispensable que las series estn
completas para poder comenzar su anlisis.
Estos valores nulos o inexistentes, conocidos como outliers, se
reemplazaron en todas las series por el valor resultante de la interpolacin
entre el valor del semestre 1997-1 y el semestre 1998-1. No se realizaron
detecciones adicionales de outliers en el resto de los datos, partiendo de la
confiabilidad de los mismos dado su origen y su forma de manipulacin,
amn de la poca cantidad de datos que se tienen lo cual minimiza la
ocurrencia de errores.
Muchas asignaturas tienen valores cero en algunos semestres lo cual
indica que no hubo estudiantes inscritos en ese momento. Estos valores se
asumieron como nulos partiendo del hecho de las mltiples ocurrencias
Ahora bien, una vez superado el tema de los outliers y graficadas las
series, se comenz el anlisis de los componentes de cada una de ellas.

La estimacin de la tendencia, se realiz utilizando los tres mtodos
existentes: el mtodo de los promedios mviles, el mtodo de los
semipromedios y el mtodo de los mnimos cuadrados, luego de lo cual se
estableci cual representaba mejor la tendencia aplicando el mtodo de la
bondad de ajuste.
Se estim la estacionalidad con la tcnica del porcentaje promedio.
El siguiente paso consisti en determinar, mediante el mtodo de los
Coeficientes de Variacin, cul es el modelo ms conveniente. Una vez
determinado el modelo a ser empleado, se ajustaron los valores de la serie
de los componentes Tendencia y Estacional para lograr un residuo C*I C+I,
los cuales fueron evaluados para determinar su incidencia sobre la serie. Se
tomaron en cuenta slo si esta incidencia superaba el 5%.
En los casos donde no hubo incidencia de este parmetro, se tomaron
slo los parmetros T y E. En caso contrario, se calcularon los ndices
cclicos y luego el componente irregular para completar el estudio.
Con todos los componentes calculados de la serie, se valid el
modelo obtenido reproduciendo el pasado de la serie. En virtud de que ya se
valid la estimacin de la tendencia de acuerdo a la bondad de ajuste de la
curva y se tienen dos mtodos para calcular la componente Estacional, se
comprob la bondad de ajuste de las dos series calculadas con los dos
mtodos para determinar cual se ajustaba mejor a la serie original y se eligi
aquella cuya bondad de ajuste fuera mejor.
Teniendo ahora establecidos los cuatro parmetros, se realiz el
pronstico de los perodos necesarios para cada serie de acuerdo al
siguiente procedimiento:
1. Estimacin la tendencia para el perodo solicitado.

2. Ubicacin del ndice estacional calculado para ese perodo (semestre
1 o semestre 2) de acuerdo al perodo a predecir.
3. Determinacin del ndice cclico, si existe.
4. Promedio del valor de la componente irregular
5. Validacin del modelo de acuerdo al histrico.
6. Clculo del valor pronosticado de la serie para el perodo deseado
7. Clculo de la desviacin aproximada del pronstico.
8. Repeticin de los pasos del 1 al 6 para los siguientes perodos, si
fuera el caso.
Pronsticos deseados para perodos superiores a n+1, requiere que
se utilice el mtodo sucesivamente para lograr estimaciones sobre la base de
estimaciones anteriores.
La aplicacin desarrollada para calcular los modelos, denominada
Promatric V1.0, le dio solucin de forma automtica a todas las series
permitiendo generar un archivo de pronstico con todas las asignaturas sin
pre-requisitos indicando adicionalmente la desviacin que podra tener.
Promatric V1.0 fue diseada en el lenguaje de programacin PHP
soportado por el motor de base de datos MySQL Server. La eleccin de
estas herramientas estuvo condicionada por el reciente decreto
gubernamental (ver anexo G: Decreto 3390 uso del Software Libre) en el
cual se establece el uso de Software Libre para las instituciones del estado.
Otros aspectos como la sencillez de programacin, la transportabilidad y el
bajo uso de recursos en cuanto a espacio de memoria, tambin incidieron en
la eleccin de las mismas. Por ltimo, el hecho de ser una aplicacin Web,
abre muchos caminos de utilizacin futura como integracin en portales,
posibilidad de uso remoto, alimentacin de otras aplicaciones similares, etc.


CAPITULO 4
RESULTADOS

En este captulo, se pueden observar los resultados de la aplicacin
del modelo formulado en la parte final del capitulo dos, aplicando la
metodologa y el anlisis descrito en el captulo tres, dndole finalmente
solucin al problema planteado en el primer captulo.
Debido al tamao de los datos originales, las grficas de las
asignaturas se encuentran en el anexo A al final del documento.

4.1 Software desarrollado
La aplicacin desarrollada, Promatric V1.0 realiza los clculos
necesarios para pronosticar la matrcula de las asignaturas sin pre-requisitos
de todas las carreras del Centro Local Metropolitano de la Universidad
Nacional Abierta, mediante la aplicacin de un algoritmo basado en series de
tiempo aplicado a los datos histricos de matrcula de las mencionadas
asignaturas, guardados desde 1995 hasta el 2004.
La aplicacin Promatric V1.0 consta de los siguientes mdulos:
Consulta de histrico: Aqu se pueden observar los datos
cargados como histricos que le sirven de base a la aplicacin.
Los datos no son modificables. Permite adems ver la grfica
del comportamiento de la matrcula, por asignatura
Nuevos datos: Permite cargar los datos del nuevo semestre una
vez realizadas las inscripciones para poder realizar los nuevos
pronsticos basados en datos reales.

Clculo de pronstico. Arroja el pronstico de la matrcula de
las asignaturas sin pre-requisitos.
Mantenimiento de tablas: Permite manipular las tablas de
carreras, materias, centros locales y prerrequisitos.

4.1 Datos de entrada
Los datos de entrada suministrados por la Unidad de Computacin
del Centro Local Metropolitano, inicialmente en formato texto (.txt) fueron
formateados de acuerdo a la estructura siguiente, para estandarizar los datos
de acuerdo a lo establecido en los parmetros del sistema. El archivo de
materias sin pre-requisitos tiene los siguientes campos:
Cdigo de asignatura: 3 dgitos numricos, por ejemplo: 102.
Descripcin de la asignatura: 20 dgitos alfanumricos, por ejemplo:
Lengua y Comunicacin I.
Inscritos regulares: 4 dgitos numricos.
Inscritos repitientes: 4 dgitos numricos.
Total inscritos: 4 dgitos numricos.


Figura N 21 Formato de los datos de entrada
Fuente: Elaboracin propia

Los datos son ingresados al sistema a travs del mdulo nuevos
datos, una vez estandarizados en el formato establecido.


Figura N 22 Pantalla de importacin de datos
Fuente: Elaboracin propia

4.1 Salida de la simulacin
Para comenzar la simulacin es necesario acceder al mdulo de
pronstico y elegir la opcin de materias sin pre-requisitos. Es importante
recordar que este Trabajo de Grado est complementado por otro de
condiciones similares cuya funcin es determinar el pronstico de las
asignaturas con pre-requisitos de la carrera Ingeniera de Sistemas del
Centro Local Metropolitano y se decidi elaborar una sola aplicacin que
permitiera recuperar el pronstico de ambos grupos de materias. Por esta
razn, para iniciar la simulacin, es necesario elegir a que grupo se referir el
pronstico. La figura N 23 muestra la pantalla donde se inicia la simulacin.


Figura N 23 Pantalla de Pronstico de Materias
Fuente: Elaboracin propia

Eligiendo convenientemente el rango de asignaturas deseadas, el
semestre a pronosticar y el grupo sin pre-requisitos, se comienza el
pronstico presionando la tecla Aceptar.
La simulacin produce una pantalla con los valores arrojados luego de
los clculos de pronstico. La figura N 24 muestra el detalle del reporte de
pronstico. El campo Desviacin, estar en blanco para este primer
pronstico, sin embargo, a medida que se vayan incluyendo los datos reales
esta columna se recalcular para indicar la desviacin promedio del
pronstico con respecto a la realidad. Esto permitir la revisin del modelo
para su optimizacin en el tiempo. Desde esta pantalla se podr imprimir el
reporte de pronstico.


Figura N 24 Reporte de Pronstico de Materias
Fuente: Elaboracin propia