Está en la página 1de 70

1

I. INTRODUCCIN.
Las

Infecciones

Respiratorias

Agudas

(IRA)

son

padecimientos

infecciosos de las vas respiratorias con evolucin menor a 15 das y en


ocasiones se complican con neumona.
La importancia de saber el comportamiento de las variaciones de los casos
de infecciones respiratorias agudas en menores de 5 aos derivado en un
futuro es muy importante para la prevencin y planificacin ante ciertos
incidentes que pueden surgir producto de los cambios climticos.
Las tcnicas de pronstico de series de tiempo permiten llevar a cabo esta
labor por medio de la metodologa Box-Jenkins, la cual permite obtener
buenas aproximaciones en el caso de que dicho mtodo sea bien aplicado,
ya que esta metodologa tiene una parte de arte en el sentido de que el
proceso es iterativo hasta alcanzar el mejor modelo.
En el presente trabajo de investigacin se utilizo informacin de los casos
de infeccin respiratoria aguda en nios menores de 5 aos por aos y
meses, buscando luego un modelo adecuado que permiti ajustar el
comportamiento de los casos de infeccin respiratoria aguda el cual a su
vez permiti realizar pronsticos.
La informacin obtenida de los casos mensuales de Infeccin Respiratoria
Aguda de la provincia de Puno corresponde al periodo 2003-2009, los
cuales fueron agrupados mensualmente, para evaluar el comportamiento
de la serie histrica a fin de realizar proyecciones con la variable en
estudio.

1.1. PROBLEMA
1.1.1. FORMULACIN DEL PROBLEMA
Las Infecciones Respiratorias Agudas (IRAs)1 son padecimientos
infecciosos de las vas respiratorias con evolucin menor a 15 das y en
ocasiones se complican con neumona, sndrome de obstruccin bronquial
que son las ms graves. Esto constituye un importante problema de salud
pblica. Actualmente en el Per es la principal causa de mortalidad
infantil; los

departamentos ms afectados del pas son Huancavelica,

Apurmac, Ayacucho, Cusco y la Regin Puno2, donde reina la pobreza y


en el que la accesibilidad a los servicios de salud se encuentra limitada. Es
precisamente en la ltima donde se

registra el mayor nmero de

atenciones por este padecimiento las que se presentan durante el invierno,


atacando esencialmente a lactantes, nios y adultos mayores ao tras ao.
El Hospital Manuel Nez Butrn es la institucin encargada de velar por
la salud de nuestros menores, debido a la elevada frecuencia de las
Infecciones Respiratorias Agudas (IRAs) y al nmero de episodios mal
diagnosticados y tratados es necesario unificar los criterios que faciliten su
manejo, pero resulta que esto no se cumple ya que ni siquiera cuenta con
datos estadsticos de posteriores aos, dando lugar a una mala toma de
decisiones preventivas por parte del rgano institucional de salud y del
estado.

Las Infecciones Respiratorias Agudas.disponible en:


< http://www.geosalud.com/enfermedades_infecciosas/IRA.htm>. [Fecha de consulta: 19 de agosto 2009].
2
Puno registra cifra ms alta en IRAS de la regin. Escribe: VCTOR RAL ORTEGA VARGAS Disponible en:
< http://www.losandes.com.pe/Educacion/20090603/36773.html>.
[Fecha de consulta: 20 de agosto 2009].

1.1.2. DEFINICIN DEL PROBLEMA


Teniendo esta problemtica con dimensiones que se debe considerar, sobre
las Infecciones Respiratorias Agudas y con el deseo de contribuir con el
conocimiento para el anlisis y proyeccin de datos a futuro, en la
bsqueda de una solucin inteligente al planteamiento del problema y dar
alternativas integrales a los problemas prioritarios de la salud de la regin,
se plantea la siguiente interrogante.
Cul es el mejor Modelo Univariante para pronosticar las
Infecciones Respiratorias Agudas en nios menores de 5 aos en el
periodo 2003-2009 en la provincia de Puno?
1.3. OBJETIVOS
1.3.1. OBJETIVO GENERAL
Determinar el Modelo Univariante Integrado que mejor se ajusta para
describir y predecir el comportamiento de las Infecciones Respiratorias
Agudas en nios menores de 5 aos
provincia Puno.

en el periodo 2003-2009 en la

1.3.2. OBJETIVOS ESPECFICOS.

Identificar, estimar y validar el modelo identificado que mejor se

ajusta para describir y predecir el comportamiento de las Infecciones


Respiratorias Agudas en nios menores de 5 aos en el periodo 2003-2009
en la provincia de Puno.

Determinar el pronstico con el modelo alcanzado para las Infecciones

Respiratorias Agudas.
1.4. HIPTESIS.
Hiptesis general:
El Modelo Univariante Integrado proporciona un mejor ajuste para
describir y predecir el comportamiento de las Infecciones Respiratorias
Agudas en nios menores de 5 aos mensualmente en los aos 2003-2009
en la provincia de Puno.

II. MARCO TERICO.


2.1. ANTECEDENTE DE LA INVESTIGACIN
Daza Cahuana Jess Mara. Modelo Uniecuacional para determinar el
ingreso neto de las pequeas y medianas empresas del sector comercial en
la ciudad de Juliaca 2008. Su objetivo es determinar un modelo
uniecuacional para explicar el ingreso neto de las pequeas y medianas
empresas del sector comercial en la ciudad de Juliaca 2008, y concluye
que la actividad econmica comercial que predomina entre las pequeas y
medianas empresas de la ciudad de Juliaca es la venta al por menor de
artculos de ferretera, pintura y productos de vidrio en almacenes
especializados 4.
Cruz Marleni y Llanos Condori Marleny. Modelo Univariante para
describir y pronosticar la influencia de turistas en la provincia de Puno en
el periodo 1995-2005. Su objetivo fue determinar los modelos univariante
que mejor se ajusta para predecir y pronosticar el comportamiento de las
variaciones de la afluencia de turistas en la provincia de Puno en el
periodo 1995-2005. Concluye que el mejor modelo univariante integrado
SARIMA (1,1,2)*(2,0,2) es el que mejor se ajusta a los datos para
describir y pronosticar la afluencia de turistas en la provincia de Puno5.

Bach. Daza Cahuana Jesus Maria. Modelo Uniecuacional para determinar el ingreso neto de las pequeas y medianas
empresas del sector comercial en la ciudad de Juliaca 2008
5
Bach. Cruz Marleni y Llanos Condori Marleny. Modelo univariante para describir y pronosticar la influencia de turistas
en la provincia de Puno en el periodo 1995-2005. Tesis Facultad de Ingeniera Estadstica e Informtica
4

Daz Mamani Nela. Pronostico mediante Modelos de Series de Tiempo


para el Consumo de Agua Potable de la Empresa Municipal de
Saneamiento Bsico de la ciudad de Puno, periodo 2000-2007. Su
objetivo fue determinar el mejor modelo de series de tiempo para el
consumo de agua potable de la empresa municipal de Puno (2000-2007).
Concluye que el mejor modelo para el consumo de agua potable es:
ARIMA(0,1,3) 6.
Guerra Jos, Snchez Gustavo y Reyes Belkis.Modelo de Series de
Tiempo para predecir la inflacin en Venezuela. Su objetivo fue proveer
una serie de modelos con periodicidad mensual que permitan realizar
proyecciones con distintas alternativas propuestas, de tal manera que se
genere una visin adecuada sobre la inflacin en el futuro inmediato. El
periodo analizado corresponde a 1989:06 1997:07. Concluye que al ser
modelada la variable nicamente en funcin de su propia evolucin
pasada, se plantea como supuesto bsico que el proceso generador de datos
de la inflacin se mantiene invariable durante el periodo de proyeccin, no
tomando en cuenta posibles alteraciones atribuidas a variables relacionadas
en el sistema econmico, mientras que las ecuaciones de regresin
permiten incorporar cambios previsibles en las variables explicativas que
afectaran los niveles futuros de la inflacin7.

Bach. Daz Mamani Nela. Pronostico mediante modelos de series de tiempo para el consumo de agua potable de la
Empresa Municipal de Saneamiento Bsico de la ciudad de Puno, periodo 2000-2007.. Tesis Facultad de Ingeniera Estadstica
e Informtica UNA-PUNO.2004
7
Bach. Guerra Jos, Snchez Gustavo y Reyes Belkis. .Modelo de series de tiempo para predecir la inflacin en
Venezuela. Disponible en World Wide Web:
<http://espejos.unesco.org.uy/simplac2002/Ponencias/Gobierno%20en%20l%EDnea/EL016.DOC>.
[citado 8 de mayo 2009; 1:50 a.m.].
6

2.2. BASE TERICA.


2.2.1. PRONSTICOS.
Los pronsticos son predicciones de lo que puede suceder o esperar, son
premisas o suposiciones bsicas en que se basan la planeacin y la toma de
decisiones.
El propsito del pronstico consiste en reducir en margen de
incertidumbre, haciendo el mejor uso de la informacin que se tiene para
guiar las actividades de la empresa hacia el cumplimiento de sus metas y
objetivos. De esta forma los pronsticos son particularmente importantes
en la asignacin del uso de los recursos de la empresa.
Los pronsticos se basan en el uso de datos anteriores de una variable para
predecir su desempeo futuro. A este respecto, los datos anteriores se dan
generalmente en la forma de series e tiempo. Una hiptesis bsica en la
aplicacin de las tcnicas de pronstico es que el desempeo de los datos
anteriores continuara ocurriendo en el futuro inmediato8.
2.2.2. NECESIDAD DE PRONOSTICAR.
Debido a que siempre ha sido cambiante el mundo en el que operan las
organizaciones, siempre ha existido la necesidad de hacer pronsticos. Sin
embargo, en los ltimos aos se ha incrementado la confianza en las
tcnicas que abarcan una compleja manipulacin de datos9.

8, 9

HANKE John E. (1996). Pronsticos en los negocios. (5ta Edicin). Mexico: Editorial Prentice Hall Hispanoamericana
S.A.

Las computadoras, junto con las tcnicas cuantitativas que hacen posible,
se han vuelto ms que recomendables en las organizaciones modernas; se
han vuelto esenciales.
Quin requiere hacer pronsticos? Casi cualquier organizacin, grande y
pequea, pblica y privada, utiliza el pronstico debido a que casi todas las
organizaciones deben planear como enfrentar las condiciones futuras de
las cuales tiene un conocimiento imperfecto. Adems, la necesidad de
hacer pronsticos cruza todas las lneas funcionales, lo mismo que todo
tipo de organizaciones.
2.2.3. TCNICAS DE PRONSTICOS.
Se pueden emplear dos tcnicas bsicas de pronsticos: Las tcnicas de
pronstico cualitativas y cuantitativas.
a) Tcnicas de pronsticos cualitativas.
Este mtodo es apropiado cuando los datos confiables son escasos o
difciles de emplear. Se basan en el juicio humano y en la intuicin, ms
que en la manipulacin de datos histricos anteriores. Las tcnicas
cualitativas comunes incluyen al mtodo Delphi, curvas de crecimiento,
escritura de escenarios, investigacin de mercado y grupos de enfoque10.

10

HANKE John E. (1996). Pronsticos en los negocios. (5ta Edicin). Mexico: Editorial Prentice Hall
Hispanoamericana S.A.

b) Tcnicas de pronstico cuantitativas.


Las tcnicas de pronstico cuantitativas se utilizan cuando existen
suficientes datos histricos disponibles y cuando se juzga que estos datos
son representativos de un futuro desconocido. Trabajan con modelos
cuantitativos o modelos matemticos que se basan en datos histricos, bajo
el supuesto de que son relevantes para el futuro. Estos modelos se pueden
utilizar con series de tiempo.
2.2.4. PRONOSTICOS SEGN PLAZOS.
Los pronsticos a largo plazo son necesarios para establecer el curso
general de la organizacin para un largo periodo, sirven para tomar
decisiones estratgicas y por lo general abarcan de tres a cinco aos. Los
pronsticos a mediano plazo abarcan de uno a dos aos. Los pronsticos a
corto plazo se utilizan para disear estrategias inmediatas que ayuden en la
toma de decisiones, solo abarcan meses. Las tcnicas ms complejas de
Box-Jenkins resultan apropiadas para pronsticos de corto y mediano
plazos11.
2.2.5. SERIES DE TIEMPO.
Es un conjunto de observaciones ordenadas segn una caracterstica
cuantitativa de un fenmeno individual en diferentes momentos del
tiempo, en el cual las observaciones son realizadas. Una serie de tiempo
consta de datos que se renen, registran u observan sobre incrementos
sucesivos de tiempo12.
11, 12

HANKE John E. (1996). Pronsticos en los negocios. (5ta Edicin). Mexico: Editorial Prentice Hall Hispanoamericana
S.A.

10

Una serie de serie es una secuencia cronolgica de observaciones de una


variable en particular. Una serie de tiempo es un conjunto de
observaciones producidas en determinados momentos durante un periodo,
semanal, mensual, trimestral o anual, generalmente a intervalos iguales. El
primer paso para analizar una serie de tiempo es graficarla, esto permite
identificar la tendencia, la estacionalidad, las variaciones irregulares
(componente aleatorio). Un modelo clsico para una serie de tiempo,
puede ser expresado como suma o producto de tres componentes
tendencia, estacional y un trmino de error aleatorio.
ANALISIS DE SERIES DE TIEMPO.
El anlisis de series de tiempo est dedicado al estudio de series; por lo
general, los datos de dichas series son independientes pero estn
correlacionados; se puede decir que existe una relacin entre
observaciones contiguas.
Es el anlisis de una secuencia de medidas hechas e intervalos especficos.
El tiempo es usualmente la dimensin dominante de los datos. Sirven para
establecer la afectividad de medidas que afectan a grupos poblacionales
teniendo en cuenta las variaciones naturales que puede haber en el tiempo.
Son muy comunes en la evaluacin de leyes en la poblacin. Permiten una
visin parcial de la relacin causa efecto, pero no pueden extrapolar los
hallazgos de la poblacin a individuos especficos13.

13

Series de Tiempo. Disponible en World Wide Web:<http://www.estadistica.mat.uson.mx/Material/seriesdetiempo.pdf>.


[Citado 8 de mayo 2009; 12:40 a.m.].

11

Anlisis de Series de Tiempo


Descripcin: Al tener una serie de tiempo, el primer paso en el anlisis es
graficar los datos y obtener medidas descriptivas simples de las
propiedades principales de la serie.
Explicacin: cuando las observaciones son tomadas sobre dos o mas
variables, es posible usar la variacin en una serie para explicar la
variacin en las otras series.
Prediccin: Dada una serie de tiempo se intenta predecir los valores
futuros de la serie. Este es el objetivo ms frecuente en el anlisis de series
de tiempo.
Control: una serie de tiempo se genera por mediciones de calidad de un
proceso, el objetivo del anlisis puede ser el control del proceso.
COMPONENTES DE UNA SERIE TEMPORAL.
En el anlisis de series de tiempo de datos, una tentacin inmediata
consiste en intentar explicar o contabilizar el comportamiento de las series.
La descomposicin clsica es un mtodo que se basa en la suposicin de
que se pueden descomponer en componentes como tendencia, ciclo,
estacionalidad e irregularidad, Una prediccin se hace mediante la
combinacin de las proyecciones de cada componente individual14.

14
Series de Tiempo. Disponible en World Wide
Web:<http://www.estadistica.mat.uson.mx/Material/seriesdetiempo.pdf>.[Citado 8 de mayo 2009; 12:40 a.m.].

12

2.2.6. PROCESO ESTOCSTICO.


En Estadstica, y en concreto Teora de la Probabilidad, un proceso
aleatorio o proceso estocstico es un concepto matemtico que sirve para
caracterizar; es una sucesin de variables aleatorias que evolucionan en
funcin de otra variable, generalmente, el tiempo. Cada una de las
variables aleatorias del proceso tiene su propia funcin de distribucin de
probabilidad y, entre ellas, pueden estar correlacionadas o no.
PROCESO ESTOCSTICO ESTACIONARIO.
En matemtica, un proceso estacionario es un proceso estocstico cuya
distribucin de probabilidad en un instante de tiempo fijo o una posicin
fija es la misma para todos los instantes de tiempo o posiciones. En
consecuencia, parmetros tales como la media y la varianza, si existen, no
varan a lo largo del tiempo o la posicin.
2.2.7 RUIDO BLANCO.
El Ruido Blanco es una seal aleatoria (proceso estocstico) que se
caracteriza porque sus valores de seal en dos instantes de tiempo
diferentes no guardan correlacin estadstica. Como consecuencia de ello,
su densidad espectral de potencia (PSD, Power Spectral Density) es una
constante, su grfica es plana.1 Esto significa que la seal contiene todas
las frecuencias y todas ellas tienen la misma potencia. Igual fenmeno
ocurre con la luz blanca, lo que motiva la denominacin15.
15

RUIDO BLANCO. Disponible en World Wide Web:<http://es.wikipedia.org/wiki/Ruido_blanco>. [citado 8 de mayo

2009]

13

2.2.8 ESTACIONALIDAD.
Estacionalidad es una variacin repetitiva a lo largo de un intervalo de
tiempo se dice que una serie de tiempo es estacional cuando los datos
tienen oscilaciones estrictamente peridicas, donde el periodo es igual o
inferior al ao, por ejemplo la repeticin del patrn puede ser cada 3
meses, 6 meses, cada ao (12 meses), cada 4 aos, etc16.
2.2.9 COEFICIENTE DE CORRELACION.
El Coeficiente de Correlacin mide el grado de independencia de una
variable relacionada con otra variable. Es una cantidad que esta entre -1 y
+1, presenta el grado de correlacin entre dichas variables; mientras este
valor se aproxima a los lmites, diremos que la correlacin es buena, se
expresa:

Donde:

: es el coeficiente de correlacin.
2

: es la correlacin.

El error siempre existir, en Estadstica es posible lograr un

cercano a

los lmites, como lograr una menor varianza17.

MERMA JARA, MARCO A. Series de tiempo,


[Fecha de consulta: 12 de junio 2009]. Disponible en: <http://www.monografias.com/tarbajos30/series-de-tiempo/series-detiempo.html >.
17
GUJARATI, D. N. (2004). Econometra (3ra edicin). Mexico: Mc Graw-Hill, pp. 717-735.
16

14

2.2.10. FUNCIN DE AUTOCORRELACIN.


La

Autocorrelacin

es

una

herramienta

matemtica

utilizada

frecuentemente en el procesado de seales. La funcin de autocorrelacin


se define como la correlacin cruzada de la seal consigo misma. La
Funcin de Autocorrelacin

resulta de gran utilidad para encontrar

patrones repetitivos dentro de una seal, como por ejemplo, la periodicidad


de una seal enmascarada bajo el ruido o para identificar la frecuencia
fundamental de una seal que no contiene dicha componente, pero
aparecen numerosas frecuencias armnicas de esta. En Estadstica, la
autocorrelacin de una serie temporal discreta de un proceso

es

simplemente la correlacin de dicho proceso con una versin desplazada


en el tiempo de la propia serie temporal.

Si

representa un proceso estacionario de segundo orden con un valor

principal de se define entonces:

R k

E X

X i k

Donde R(k) es la funcin de autocorrelacin, E es el valor esperado y k el


desplazamiento temporal considerado (denominado desfase). Esta funcin
vara dentro del rango [1, 1], donde 1 indica una correlacin perfecta de
k) y 1 indica una anti correlacin perfecta. Es una prctica comn en
muchas disciplinas el abandonar la normalizacin por 2 y utilizar los
trminos Autocorrelacin y autocovarianza de manera intercambiable18.

18

GUJARATI, D. N. (2004). Econometra (3ra edicin). Mexico: Mc Graw-Hill, pp. 717-735.

15

2.2.11. FUNCIN DE AUTOCORRELACIN PARCIAL.


PACF: La Autocorrelacin parcial en el lapso determinado. El PACF
variar entre -1 y +1, con valores cercanos

1, que indica fuerte

correlacin. El PACF elimina el efecto de la Autocorrelacin retraso


menor de la estimacin de la correlacin a mayores rezagos. Este clculo
slo es vlido con un decimal.
2.2.12. MODELO
Un Modelo es una expresin formalizada de una teora, o la representacin
matemtica de los datos observados. En el anlisis estadstico un modelo
es expresado en smbolos, en forma matemtica. Es un esquema terico,
generalmente en forma matemtica, de un sistema o de una realidad
compleja, como la evolucin econmica de un pas, que se elabora para
facilitar su comprensin y el estudio de su comportamiento19.
2.2.13. MODELO DE SERIES TEMPORALES.
Son formas tericas determinanticas o la combinacin de ambas.
Variables temporales: son variables que se observan a lo largo del
tiempo.

Yt

Indica la variable Y en el momento t.

Serie temporal: es el conjunto de t observaciones, una observacin por


cada una de las variables

Y 1 , Y 2 , Y 3 ,........ Y t

. Tambin es llamada serie

cronolgica. 20.
ARELLANO MIREYA Introduccin al anlisis clsico de series de tiempo, [fecha de consulta: 18 de marzo 2009].
Disponible en: <http://www.ciberconta.unizar.es/LECCION/seriest/100.html 22 GUJARATI, D. N. (2004). Econometra (3ra
edicin). Mexico: Mc Graw-Hill, pp. 717-735.
19,20

16

2.2.14. MODELO UNIVARIANTE.


Los Modelos Univariantes en una serie de tiempo { Y t }, son todos aquellos
que solamente tienen una variable observada en el tiempo. Estos tipos de
modelos se expresan en forma polinomial.
Son tcnicas univariantes: el modelo autoregresivo de primer orden, el
modelo de tendencia lineal o exponencial, entre otros.
Las tcnicas ms rigurosas para la prediccin univariante son las
denominadas tcnicas o modelos Box-Jenkins, o ms concretamente
modelos ARIMA, pues las tcnicas Box-Jenkins constituyen un conjunto
ms amplio, dentro del cual los modelos ARIMA univariantes son solo una
parte.
Modelo Univariante No Integrado.
Los Procesos Autoregresivos AR(p), de Medias Mviles MA(q) y
procesos mixtos ARMA(p,q) son considerados como los modelos no
integrados debido a que no interviene el grado de diferenciacin y la
estacionalidad de la serie.
a) Modelo Univariante Integrado.
Son aquellos modelos que se pueden obtener mediante suma o integracin
de un proceso estacionario. A estos modelos se les denomina tambin
modelos no estacionarios homogneos21.

ARELLANO MIREYA Introduccin al anlisis clsico de series de tiempo, [fecha de consulta: 18 de marzo 2009].
Disponible en: <http://www.ciberconta.unizar.es/LECCION/seriest/100.html 22 GUJARATI, D. N. (2004). Econometra (3ra
edicin). Mexico: Mc Graw-Hill, pp. 717-735.
21

17

Los procesos mixtos integrados ARIMA(p,d,q), los procesos estacionarios


mixtos integrados SARIMA(p,d,q)*(P,D,Q), procesos de medias mviles
integrado IMA, proceso de medias mviles exponenciales EWMA, y los
procesos de autoregresin, son considerados como los modelos integrados
debido a que si interviene el grado de diferenciacin y la estacionalidad de
la serie.
2.2.15. ELABORACIN DE MODELOS AR, MA, ARMA Y ARIMA.
Los modelos ARIMA o modelos de promedio mvil autoregresivo
integrado son un tipo general de los modelos de Box-Jenkins para series de
tiempo estacionarias. Una serie histrica estacionaria es aquella cuyo valor
promedio no cambia a travs del tiempo. Este grupo incluye a los modelos
AR solo con trminos autoregresivo, los modelos MA solo con trminos
de promedio mvil y los modelos ARIMA que comprenden tanto trminos
autoregresivos como de promedio mvil. La metodologa de Box-Jenkins
permite al analista seleccionar el modelo que mejor se ajuste a sus datos.
Dado el concepto de proceso estacionario anteriormente definido, los
modelos de pronstico se dividen en22:
MODELOS LINEALES ESTACIONARIOS.
A) MODELOS AUTOREGRESIVOS (AR)
Se realizan tantas regresiones mltiples escalonadas como sea posible en
las series combinadas con demora que hagan falta, hasta que las series
adicionales con demora carezcan de poder explicatorio23.
22, 23

HANKE John E. (1996). Pronsticos en los negocios. (5ta Edicin). Mexico: Editorial Prentice Hall Hispanoamericana
S.A.

18

La ecuacin en prueba es

a1 X

... a p X

t 1

t p

et

Donde e es el residuo o trmino de error, al que se supone una media igual


a cero. El nmero de perodos de demora p que requiere se determinar
cuando se llegue a la estabilidad de los coeficientes. Si resulta que p es 12
para datos mensuales, el modelo autoregresivo establece un modelo de
ndices estacionales que son los coeficientes estimados. Como se
mencion previamente, puede eliminarse el propio patrn estacional para
investigar si hay otro modelo que abarca varios aos, o si el modelo se
extiende a un plazo ms largo. Naturalmente, el modelo autoregresivo
puede tambin revelar variaciones cclicas menores de doce meses. El
analista debe prestar atencin a estos ciclos ms cortos, eliminarlos de los
datos, o no tenerlos en cuenta.
La notacin AR(p) se refiere a un Modelo Autoregresivo de orden p. Un
modelo AR(p) puede escribirse como

ti

et

i 1

Donde

1 ,...

son los parmetros del modelo, c es una constante y t es un

trmino de error. El trmino constante es omitido por muchos autores para


simplificar. Un Modelo Autoregresivo es esencialmente un filtro de
respuesta infinita al impulso IIR, con determinada interpretacin adicional.
Se debe tener en cuenta que es necesario imponer ciertas restricciones a los
valores de los parmetros de este modelo para que funcione correctamente

19

estacionario. Por ejemplo, en un modelo AR(1), si |1| > 1 el modelo no


tendr un buen comportamiento.

Un proceso AR(1)
Un AR(1) Proceso est dado por

c X

Donde

et

t 1

et

es un proceso de ruido blanco con media cero y varianza 2.

El proceso es de covarianza estacionaria es | | < 1. Si = 1 entonces Xt


tiene una raz unitaria.

B) MODELOS DE MEDIAS MOVILES (MA).


Este modelo de Box-Jenkins propone que una serie de tiempo tiene su
explicacin en una combinacin de eventos aleatorios que se remontan a
perodos del pasado.

Ningn fenmeno terrestre est libre de eventos aleatorios. Por ejemplo, la


venta de productos est afectada por la introduccin de otros nuevos y
diferentes, o el mercado de acciones sufre un continuo bombardeo de
nueva informacin aleatoria. Cuanto ms tiempo haya pasado desde el
suceso, menos influencia tendr en las observaciones actuales. Como
antes, q se escoge de manera que los coeficientes sean estables y que no se
consiga mayor poder explicatorio despus de rebasar este valor24.

24

HANKE John E. (1996). Pronsticos en los negocios. (5ta Edicin). Mexico: Editorial Prentice Hall Hispanoamericana S.A.

20

La notacin MA(q) se refiere a un modelo de media mvil de orden q.


q

ti

i 1

Donde 1,...,q son los parmetros del modelo y

t , t 1 ,...

son, de nuevo, los

trminos de error. Un modelo de medias mviles esencialmente un filtro


de respuesta finita al impulso FIR, con cierta interpretacin adicional.
Modelo Autoregresivo De Media Mvil.
La notacin ARMA (p, q) se refiere a un modelo con p trminos
autoregresivo y q trminos de media mvil. Este modelo combina los
modelos AR y MA25.

i 1

i X

ti

ti

i 1

Nota sobre los trminos de error


Los trminos de error t se asume normalmente que son variables
aleatorias independientes idnticamente distribuidas tomadas de una
muestra con distribucin normal de media cero: t ~ N(0,2) donde 2 es la
varianza. Estas suposiciones pueden ser frgiles y si no se cumplen pueden
cambiar las propiedades del modelo. De hecho, un cambio en la suposicin
de independencia y distribucin idntica podra dar lugar a una diferencia
substancial.

25

HANKE John E. (1996). Pronsticos en los negocios. (5ta Edicin). Mexico: Editorial Prentice Hall Hispanoamericana S.A

21

Especificacin en trminos del operador retardo (lag operator)


En algunos textos los modelos son especificados en trminos del operador
retardo L. En estos trminos, el modelo AR(p) viene dado por

Donde

i
L X

t 1

i 1

representa el polinomio.

iL .
i

i 1

Un modelo MA(q) viene dado por

i 1

i
L t

Donde representa el polinomio

L .

i 1

Por ltimo, el modelo combinatorio ARMA viene dado por

i 1

i L X
i

i 1

O de forma ms concisa,

i
L t

t .

22

Modelos de ajuste (Fitting models).


Los modelos ARMA en general pueden, tras seleccionar p y q, ser
ajustados mediante regresin de mnimos cuadrados para encontrar los
valores de los parmetros que minimizan el trmino de error. Se considera
generalmente una buena prctica, encontrar los valores menores de p y q
que proporcionan un ajuste aceptable a los datos. Para un modelo puro AR
se deben utilizar las ecuaciones Yule-Walker para proporcionar un ajuste.

Generalizaciones La dependencia de Xt en valores pasados y en los


trminos de error t se asume que es lineal, salvo que se especifique lo
contrario. Si la dependencia no es lineal, el modelo es especficamente
llamado modelo de media mvil no lineal (NMA), autoregresivo no lineal
(NAR), autoregresivo de media mvil no lineal (NARMA).

Los Modelos Autorregresivos de media mvil pueden generalizarse con


otros mtodos. Vase tambin los modelos ARCH (modelos de
heterocedasticidad

condicional

autorregresivos)

los

Modelos

autorregresivos integrados de medias mviles ARIMA (modelos


autorregresivos integrados de medias mviles). Si tenemos que ajustar
mltiples series temporales, entonces se pude ajustar un modelo vectorial
ARIMA (VARIMA). Si las series temporales en cuestin muestran una
memoria lejana, entonces es apropiado un modelo ARIMA fraccional
(FARIMA, a veces chamado ARFIMA). De pensar que los datos presentan
estacionalidad, entonces debe usar un modelo SARIMA26.

26

GUJARATI, D. N. (2004). Econometra (3ra edicin). Mexico: Mc Graw-Hill, p 725

23

MODELOS LINEALES NO ESTACIONARIOS.


Modelos De Promedio Mvil Autoregresivo Integrado: ARIMA (p,d,q).
Es un modelo que permite describir un valor como una funcin lineal de
datos anteriores y errores debidos al azar. Se analiza sobre una serie
estacionaria. Los modelos de promedio mvil autoregresivo integrado
(ARIMA: Autoregresive integrated moving-average) son una clase
especializada de tcnicas de filtracin que ignoran por completo a las
variables independientes en la formulacin de pronsticos. Estos modelos
son dispositivos altamente refinados de ajuste de curvas que utilizan
valores reales y anteriores de la variable dependiente, para producir
pronsticos precisos de corto plazo.
En 1970, Box y Jenkins desarrollaron un cuerpo metodolgico destinado a
identificar, estimar y diagnosticar modelos dinmicos de series temporales
en los que la variable de tiempo juega un papel fundamental. Podemos
decir que la consideracin exclusiva de los valores pasados de una
determinada variable para explicar su evolucin presente y futura supone,
al mismo tiempo una ventaja y un inconveniente:
La ventaja radica en el hecho de no necesitar distintas series de datos
(distintas variables) referida al mismo periodo de tiempo (caracterstica
comn a todos los modelos univariantes) y, al mismo tiempo, ahorramos la
Identificacin y especificacin del modelo en el sentido de la estadstica
tradicional27.

27

MODELOS LINEALES NO ESTACIONARIOS. Disponible en World Wide Web:


<http://www.uam.es/docencia/predysim/prediccion_unidad3/3_2_ficha.htm>. [citado 30 de julio 2009

24

El inconveniente es que, al renunciar a la inclusin de un conjunto mas


amplio de variables explicativas, no atendemos a las relaciones que sin
duda existen entre casi todas las variables econmicas perdiendo
capacidad de anlisis de tiempo que renunciamos, implcitamente, al
estudio terico previo del fenmeno y a su indudable utilidad.
TRANSFORMACIONES BOX COX.
La familia de transformaciones de Box-Cox arregla problemas de
normalidad y heterocedasticidad (no homogeneidad de varianzas).
Suponga que tenemos los datos
Y

( Y 1 , Y 2 , Y 3 ,... Y n )

para una variable respuesta

. Si el cociente entre el valor ms grande observado de

y la ms

pequea es considerablemente grande, por decir, 10 o ms, se debe


considerar la posibilidad de transformar la variable respuesta

. Existen

muchos tipos de transformaciones:

Mtodo 1.

Una idea til en muchas aplicaciones es considerar transformar los datos


de la respuesta
de

en la potencia

, pero si el mejor valor de

, por decir, y encontrar el mejor valor


fuera

, entonces

, lo cual

producira que al transformar los datos, todos seran iguales, lo cual no es


deseable. Por esto este mtodo no es recomendado28

28

TRANSFORMACIONES BOX COX. Disponible en World Wide Web:


<http://www.cimat.mx/~posada/ModEst/BoxCox/BoxCox.ppt>. [citado 28 de junio 2009].

25

Mtodo 2.
Otro mtodo consiste en transformar la variable

en la variable

Y
,...... si ... 0

W
ln Y ,......... si ... 0

As el problema

en el mtodo 1, ya no se tiene, porque

ln Y

es el

apropiado limite, cuando tiende a cero, y as la familia es continua en .

MODELOS ARIMA ESTACIONALES.


Los modelos ARIMA adquieren su mayor protagonismo en la prediccin a
corto plazo de series de frecuencia inferior a la anual (trimestral, mensual o
incluso diaria). Por ello el tratamiento de la estacionalidad tiene un papel
central en la metodologa.
En series con estacionalidad no slo hay que modelizar la
componente regular (o no estacional) sino tambin la componente
estacional.
En esos casos, lo normal es manejar un modelo producto de dos:
ARIMA(p,d,q)*SARIMA(P,D,Q) Donde la primera parte corresponde
a la parte regular, y la segunda a la estacional29.

29

CHATFIELD, C. (1978). The analysis of time series: theory and practice, Londres: chapman and hall

26

Un procesos SARIMA(p,d,q)(P,D,Q) se define asi.


p ( L )

( L )( 1 L ) (1 L ) Y t q ( L )

Donde:

p ( L ) 1 1 L 2 L ... p L

q ( L ) 1 1 L 2 L ... q L
2

(L ) 1 1L 2 L

(L ) 1 1L

2L

( L )
S

2S

... P L

PS

2S

...

pS

2.2.16. METODOLOGA DE BOX-JENKINS.


Anlisis de series de tiempo segn Box-Jenkins

Se investigan generalmente tres patrones: autoregresin, promedios


mviles y tendencias. Tambin pueden existir observaciones errticas
ocasionales, o "disturbios" que deben ser eliminados o corregidos. El
procedimiento requiere una secuencia de tres pasos:

Identificacin, en el que se ensayan los diferentes modelos citados.

Estimacin, en el que se registran en una secuencia temporal los

valores estimados de los coeficientes.

Diagnstico, en el que se verifica la conveniencia del ajuste para ver si

es el adecuado. Si es insuficiente, el procedimiento se vuelve a


comenzar30.

30

HANKE John E. (1996). Pronsticos en los negocios. (5ta Edicin). Mexico: Editorial Prentice Hall Hispanoamericana S.A.
PINDICK S. Roberto. (1980). Modelos Econometricos. Espaa: Editorial Labor Universitaria

27

a)

Modelo Autoregresivo

Se realizan tantas regresiones mltiples escalonadas como sea posible en


las series combinadas con demora que hagan falta, hasta que las series
adicionales con demora carezcan de poder explicatorio. La ecuacin en
prueba es

Y t a 1 Y t 1 ... a p Y t p e t

Donde et es el residuo o trmino de error, al que se supone una media igual


a cero.
El nmero de perodos de demora p que Y requiere se determinar cuando
se llegue a la estabilidad de los coeficientes. Es decir, si se realizan las
regresiones con Y retardado ms all de p, los coeficientes permanecen
constantes, lo que prueba que ningn Y adicional con retardo tiene poder
explicatorio adicional ms all de p.

Si resulta que p es 12 para datos mensuales, el modelo autoregresivo


establece un modelo de ndices estacionales que son los coeficientes
estimados. Como se mencion previamente, puede eliminarse el propio
patrn estacional para investigar si hay otro modelo que abarca varios
aos, o si el modelo se extiende a un plazo ms largo. Naturalmente, el
modelo autoregresivo puede tambin revelar variaciones cclicas menores
de doce meses. El analista debe prestar atencin a estos ciclos ms cortos,
eliminarlos de los datos, o no tenerlos en cuenta.

28

b) Modelo de promedios mviles

Este modelo de Box-Jenkins propone que una serie de tiempo tiene su


explicacin en una combinacin de eventos aleatorios que se remontan a q
perodos del pasado.

Y t b 1 e t 1 ... b p e t q e t

Donde et es, como se dijo antes, una variable aleatoria serialmente


independiente, de media igual a cero.

Ningn fenmeno terrestre est libre de eventos aleatorios. Por ejemplo, la


venta de productos est afectada por la introduccin de otros nuevos y
diferentes, o el mercado de acciones sufre un continuo bombardeo de
nueva informacin aleatoria. Cuanto ms tiempo haya pasado desde el
suceso, menos influencia tendr en las observaciones actuales. Como
antes, q se escoge de manera que los coeficientes sean estables y que no se
consiga mayor poder explicatorio despus de rebasar este valor.

2.2.17. DICKEY-FULLER AMPLIADO(TEST ADF).


Pruebas Formales: La prueba de Dickey-Fuller
Dickey y Fuller (1979, 1981) disearon un procedimiento para probar
formalmente la presencia de Races Unitarias. La prueba comienza por
suponer que la serie t sigue un proceso autoregresivo de primer orden
AR(1), de la forma31
31

DICKEY-FULLER AMPLIADO(TEST ADF). Disponible en World Wide Web:


<http://www.uam.es/docencia/predysim/prediccion_unidad3/3_4_doc.pdf>.
[citado 17 de junio 2009].

29

- Definicin bsica del contraste:

: Y t a 1Y t 1

: Y t Y t 1

La distribucin de probabilidad asinttica del parmetro estimado


" a 1 " presenta

una discontinuidad cuando

en varianza de

yt

a1 1

dada la no estacionariedad

Debemos usar las tablas de Dickey (1976) y Fuller (1976)


Mackinnon (1991).
Generador de datos elegido:
y t y t 1 a 0 a 1 y t 1 y t 1 t
y t a 0 ( a 1 1) y t 1 t
y t a 0 . y t 1 t

: 0 frente . a . H

: 0

Los valores de referencia para el contraste del parmetro dependen del


proceso Generador de datos elegido:

Modelo

1 ( simple ) ( ) : y t . y t 1 t

Modelo

2 ( con const )(

Modelo

3 ( con const

) : y t a 0 . y t 1 t

y tend . )( ) : y t a 0 . y t 1 a 2 t t

Puede adems contrastarse alguna hiptesis conjunta de parmetros

1, 2 ,3

SCR

mr

SCR

SCR
mnr

mnr

/n k

/ r

30

Por ltimo cabe la posibilidad de contrastar la nulidad de los


parmetros.

Debe pensarse siempre en la posibilidad de la existencia de ms de


una raz unitaria.
2.3. DEFINICIN DE TRMINOS BSICOS.
IRA (Infecciones Respiratorias Agudas).- Se conoce como
infecciones respiratorias agudas (IRAs) a un conjunto de enfermedades
transmisibles del aparato respiratorio que incluye desde el catarro comn
hasta la neumona grave, pasando por la otitis, amigdalitis, sinusitis o
bronquitis aguda, entre otras. Entre los grmenes responsables se
encuentran bacterias (sobre todo el neumococo y el Haemophilus) y virus.
Sin embargo, con frecuencia es imposible distinguir cul es el
microorganismo causal basndose solamente en datos clnicos o
radiolgicos32.

32

G. KENDALL Maurice y BUCKLAND William. (1984). Diccionario de Estadstica. Traducido por Eduardo Morales.
(3ra Edicin). Ediciones pirmide.

31

INFECCIN.- Una infeccin refiere a la colonizacin que especies


exteriores realizan en un organismo que en trminos mdicos se denomina
hospedador, siendo estas absolutamente perjudiciales para el desarrollo y
la supervivencia del mencionado organismo.
NEUMONA.- La neumona, pulmona o neumonitis es una
enfermedad infecciosa e inflamatoria que consiste en la infeccin de los
espacios alveolares de los pulmones. La neumona puede afectar a un
lbulo pulmonar completo (neumona lobular), a un segmento de lbulo, a
los alvolos prximos a los bronquios (bronconeumona) o al tejido
intersticial (neumona intersticial). La neumona hace que el tejido que
forma los pulmones, se vea enrojecido, hinchado y se torne doloroso.
Muchos pacientes con neumona son tratados por los mdicos de cabecera
y no se ingresan en los hospitales; esto es lo que se denomina Neumona
adquirida en la comunidad (NAC) o Extrahospitalaria. La Neumona
nosocomial (NN) es la que se adquiere durante la estancia hospitalaria
despus de las 48 horas del ingreso del paciente por otra causa.
SERIES DE TIEMPO.- Una serie temporal o cronolgica es una
secuencia de datos, observaciones o valores, medidos en determinados
momentos del tiempo, ordenados cronolgicamente y, normalmente,
espaciados entre s de manera uniforme. El anlisis de series temporales
comprende mtodos que ayudan a interpretar este tipo de datos,
extrayendo informacin representativa, tanto referente a los orgenes o
relaciones subyacentes como a la posibilidad de extrapolar y predecir su
comportamiento futuro.

32

De hecho uno de los usos ms habituales de las series de datos temporales


es su anlisis para prediccin y pronstico.

Por ejemplo de los datos climticos, de las acciones de bolsa, o las series
pluviomtricas. Resulta difcil imaginar una rama de las ciencias en la que
no aparezcan datos que puedan ser considerados como series temporales.
Son estudiadas en estadstica, procesamiento de seales, econometra y
muchas otras reas.
RUIDO BLANCO.- El ruido blanco es una seal aleatoria (proceso
estocstico) que se caracteriza porque sus valores de seal en dos instantes
de tiempo diferentes no guardan correlacin estadstica. Como
consecuencia de ello, su densidad espectral de potencia (PSD, Power
Spectral Density) es una constante, i.e, su grfica es plana. Esto significa
que la seal contiene todas las frecuencias y todas ellas tienen la misma
potencia. Igual fenmeno ocurre con la luz blanca, lo que motiva la
denominacin.
CORRELOGRAMA.- Un Correlograma es el grfico de las
autocorrelaciones. Si se utiliza la correlacin cruzada, se llama un cruzcorrelograma.

33

2.4. OPERACIONALIZACIN DE VARIABLES

Variables

Indicadores

ndice

Aos/Meses

N de casos

Aos/Meses

N de casos

Variable dependiente
Nmero de casos de infeccin respiratoria aguda en
menores de 5 aos, mensual para cada uno de los
aos en el periodo 2003-2009

Variable Independiente
Nmero de casos de infeccin respiratoria aguda en
menores de 5 aos, mensual para cada uno de los
aos en el periodo 2003-2009, rezagada en
distintos periodos de tiempo.

34

III MATERIALES Y MTODOS.


3.1. MATERIAL.
El presente trabajo de investigacin toma como material de anlisis de la
serie de nmero de casos de nios menores de 5 aos con infeccin
respiratoria aguda en la provincia de Puno, en el periodo 2003-2009.
3.2. POBLACIN Y MUESTRA.
3.2.1 Poblacin.
La poblacin est conformada por todos los casos de Infecciones
Respiratorias Agudas en nios menores de 5 aos desde el inicio de
funcionamiento en el hospital Manuel Nez Butrn-Puno.
3.2.2. Muestra.
La muestra est conformada por los casos de Infecciones Respiratorias
Agudas en nios menores de 5 aos en el periodo 2003-2009, de la oficina
de Estadstica e Informtica en redes del Hospital Manuel Nez Butrn
Puno.
3.3. MTODOS DE RECOPILACION DE DATOS
Los datos para el presente trabajo de investigacin fueron obtenidos de la
Oficina de Estadstica e Informtica en Redes del Hospital Manuel Nez
Butrn Puno, los cuales corresponden al periodo (en meses) enero 2003diciembre 2009.

35

3.4. MTODOS DE TRATAMIENTO DE DATOS.


El nmero de casos de Infecciones Respiratorias Agudas se tomaron
anualmente a partir del ao 2003 hasta el 2009 tomados de la base de datos
de la Oficina de Estadstica e Informtica del Hospital Regional Manuel
Nez Butrn de la provincia de Puno.
3.5. METODOLOGA DE LA INVESTIGACIN.
3.5.1. Tipo de investigacin
El presente trabajo de investigacin es descriptivo aplicativo.
3.5.2. Metodologa de anlisis
Para el presente trabajo de investigacin se har uso de la metodologa de
Box-Jenkins, con los denominados modelos ARIMA, los pasos a seguir en
esta metodologa para obtener modelos univariantes son:
1) Representacin grafica de la serie.
2) Calculo de la funcin de Autocorrelacin (F.A.C.) y la funcin de
Autocorrelacin parcial (F.A.C.P.)
3) Proceso de identificacin.
4) Estimacin de parmetros.
5) Proceso de verificacin.
6) Proceso de prediccin.

36

MTODO DE BOX-JENKINS (teora de WIENER-KOLMOGOROV).


La metodologa Box-Jenkins sigue un proceso que consta de cuatro fases,
las cuales son:
1. Identificacin.- Se trata de elegir uno o varios modelos ARIMA
como posibles candidatos para explicar el comportamiento de la serie.
2. Estimacin.- Se realiza la estimacin de los parmetros de los
modelos seleccionados.
3. Verificacin o validacin.- se comprueba la adecuacin del modelo
estimado y se verifica que cumplan las propiedades respectivas.
4. Pronstico o prediccin.- si el modelo elegido es satisfactorio se
realizan las predicciones de la variable.
La metodologa de elaboracin de modelos ARIMA, se muestra a
continuacin.

37

METODOLOGA DEL ENFOQUE BOX-JENKINS.

Datos de la Serie

IDENTIFICACION
Calculo de
pronstico de la
serie

Transformacin
de la serie

NO
Es la serie
estacionaria

Seleccin de d y

SI

Seleccin de P,
decisin sobre la
inclusin de

ESTIMACION
-Calculo de
estimadores
-Calculo de
estimadores y de los
residuos

VALIDACION
NO
Es el mejor
modelo
adecuado?
SI

PREDICCION
Seleccin de los
periodos de
prediccin

-Calculo de predicciones
-Calculo de estadsticos
para evaluacin de la
capacidad

NO
Predice
correctamente

TAREAS REALIZADAS
POR EL ANALISTA

TAREAS REALIZADAS
POR EL ORDENADOR

Figura N 03. Metodologia Del Enfoque Box Jenkis


FIG. ELABORACION PROPIA

38

FASES DEL MTODO BOX-JENKINS


FASE 1: Identificacin del modelo.
1 El primer paso en la identificacin del modelo consiste en determinar si
la serie es estacionaria en funcin de la serie original. Si la serie no es
estacionaria, se convierte a una serie estacionaria. Se estabiliza la serie
mediante la transformacin Box Cox, se especifica el grado de
diferenciacin segn al nmero de veces que la serie sea diferenciada para
obtener una serie estacionaria en media y varianza. El orden de integracin
define el parmetro d del modelo ARIMA. En la prctica es suficiente
tomar una diferencia (d=1), o dos diferencias (d=2) para obtener una serie
estacionaria en media. A partir de la tercera diferencia la varianza se
deforma, es decir la varianza crece. Un aspecto importante en la
modelacin ARIMA de una serie de tiempo simple es el nmero de veces
que necesita de una diferencia antes de fijar el modelo. Para esto se utiliza
la prueba de Dickey Fuller o de races unitarias en la cual la hiptesis a
verificar es:

: Hay raz unitaria (proceso no estacionario).

H1:

No hay raz unitaria (proceso estacionario).

El estadstico de prueba es:

a0


Tu a / s ( a 0 )

: Estimacin mnimo cuadrado de

ser:

Donde:

. La regla de decisin a considerar

39

Rechazar
estadstico

si

Tu Tt

T u Sigue

y por tanto el proceso es estacionario. El

una distribucin T de Students que se tabulo por

Dickey y Fuller.
2 una vez obtenida una serie estacionaria con algn valor para la
diferencia d, se deber de identificar la forma del modelo a utilizar
encontrando los valores apropiados de p y q, mediante la comparacin de
los coeficientes de Autocorrelacin parcial de los datos. Si el modelo no
es satisfactorio, se puede intentar un modelo alternativo.
FASE 2: Estimacin de parmetros
Una vez seleccionado el modelo tentativo, habiendo identificado los
valores apropiados de p, d y q se procede a estimar los valores de
parmetros de los trminos autoregresivos y de media mvil incluidos en
el modelo, a travs del uso de los mnimos cuadrados no lineales que
minimizan la suma de los cuadrados de los residuos.
FASE 3: Validacin o Verificacin.
La finalidad de esta fase consiste en analizar la adecuacin entre el modelo
y los datos, o dicho de otra forma en que medida se cumple lo siguiente:
a) Los residuos del modelo estimado se aproximan al comportamiento de
un ruido blanco.
b) El modelo estimado es estacionario e invertible.
c) Los coeficientes son estadsticamente significativos.

40

d) El grado de ajuste es elevado en comparacin al de otros modelos


alternativos. Una de las formas para detectar violaciones a los supuestos es
a travs del anlisis de los residuales, que presentan la parte de las
observaciones que no es explicada por el modelo (uso del estadstico de
Box Pierce).
Conviene sealar que es esencial que se cumpla el requisito a). Pues en
caso contrario el modelo debe ser rechazado.
FASE 4: Prediccin.
Una vez identificado el modelo adecuado que genera la serie temporal de
inters, estimados los parmetros del modelo correspondiente y despus de
haber pasado la etapa de verificacin se utiliza el modelo estimado en la
prediccin de valores futuros de la variable objeto de estudio.
PROCESO DE PREDICCIN.
Dada una serie estacionaria que sigue cualquier proceso de la forma:
z t 1 z t 1 ... p z t p E t 1 E t 1 ..... q E t q

Si se tiene la informacin hasta el momento t y para predecir m periodos


hacia delante, se construye la funcin.
z t m 1 z t m 1 ... p z t m p E t m 1 E t m 1 ..... q E t m q

Cuya funcin eficiente de prediccin sea

ztm / t

cumplen con los siguientes

supuestos.
Los parmetros p y q son conocidos.
Los errores pasados y presentes son conocidos.

41

E t , E t 1 ,......... , E 1

E1

Predictor optimo se constituye de una funcin lineal

de todos los valores conocidos de

Et

*
*
*
~z
m E t m 1 E t 1 m 2 E t 2 .........
tm / t

Donde

m
*

son

los

coeficientes a estimar, tal que el predictor optimo tenga un error cuadrtico


medio mnimo.

42

IV.

RESULTADOS Y DISCUSIN.

RESULTADOS DE RECOPILACIN DE INFORMACIN.


Para el anlisis de datos, se ha utilizado informacin de los casos de
Infecciones Respiratorias Agudas del periodo 2003-2009, los cuales fueron
obtenidos de la Oficina de Estadstica e Informtica de Red del Hospital
Manuel Nez Butrn Puno. Se muestra los datos originales de los casos
de infeccin respiratoria aguda en menores de 5 aos referido en nmeros,
del periodo 2003-2009.
CUADRO N 01: Casos de Infeccin Respiratorias Agudas en menores de 5
aos segn meses del periodo 2003-2009.
MES
ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO
JULIO
AGOSTO
SETIEMBRE
OCTUBRE
NOVIEMBRE
DICIEMBRE
TOTAL

2003
1263
951
1040
1139
1481
1707
2986
3519
3132
2207
1713
1502
22640

2004
1288
657
1150
935
1473
2893
2174
2448
2327
1761
1607
1404
20117

2005
1253
1041
1040
1453
1931
2851
2826
2406
2015
2051
2069
1769
22705

2006
1286
1000
1044
1294
2450
3477
2499
2028
1912
2108
1846
1845
22789

2007
1496
1023
1557
1645
2412
3181
2434
2308
2380
2541
1795
1710
24482

2008
1397
1475
1245
1587
1818
2559
2289
2075
2196
1829
2067
1460
21997

2009
1256
1053
1331
1311
1897
3046
2779
1973
2387
278
1755
1541
20607

2010
531
555
543
1193
1947
2484
2443

9696

Fuente: Datos obtenidos de la Oficina De Estadstica E Informtica de la redes


del Hospital Manuel Nez Butrn Puno.

43

4.1 FASE DE IDENTIFICACIN


REPRESENTACIN GRAFICA (Serie Original).
En el grafico N 1, se presenta la serie original de los casos de infeccin
respiratorias agudas en menores de 5 aos en la provincia de Puno.
Periodo 2003-2009.
Grafico N 01. Serie Original de los casos de Infeccin
Respiratorias Agudas en menores de 5 aos (N) periodo 20032009.
P L O T E O D E D A T O S O R IG IN A L E S
4000

C3

3000

2000

1000

0
1

18

27

36

45

54

63

72

81

90

Se puede observar que los valores individuales no se desplazan alrededor


de la media del proceso (u=1813,54945), adems la desviacin estndar es
s=687,850, lo cual indica que no es estacionaria, y es un indicio para
realizar la transformacin de la serie.

44

En el Grfico N 2, se muestra la funcin de autocorrelacin de la serie con


un lento decrecimiento aritmtico en los coeficientes de autocorrelacin

rk

pero no con un decrecimiento geomtrico que sera lo adecuado, con lo


cual tambin se observa que la serie requiere de una transformacin para
convertirla en una serie estacionaria.
Grafico N 02: Funcin de Autocorrelacin para la serie original
de los casos de Infeccin Respiratorias agudas en menores de 5
aos de la provincia de Puno.
A U T O C O R R E L A C IO N P A R A D A T O S O R IG IN A L E S
1 ,0
0 ,8

A u t o c o r r e la t io n

0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
1

10

20

30

40

50

60

70

80

90

La g

Analizando el grafico se observa tambin que varias de las


autocorrelaciones difieren de cero en forma significativa (los retardos
1,2,4,5,6,7,11,12) es decir 8 de los 91 coeficientes de Autocorrelacin son
estadsticamente significativos al nivel de confianza del 95%.
En el Grafico N 03, se muestra la funcin de autocorrelacin parcial para
la serie de los casos de Infeccin Respiratorias Agudas en menores de 5
aos en la provincia de Puno.

45

Grafico N 03: funcin de Autocorrelacin Parcial para la serie


Original de casos de Infeccin respiratorias Agudas en menores
de 5 aos en la Provincia de Puno.
A U T O C O R R E L A C IO N P A R C IA L P A R A D A T O S O R IG IN A L E S
1 ,0

P a r t ia l A u t o c o r r e la t io n

0 ,8
0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
1

10

20

30

40

50

60

70

80

90

La g

En el Grafico N 03, se observa que la serie muestra un decrecimiento


rpido sin llegar a cero, lo que confirma la sospecha sobre la no
estacionariedad. Adems de que los 6 de los 91 coeficientes de
Autocorrelacin Parcial son estadsticamente significativos con un 95%
de nivel de confianza.
Habiendo analizado la serie original en el grafico N 01, se pudo observar
que los valores individuales no se desplazan alrededor de la media, lo cual
indico que la serie de los casos de Infeccin respiratorias agudas en
menores de 5 aos en la provincia de Puno no es estacionaria, puesto que
la media y la varianza no son constantes, existiendo adems estacionalidad
en los datos puesto que los datos tienen oscilaciones peridicas ao tras
ao.
Para que la serie sea estacionaria tanto en media como en varianza se
efectu la transformacin Box Cox (cuando

).

46

Grafico N 04. Serie Transformada (Transformacin Box-Cox)


de las infecciones respiratorias agudas en menores de 5 aos en el
periodo2003-2009.
DATO S TR AN S FO R M ADO S
8 ,5

8 ,0

C4

7 ,5

7 ,0

6 ,5

6 ,0

5 ,5
1

18

27

36

45

54

63

72

81

90

In d e x

En el grfico N 04, luego de la transformacin Box Cox se tiene que


7,41821209

y adems la desviacin estndar es s=0,44554416. Se

puede ver la estacionariedad en varianza pero no en media, para esto se


deber efectuar una primera diferencia.
En los grficos de funcin de autocorrelacin N 05 y 06, podemos
observar que las autocorrelaciones decrecen sin llegar a cero y vemos que
existe tendencia, por lo que ms adelante se proceder a realizar la primera
diferencia. La totalidad de los valores estimados se dan en el anexo,
tambin se muestran sus lmites de probabilidad a un 95% de confianza
alrededor de 0.

47

Grfico N 5. Funcin de autocorrelacin Estimada para la serie


transformada de la infeccin respiratoria aguda en menores de 5
aos.
fu n c io n d e a u to c o r r e la c io n e s tim a d a ( tr a n s f. B o x c o x )
1 ,0
0 ,8

A u t o c o r r e la t io n

0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
2

10

12

14

16

18

20

22

La g

Analizando el grfico N 5 se observa tambin que varias de las


autocorrelaciones difieren de cero en forma significativa al nivel de
confianza del 95%.
Grfico N 06. Funcin de Autocorrelacin Parcial Estimada para
la serie transformada de la infeccin respiratoria aguda.
F u n c io n d e A u to c o r r e la c io n P a r c ia l E s tim a d a ( T r a n s f B o x C o x )
1 ,0

P a r t ia l A u t o c o r r e la t io n

0 ,8
0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
2

10

12

14

16

18

20

22

La g

En el grfico N 06 se observa que 4 de los 22 coeficientes de


autocorrelacin parcial son estadsticamente significativos con un 95% de
nivel de confianza.

48

Para corregir la no estacionariedad en media, se realiz la primera


diferenciacin no estacional de la serie. En el grfico N 07 se observa la
nueva grfica y en el grfico N 08 su respectiva Funcin de
autocorrelacin Estimada.
Grfico N 07. Serie Transformada (Transformacin Box Cox) de
la Infeccin Respiratoria Agudas en menores de 5 aos para la
primera diferencia no estacional.
s e r ie tr a n s fo r m a d a p a r a la in fe c c io n r e s p ir a to r ia a g u d a s
P r im e r a D ife r e n c ia N o e s ta c io n a l
2

p r im e d if

-1

-2

18

27

36

45

54

63

72

81

90

In d e x

En el Grfico N 07, se pudo ver que los datos no presentan tendencia


descendente a travs del tiempo.
Grafico N 08. Funcin de Autocorrelacin Estimada de la serie
transformada de la IRA para la primera diferencia No Estacional.
f u n c io n d e a u to c o r e s t( tr a n s f .B o x C o x ) P r im D if N o E s ta
1 ,0
0 ,8

A u t o c o r r e la t io n

0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
1

10

20

30

40

50
La g

60

70

80

49

Se observa que existen autocorrelaciones muy altas en los retrasos 12, 24,
36, 48 y 60, con lo que se confirma que existe una tendencia entre periodos
estacionales sucesivos, separados por un periodo de desfase de 12 meses.
Si el coeficiente de autocorrelacin hubiera cado a cero en el retraso 24,
se habra concluido que los datos de primera diferencia no estacional eran
estacionarios.
Para eliminar la tendencia de los retrasos 12, 24, 36, 48 y 60 que se
observaron en el grafico de la Funcin de Autocorrelacin Estimada de la
primera diferencia no Estacional (Grafico N 08), se emplea la diferencia
de largo plazo (diferencias cuya longitud est separada por 12 periodos).
El grafico N 09 muestra la serie para los datos despus de la primera
diferencia no estacional (diferencia corta) y de la primera diferencia
estacional (diferencia de largo plazo).
Grafico N 09. Serie Transformada (transf Box Cox) de la
Infeccin Respiratoria Agudas para la primera diferencia no
estacional y la primera diferencia estacional.
s e r ie tr a n s fo r m a d a p a r a la in fe c c io n r e s p ir a to r ia a g u d a s
P r im e r a D ife r e n c ia N o e s ta c io n a l
2

C6

-1

-2
1

18

27

36

45
In d e x

54

63

72

81

90

50

En los grficos N 10 y 11 se muestra la Funcin de Autocorrelacin


Estimada y Parcial Estimada para los datos despus de la primera
diferencia corta y de la diferencia de largo plazo. La totalidad de sus
valores estimados se dan en el ANEXO.
Grafico N 10. Funcin de Autocorrelacin Estimada para la
primera diferencia no estacional y la primera diferencia estacional
de la serie transformada de la IRA en menores de 5 aos.
f u n c io n d e a u to c o r e s t( tr B o x C o x ) P r im D i f N o E s ta Y P r D iE
1 ,0
0 ,8

A u t o c o r r e la t io n

0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
1

10

15

20

25

30

35

40

45

50

55

60

65

70

75

La g

Grafico N 11. Funcin de Autocorrelacin Parcial Estimada para


la primera diferencia no estacional y la primera diferencia
estacional de la serie transformada de la IRA en menores de 5
aos.
f u n d e a u to c o r p a r c e s t p r im d if n o e s ta c y p r im d if e s t
1 ,0

P a r t ia l A u t o c o r r e la t io n

0 ,8
0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
1

10

15

20

25

30

35

40
La g

45

50

55

60

65

70

75

51

Segn los grficos 09, 10 y 11 se observa que la serie ya no presenta


tendencia y es estacionaria en media.
CONCLUSIN DE LOS MODELOS IDENTIFICADOS
En base a los grficos N 10 y 11 de las funciones de autocorrelaciones
estimadas, luego de realizar la transformacin Box Cox y diferenciarse la
serie, se identificaron diferentes modelos alternativos a los cuales se les
realiz pruebas siguiendo el proceso de la metodologa Box Jenkins,
seleccionando luego dos modelos buenos de los cuales se eligi solo uno
para la prediccin.
Los modelos identificados fueron:
Modelo 1: proceso multiplicativo SARIMA(12)
SARIMA(0,1,2)(0,1,1)
Modelo 2: proceso multiplicativo SARIMA(12)
SARIMA(1,1,0)(0,1,0)
El Modelo es SARIMA(1,1,0)(0,1,0)
Su ecuacin de pronostico aplicando el operador de retardos L es:
(1 1 L )( 1 L )( 1 L ) Y t (1 0 L )( 1 0 L ) E t
12

12

(1 0 , 3868 L )( 1 L )( 1 L ) Y t E t
12

Donde:
L: Es el operador de retardos.
y t LnZ

Es la variable transformada

52

Et

= Es el termino de residuo. Tambin se le conoce como ruido blanco.

Expresado en sus variables desfasadas es:


Yt (1 1 ) Y t 1 1 Y t 2 Y t 12 (1 1 ) Y t 13 1 Y t 14 E t

Yt (1 0 . 3868 ) Y t 1 0 . 3868 Y t 2 Y t 12 (1 0 . 3868 ) Y t 13 0 . 3868 Y t 14 E t

Donde:
Yt

: Variable Dependiente. Casos de infeccin respiratoria aguda

(Transformacin Box Cox)

Y t 1

, Y t 2 , Y t 12 , Y t 13 , Y t 14 : Variables Independientes que son variables

dependientes desfasadas un numero especficos de periodos. Casos de


Infeccin Respiratorias Agudas (Transformacin Box Cox) desfasados un
nmero especficos de periodos.
1

: Coeficiente de regresin estimada.

4.2 FASE DE ESTIMACIN


Una vez identificada la serie habiendo identificado los valores apropiados
de p,d,q,P,D,Q se procede a estimar los valores de los parmetros de los
trminos autoregresivos y de media mvil incluidos en los modelos.
A continuacin en un cuadro se muestran los respectivos valores
estadsticos, donde se comparan los dos modelos identificados
anteriormente segn criterios estadsticos que permitieron elegir el mejor
modelo.

53

CUADRO N 02: Comparacin de los diferentes procesos estimados

varianza de
ruido blanco

desv
estandar de
ruido blanco

Modelo 1

0,14543316

0,381357

0,956

Modelo 2

0,13578341

0,368488

0,977

Modelos

prob de
aceptacion
Box Pierce()

Los dos modelos son buenos puesto que no existe mucha diferencia
respecto a los valores de sus estadsticos. El modelo que mejor se ajusta
por tener menores valores en la varianza y desviacin estndar de los
errores de la regresin, y por tener mayor probabilidad de aceptacin de
ser ruido blanco a comparacin del otro modelo, es el modelo N 02.
El modelo es SARIMA(1,1,0)(0,1,0)
4.3 FASE DE VALIDACIN O VERIFICACIN
En esta fase se comprueba la adecuacin del modelo estimado. Es decir
verifica que los residuos siguen un proceso ruido blanco, en base al
cumplimiento de ciertas condiciones.
En base a los resultados del mejor modelo que se obtuvo en el paquete
estadstico MINITAB 14. Se verifica en el cuadro N 03.

54

CUADRO N 03: Resultados de la Estimacin del Mejor Modelo


Identificado. SARIMA (1,1,0)(0,1,0)
Modelo ARIMA: datos originales
Estimacin en cada iteracin.
Iteracion
0
1
2
3
4
5
6

SSE
24031808
21318455
19593315
18856386
18826661
18826554
18826553

Parametros
0,100
-0,050
-0,200
-0,350
-0,385
-0,387
-0,387

Cambio relativo en cada estimacin menor que 0,0010


Las estimaciones finales de parmetros
Tipo
AR
1

Coef
-0,3868

SE Coef
0,1052

T
-3,68

P
0,000

Diferenciacin: 1 regular, 1 estacional de orden 12


Numero de observaciones: Series originales 91, despus de diferencia 78
Residuales:
SS = 18813604 (backforecasts excluded)
MS = 244333 DF = 77
Box-Pierce Modificado (Ljung-Box) Chi-Square statistic
Retraso
Chi-Cuadrado
DF
Valor de P

12
24
36
48
18,9
30,1
39,3
46,9
11
23
35
47
0,063 0,145 0,282 0,977

ANLISIS DE LOS COEFICIENTES


En la fase 1, luego de realizar las transformaciones necesarias se alcanzo la
estacionariedad en media y varianza de la serie transformada. Segn las
propiedades definidas en los modelos ARMA, un proceso es estacionario
cuando

e invertible cuando

estimados para la parte autoregresiva ,

. Segn los parmetros

y de medias mviles

55

, que se mostraron en el cuadro N 03 se puede comprobar que si se


cumple esta condicin.
COMPROBACIN DE LA SIGNIFICANCIA DE LOS PARMETROS
En el cuadro N 03 se comprob que los parmetros son significativos
(distintos de cero) a partir del t estadstico asociado al nivel de confianza
del 95%, puesto que los parmetros obtenidos son mayores que el valor 2
del t estadstico.
Si

t 2

indica que el parmetro es significativamente distinto de cero.

Si

t 2

indica que el parmetro es cero y puede ser eliminado del

modelo.
CAPACIDAD EXPLICATIVA DEL MODELO.
La capacidad explicativa del modelo se mide por el error estndar o
desviacin estndar de la regresin

, el modelo elegido (modelo 2)

presenta menor error estndar ( e ,=0,368488) comparado con el modelo


N 1 ver cuadro N 02.
ANLISIS DE LOS RESIDUOS (RUIDO BLANCO)-Test de Box Pierce.
La interpretacin del estadstico Q de Box Pierce es ms favorable al ruido
blanco cuanto mayor sea el valor de la probabilidadp. Si se utiliza el
nivel de confianza habitual del 95%, entonces los residuos son ruido
blanco siempre que el p-valor sea superior a 0.05.

56

Contraste de Autocorrelacin: para determinar si los residuos eran ruido


blanco se realiz la siguiente comparacin.
Si Prob(Q)>0.05, los residuos son ruido blanco.
Si Prob(Q)<0.05, los residuos no son ruido blanco.
En nuestro caso los valores de las probabilidades del estadstico Q de box
Pierce aplicado a los 91 coeficientes de las funciones de autocorrelacin
estimadas de los residuos para el modelo 1: 0.956 y el modelo 2: 0,977.
Por consiguiente centrndonos en el mejor modelo elegido (modelo 2), se
acepta la hiptesis nula de residuos iguales a ruido blanco.
Anlisis de grficos de Autocorrelaciones de los residuos: en el grafico
N 12 y 13 se puede ver claramente que todas las autocorrelaciones de los
residuos se encuentran dentro de los intervalos, a excepcin del coeficiente
de autocorrelacin N 2. Adems 2, 4 del coeficientes de autocorrelacin
parcial que puede considerarse por efecto de azar, considerndose la serie
como aleatoria. Por consiguiente los residuos son ruido blanco.
Grafico N 12. Funcin de Autocorrelacin Residual
Estimada para la serie residuos del modelo estimado
fu n c io n d e A u to c o r r e la c io n r e s id u a l e s tim a d a
( w ith 5 % s ig n ific a n c e lim its fo r th e a u to c o r r e la tio n s )
1 ,0
0 ,8

A u t o c o r r e la t io n

0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
3

12
La g

15

18

57

Grfico N 13. Funcin de Autocorrelacin Parcial Residual


Estimada para la serie de residuos del modelos estimado
A u to c o r r e la c io n P a r c ia l R e s id u a l E s tim a d a
( w ith 5 % s ig n ific a n c e lim its fo r th e p a r tia l a u to c o r r e la tio n s )
1 ,0

P a r t ia l A u t o c o r r e la t io n

0 ,8
0 ,6
0 ,4
0 ,2
0 ,0
- 0 ,2
- 0 ,4
- 0 ,6
- 0 ,8
- 1 ,0
3

12

15

18

La g

Luego de comprobar que el modelo elegido SARIMA(1,1,0)(0,1,0)


(MODELO UNIECUACIONAL INTEGRADO) es el mejor modelo de
pronstico, podemos asumir que dicho modelo es adecuado para modelizar
los datos de los casos de infeccin respiratoria agudas en menores de 5
aos.
4.4 FASE DE PREDICCIN
A continuacin en el grfico N 14 se muestra el grfico de predicciones
con el modelo seleccionado SARIMA(1,1,0)(0,1,0).
El resultado de los valores pronosticados para el modelo elegido
SARIMA(1,1,0)(0,1,0), se presenta en el cuadro N 04. Se muestra la
prediccin de la serie para los datos transformados, pero como nuestro
objetivo es la serie original, se invirti la transformacin efectuada por lo
que se presenta tambin la prediccin de la serie original de los casos de
infeccin respiratoria agudas en menores de 5 aos.

58

Las predicciones que se presentan son para los dos siguientes aos de la
serie de tiempo, se muestran los lmites al 95% de prediccin para los
pronsticos.
Estos lmites muestran en donde podra estar el valor verdadero del dato, al
tiempo futuro seleccionado, con 95% de confianza asumiendo que el
modelo ajustado es apropiado para los datos. Se puede observar que estos
lmites se van haciendo anchos a medida que hacemos predicciones ms
alejadas en el tiempo.
CUADRO N 04: Resultados de las predicciones para el ao 2010 segn
meses. Modelo SARIMA(1,1,0)(0,1,0)
Ao

Mes
2010
2010
2010
2010
2010
2010

ENERO
FEBRERO
MARZO
ABRIL
MAYO
JUNIO

2010 JULIO
DATOS NO
EXISTENTES
2010
2010
2010
2010

AGOSTO
SETIEMBRE
OCTUBRE
NOVIEMBRE

2010 DICIEMBRE

Datos
Orig
1263
951
1040
1139
1481
1707

Dat Transf
7,141245122
6,857514063
6,946975992
7,037905963
7,300472814
7,442492723

2986 8,001689978

Predicciones
7,105505294
6,96177619
7,183469392
7,173200457
7,540799686
8,01508408

Dat.
Invertid

Residuos

1218,657709
1055,506673
1317,471163
1304,011364
1883,3355
3026,263835

0,035739828
-0,104262127
-0,2364934
-0,135294493
-0,240326872
-0,572591357

7,923064065 2760,215581

0,078625913

Predic.Trans. Predicciones
7,580637184
7,771077127
5,620921928
7,46351864

1959,877371
2371,023806
276,1438508
1743,271223

7,333483781 1530,705135

59

V. CONCLUSIONES
1.

Los Modelos Univariantes Integrados de Box Jenkins proporcionan un

mejor ajuste para describir y predecir el comportamiento de las variaciones


de casos de infeccin respiratoria agudas en menores de 5 aos del periodo
2003-2009. El modelo univariante integrado que mejor se ajusta para
describir y predecir el comportamiento de la serie de tiempo de casos de
infeccin

respiratoria

agudas

del

periodo

2003-2009

es

un

SARIMA(1,1,0)(0,1,0) , cuya ecuacin de pronstico es:


Yt (1 1 ) Y t 1 1 Y t 2 Y t 12 (1 1 ) Y t 13 1 Y t 14 E t

2.

Para identificar el modelo se realizaron algunas transformaciones de la

serie original convirtindola en estacionaria. Luego se identific la forma


del modelo usando la funcin de autocorrelacin estimada y la funcin de
autocorrelacin parcial estimada. La estimacin se realiz con el paquete
estadstico MINITAB 14. Para validar el modelo se realiz el anlisis de
los residuos y de los coeficientes, con lo que se cumpli que los residuos
sean compatibles con un ruido blanco. El valor de los coeficientes
estimados garantizo la invertibilidad (coeficientes menores que 1).
3.

Para la prediccin de la serie analizada, se hizo uso del mejor modelo

estimado se obtuvieron predicciones para el ao 2010, comparando con los


datos existentes y as comprobar el mnimo error, as mismo prediciendo
para los meses faltantes, dando a conocer que el comportamiento de los
casos de infeccin respiratoria agudas seguir ascendiendo en mayor
magnitud.

60

VI.
1.

RECOMENDACIONES Y SUGERENCIAS

En las fases de identificacin, estimacin, validacin y pronstico no

solo se recomienda utilizar las herramientas estadsticas necesarias para


comprobar

la

estacionariedad,

invertibilidad

del

proceso,

el

comportamiento de ruido blanco; sino herramientas o paquetes estadsticos


que permitan encontrar el mejor nivel de precisin respecto a otras
herramientas estadsticas, garantizando de ese modo la precisin del
pronstico.
2.

Evitar la sobre-diferenciacin y la sobre-parametrizacion debido a que

nos conducen a obtener modelos errneos.


3.

Verificar la adecuacidad del modelo obtenido (modelo 2) cada cierto

tiempo segn sea el comportamiento futuro de los casos de infeccin


respiratoria agudas en la provincia de Puno. Analizar dicho modelo junto a
los nuevos datos reales que sern registrados por la oficina de estadstica e
informtica en redes puno. En caso de no resultar adecuado para los
posteriores dos aos, reformular el modelo.
4.

En caso de proceder a la reformulacin futura del modelo, tener

presente el modelo SARIMA(0,1,2)(0,1,1) (conocido en esta investigacin


como modelo 1) para el respectivo anlisis.

61

VII. BIBLIOGRAFIA CONSULTADA.


Referencias bibliogrficas.
1. ANDERSON, Oliver D. (1985). "Times serie Analisis and forecasting"
(1ra Edicin).
2. CHATFIELD, C. (1978). "The analysis of time series: theory and
practice, Londres: chapman and hall".
3. GUJARATI, D. N. (2004). "Econometra" (3ra edicin). Mexico: Mc
Graw-Hill, pp. 717-735.
4. G. KENDALL Maurice y BUCKLAND William. (1984). "Diccionario
de Estadstica". Traducido por Eduardo Morales. (3ra Edicin). Ediciones
pirmide.
5. HANKE John E. (1996). "Pronsticos en los negocios". (5ta Edicin).
Mexico: Editorial Prentice Hall Hispanoamericana S.A.
6. PINDICK S. Roberto. (1980). "Modelos Econometricos". Espaa:
Editorial Labor Universitaria S.A.
7. URIEL JIMENEZ, Ezequiel. (1985). "Analisis de series temporales".
Modelos ARIMA. Madrid-Espaa: Editorial Paraninfo S.A.
Tesis
1. CURASI, Judith. (2006). Modelos Univariantes para predecir el
consumo de energa elctrica en el distrito de Puno, 2000-2005. Facultad
de Ingeniera Estadstica e Informtica-Universidad Nacional del
Altiplano, Puno-Peru.
2. DIAZ MAMANI, Nela. (2008). Pronstico mediante modelos de series
de tiempo para el consumo de agua potable de la empresa municipal de
saneamiento bsico de la ciudad de Puno, periodo 2000-2007. Facultad de
Ingeniera Estadstica e Informtica-Universidad Nacional del Altiplano,
Puno-Per.

62

3. NEIRA, Porfirio. (1995). Modelos Univariantes y Espectros de series


de tiempo para los pacientes Hospitalizados por Neumona Carlos Monje
Medrano Juliaca 1980-1993. Facultad de Ingeniera Estadstica e
Informtica-Universidad Nacional del Altiplano, Puno-Per.
Sitios Web
ARELLANO MIREYA Introduccin al anlisis clsico de series de
tiempo, [fecha de consulta: 18 de marzo 2009]. Disponible en:
<http://www.ciberconta.unizar.es/LECCION/seriest/100.html >.
GUERRA JOSE, SANCHEZ GUSTAVO Y REYES BELKIS Modelo
de series de tiempo para predecir la inflacin de Venezuela, [fecha de
consulta:

23

de

marzo

2009].

Disponible

en:

<http://www.bcv.org.ve/Upload/Publicacionest/doc13.pdf >.
MERMA JARA, MARCO A. Series de tiempo,
[Fecha

de

consulta:

12

de

junio

2009].

Disponible

en:

<http://www.monografias.com/tarbajos30/series-de-tiempo/series-detiempo.html >.
ORTIZ GUERRRERO, NUBIA AMPARO, La evolucin de los
proyectos de investigacin. [Fecha de consulta: 12 de Junio
2009]Disponible

en:

<http://www.monografias.com/trabajos/elabproyect/elabproyect.shtml>
RODRIGUEZ RODRIGUEZ CONCEPCION, Modelo Box-Jenkins
Aplicacin de su metodologa a la produccin de azcar. [Fecha de
consulta:

23

de

Junio

2009]

Disponible

en:

http://www.dict.uh.cu/revistas/econom/%EDa_%20desarrollo/2001%20n1/concepci%F3n%20Rodr%EDguez.pdf>

63

VIII. ANEXOS
ANEXO N 01: Funcin de Autocorrelacion y Autocorrelacion Parcial de Datos
Originales.
ACF2

TSTA2
0,644439
0,283382
-0,060232
-0,356992
-0,443033
-0,485952
-0,457206
-0,304115
-0,036812
0,296311
0,524138
0,621773
0,426326
0,115686
-0,124514
-0,31851
-0,378375
-0,390414
-0,336776
-0,179622
0,054405
0,271947
0,452078
0,471876
0,305752
0,081594
-0,112975
-0,315449
-0,383227
-0,364241
-0,331723
-0,178455
0,030422
0,199463
0,341902
0,380562
0,262975
0,060114

PACF1
6,14755
1,998
-0,40718
-2,40897
-2,81541
-2,84988
-2,46991
-1,54271
-0,18204
1,46476
2,53197
2,81204
1,77965
0,46694
-0,50137
-1,279
-1,49279
-1,5039
-1,26619
-0,66374
0,20007
0,99963
1,64381
1,66702
1,04859
0,27651
-0,38254
-1,0664
-1,27964
-1,19493
-1,07157
-0,56933
0,09671
0,63403
1,08202
1,18917
0,80926
0,18367

TSTA1
0,644439
-0,22562
-0,249866
-0,276348
-0,034456
-0,246176
-0,226375
-0,093628
0,112278
0,208358
0,123383
0,19943
-0,13982
-0,120095
0,017098
0,010459
0,042065
-0,033967
0,017558
-0,015043
0,02273
-0,079548
0,122207
0,055468
-0,014457
0,019811
0,042415
-0,15882
-0,040534
0,03342
-0,12245
-0,063579
-0,024552
-0,069135
-0,053357
0,02
-0,023025
-0,111629

6,14755
-2,15227
-2,38357
-2,63619
-0,32869
-2,34837
-2,15948
-0,89315
1,07107
1,98761
1,17699
1,90245
-1,3338
-1,14564
0,16311
0,09977
0,40127
-0,32402
0,16749
-0,1435
0,21683
-0,75884
1,16578
0,52913
-0,13791
0,18899
0,40461
-1,51505
-0,38667
0,31881
-1,1681
-0,60651
-0,23421
-0,65951
-0,509
0,19078
-0,21964
-1,06488

64

-0,118601
-0,283451
-0,308918
-0,263225
-0,226542
-0,127485
0,022659
0,181817
0,297697
0,335174
0,244783
0,052876
-0,11288
-0,245228
-0,243333
-0,238375
-0,201226
-0,112854
0,026118
0,167374
0,244203
0,259779
0,158451
0,029042
-0,052366
-0,185658
-0,188822
-0,153826
-0,145573
-0,023648
0,082231
0,191207
0,235354
0,178144
0,072226
-0,038775
-0,107601
-0,132736
-0,169793
-0,144446
-0,089225
-0,00876
0,074149
0,111004
0,120675

-0,36224
-0,86449
-0,93452
-0,78876
-0,67424
-0,37755
0,067
0,53758
0,87742
0,97963
0,70801
0,1521
-0,32463
-0,70443
-0,6952
-0,67745
-0,56901
-0,31799
0,07351
0,47106
0,68562
0,72561
0,44005
0,08048
-0,14511
-0,51436
-0,52161
-0,42367
-0,40015
-0,06489
0,22563
0,52435
0,64347
0,48485
0,19607
-0,10522
-0,29195
-0,3598
-0,4596
-0,39009
-0,24056
-0,0236
0,19978
0,29895
0,32468

-0,029229
-0,067451
0,103959
-0,009732
-0,059107
-0,084438
0,001034
0,000431
-0,044119
0,077343
0,051684
-0,056837
-0,019786
-0,006665
0,063201
-0,13159
0,080815
-0,018642
0,048628
-0,079758
-0,099417
-0,028872
-0,053711
0,009233
0,074147
-0,11592
-0,007467
0,034277
-0,023039
0,02049
-0,000402
0,097507
-0,006567
-0,130606
-0,050744
0,004839
-0,012246
0,054239
-0,014461
-0,072874
0,024233
-0,07797
-0,062483
-0,103922
-0,048306

-0,27883
-0,64344
0,9917
-0,09284
-0,56385
-0,80549
0,00986
0,00411
-0,42087
0,7378
0,49304
-0,54219
-0,18875
-0,06358
0,60289
-1,25529
0,77092
-0,17783
0,46388
-0,76084
-0,94838
-0,27542
-0,51237
0,08807
0,70732
-1,10581
-0,07123
0,32698
-0,21978
0,19546
-0,00384
0,93015
-0,06264
-1,2459
-0,48407
0,04616
-0,11682
0,51741
-0,13795
-0,69517
0,23117
-0,74379
-0,59605
-0,99135
-0,46081

65

0,089598
0,044356
0,011036
-0,016831
-0,026741
-0,021418
-0,008138

0,24078
0,11913
0,02964
-0,04519
-0,0718
-0,05751
-0,02185

0,00966
0,045724
-0,011021
0,011233
0,060783
0,048591
-0,011028

0,09215
0,43618
-0,10514
0,10716
0,57984
0,46353
-0,1052

66

Datos Orig
1263
951
1040
1139
1481
1707
2986
3519
3132
2207
1713
1502
1288
657
1150
935
1473
2893
2174
2448
2327
1761
1607
1404
1253
1041
1040
1453
1931
2851
2826
2406
2015
2051
2069
1769
1286
1000
1044
1294
2450
3477
2499

Datos
Primera
Prim Difer
Transformados
Diferencia
Estacional
7,14125 *
*
6,85751
-0,28373 *
6,94698
0,08946 *
7,03791
0,09093 *
7,30047
0,26257 *
7,44249
0,14202 *
8,00169
0,5592 *
8,16593
0,16424 *
8,04943
-0,11651 *
7,69939
-0,35004 *
7,446
-0,25339 *
7,31455
-0,13145 *
7,16085
-0,15371 *
6,48768
-0,67316
-0,30159
7,04752
0,55983
0,28542
6,84055
-0,20697
-0,07451
7,29506
0,45451
0,05046
7,97005
0,67499
0,62413
7,68432
-0,28573
-0,5918
7,80303
0,1187
-0,44682
7,75234
-0,05069
0,04419
7,47364
-0,2787
0,1026
7,38212
-0,09151
0,19576
7,24708
-0,13504
0,07328
7,1333
-0,11378
0,03821
6,94794
-0,18536
0,50676
6,94698
-0,00096
-0,32912
7,28139
0,33441
0,27504
7,56579
0,28441
0,08701
7,95543
0,38963
-0,36615
7,94662
-0,00881
0,14139
7,78572
-0,1609
-0,14808
7,60837
-0,17735
-0,25944
7,62608
0,01771
0,23625
7,63482
0,00874
0,24102
7,47817
-0,15665
0,026
7,15929
-0,31888
-0,21536
6,90776
-0,25154
-0,16358
6,95081
0,04306
0,01259
7,16549
0,21468
-0,09882
7,80384
0,63835
0,29708
8,15393
0,35008
0,12855
7,82365
-0,33028
-0,34026

67

2028
1912
2108
1846
1845
1496
1023
1557
1645
2412
3181
2434
2308
2380
2541
1795
1710
1397
1475
1245
1587
1818
2559
2289
2075
2196
1829
2067
1460
1256
1053
1331
1311
1897
3046
2779
1973
2387
278
1755
1541
531
555
543
1193

7,61481
7,55591
7,65349
7,52078
7,52023
7,31055
6,93049
7,35052
7,4055
7,78821
8,06495
7,79729
7,74414
7,77486
7,84031
7,49276
7,44425
7,24208
7,29641
7,12689
7,3696
7,50549
7,84737
7,73587
7,63772
7,69439
7,51152
7,63385
7,28619
7,13569
6,9594
7,19369
7,17855
7,54803
8,02158
7,92985
7,58731
7,77779
5,62762
7,47022
7,34019
6,27476
6,31897
6,29711
7,08423

-0,20884
-0,0589
0,09759
-0,13272
-0,00054
-0,20968
-0,38006
0,42002
0,05498
0,38272
0,27674
-0,26766
-0,05315
0,03072
0,06546
-0,34755
-0,04851
-0,20217
0,05433
-0,16952
0,24271
0,13589
0,34188
-0,1115
-0,09815
0,05668
-0,18287
0,12233
-0,34766
-0,1505
-0,17629
0,23429
-0,01514
0,36948
0,47356
-0,09174
-0,34254
0,19048
-2,15017
1,8426
-0,13004
-1,06542
0,04421
-0,02186
0,78712

-0,20062
0,09568
0,13614
-0,10352
0,08893
0,18333
-0,07666
0,31592
0,01933
-0,33148
-0,19475
0,02779
0,18543
0,16356
0,01043
-0,23009
-0,15
-0,01526
0,43796
-0,38324
-0,09226
-0,15767
-0,05208
0,1871
0,02916
0,00459
-0,236
0,35194
-0,07599
-0,09041
-0,20608
0,29428
-0,06607
0,11113
0,24262
0,0823
-0,235
0,01774
-1,90376
0,78595
1,03463
-0,81156
-0,21403
-0,15143
0,68061

68

1947
2484
2443

7,57405
7,81763
7,80098

0,48982
0,24358
-0,01664

0,50135
-0,17282
-0,03413

69

ANEXO N 02. MODELO SARIMA(1,1,0)(0,1,1)


Modelo ARIMA: datos originales
Estimacin en cada iteracin.
Iteracin
0
1
2
3
4
5
6

SSE
24031808
21318455
19593315
18856386
18826661
18826554
18826553

Parmetros
0,100
-0,050
-0,200
-0,350
-0,385
-0,387
-0,387

Cambio relativo en cada estimacin menor que 0,0010


Las estimaciones finales de parmetros
Tipo
AR
1

Coef
-0,3868

SE Coef
0,1052

T
-3,68

P
0,000

Diferenciacin: 1 regular, 1 estacional de orden 12


Numero de observaciones: Series originales 91, despus de diferencia 78
Residuales:
SS = 18813604 (backforecasts excluded)
MS = 244333 DF = 77
Box-Pierce Modificado (Ljung-Box) Chi-Square statistic
Retraso
Chi-Cuadrado
DF
Valor de P

12
24
36
48
18,9
30,1
39,3
46,9
11
23
35
47
0,063 0,145 0,282 0,977

70

ANEXO N 03. MODELO SARIMA(0,1,2)(0,1,1)


Modelo ARIMA: datos originales

Estimadores Finales de Parmetros.


Tipo
MA
1
MA
2
SMA 12

Coef
0,6521
0,2422
0,9040

SE Coef
0,1093
0,1116
0,0952

T
5,97
2,17
9,49

P
0,000
0,033
0,000

Diferenciacin: 1 regular, 1 estacional de orden 12


Numero de observaciones: Serie Original 91, despus de la diferencia 78
Residuales:
SS = 9178024 (backforecasts excluded)
MS = 122374 DF = 75
Box-Pierce Modificado (Ljung-Box) Chi-Cuadrado estadstico
retraso
Chi-Cuadrado
DF
Valor de P

12
24
36
48
11,2
15,9
22,7
30,2
9
21
33
45
0,263 0,777 0,910 0,956