Texto Regresión

CAPITULO 1
CORRELACIN

Antes de plantear cualquier modelo de regresin, pronosticar o predecir el
valor de y conociendo los valores de la variable X
1
, X
2
, ..., X
n
, se debe
realizar un anlisis de la relacin existente entre la variable dependiente y y
las variables independientes X
i
.

COVARIANZA

Se define la covarianza, entre dos variables X, Y como la asociacin que
existe entre las variables.

Sea (X
1
, Y
1
); (X
2
,

Y
2
); .....; (X
n
, Y
n
) una muestra aleatoria de tamao n a la
cual se le mide las caractersticas X, Y. La covarianza de dicha muestra se
calcula de la siguiente manera:

__ __ __ __
__
1
__
1
) , ( Y X
n
n
n
Y
X
n
X
Y
n
Y X
n
Y Y X X
Y X COV
i i i i
+ =
= + =

__ __ __ __ __ __ __ __
) , ( X Y
n
Y X
Y X Y X X Y
n
Y X
Y X COV
i i i i

Tambin se interpreta la covarianza como un estadstico que resume la
variabilidad simultanea de las variables, un estimador insesgado de la
varianza poblacional es la covarianza muestral. co

=
__ __
1
1
) , ( Y Y X X
n
Y X COV
i i

Algunos textos de estadstica aplicada a los ingenieros como Sheldon, M.
oss, Douglas C. Mongomomery y George, Paul Newbol (Estadstica
plicada a los negocios), definen la expresin:
R
a

=
n
Y X
Y X Y Y X X
i i
i i i i XY
__ __
S

CARTESIANO

Y Y

INTERPRETACIN GRFICA DEL PLANO

__
__
X X
n
Y Y X X
i i
__ __
m m

__
Y Relacin positiva
__

__
Y Y
X X

__
X

__

__
Y Y
X X

n

__
Y Y X X
i i
__ __
m

Y
__
Relacin negativa

X

__
X

Y Y

__
X

Ejem: Se efectu un estudio que relaciona los puntajes de aptitud de un
examen (X), con productividad (Y una empr e to n a
sei ersonas y e son los resultad

Aptitud (X) Productividad (Y) XY X
2
Y
2
la ), a esa s maro l azar
s p stos os:
9 23 207 81 529
17 35 595 289 1225
20 29 580 400 841
19 33 627 361 1089

20 43 860 400 1849
23 32 736 529 1024

108 195 3605 2060 6557
( ) ( ) 83 . 15 5 . 32 * 18
6
3605
) , (
__ __
= = =
Y X
n
XY
Y X COV

olo diremos que la covarianza es positiva pero no sabemos si esta es
tomar esta decisin debe estandarizarse la
e no dependa de las unidades de medidas de las
aractersticas X, Y.

S
grande o pequea, para
ovarianza con el fin de qu c
c
2
2
__
2
__ __ __
n
Y Y X X
n
Y Y X X
i i i i

Y X
S S Y X COV ) , (

Y X Y X
S S Y X COV S S ) , ( Dividimos entre S
X
S
Y

1
) , (
1
Y X
S S
Y X COV
Sea
Y X
S S
Y X COV
r
) , (
=

1 1 r

Donde el estadstico r se llama Coeficiente de Correlacin lineal y este
ide la asociacin lineal entre las variables X, Y.
Una vez calculada la covarianza, para poder hallar el coeficiente de
correlacin lineal se hace necesario calcular la desviacin estndar de (X) y
(Y), para ello aplicamos un conjunto de formulas reducidas.

m

2
2
__
2
2
__
2
X X
i
i
X
S S
X
n
X
n
X X
=

S

Para nuestro problema de la productividad, la desviacin estndar de X, Y
son respectivamente:

4 . 4 33 . 19
33 . 19 18
6
2060
2
2
__
2
2
= =
i
i
X
X
n
X
n
X X
S

2
__
= =

X

S
05 . 6 58 . 36
58 . 36 5 . 32
6
6557
2
2
__
2
2

=
i
i
Y
n
Y
n
Y Y
S
2
__
= =
= =
Y
Y

S

6 . 0
4 . 4 * 05 . 6
83 . 15 ) , (
= = =
Y X
S S
Y X COV
r

rmalmente se considera que un coeficiente de correlacin es alto cuando
e es mayor a 0.8.
No
est

COEFICIEN MINACIN

Este coeficiente mide la cantidad de variabilidad de la caracterstica Y que
es explicada por la variable X (o el modelo). El coeficiente de
determinacin se calcula de la siguiente manera:

TE DE DETER

2
36 . 0 6 . 0
) , (
2
2
= =
= =
S S
Y X COV
r R
Y X
sto significa que el 36% de la variabilidad de la productividad es explicada

R

E
por el puntaje de aptitud.

TALLER No 1

1. Un individuo asegura que el consumo de combustible de su automvil
no depende de la velocidad, con el fin de probar la anterior afirmacin se
probo el automvil a diferentes millas y se midi el consumo de
gasolina. Los datos aparecen a continuacin:

Velocidad (X) Consumo (Y)
45 24.2
50 25.0
55 23.3
60 22.0
65 21.5
70 20.6
75 19.8

Hallar el coeficiente de determ tar.

2. Para los problemas del libro gua 11.6 11.11, hallar el coeficiente de
s variables X
1
, X
2
, ..., X
n
se debe o se desea predecir o pronosticar
l comportamiento de Y para unos valores determinados de X , X , ..., X .
sos (X
1
) y la capacidad de ahorro (X
2
). El
bjetivo seria crear una ecuacin de prediccin o un modelo que exprese los
gastos (Y) variable dependiente como una funcin de las variables
independientes (X
1
) ingresos, (X
2
) ahorro.

Los modelos que se emplean para relacionar una variable dependiente (Y)
con las variables independientes X
1
, X
2
, ..., X
n
se denominan m elos de
regresin o modelos estadsticos lineales.

inacin e interpre
determinacin e interpretar.

ANLISIS DE REGRESIN

Una vez que se sospeche que una variable aleatoria Y esta relacionada con
una o m
e
1 2 n

Como por ejemplo un economista quiere relacionar los gastos de una
comunidad (Y) con los ingre
o
od
CAPITULO 2
regresin simple es la de poder predecir el valor
e (Y) variable dependiente en trminos de una variable independiente (X).

Los valore gadas cuadradas) y las
resin resultantes Y (en unidades 0.1 de pulgada). Se
resentan a continuacin:
REGRESIN LINEAL SIMPLE

La finalidad del modelo de
d

Ejem: Supongamos que el inventor de un nuevo material aislante quiere
determinar la magnitud de la compresin que se producir en un espcimen
de dos pulgadas de espesor cuando se somete a diferentes cantidades de
presin.
s de X (en unidades de libras por pul
magnitudes de comp
p

GRAFICA PRESION Vs COMPRE ION
2,5
3
3,5
4
4,5
E
S
I
O
N
S
0
0,5
1
1,5
2
0 1 2 3 4 5
PRESION
C
O
M
P
R

El estado ideal ser el de trazar una lnea y que todos los puntos quedaran
sobre dicha lnea, pero esto en la realidad no ocurre, ya que algunos puntos
se desviarn de esta lnea.

La solucin a este problemas es el de construir un modelo probabilstico
(modelo de regresin lineal simple), supone que el valor medio de Y para
un valor dado de X se grafica como una lnea recta y que los puntos se
desvan de esta recta a una cantidad aleatoria (positiva o negativa) igual a
es decir:
Presin (X) Compresin (Y)
1 1
2 1
3 2
4 2
5 4
+ + =
1 1 0
X Y

1 1 0
X +
Valor medio de Y para un valor de X
Error aleatorio

Es lgico pensar que el E() = 0 ya que las desviaciones ocurren por debajo
o por encima y por tanto ( ) X E X E Y E
1 0 1 0
) ( ) ( + = + + = donde
0
y
1

son parmetros de la parte deterministica que se estimaron y su distribucin
dad de hacer inferencias sobre dicho parmetro
depende de la distribucin de probabilidad de la variable aleatoria .

de probabilidad con la finali

Un modelo de regresin lineal simple
+ + =
1 1 0
X Y

Y = variable dependiente
X = variable independiente
X Y E
1 0
) ( + = es el componente determinstico
(epsilon) = componente aleatorio
= Pendiente
1
0
= Corte con la ordenada Y

Si queremos ajustar un modelo de regresin lineal simple se debe estimar
0
,
1
de la lnea de regresin Y. Con el fin de hacer algunas inferencias
obre estos parmetros, daremos algunos supuestos: s

1. E() = 0
2. V() = constante para todo valor de X
n valor
en particular Y no tiene efecto alguno sobre los errores asociados a otros valores de
Y.

EROS

= =
2 2
y
3. N(
1
,
) = N(0,
)
4. Los errores son independientes, esto quiere decir que los errores asociados a u
INTERPRETACIN GRFICA DE LOS TRES PRIM
SUPUESTOS

ESTIMACIN DE LOS PARMETROS PARA
0
,
1

Si queremos tomar la mejor recta ser aquella que minimice la distancia de
los puntos (errores) a la recta. Como aparece en la siguiente grfica:

Si queremos encontrar la lnea de mnimos cuadrados para un conjunto de
os que tenemos una muestra n, (X
1
, Y
1
); (X
2
, Y
2
),...,(X
n
, Y
n
),
or ejemplo, los n = 5 puntos de datos del ejercicio anterior son (1,1), (2,1),
s la recta que minimice los
e os estimadores de
0
y
1
se
llaman y respectivamente y representamos el modelo estimado como
.

Toda observacin se obtiene al reemplazar x en la anterior ecuacin,
toda observacin Y se obtiene al sumar el error
i
al modelo estimado

Se aplicara el mtodo de los mnimos cuadrados para estimar
0
y
1
tal que
haga mnima la sumatoria al cuadrado de los errores.

2
1 0
x y
i i i
derivando con respecto a
y e igualando a cero se tiene:

datos suponem
p
(3, 2), (4, 2), (5, 4) para estimar
0
,
1
tomamo
rrores al cuadrado
i
2
es la ms pequea, l
( )
i i
x y

+ =
1 0

i
y
( )
i i i
x y + + =
1 0

+ =
= =

2
1 0 1
2
1
2
1 1
x y y y y y
i i

=
= =
2
2
y y SSE

i i
x y
SSE
1 0
0
2

x y x
SSE
i i 1 0
1
2
las dos ecuaciones igualadas a cero se tiene

0 2
0 2
2
1 0
1 0
=

i i i i
i i
x x y x
x n y

=

0
1 0 i i
x n y

=

i i
y x n
1 0

0
2
1 0
=

i i i i
x x y x

i i i i
i i
y x x x
y x
2
1 0
1 0

despejamos
0
ecuaciones normales

=
i i i i
y x x x
2
1 0

= +
= +

n
=
i i i
0
=
i
i i
x
x y x
n
x
n
y
2
1
1

i
i i i
i i
x
x y x
x y
n
2
1
1
1

0
Igualando trminos se tiene:

=
=
=

i i i i
i i i i i i
y x x y n
y x x y n x x
x n y x n x y x
2 2
2
1
2
1
) (
) (

( ) ( )

i i
i i i i i i
x x n
2
2
1
1 1

n

( )

i i
y x
Dividimos entre n
2
2
1
i i
i
x n
x y
n

i
x
2
( )
2
2
2
2
x
2 2
1
n
x
n
n
n
y x
n
y n
i i
i i i

x
i
=

2 2
2
__ __
) , (
x
i i
i i
i
S
y x COV
n
x
n
x
y x
n
x y
=

( ) ( )
=
n n
i i
2 2

n
x
x
y x
x y
n
x
n
x n
y x
n
x y n
i
i
i i
i i
i i i i
i
2
2
=
2
__
__ __
x x
y y x x
S
S
i
i i
xx
xy

Despejando en la primera ecuacin se tiene que

= = +
n
x
n
y
y x n
i i
i i
1
0 1 0

__
1
__
0
x y

=

Calcular o estimar por mnimos cuadrados para y con los datos de
nuestro ejemplo

Presin (X
i
) Compresin (Y
i
) X
i
Y
i
X
i
2
Y
i
2
1 1 1 1 1
2 1 2 4 1
3 2 6 9 4
4 2 8 16 4

5 4 20 25 16

15 10 37 55 26

COV (x,y) =

4 . 1
5
7
= =
n
Sxy

41 . 1 ; 2
5
10
5
2
= = = = Sx
Sxx
x S
( )
2 . 1
5
20 26
5
5
5
2
2
1
2
=
= =
i
y
y
Syy
y S
1 . 1 2 . 1 = = Sy
90 . 0
41 . 1 * 1 . 1
4 . 1 ) , (
= = =
SxSy
y x COV
r
81 . 0
2
= R

( )
= = = 7
5
10 * 15
37
2
n
y x S
i i
i i xy

= = = 10
5
15
55
*
2
2
x
x
y x
i

S
n
i xx
7 . 0
10
1
= =
7

1
es la dependiente de la recta estimada
1 . 0
5
15
7 . 0
5
10
1
__
1
__
0
= = = =

n
x
n
y
x y
i i

Interpretacin de
o anterior significa que la compresin aumenta 0.7 por cada valor de
umento de la presin.

nterpretacin de
1 este resultado es absurdo puesto
ue no hay compresin negativa, la razn es que x no puede tomar valores
s a cero o negativos. La compresin puede expresarse en trminos de
.
observ e timados con el
mismo que todas las desviaciones al cuadrado de
los valores observados y estimados y y la suma de estas observaciones
de a viaciones SSE y este
alor es el menor que se obtiene ajustando cualquier otra recta.
y y
i

1

L
a
0
I

uando x = 0 la compresin es de 0. C
q
iguale
la presin si esta toma valores positivos

En la siguiente tabla se presenta los valores ados y s
modelo x y 7 . 0 1 . 0 + = lo
2
) (
i
al cuadrado se llama suma de cuadrados l s des
v

x y

x y 7 . 0 1 . 0 + = ) (
2
) (
y y
i

1 1 0.6 0.4 0.16
2 1 1.3 -0.3 0.09
3 2 0 0.00 2.0
4 2 -0.7 0.49 2.7
5 4 3.4 0.6 0.36
0 1.10

A L Z RA E LO EAL SI LE

Se llamara suma de cuadrados total a la desviacin de y con respecto a
su media =
2
__
y y SS
i yy
.
Llamaremos sum e cuadra s de la re sin a l iacin
N ISIS DE VARIAN A PA L MODE LIN MP
a d do gre a desv de

+ x

=
1 0
y a la media de las bservada = y SS
i R
.
las observaciones
+ = y y y

i

_

2
__
y y o s
Llamamos suma de cuadrados del error a las desviaciones del modelo a
( )
2
2

1 0
2
y y SSE
i

INTERPRETACIN GRFICA

y
i

x y
1 0

+ =
y y

y y
_
y

0

x

En la grfica anterior se

__ __
y y
i
En el siguiente cuadro se presentan los resultados de la SS
yy
, SS
R
, SSE para
los datos de la compresin (y) y la presin (x).

i
puede observar que
__ __
0
y y y y
y y y y y y
i i i
i i i i

Presin
x
Compresin
y
SS
yy
2
__
) ( y y
i

y estimado
-0.1+0.7x
SSE
2
) (
i i
y y
SS
R
2
__
) (
i i
y y

1 1 1 0.6 0.16 1.96
2 1 1 1.3 0.09 0.49
3 2 0 2 0.00 0.0 0
4 2 0 2.7 0.49 0.49
5 4 4 3.4 0.36 1.96

15 10 6 1.1 4.9

n la estadstica aplicada, cobra m E ucha importancia la tabla de anlisis de
arianza la cual presenta las siguientes columnas.

uente de Suma de Grados de F Significa
v
F
variacin cuadrados libertad cuadrtica ncia
Media
Regresin SS
R
P 1 SS
R
/(P 1) SS
R
/(P1)/ SSE/(NP)
Residual SSE N P SSE/(N P)
Total SS
yy
N 1 SS
yy
/(N 1)

n la tabla anterior P es el nmero de parmetros en el modelo y la razn E
)
) 1 (P
SS
R
se distribuye F con P 1 y N
(N
respectivamente y la ltima colum
P
SSE
P grados de libertad
na corresponde a la probabilidad o
e la cola superior de encontrar un valor mayor que el F
ara el modelo l ple de nuestro ejemplo.
a tabla de anlisis de varianza ser la siguiente:
e Suma de
cuadrados
Grados de
libertad
Media
cuadrtica
F Significa
ncia
porcentaje d
calculado p linea sim

L

Fu nte de
variacin
Regresin 4.9 (2-1) = 1 4.9 13.364 0.035
Residual 1.1 (5-2) = 3 0.367
Total 6.0 (5-1) = 4

CALCULO DEL COEFICIENTE DE DETERMINACIN CON LA
SUMA DE CUADRADOS

l coeficiente de determinacin se define como el porcentaje de la E
variacin total que es explicada por el modelo, esto puede representarse de
la siguiente manera:

82 . 0
6
1 . 1 6
=
=
yy
yy
SS
SSE SS
R

AREA: Calcular R para el ejemplo de la compresin (y) y la presin (x)
diante la siguiente frmula
T
2
2
) , (
= =
y x
S S
y x COV
r R me y observar su similitud
o igualdad con el resultado anterior si existe una pequea diferencia esta es
por el redondeo.

tra manera de calcular la SS
R
= en nuestro ejemplo y
S
xy
= 7, entonces SS
R
= 0.7*7 = 4.9

Taller: Pginas 570 571

PROPIEDADES DE LOS ESTIMADORES DE MNIMOS
CUADRADOS
En la teora de estimacin se espera que este cumpla algunas propiedades
como insesgado, de varianza mnima (eficiente), etc. Demostramos que el
s insesgado calculemos la varianza, la cual ser til en las
intervalos de dichos estimadores.
Antes de realizar dichas demostraciones recordaremos algunas expresiones
que son importantes para dichas demostraciones.

__ __
y x x S

ya que

SS
xx
=
=

1) es un estimados insesgado

Demostracin:
xy
SS
1
7 . 0
1
=
O
S

estimador
1
e y
pruebas de hiptesis y estimacin por

=
__ __ __
x y x y y x x S
i i i i i xy

i i i i i
y x x x x y y x x
__ __ __ __
=
( )
= 0
__
x x
i
= = 0
__ __ __
x n x n x n x
i

=

__ __ __ __ __
2
__
x x x x x x x x x x x x
i i i i i i

i i i i i
x x x x x x x x x
__ __ __ __

1 1
=
+ +
= =
1
__
2
__
2
1
__
__
1
.....
1

n
xx
n
xx xx
i
i i
xx xx
xy
y
SS
x x
y
SS
x x
y
SS
x x
y x x
SS SS
SS

En la expresin anterior puede observarse como
1
se representa como una
combinacin lineal de los y
i
.

x
y
x x ( ) (
2 1
+ +

n
xx
n
xx xx
y
SS
x x
y
SS
x
SS
) (
....
)
__
2
__
1
__
1

( )
1 1 0 1
x y + = ; ( )
2 1 0 2
x y + = ; .....; ( )
n n
x y
1 0
+ =

+ +
) (
) (
.... ) (
) (
) (
)
__
2
__
2
1
__
1
1 n
xx
n
xx xx
y
SS
x x
y
SS
x x
y
SS
x x
(
1
x
+ + +
+ +
) (
) (
.... ) (
) (
) (
)
1 0
__
2 1 0
__
2
1 1 0
__
1 n
xx
n
xx xx
x
SS
x x
x
SS
x x
x
SS
x

=

xx
i i
i i
xx
i
xx
SS
x x x
x x x
SS
x x
SS
__
1
__
1
__
0

1 1 1 1
=
xx
xx
SS
SS

( )
( )
( )
( )
( )
n
y V
x x
y V
x x
y V
x x
V
2
2
__
1
+ +

V
y
= =
2 2

2
__
2
__

n
xx xx xx
SS SS SS
2 2 2 1
2
1
) (

....
( ) y

2
2
__
2 2
2
2
__
2
2 2
1
) ( ) (
xx xx
SS SS
V + =

2
__
2
2
2
__
1
) ( ) (
....
xx
i
xx
n
SS
x x
SS
x x x x x x
+ +

=
xx xx
xx
SS SS
2
2
) (
=

SS
2
xx
SS
2
1

V
xx xx
SS SS
V = =

2
1

2)

0
es un estimador insesgado, de
0
se tiene que:
0
x y = pero
__ __

1
xx
i i
xy
SS
xx
SS SS
y x x
= =
__
1

xx
i i
i
xx
i i
i
xx
i i
SS
y x x x
n
y
SS
y x x
x
n
y
SS
y x x
x y
__ __ __
__
__
__ __
0
i
SS
x x x
n
__ __
0
1
i
xx
y
( )

i
xx
i
i
xx
i
y
SS
x x x
n
y
SS
x x x
n
__ __ __ __
0
1 1

( )

= +
xx xx
i
xx
SS n SS n
x
SS n
0 1 0 0

i
i i i
x
x x x x x x x x x
1
__
__ __ __ __ __
1 1 1

i
i
i
x x
x
x
x x
_
1
1
__
i i
xx xx
x
SS n SS
x
n
n
_
__ __
0
0 0
= = + =
+ =
0 1
__
1 0 0
1
__
1 0 0
0

x x
SS
SS
x x
xx
xx

0
__ __
0
0 0
x
SS
i
xx xx
__
1
1
__
x x
SS
x
n
x
x x
x
i
i
i
0
es un estimador insesgado

__
__ __ __ __
x x x x x x x x x
V

2
0
1 1 1
xx
i
i
xx
i
i
xx
i
SS n
y
SS n
V y
SS n
V
=
( )
2
2
2
2
1
xx
i
xx
i
SS
x x x
nSS
x x x
n

2
__
2
__ __ __
=
( )

2
SS SS
i
xx
i
xx

__ __
2
2
2 1
x x
x
x x
n
x
n

2
2
__ __
=
( )
xx xx
S
x n
2
__
2
__
2
__
2 2
2
__

=
+ =
+ =
+
xx
xx xx
xx
nS
SS
SS
x
n SS
x
n SS
SS x
n
2 2 2
2
2
1
0
1
*

+
=
xx
i i
xx
i
nSS
x n x x x x
nSS
x n x x
2
__
2
__ __
2
2
2
__
2
__
2
2

=
+
=
+ +

xx
i
xx
i
xx
i i
nSS
x
nSS
x n n x x
nSS
x n x n x x x
2
2
2
__
2
__
2
2
2
__
2
__ __
2
2
2 2 2

S

edio de la suma de
las desviaciones al cuadrado entre los y observados y la lnea de regresin
ESTIMADOR INSE GADO
2

La varianza de los errores o lo que es lo mismo el prom
x debe calcularse de la siguiente manera: y
1 0
+ =
( ) ( )
n
y y
n n
i
i
= =

=
2
2
2
1 1

( ) ( ) ( )
2
1 0
2
y
V x V y V
n
Un estimador insesgado de
SSE
= = + + = = =
2
2 2 2 2
= = = =
n
SSE
s
y

La explicacin anterior se deriva del echo que se debe estimar los
armetros
0
y
1
. para demostrar lo anterior enunciaremos el siguiente
orema:
l estadstico
p
te

E
2
SSE
se distribuye
2
2
2
2
) 2 (
s n
= =
2
2
SSE
como SSE = (n 2)s
2
se tiene que

2
) =
2
iene que
Demostracin de E(s

el teorema anterior se t D
( )
2
2
2
) 2 (
n
( )
2
2
2 2
2
) 2 ( 2
=
n
s
n
s
) ( )
2
2
2
(
2
2
s
) 2 (
) 2 (
2
=
n
n
n

alor esperado de una
2
son sus grados de libertad
E(
2
) = n 2
onde
Recordamos que el v

=
xy yy i
SS SS y y SSE
1
2
D
( )
xx
xy
i i
i i i i xy
i
i i yy
n
y
y y y SS =
2
2
2
__
SS
SS
=
n
y x
y x y y x x =

1
__ __

erci presin.

SS SS SS
SS =

Ej plo la varianza del ej cio de la presin y com em : Estime
1 . 1 7 * 7 . 0 0 . 6
1
= = =
E
xx yy
367 . 0
3
1 . 1
2
= = =
SSE
s y la
2 n
desviacin estndar 61 . 0
2
= = s s

INFERENCIA RESPECTO A LOS

Para nuestro ejemplo supngase que la presin no tiene relacin con la
ompresin, que podra decirse de los valores
0
,
1
del modelo
robabilstico y =
0
+
1
x +.
fecta el valor medio de y, y =
0
+
1
x ; es decir y
independiente del valor de x, entonces se podra
afirmar que
1
= 0. Cobra importancia probar la siguiente hiptesis nula y
alterna.

Ho
1
= 0
Ha
1
0

Para probar esta hiptesis se hace necesario conocer la distribucin del
estadstico

c
p

Si los cambios de x no a
tomara cualquier valor
xx
xy
SS
SS
=
1
Bajo el supuesto de que los errores se distribuye
N(0, ), entonces y =
0
+
1
x +. Se distribuye N(
0
+
1
x; ), como
1

puede expresarse como una combinacin lineal de los y
i
ya que
( )
n
x
x
n
y x
y x
i
i
i i
i i
2
2
1
t el estimador
1
iene una distribucin N(
1
,
xx
SS
)
por lo tanto el estadstico
xx
SS
1
tiene una distribucin normal estndar.

El 95% de las mu se hallan entre =
1
1
2

SSxx
1
estras

Como
2
es desconocido y se estima con el estadstico
2
2
=
SSE
s el
n
estadstico
SSxx
S
1
1
iene una distribucin t estuden y la hiptesis nula

o 0
1
= H

Ha 0
1

, 2
0
1
1

Puede rechazarse si ,
2
n
t T o
n
t
S

SSXX

Prueba de una cola inferior

Ho 0
1
=
0 < Ha
Estadstica de prueba
SSxx
s
1

Pru

Ho
Regin de rechazo t < t

eba de una cola superior
0
1
=
0
1
> Ha
Estadstica de prueba
SSxx
s
1

Regin de rechazo t > t

Ejemplo
Para nuestro ejemplo de compresin del aislante probamos la siguiente
hiptesis en los siguientes pasos:

a. Ho 0
1
=

0
1
Ha

b. Nivel de significancia =0.05 n = 5 n-2=3
t
0.025, 3
= 3.182
-t
0.025, 3
= -3.182

c. Estadstico de prueba
1
1
S
T = =
SSxx
S
1
= 7 . 3
19 . 0
61 .
7 . 0
=
7
=
. Decisin estadstica

Como T=3.7 es mayor que el t de la tabla t
0.023, 3
= 3.182 se rechazara la
hiptesis nula. Esto significa que
10

d

1
es diferente se cero, la inferencia
sobre le parmetro
0
no tiene mucho significado en el anlisis de la
regresin.
i se tomo la decisin de hacer pruebas de hiptesis sobre este intercepto se
ebe utilizar el siguiente estadstico.

S
d
0 0

T =
0
0 0

=
nSSxx
x
i
2
2
SSxx
x
x
1
2
0 0

INTERVALO DE CONFIANZA PARA
1

Otra manera de hacer inferencia acerca de la pendiente del modelo es a
travs de la estimacin por intervalo. Un intervalo de confianza esta dado
por la siguiente expresin

1
2
1
S t donde
SSxx
S
S =

Ejemplo: Determine un intervalo de confianza para nuestro ejemplo con un 95% de
confianza

SSxx
S
t
3 , 025 . 0 1
= 61 . 0 7 . 0
10
61 . 0
185 . 3 7 . 0 =

45 . 0 31 . 1 09 . 0
1
=
p

Un intervalo de confianza para
0
ser el siguiente
2 ,
2
0
, S
0
nSSxx
x
t
n
i
n
2 ,
2
0

Pag , 55 56 en cio
R Y PREDECIR
Un e l modelo es el mas adecuado a travs del
oeficiente de determinacin o pruebas de hiptesis a los parmetros. Este
a e creado, que es la de
valor de y para unos valores particulares de x, los usos
s comunes de los modelos probabilsticas son:

1. Estimar el valor medio de y, E(y/x
p
) para un valor especifico de x. Para
nuestro ejemplo queremos estimar el valor medio de la compresin para
una presin de 40 lb. (x = 4) por lo tanto, E(y / x = 4)= =

Taller: inas 557 8, 559, 0, 561 m os los op nales

EMPLEO DEL MODELO PARA ESTIMA

a vez que se det rmina si e
c
deber utilizarse para la finalid d por la cual fu
estimar o predecir el
m
) 4 (
1 0

+
-0.1+0.7(4)=2.7
E(y / x = 4)=2.7 se espera una compresin de 2.7 cm / lb.
ara un x dado.
= -0.1+0.7(4)=2.7=
esto quiere decir que para una presin de 40 lbs se pronostica una
compresin de 2.7 cm / lbs.

omo puede observarse tanto para estimar el valor medio como para
redecir un valor en particular para y para un valor dado de x se aplica el
ismo modelo, la diferencia radica en su interpretacin y en la exactitud de
estimacin y prediccin.
n el caso de la estimacin debe verse como varios experimentos en los
uales se toma un solo valor de x
0
en todos los experimentos y se registra
s valores observados en .
n el segundo caso en un solo experimento y se pronostica el valor de .

AJUSTE DE CURVAS
lgunas veces la dispersin de los puntos no indica una relacin lineal
ntre las variables x,y pero se puede visualizar alguna otra curva estndar
onocida y = f(x); la cual se puede aproximar a los datos. Algunas de estas
urvas estandar, donde y es la variable dependiente y x la variable
dependiente son:
) Curva parablica: y =
) Curva cbica: y = +
) Curva hiperblica: y =

2. El otro uso del modelo probabilstico es el r de predecir el valor de
y en
particular p
0 1 0
x y

+ =
y
C
p
m
la

E
c

y lo
y E

A
e
c
c
in

1
2
2 2 1 1 0
x x + +

2
2
2 2 1 1 0
x x + +
3
3 3
x

1 1 0
1
x +
1/y =
1 1 0
x + 3

4) Curva compuesto: y =
x
; log y = log
1 0

1 0
log x +

7) Curva geomtrica: y = log y = log a + b log x

6) Curva exponencial: y =
x
e
1
0

b
ax
La representacin grfica de alguna de estas curvas es la siguiente:

Parabli a Exponencial Hip c erblica

Ejemplo: considere los siguientes datos que indican un
x ncial.

a grfica en el plano cartesiano para estos puntos se representa a
continuacin:
crecimiento e pone
L
0
200
400
600
800
1000
1200
1400
1600

La curva compuesto tiene la forma ; log y =
x
y
1 0
=
x x
1 0 1 0
log log + = + ; donde y , por lo tanto
buscamos la lnea de mnimos cuadrados que ajuste los siguientes datos:

X 1 2 3 4 5 6
0
0 log =
1
1 log =
Y 6 18 55 160 485 1460
X 1 2 3 4 5 6
Log y 0.7782 1.2553 1.7404 2.2041 2.6857 3.1644

Utilizando loas ecuaciones normales se tiene que :

0
= 0.3028
1
= 0.4767

log
0
= 0.30228; se tiene que, =
0
anti log 0.30228

0
= 0 . 2
0 . 3 log
4767 . 0 log log
1 1 1
1 1 1
= =
= =

anti

Por lo tanto
x
y
1 0
= el modelo que se utilizara.

El paquete estadstico SPSS dispone de 11 modelos o curvas de ajustes que
se pueden probar a un conjunto de datos. Dichas curvas se presentan a
continua

cin:

INTERVALO DE CONFIANZA PARA LA RESPUESTA
MEDIA

Un intervalo de confianza para la respuesta media para un valor especifico
de x, por ejemplo x
p
se conoce como intervalo para E(y / x
p
)=
p
x
1 0
+
) a partir de los
es
posible obtener una estimacin puntual para E(y / x
p
estimadores de y E(y / x
p
)=
p
x
1 0
+ .

La varianza de
+ =
SSxx n
x
y
V
x x
p
p
2
2
1

Demostracin:

haciendo x = x
p
y
_
_ _
reemplazando
Xp Y

+ =
1 0

_
1 0
x y

=

0
1 1
= + = Xp x y Y
+ =
1
x Xp y Y
_
Sxx
SSxy
=
x Xp
_
+ =
i
y x x
Sxx
y
_
1
_

Y

i
i
i
y
Sxx
x x x Xp
n
y

+ =
_ _
1
Y

i
y
SSxx

i p
x x x x
n
Y
+ =
_ _
1
( )
i
i p
y V
SSxx
x x x x
n
Y V
_ _
1
+ =

2
( )
2
x x x x x x x
i p i
2
2
_
2
_ _
2
2 1
+ =
SSxx SSxx
x
n n
Y V
p

( )
2
2
2
_
2
_ _
2
x x x x x x
n
i p p
2

+

+ =
SSxx SSxx n n
y V
( )
2
2
2
_
2
_
1
+ =
SSxx
x x x x
n
y V
i p
=
( )
2
2
2
1
+
SSxx
SSxx x x
n
p

( )
2
2
_
1
+ =
SSxx
x x
n
y
p

Con lo cual queda demostrado
media estar dada por:
V

Un intervalo de confianza alrededor de la respuesta
SSxx
x x
p
+
_
1
2
n
t
Y
E
y
E

x X
n
P

2 ,
2
SSxx
n
P

2 ,
2

Para una presin de 40 libras por pulgada cuadrada x
x x
n
t
X
Y
E
p
+
+
2
_
2
1
p
= 4, dado n = 5,
y = n-2=3 el intervalo para un 95% de confianza sera

SSxx
x x
n
S t y
o sea
p
+
2

2
_
1
x
4
SSxx
181 . 3
025 . 0
= t
S t
2
025 . 0
Y ; S=0.61, = X SSxx=10 y
+
5
1
_
_
y 3 7 . 2 =
( )
( )
2
10
3 4
5
1
61 . 0 182 . 3 7 .
+ =2.7 3.182*0.61*0.55 = 2.7 2 1.1= (3.8,1.6)

int .6 ien pre ia cund
1.1es sometida 40 libras de presin en el 9 ve
PREDICCION DE NUEVAS OBSERVACIONES

Se estima que el ervalo 1 a 3.8 cont e la com sin med o
5% de las ces.

Un intervalo de confianza para un valor nuevo de y cuando X = Xp esta
dado por la siguiente expresin

+ +
2
_
2
2 ,
2
1
1
SSxx
x x
n
t y
o
n
n

p
y
+ + +
2
_
2
2 ,
2
1
1
SSxx
x x
n
t y
o
n
n

Ejemplo: Con el fin de predecir la compresin de aterial
aislante en particular Xp = 4 calculamos el intervalo de prediccin del 95%
omo
un trozo de m
c
2 ,
t
n
n
+ +
2
2
1
1
SSxx
x x
n
y
o
=
2
_
( )
10
3 4
5
1
1 ) 61 . 0 )( 182 . 3 ( 7 . 2
2
+ +
) 14 . 1 )( 61 . 0 )( 182 . 3 ( 7 . 2 2 = 7 . 2 = [0.05 1.9)
t predecimos que la compresin del trozo de material aislante
star dentro (0.5 a 4.9) pulgadas.
continuacin se presenta el grafico de intervalos y se puede observar
2 .

Por lo tan o
e

A
como la amplitud del intervalo para una prediccin de un valor particular es
mayor

EGRESI

REGRESIN LINEAL POLINOMIAL

R N LINEAL SIMPLE CON SPSS

Escribir una introduccin como se maneja el SPSS y resolver todos los
ejercicios del texto gua del SPSS.

En situaciones donde la relacin funcional entre la respuesta Y y la variable
independiente X no se puede aproximar adecuadamente con una relacin
neal, en algunas ocasiones es posible obtener un ajuste polinomial, es
decir, podemos ajustar el conjunto de datos a una relacin funcional de la
a:
r
0,
1,...
r
son coeficientes de la regresin que tienen que estimarse
os
j donde j = 1, 2, ...r, y son aquellos valores que minimizan

i

=

ara obtener estos valores, obtenemos las derivadas de la suma de
cuadra r a mo a
obtener los valores que minimizan la suma de cuadrados, al realizar estos
asos y al organizar algunos trminos se obtienen las siguientes ecuaciones
li
form
Y =
0
+
1
X
1
+ ...+ rXr

+ e

onde D
de los n datos (Xi, Yi) i = 1,2,3...n; los estimadores de j los llamarem
2
n
1 1
1
0
)
.....

( r rX X Yi
r
P
dos anterio es respecto r
,.....
1 0

y luego iguala s a cero par
p
normales.

= = =
+ + + =
n
i
n
i
n
i
Xi Xi n Y
1 1
.
2
2 1 0
1
0
.....

=
n
i
r
Xi r
1
)

=
+
= = = =
+ + + + =
n
i
r
n
i
n
i
n
i
n
YiXi
i
Xi r Xi Xi Xi
1
1
1
3
2
1
2
1
1
0
1
..........

=
+
= = =
+ + + =
n
i
r
n
i
n
i
n
i
Xi r Xi Xi YiXi
1
2
1
3
1
1
2
0
1
2
. ..........

. . .
. .
. .
. .
. .
.
.
.
.

= =
+
=
+
= =
+ + + + =
n
i
r
n
i
r
n
i
r
n
i
r
n
i
r
Xi r Xi Xi Xi YiXi
1
2
1
2
2
1
1
1
1
0
1
.........

ntes de ajustar un polinomio de grado r a un conjunto de datos debe
alizarse un diagrama de dispersin para determinar el valor ms probable
e r, o a travs del paquete SPSS este podr determinar el valor ms
robable de r encontrando el coeficiente de determinacin de cada modelo.
iempre debe usar el menor grado del polinomio posible que parezca
escribir los datos adecuadamente.

A
re
d
p
S
d

Ejemplo: Ajuste una funcin polinomial a los siguientes datos:
x 1 2 3 4 5 6 7 8 9 10
y 20.6 30.8 55 71.4 97.3 131.8 156.3 197.3 238.7 291.7

Realizando una grafica de dispersin y observando los modelos lineal,
cuadrtico y cbico se obtuvo los siguientes resultados.
MODELO R
2
b
o
b
1
b
2
b
3

LINEAL 0.967 -34.107 29.672
CUADRATICO 0.999 12.6433 6.2971 2.1250
CUBICO 0.999 5.1567 12.9374 0.6853 0.0873

GRAFICO DE DISPERSION
0
100
200
300
400
0 5 10 15
X
Y

Observando los resultados anteriores tanto el grfico como la dispersin de
s datos estos sugieren que se debe ajustar un modelo cuadrtico y estas
on sus ecuaciones:
lo
s

= = = =
+ + + =
n
i
n
i
n
i
r
n
i
r Xi Xi n Y
1 1 1
.
2
2 1 0
1
.....

)
Xi

=
+
= =
+ =
n
i
r
n
i
n
i
Xi r Xi YiXi
1
1
1
1
1
0
1

= =
+ + +
n
i
n
i
Xi Xi
3
2
1
2
..........

+
=
+ + + =
n
r
n n
i
n
i
Xi r Xi Xi YiXi
2 3 2
0
1
2
. ..........

= = = i i 1 1
1
1

= 385
2
1
X
= 3025
3
1
X
= 25333
4
1
X
= 55
1
X

= 1 . 1291
1
Y
= 3 . 9549
1 1
X Y
= 9 . 77758
1
2
1
Y X

1291.1 =
954

777

Estas ecuaciones normales se pueden escribir en notacin matricial como
sigue:

9549.3 385 3025
77758.9 385 3025 25333

3025 9549.3
3 77758.9

= 12.6433 =6.2971 =2.1250
CAPITULO 3
SIN LINEAL MLTIPLE

En a ayo a de de un experimento puede
predecirse de manera m adecuada no con base en una sola variable de
entrada independiente sino con una coleccin de k variables
independientes, donde Y se puede expresar mediante la siguiente relacin:

Y =
2 1 0
385
55
10 + +

9.3 =
2 1 0
3025
385
55 + +
58.9 =
2 1 0
25333
3025
385 + +
0
1291.1 10 55 385

1
55

2

Resolviendo este sistema para i
se tiene:

0
10 55 385 1291.1
55 385

1
2
385 3025 253

- 1
0

REGRE
l m r las aplicaciones, la respuesta
as
e kXk X X + + + + + ......
2 2 1 1 0

Donde X
j
el nmero de variables j
independientes y e es el error aleatorio distribuido normal con
media cero za .

Se supone que los parmetros
, j = 1, 2, 3, .... k es
y varian constante (
2
)
k ,...... , ,
2 1 0
y no se conocen y
deben estimarse a partir de los datos, los cuales se pueden
representar como:

X Y
2
1 1 1 12 2 11 1 0
.. .......... ........ e X X X
k k j j
+ + + + + =
1

1 2
.. .......... ........ e X X X X Y
k k j j 2 2 2 22 2 21 0
+ + + + + =

X Yi
i ik k j i j i i
e X X X + + + + + = .. .......... .....
2 2 1 0
...
1

e Yn
n nk k j n j n n
X X X X + + + + + = .. .......... ........
2 2 1 1 0

Estas ecuaciones pueden representarse matricialmente de la siguiente
maner

Y 1 X X ...........X ........X
1

Y 1 X
21
X
22
...........X
2j
..........X e
2

i i1
X
i2
............X
ij
...........X
ik
e

X
n1
...X
nk
e
n

En resume
a:
1 11

12 1j 1k
0
e
1

2k

2

i
Y 1 X
i

k
Y
n
1 X
n2
...........X
nj

n se tiene . + = X Y

El valor esperado de Yi es como sigue:

E(Yi) =
ik k j i j i i
X X X X + + + + .. .......... ........
2 2 1 1 0

Un superficie,
llamada superficie de respuesta.

a grfica de E(y) como funcin de X
1
y X
2
describe una
Y

0 ) (Y E
2 2 1
X X
1
+ + =

En gran parte de las aplicaciones reales aplicaremos un modelo de la
forma:

1 4 2 1 3 2 2 1 1 0
) ( X X X X X X Y E + + + + =
Que corre

X
2
X
1

2
+
2
2 5

sponde a una curvatura en la superficie de respuesta:

X
2
X
1

Despus de seleccionar la parte determinstica de un modelo E(Y), todo Y
e la siguiente manera:
Y = X + E E(Y)= X
ULTIPLE

equivalente a la parte deterministica:

puede representarse d

SUPUESTOS DEL ANLISIS DE REGRESIN
M

1. E(E) = 0
Esto implica que la media de Y es
Y E
K K
X X X .. ..........
2 2 1 1
+ +
3. La distribucin de probabilidad de E es normal.
rrores aleatorios son independientes en un sentido
probabilstico.

INTERPRETACIN DE LOS SUPUESTOS

1. El valor esperado de los errores es cero.

1 1

E(E) = E E
2
= E(E
2
) = 0

conceptos

E = (e
1
, e
2
, .............e
n
E E - E(E) (E E

) (
0
+ =

2. Para todos los valores de la variable independiente X
1
, X
2
, .......X
K
la
varianza de E es constante
2
.
4. Los e

E

E(E ) 0

E
3
E(E
3
)

0

2. Para interpretar los supuestos 2 y 4 recordaremos algunos
de los vectores aleatorios.

)

COV( ) = E ( - E( ) = E ( - 0) ( - 0) E E

e
1
e
(E E) = E e
1
, e
2
, .......e
n
) =

e
n

E

=

2

=
2
e
1
) E(e
2 2
e
n
)
.
.
E(e
n
e
1
) E(e
n
e
2
)......... E(e
n
2

i
) = E (e
i
2
) - = E(e
i
2
) 0 = E(e
i
) =
i
2

OV (e
i
e
J
)) = E (e
i
e
j
) =
ij
2
. (
.

e
1
2
e
1
e
2
............ e
1
e
n

e
2
e
1
e
2
2
............. e
2
e
n
.
.
e
n
e
1
e
n
e
2
............. e
n

E(e
1
2
) E(e
1
e
2
).......... E(e
1
e
n
)
E(e
2
)........... E(e

.

)

( ) [ ]
2
i
e E V(e

C ) = E (e
i
- E (e
i
)) (e
J
- E (e
J
( ) ( ) ( ) ( )
j i j i j i
e e E e E e E e e E =
Reemplazando estas expresiones en la matriz anterior se tiene que:
1
2

12
...........
1n

E) =
21
2
2
...........
2n

r es simtrica esto debido a que
ij
=
ji
.
1 2 n

COV(

n1
n2
...........
n
2

La matriz anterio

Si los supuestos 2 y 4 son verdaderos se tiene que:

2
=
2
= ......
2
=
2
y

= 0 para i j
ij

Por lo tanto la matriz de covarianza presenta la si nt ru t

guie e est c ura:
..... 0
E) = 0
2
0....... 0 =
2
I

0 0 0.......
2
COV(E) =
2
I

El supuesto nmero tres afirma que el vector tiene una distribucin
norma multivariada:

f(E) = f (e
1
,

e
2
,

....... e
n
)

0 0. .

2
COV(

DISTRIBUCIN NORMAL MULTIVARIADA

E
l

La distribucin normal multivariada se define como una funcin de

f(x) = 1, x
1
1
x x

densidad conjunta:
f(x 2, .. x3) 1 e
( 2 / (
)) ( )'

2 / 1
2
n

donde
n = es l
=
X = V
= valor esperado
ueda expresado de la siguiente manera:
,

e
n
:
nmero de componentes en el vector e
COV(X)
ector aleatorio

Si los supuestos 1, 3 y 4 son verdaderos la distribucin normal multivariada
para el vector de errores q

f(E) = f (e
1 2
,

....... e ) = ) 1 e
)
1
( I

2 / 1
2
n

bserve que I
=
2
1
O

Una manera si ara expresar que un ector a eato es no mplificada p v l rio rmal
ultivariada se representa de la siguiente manera:
= N (, )
e tor de los errores y bajo los supuestos se tiene que:
m

X

= vector

= COV(X)

Para l caso del vec

= N (0, I
1
)
2

AJUSTE DEL MODELO POR EL MTODO
DE LOS MINIMOS CUADRADOS

senta de la siguiente manera: El modelo general mltiple se repre

i ik k i
e X X Yi + + + = .. ..........
1 1 0

Llamaremos
k

. ..........
1 0
los estimadores de i donde i = 1, 2, ....k.
ple la estimacin de los parmetros
se har po aquellos que
im .

Al igual que en la regresin lineal sim
i
r el mtodo de los mnimos cuadrados (se tomar

min icen la sumatoria de los errores al cuadrado

e
1

e
2

EE = (e
1
,

e
2
,

....... e
n
)

. =

=
2 2
) ( y y e
i i
= SSE

e
n
=
+ + =
n
ik k i i
X X y
2
1 1 0
)) ........ ( (
Para determinar los estimadores de mnimos cuadrados, tomamos las
la suma de cuadrados anteriores, primero con
y despus , e igualamos a cero las k+1
.

SSE =
i
y y
2
) (
i 1

derivadas parciales de
specto a
, luego a
0 1
re
ecuaciones.

0
0
=

SSE
0
1
=

SSE
0
K
SSE

ados:
0 )
..... ..........

( 2 X X X y
Y se obtienen los siguientes result

=
2 2 1 1 0 ik k i i i

..... ..........

( 2
2 2 1 1 0 1 i i i
X X y X = 0 )
ik k
X
0 )
..... ..........

(
2 2 1 1 0 2 ik k i i i i
X X X y X
0 )
..... ..........

2 2 ik k i
X X
Rescribiendo estas ecuaciones obtenemos que los estimadores de
mnimos cuadrados satisfacen el siguiente conjunto de
ecuaciones lineales, llamadas ecuaciones normales:

i

2 =
.
.
.
( 2
1 1 0 i i ik
X y X =

k

. ..........
0

+ +
ik k i i i
X X y
... ..........
2 2 1 1 0

+ + = X n

+ =
i i
X
1 0
+ + +
ik ik k i i i i
X X X X X y X
... ..........

1 2 2
2
1 1 1

+ + + = ........

X X X X X X
+
2
2 2
... ..
ik k i
X
Estas ecuaciones normales pueden representarse matricialmente de la
te
XX = X
Demostracin:

.
.
X
1k
X
2k
....... X
nk
1 X
n1
X
n2
X

X
ik

XX X
11
X
i1
2
X
i2
X
i1
X
ik
X
i1
1 1 0 ik ik i ik i k i
y

siguien manera:

1 1........ 1 1 X
11
X
12 ........
X
1K

X
11
X
21
...... X
n1
1 X
21
X
22.......
X
2K

XX =
X
12
X
22
....... X
n2
1 ......
. .
.
nk

n X
i1
X
i2
................

0

=
1

X
ik
X
i1
X
ik
X
i2
X
ik
X
ik
2

X
11
X ... X
n1
Y
2
X =
X
12
X .... X
n2

.
.
X
1k
X
2k
....... X
nk
Y
n
Y
1
X
ik
Con lo cual queda demostrado que una manera de representar las
ecuaciones normales mediante notacin matricial est dada por la
siguiente expresin:

XX = X

a matriz XX proporciona la siguiente informacin:

a. Las sumas simples de cada variable .
b. Sobre la diagonal principal la suma de cuadrados .
c. Fuera de los elementos de la diagonal se presenta la suma
simple de los productos cruzados donde L K
triz simtrica
(XX) = XX.
s expresadas en forma
1 1........ 1 Y
1
Y
1
21
... Y
1
X
i1

=
22
... Y
1
X
i2

=
n
i
ik
X
1
=
n
i
ik
X
1
2
jk
n
i
iL
X X
=1

Una caracterstica importante de XX es que una ma

Otra manera de llegar a las ecuaciones normale
matricial es la siguiente

= + =

= (
)(
) =

Recordar que
adems
es un escalar y es igual a su
+
transpuesto.

(
) =
Se tiene
= 2
=
stas son las ecuaciones normales representadas matricialmente y
alculadas con anterioridad al despejar de dichas ecuaciones se tiene
u =()
-
lar la estimacin de los

RESIN y

/ = 2 + 2 igualamos a cero

2 + 2
= 0
2
= 2

=
E
c
e
q

Ejemplo : Para nuestro problema tradicional calcu
i mediante notacin matricial :

PRESION x COMP
1 1
2 1
3 2
4 2
5 4

1
1
2 1

1 4 = = 3
5 1 4

1 1
1 1
2 1 3 2
= 2 =
4 1

1 1
1 1 1 2 5 15

1 1 1
X = 1 3 =
1 2 3 4 5 1 4 15 55
1 5

= 1 2 3 4 5 2 =
2 37

1 1 1 1 1 1
1 10
4

15
1
)
1
=
55
inversa de una matriz de 2x2
a
21
a
22

= Matriz adjunta / determinante
eterminante A = a
11
* a
22
- a
12
* a
21

A
+
= cofactor de a
21
=-a
12

cofactor de a
22
= a
11

55 1
2

0.3 0.1
5
(
15

Recordemos como se halla la

a
11
a
12

=

+

d
cofactor de a
11
= a
22

cofactor de a
12
=-a
21

5
( )
1
X X =
-15 5

55 * 5 15 =50

1.1 -0.3
( )
1
X = X

0.3 10 0.1
-0.3 0.1 37 0.7
= o cuacin de prediccin es
1.1
= ()
1
= =

nt la e
0
= -0.1
1
0.7 y por lo ta

= 0.1 0.7x +
a uciones anteriores.
992) utilizaron un modelo de regresin
el dor para dar
o ero de
e
o e se encuentra la mquina (X
2
).
X
1
X
2
Y

Result dos que concuerdan con la sol

Ejemplo : Montgomery y Peck (1
para r acionar la cantidad de tiempo que requiere un vende
servici a una m quin expend ora a a ed de refrescos, (Y) con el nm
envases contenidos en la mquina (X) y la distancia del vehculo d
servici al sitio dond

OBSERVACION
1 2 50 9.95
2 8 110 24.45
3 11 120 31.75
4 10 550 35
5 8 295 25.02
6 4 200 16.86
7 2 375 14.38
8 2 52 9.6
9 9 100 24.35
10 8 300 27.5
11 4 412 17.08
12 11 400 37
13 12 500 41.95
14 2 360 11.66
15 4 205 21.65
16 4 400 17.89
17 20 600 69
18 10.30 1 585
19 34.93 10 540
20 15 250 46.59
21 15 290 44.88
22 16 510 54.12
23 17 590 56.23
24 6 100 22.13
25 5 400 21.15

X
0
X
1
X
2

9.95
10 24.45
11 120 31.75
10 550
1 8 295
1 4 200
2 375 14.38
0
100 24.35
300 27.50
4 205 21.65
400 17.89
20 600 69
10.30
34.93
15 250 46.59
15 290 44.88
1 16 510 54.12
1 590 56.63
1 6 100 22.13
5 40 21.15

1

1 2 50
1 8 1
1
1 35
25.02
16.86
1
1 2 52 9.6
1 9
1 8
1 4 412 17.08
1 11 400 37
1 12 500 41.95
= 1 2 360 = 11.66
1
1 4
1
1 1 585
10 540 1
1
1
17

1 0

2 50
1 1............1 1 8 110
= 2 8.............5 . . .
50 110..........400 1 5 1100

25 206 8294
= 206 2396 77177
8294 77177 3531848
.45

274811.31

2.74426964
2 0.01252781

()
-1
=

El modelo de predicci

9.
1 1...........1 24
45

= 2 8 5 .
50 110 400 21.15

725.82
= 8008.37
274811.31

= ()
-1

25 206 8294
-1
725.82
1 = 206 2396 77177 8008.37
2 8294 77177 3531848

2.26379143
1 =

0.21653 0.007491 0.000340
0.007491 0.001671 -0.000019
0.000340 0.0000019 -0.000015
n ser el siguiente:
Y
= 2.26379 + 2.74427X1 + 0.01253X2

PROPIEDADES DE LOS ESTIMADORES DE MINIMOS
os estimadores de en la regresin mltiple a travs del mtodo de los
dos producen estimadores insesgados y de mnima
arianza.
CUADRADOS

L
mnimos cuadra
v

A continuacin solo se demostrar que son insesgados y se hallar la matriz
dichos estimadores.

=()
-1
()+()
-1

(
Con
b. MATRIZ DE COVARIAN
e () se tiene que =+()
-1

=()
]
COV )=[( )( )]
OV )=[()
-1
()
-1]
)
-1
2
()
-1
] =
2
[()
-1
()()
-1
]
lamaremos () = C
ica

2
C
= C
01
=C
10
; C
02
=C
20
; C
12
=C
21

=
2
C
00
; =
2
C
11
; =
2
C
22

OV i)= C
ij

de covarianza para

a. ESPERANZA DE
=()
-1
=()
-1
(+)
=+()
(
)=+() ()= Puesto que ()=0
)=
cluimos que
es un estimador insesgado

ZAS PARA
por lo tanto
COV(
)=[(
))(
COV(
)=[()
-1
()
-1
)]

(
C
COV(
)=[()
-1
()()
-1
]
OV(
)=[( C
COV(
)=
2
()
-1

1
L

Donde C es simtr
COV(
)=
2
()
-1
=

C
00
C
01
C
02

C C
01
C
11
C
12

C
20
C
21
C
22

2
0
2
COV(
0
,
1
)=
2
C
01
; COV(
2
)=
2
C
02

2
( i C
V )=
2
C
jj

OV )=
2
C
ij
=
2
C
ji
ij

ESTIMACION DE , LA VARIANZA DE

=SSE=( )( )=2 +
Puesto que = se tiene que
SSE=2 + =
nsesgado de esta dado por el error o error cuadrtico
j
(
(
j
C
Un estimador i
edio. m

p n
y x y y SSE
` ` `
p n
S
= =
2 2

E E erro tico para los dos anteriores
2

= =
=[1 1 2 2 4
1
2 = 26
2
= 24.9
SE==2624.9=1.1

jemplo: stimar el r cuadr medio
ejemplos

0.1 10

0.7 37

] 1

4

=[0.1 0.7]
10

37
S
367 . 0
2 5
=
=
p n
S ;
1 . 1
2
SSE
61 . 0 605 . 0 367 . 0 = = S
19 . 0 0367 . 0 ; 0367 . 0 1 . 0 * 367 . 0
1 11
1 = = = = =
C
2
6355 . 0 4037 . 0 ; 04037 . 0 1 . 1 * 367 . 0
0 00
0
2
= = = = =
C
Ejemplo: para el problema del vendedor se tiene
=
=

25
1
2
i
yi =27177.4510
725.8
=[2.26379110 2.74426964 0.01252781] 8 008.37
274811.3

=27062.7775

SSE=
=27177.451027062.7775
=115.1735
2
=
3 25 p n
1735 . 15
= =115.1735 =
1 SSE
2352 . 5
22
=
1735 . 115
= 115.1735
2
= 2352 . 5 = 2.28805

Ejercicio: hallar ; ; ; ;
0
2

1
2

2
2

0

PRUEBAS DE HIPTESIS EN LA REGRESIN LINEAL
MLTIPLE
pruebas d
p
stos

regresin x
1
, x
2
, ..., x
k
. La hiptesis apropiada es:

a
J
0

l rechazo de la hiptesis nula indica que almenos una de las
J
es diferente

variacin
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
F Signifi-
cancia

En la regresin lineal mltiple existen e hiptesis sobre todos los
parmetros del modelo para probar la significancia del mismo, y sobre cada
rmetro del modelo para determinar que una variable en particular tiene a
alguna contribucin al modelo (esto es posible si se cumplen los supue
el modelo). d

Significancia del modelo

La prueba para la significancia del modelo determina si existe una relacin
lineal entre la variable de respuesta y y un subconjunto de las variables de
Ho
1
=
2
= ....... =
p
= 0
almenos para una J H
E
de cero. Para probar la hiptesis de la significancia del modelo cobra
importancia la tabla de anlisis de varianza.

Fuente de
Variacin SSR P 1 CMR= SSR/P 1 CMR/CME p
Residuo SSE N P CME=SSE/N P
Total SS
yy
N 1

Donde:

( )
( )
= y y y SS
i
2
2
__
=
= =
n
y
y x y y SSR
y x y y x y y y y
n
y
i
i
i i i
i
2
2
__
2
2
2
` `
` ` ` ` `

a tabla de anlisis de varianza plantea que la suma de cuadrados total se
emostracin:
SE = y`y - `x`y
Sumando y

i yy
SSE
L
puede descomponer en dos partes
SS
yy
= SSR + SSE

D

e las frmulas anteriores se tiene que D

S

restando
( )
n
y
i
2
se tiene
( ) ( )
SSE = y`y -
n
- [`x`y -
y
i
2
n
y
i
2
]
SSE = SS
yy
SSR despejando SS
yy

SS
yy
= SSE SSR

i la hiptesis nula es verdadera Ho = 0 para toda J se tiene que S
J
SSR
tiene una distribucin Chi cuadrado tambin puede demostrarse que
2
2
SSE
tambin se distribuye Chi cuadrado
( )
2 2
s P n SSE
P n
SSE
s =
=
( )
2 2
2

SSE s P n
=

( )
( )
( )
( )
CME
CMR
P n
SSE
P
SSR
P n
SSE
P
SSR
f =
=
1 1
2
2
0
De la definicin de f se tiene que

echazar la hiptesis nula si f
0
es mayor a f
, P-1,n-P o si el valor
varianza es menor a .
jemplo: Para el problema de regresin del vendedor rechazar la prueba
de hiptesis.
o:
J
= 0 J = 1, 2, ...., p
a:
J
0 para almenos un J
`
Debemos r
de p en el anlisis de

E

H
H

y
(
y = 271779510
)
( )
25 n
`x`y = 27062.7775

De la anterior informac
82 . 725
2
2
=
y

in se tiene que:

( )
( )
9447 . 6105
25
82 . 725
. 27177 ` = =
n
y
y y SS
yy
4510
2
2
=

Y la suma de cuadrados de la regresin se calcula de la siguiente manera:

( )
( )
1735 . 115 7712 . 5990 944 . 6105 = = = SSR SS SSE
yy
7712 . 5990
25
7775 . 27061 ` ` = = =
n
y x SSR

82 . 725
2
2
y
17 . 572
2352 . 5
3856 . 29
2352 . 5
1735 . 115
= =
= = =
CMR
f
SSE
CME

95
22
38 . 2995
2
7712 . 5990
1
7712 . 5990
0
=
=
P n
P
CMR
= 3.44
Como f
0
> f
0.05, 2, 22
572.17 > 3.44 se rechaza la hiptesis nula

=
CME

f
0.05, 2, 22

Fuente de
variacin
Suma de
cuadrados
Grados de
libertad
Cuadrado
medio
F Significancia
Variacin 5990.7712 2 2995.3856 572.17 0.0000001
Residuo 115.1735 22 5.2352
Total 6105.9447 24

O en la anova anterior el valor de p es mucho menor que .

area: Para el problema de la presin y compresin probar:
0 1

0
0 o
1
0

Pruebas sobre los coeficientes individuales de la regresin y sobre un subconjunto
n ocasiones se tiene inters en hacer pruebas de hiptesis e intervalos de
onfianza ebas son
portantes para determ
e ser ms eficaz con la inclusin
e una variable o con la eliminacin de una o ms variables.
a adicin de una variable al modelo de regresin siempre hace que la
suma de los cuadrados de la regresin aumente y la suma de los cuadrados
el error disminuyan.

T

Ho: = = 0
a: H

E
c sobre cada coeficiente de la regresin. Dichas pru
inar el valor potencial de cada una de las variables im
del modelo de regresin. El modelo pued
d

L
d

Por lo tanto, debe si el aumento a la suma de cuadrados de la regresin es
suficientemente grande como para justificar el uso de una variable mas en
l modelo. e

Por otra parte, la adicin de una variable sin importancia puede aumentar el
error cuadrtico medio, esto disminuye la calidad del modelo debido a que
el estadstico f disminuye
P n

Para realizar las diferentes pruebas de hiptesis y construir los intervalos de
confianza, se hace la supos
SSE
P
SSR
CME
CMR
f
= =
1

icin que los supuestos del modelo se cumplen.

a) Intervalos de confianza
stn basados en el estadstico

JJ
J J
C s
t
2
=

E donde C
JJ
es el J esimo
elemento de la matriz (x`x)
-1
y s la estimacin de la varianza del error
2
es
P n
Un intervalo de confianza para
J
esta dado por la siguiente expresin:

SSE
=
2

s
JJ J J JJ J
C s P n t
2
,
C s P n t
2
2
2
+

e valo de confianza del 95% para el parmetro
e refresco, ntese que la
es el elemento de la diagonal de
(x`
est

E r j mplo: Construir un inte
1
del problema de tiempo de suministro d
estimacin puntual de
1
74427 . 2
1
=
x)
-1
que corresponde a
1
es C
11
= 0.001671; s
2
= 5.2352 y en la tabla t
udent
074 . 2 22 , ,
025 . 0
= = t P n

intervalo estar dado por la siguiente expresin:
( )
2
t
Un

( )
(
7 . 2
P

Ejem
1
presi

`
11
00
=
=
C
x x

) 95 . 0 93825 . 2 55029 . 2
001671 . 0 * 2352 . 5 074 . 2 7442 . 2 001671 . 0 * 2352 . 5 074 . 2 4427
1
1
=
+

plo: Calcule un intervalo de confianza para en el problema de la
n y compresin del 95% de confianza:
3 . 0 1 . 1

C
( )
1 . 0
1 . 1
1 . 0 3 . 0
1
95 . 0 31 . 1 09 . 0
7 . 0 192 . 0 * 182 . 3 192 . 0 * 182 . 3
7 . 0
,
1 . 0 * 367 .
1
1
2
11
1
=

+
=
P
n t
S

182 . 3 3 ,
025 . 0
= = t P
192 . 0 0
2
= = C s

b) Pruebas de hiptesis

Considere los datos sobre tiempo de suministro de refresco y supngase
que s
difere

e busca probar la hiptesis que el coeficiente de regresin de x
1
es
nte de cero.
Ho:
1
= 0 = 0.05
Ha:
1
0
349 . 29
74427 . 2
=
074 . 2 22 , ,
025 . 0
2
11
= = t P n t

001671 . 0 * 2352 . 5
2
1
= =
C s
t
la Ho:
1
= 0 y se concluye que la
1
portante en el modelo.

Ta r sta la 625.

plearse para predecir observaciones
rrespondientes a valores particulares
l
n intervalo de prediccin del 100(1 - ) para esta observacin futura es:

Como 074 . 2 22 ,
025 . 0
= t se rechaza
ariable x (nmero de envases tiene contribucin im v
lle : En el SPSS realizar los ejercicios desde la pgina 619 ha

PREDICCIN DE NUEVAS OBSERVACIONES

Un m delo de regresin puede em o
futuras de la variable de respuesta y, co
e as variables independientes, por ejemplo: d
X
i1
, X
i2
, ..., X
ip
si X
i
`= (1, X
i1
, X
i2
, ..., X
ip
) entonces una estimacin puntual
de la observacin futura Y
i
en el punto X
i1
, X
i2
, ..., X
ip
es

= `
i i
x y .

U

( ) ( ) ( ) ( ) ( ) ( )
i i i
x x x x s P n t y t
1
2
2 2
` ` 1 , ,
+ +
i i i
y x x x x s P n y
1
2
` ` 1
+

Ejemplo: Supngase que el embotellador de refrescos desea construir un
intervalo de prediccin del 95% para el tiempo de suministro a un
distribuidor donde x
1
= 8 envases y la distancia que camina el empleado es
x
2
= 275 pies. Por tanto

X
i
` = [1 8 275] y la estima con puntual para

[ ] adems X y
i i
01253 . 0

66 . 27 74427 . 2 275 8 1 ` =

= =
26379 . 2

( ) [ ] 0444 . 0
275
8
1
0000015 . 0 000019 . 0 000340 . 0
000019 . 0 001671 . 0 00749 . 0
00 . 0 007491 . 0 21653 . 0
034
275 8 1 ` `
1
=
o o
x x x

x
( ) ( ) ( ) 95 . 0 0444 . 0 1 * 2352 . 5 074 . 2 66 . 27 0444 . 0 1 * 2352 . 5 074 . 2 66 . 2
(
7 = + + +
i
y P
)
INTERVALO DE CONFIANZA PARA LA RESPUESTA MEDIA
e un intervalo de confianza para la respuesta
romedio en un punto en particular por ejemplo X
i1
, X
i2
, ..., X
ip
. El vector
i
se representa como:
i
X
1
P 95 . 0 51 . 32 81 . 22 =
i
y

Tambin puede obteners
p
x

=
ip
i i
X
X x
M
2

La respuesta promedio en este punto es
i
y
i
x
x x
y
` = =
la cual es
estimado por
i
y
x
x
`
.
El estimador anterior es insesgado ya que
i
y
y
x x
= =
` ` la
i

x x

( )
i
i
y
V
x x x x
x
1 2
` `
varianza es:

Un intervalo de confianza del 100(1-) para
i y
x puede construirse a
partir del estadstico:
( )
i
o y o y
x x x x s
x x
1 2
` `

El intervalo de confianza esta dado por la siguiente expresin:
( ) ( ) ( ) ( ) ( ) ( )
i i y i y i i i y
x x x x s P n t x x x x x x s P n t x
1
2
2
1
2
2
` ` , ` ` ,
+

Ejemplo: El embotellador de refrescos le gustara construir un intervalo de
onfianza del 95% para el tiempo promedio de suministro a un distribuidor
ue requiere x
1
= 8 envases y la distancia x
2
= 275 pies.
=
275
8
i
x
c
q

1
[ ] 86 . 27
01253 . 0
74427 . 2
. 2 26374
275 8 1 ` =
= =
o y
x x

La varianza es:
( ) [ ]

= =
275
8
1
0000015 . 0 000019 . 0 0034 . 0
000019 . 0 001671 . 0 007491 . 0
000540 . 0 007491 . 0 214653 . 0
275 8 1 2352 . 5 ` `
1 2
i i y
x x x x s x V

23266 . 0 =
i y
x V por tanto, un intervalo de confianza del 95% para el
suministro promedio es:

66 . 28 70 . 26
i y
x

MEDIDAS DE ADECUACIN DE UN MODELO

a) Coeficiente de determinacin mltiple

El coeficiente de determinacin mltiple R
23266 . 0 074 . 2 66 . 27 23266 . 0 074 . 2 +
i y
x

66 . 27
2
esta definido como:

yy yy
SS
SSE
SS
SSR
R = = 1
2
.

R
2
es una medida de la reduccin en la variabilidad de y obtenida mediante
el empleo de las variables de regresin x
1
, x
2
, ..., x
p
al igual que en el caso
de la regresin lineal simple -1 R
2
1.

Un valor de R
2
grande no necesariamente implica que el modelo de
gresin es bueno, la adicin de una nueva variable al modelo siempre
2
es una estadsticamente
tienen valores de R
2
grandes
ueden proporcionar predicciones pobres.
a raz cuadrada de R
2
se llama coeficiente de correlacin mltiple entre y
el conjunto de variables x
1
, x
2
, ..., x
k
, R es una medida de la asociacin
neal entre y x
1
, x
2
, ..., x
p
.
Ejemplo: El coeficiente de determinacin mltiple para nuestro modelo
re
aumenta R , sin importar si la variable
significativa. Es as como los modelos que
p

L
y
li

es:

981137 . 0
9447 . 6105
7712 . 5990
2
= = =
yy
SS
SSR
R

El 98.11% de la variabilidad en el tiempo suministrado y queda explicado
cuando se utiliza dos variables de regresin, volumen suministrado (x
1
) y
distancia (x
2
).

b) Anlisis de los residuos

Aleatoriedad (ver SPSS).
Normalidad (ver SPSS).
Intervalos de confianza para y,
y (ver SPSS)
Pruebas de normalidad
Para probar la normalidad de los datos se elige el men analizar del
SPSS estadsticos descriptivos explorar y se coloca en la pantalla
resultante en dependiente la variable sobre la cual se mide la
normalidad, en ambos se analiza los grficos y estadsticos en explorar
estadsticos se le coloca el chulito y si se desea se plantea un intervalo
y grficos en prueba de normalidad. A continuacin se
presentan los resultados que arroja esta corrida de SPSS.
de confianza para . En explorar grfico se teclea niveles de los
factores juntos

Grfico Q Q normal: entre ms prximo estn los puntos sobre
la recta mejor es el ajuste de normalidad.
En estadsticos descriptivos debe observarse los estadsticos de
asimetra y curtosis.

Asimetra = as
3
1
s
x x
i
i
3
__ n
=

donde
n
x x
s
i
=

2
__
Si as = 0; la distribucin es simtrica
Curtosis k =
Si as > 0; asimtrica a la derecha
Si as < 0; asimtrica a la izquierda

3
4
4
__
s
x x
i

La distribucin normal se caracteriza por tener una curtosis k = 0. El
sta prueba de normalidad garantiza que todo tipo de inferencias
stadsticas que se hace sobre los parmetros y pronsticos tengan alguna
alidez.
ichas pruebas son las siguientes:
- Comprobar la bondad del modelo en la tabla de anlisis de varianza
(Distribucin F).
- Pruebas de hiptesis e intervalos de confianza para los
i
.
- Intervalos de confianza para los pronsticos.
hazada, las inferencias
stadsticas planteadas anteriormente carecen de sentido.
SPSS considera que si la asimetra las y la curtosis (k) se halla en el
intervalo (-2,2) debe ser considerado un buen indicador de
normalidad.

PRUEBAS DE NORMALIDAD

E
e
v

D

Si al hacer la prueba de normalidad sta es rec
e

PRUEBAS DE NORMALIDAD

a) Contraste de Kolmogorov Snirnov
ucin acumulada de los datos con la
istribucin acumulada de la distribucin terica.
ribucin de probabilidad cerrada si D
n
es mayor que la
ncontrada en tablas para un nivel , rechazamos la distribucin F(x) para
la muestra para n y n crtica ser D
n
>
D(,n), si el D
n
calcu d D(,n) se rechaza la
iptesis que la distribucin es normal, por lo tanto si el SPSS arroja un
.01 se rechaza la hiptesis de normalidad de lo
ontrario aceptamos que existe esa normalidad.

b) Contraste de normalidad de Shapiro y Wilks

l contraste de Shapiro y Wilks mide el ajuste de la muestra a una recta al
dibujarla en un papel probabilstico normal, se rechaza la normalidad

Esta prueba es mucho ms robusta que la prueba de chi cuadrado. Esta
prueba se basa en comparar la distrib
d

D
n
= MAX F
n
(x) F(x)
F
n
(x) = distribucin de los datos
F(x) = distribucin terica

D
n
tiene una dist
e
dados hallamos D(,n) la regi
lados en los atos es mayor que
h
valor menor a 0.1, 0.05 y 0
c
E
cuando el ajuste es bajo, que corresponde a valores pequeos del
estadstico de este dicho estadstico toma la expresin.

( )
( )
( )
2
2
2
1
1 ,
2
ns
A
X
ns
J
J
J n n J
=
+
donde ns
2
=
2
__
x x
i

1
X a
h
w
impar es n si
n
h o par es n si
n
h
2
1
2
= =
os coeficientes a
Jn
estn tabulados y x
J
es el valor ordenado de la muestra
ue ocupa el lugar J. La distribucin de muestra tabulada y se rechaza la
ormalidad cuando su valor calculado a partir de la muestra es menor que
ndiente valor crtico dado en las tablas.
Si el valor dado por el SPSS es menor a 0.1, 0.05 y 0.01 se rechaza la
hiptesis de normalidad de lo contrario debe aceptarse que los datos siguen
una distr cin al

L
q
n
el correspo

ibu norm .

ANLISIS DE LOS RESIDUOS

Con la regresin y correlacin, al igual que con otras experiencias de la
vida, podemos aprender de nuestros errores. Por consiguiente, conviene
estudiar resid o sin.
Como se ha subrayado antes, una regr
al puro a r que en u d y una
varianza de
2
. Si el estudio de estos re
demuestr lo co rio u entes
al model La d ci a a inos
de error dra s fic e a l tesis
bsicas relativas al mo L r e ica a
estudiar trm s d i b u eden
detectar dicho lis m d os de
la autoc laci e

Autocor cin

Una de las propiedades bsicas del modelo OLS es que los errores no
guardan relac i se i n un
momento temporal no tiene relacin lineal con el error que se puede
experimentar en otro m as u entar
los errores a lo largo del tiem grfica, sta se parecera a la de la
siguiente figura:

igura 1.

los uos trminos de erro
esin buena presenta errores debidos
r en nuestro modelo de regre
za sigu una distribucin normal con
siduos revela condiciones que
na me ia de 0
an
o.
ntra
etec
, sera
n de cu
n indicio
lquier p
de que hay
uta de corre
problem
lacin en
as inher
los trm
po igni ar que s
delo O
han tr
S. El
nsgredido a
esto de est
gunas de
captulo
las hip
se ded
los
en
ino
an
e error
is. Nos
ya anal
centrare
zar los pro
os ante to
lemas q
o en los
e se pu
principi
orre n y d la heterocedasticidad.
rela
cor in. El error de pred ccin que exper menta e
omento. En el c o ideal, si hubiera q e repres
po en una

F

No hay pauta detectable en los errores. Los trminos de error parecen se
independientes y no dan ninguna indicacin de que haya relacin entre
ellos.

Pero cuando se trata de datos pertenecientes a series temporales, muchas
eces esta condicin deja de cumplirse. Encontramos que los errores
ueden estar correlacionados, de donde resulta una autocorrelacin (AC).
uchas series econmicas, como el desempleo, el PNB o los tipos e
ters, varan de manera cclica en el tiempo. Si una serie tiene un valor
emasiado bajo (alto) durante un mes en relacin con su media a largo
ble que siga siendo bajo (alto) el mes siguiente. Las
cen de la noche a la maana. Un modelo de regresin
e basa en una media a largo plazo de la serie. Si una serie tiene un valor
lo de regresin haga una
stimacin excesiva de su valor. Esta sobreestimacin dar lugar a un error
er ga siendo
uy baja el perodo tem es de esperar que ocurra otro error
emasiado alto. Los errores positivos sern generados para varios perodos
varios
igura 2.
v
p
M
in
d
plazo, es proba
correcciones no se ha
s
demasiado bajo, es probable que el mode
e
negativo, puesto que e = Y
i
. Como es probable que la s ie si
m poral siguiente,
o la serie pasa a un ciclo de nivel negativo. Lo contrario sucede cuand
d
sucesivos. Esta pauta de errores sucesivos negativos, seguidos de
errores positivos, es prueba de que existe autocorrelacin.

La siguiente figura ilustra la autocorrelacin:

F

Hay puta clara en los trminos de error. Inician la pauta varios errores
sucesivos negativos seguidos de varios errores positivos tras los cuales
aparecen varios errores negativos ms (no es de esperar que la pauta sea tan
de error. Como todos los parmetros, se
stima con el estadstico correspondiente cuando se toman datos
aestrales. Esta correlacin entre errores a nivel muestral se mide por r, el
correlacin muestral que hemos utilizado para medir
correlacin entre dos variables de nuestro modelo. En la figura 1, en que
evidente en la prctica).

La correlacin entre trminos de error se puede medir igual que la
correlacin entre dos variables cualesquiera del modelo. La correlacin
entre un error en un perodo temporal t y el perodod temporal anterior t-1
se por e
t,
e
t-1
, donde el parmetro es el coeficiente de correlacin
poblacional para los trminos
e
m
mismo coeficiente de
la
no existe AC, estimaramos la correlacin entre trminos de error con re
t,
,e
t-
1
igual a cero. En cambio, la figura 2 sugiere la probabilidad de que un
error vaya seguido de otro error del mismo signo. Es decir re
t,
,e
t-1
. Se dice
que hay una AC positiva. Si los errores tendieran a alternar su signo,
habra tambin correlacin negativa y re
t,,
e
t-1
<0.

La siguiente figura nos muestra la grafica en donde los errores tienden a
alternar su signo:

Figura 3.

En presencia de AC todos los contrastes de hiptesis e intervalos de
onfianza se tornan menos fiables, los que convierte a la autocorrelacin en
lgo muy perjudicial.
un modelos para estudiar el error del modelo original.
Si el error es , el modelo que relaciona el error de un perodo temporal con
el del siguiente es:

= e
t-1
+
t

D
e error aleatorio en la prediccin de los errores; es decir, mide el error
c
a

Se puede construir
onde es la correlacin entre errores del modelo original y el trmino
d
que experimentamos cuando tratamos de estimar el error de nuestro modelo
riginal. El trmino
t
, que a menudo se denomina ruido blanco, se
roduce porque los errores del modelo original no responden a una
o
p
correlacin perfecta. Por tanto, habr algo de error en nuestro intento de
predecir el error del modelo original.

Figura 4.

n de errores est
ontenida en los dos cuadrantes positivos de los ejes. De ello resultara que
e
t,
e
t-1
>0.
ra 4 b) los trminos de error estn limitados a los dos cuadrantes
egativos, lo que indica una correlacin negativa, es decir, e
t
y

e
t-1
toman
ignos opuestos, luego e
t,
e
t-1
<0.
a t, t-1
La Figura 4 tambin refleja pautas de error que pueden revelar informacin
obre el modelo cuando se representa e
t
frente a e
t-1.

En la figura 4 a) existe autocorrelacin positiva porque cuando e
t
es
positivo, e
t-1
tambin lo es, y cuando e
t
es negativo,

e
t-1
tambin es negativo.
Los errores consecutivos tienen el mismo signo. La relaci
c

En la figu
n
s

Aunque el anlisis de errores puede ser un medio de detectar la
autocorrelacin , ne es muy fiable. Rara vez se observan pautas tan claras
como las aqu sugeridas. Necesitamos un procedimiento menos falible, y
por suerte tenemos uno basado en el estadstico d de Durbin-Watson. El
estadstico de Durbin-Watson se utiliza para comprobar la hiptesis de no
autocorrelacin:

H
0
: e
t,
e
t-1
= 0, No hay correlacin
H : e e 0, Hay correlacin

Se calcula por la frmula:

d =
( )
( )
2
1 e e t t

2

Con n
anterio
genera
aut
me
hip

et (et) et -et-1 (et -et-
1)
et

uestros datos del estudio de gastos de los consumidores, la frmula
r facilita los clculos necesarios. Obsrvese que 0 d 4. Por regla
l, si d es prximo a 2, supondremos que no hay problema de
ocorrelacin. Pero es recomendable determinar si el valor hallado
diante la esta frmula es significativo, y para ello hay que contrastar la
. tesis de = 0

Ejemplo:

Observ
acin
Yi Ypron
1 51 49,335
9
1,6641 2,7692288
1

2 30 30,378 -0,3784
4
0,1431865
6
-2,0425 4,1718
06
3 32 32,113
8
-0,1138 0,0129504
4
0,2646 0,0700
13
4 45 42,394
3
2,6057 6,7896724
9
2,7195 7,3956
80
5 51 53,674
5
-2,6745 7,1529502
5
-5,2802 27,880
51
6 31 32,981
5
-1,9815 3,9263422
5
0,693 0,4802
49
7 50 51,071
4
-1,0714 1,1478979
6
0,9101 0,8282
82
8 47 46,732 0,2672 0,0713958
8 4
1,3386 1,7918
49
9 45 42,526 2,4737 6,1191916 2,2065 4,8686
3 9 42
10 39 39,791 -0,7912 0,6259974 -3,2649 10,659
2 4 57
11 50 50,218 -0,218 0,047524 0,5732 0,3285
58
12 35 34,594 0,406 0,164836 0,624 0,3893
76
13 40 39,938 0,062 0,003844 -0,344 0,1183
36
14 45 45,146 -0,146 0,021316 -0,208 0,0432
64
15 50 50,354 -0,354 0,125316 -0,208 0,0432
64

29,121649
73
59,069
40

d =
( )
( )
2
2
1 e e t t

e
=
t

2912203
40475 . 59

= 2.03
araremos d = 2.03 se hallan
mediante dos valores: el nmer e va ables independientes, k, y el
mero de observaciones, n. En nuestro ejemplo, k = 2 n = 15. Si = 0.05,
tabla K da d
L
= 0.95 y d
U
= 1.54. Ahora se puede construir una escala

Estadstico de
urban-Watson

Los valores crticos con los cuales comp
o d ri
n
la
sencilla para determinar si se rechaza o no la hiptesis nula de no
autocorrelacin. La escala es como se describe en la siguiente figura:

D

La prueba no La prueba no
+AC es concluyente No AC es concluyente -AC

d
L
d
U
2 4 d
U
4 d
l

0.95 1.54 2.46 3.05

Si d
U
< d < 4 d
U
, no hay pruebas de que exista autocorrelacin y la
hiptesis nula no se rechaza; d < d
L
demustra que existe AC positiva; d > 4
d
L
indica AC negativa. Las dos regiones no concluy

entes que existen
d = 2(1 r)

entre e
t
y e
t-1
. Una vez ms, si los
er preciso efectuar gran cantidad de
ortuna, casi todos los programas de
rdenador dan el valor de Durban-Watson.
arciales,
gresar todas las variables de residuos de los modelos en estudio, aceptar.
n la hoja de resultados se analiza que estos residuos se encuentren dentro
de los intervalos establecidos.

s una
ariacin constante de los trminos de error. La variacin de los errores
indican que la distribucin de d depende de las caractersticas de las
relaciones entre las variables independientes. Ninguna generalizacin de
estas caractersticas puede ser lo bastante amplia para restringir sin
ambigedad el valor de d.

Ya calculamos que d era 2.03, de manera que no se rechaza la hiptesis
nula. Parecera que la correlacin entre trminos de error no constituye un
problema.

El clculo es bastante aburrido. Se puede simplificar si el valor de d se
estima por:

donde r es el coeficiente de correlacin
clculos se han de hacer a mano, s
operaciones aritmticas. Por f
o

Autocorrelaciones de los errores en el SPSS

En la barra de men dar clic en Grficos/ Series temporales y abrir la
ventana Autocorrelaciones, desactivar las autocorrelaciones p
in
E

Hetorocedasticidad

Adems de la ausencia de correlacin entre errores, otra propiedad bsica
del modelo OLS es la homocedasticidad. La homocedasticidad e
v
que se experimenta cuando , por ejemplo 10, es igual
que la variacin de los errores cuando X es igual a cualquier otro valor. En
lo indica la existencia la existencia de
curva en X = 10, lo que
X es igual a un valor
la figura 5 a) las dos curvas normales indican que la distribucin de los
valores de Y
i
por encima y por debajo de la recta de regresin es la misma
en X = 10 y en X = 11. Por tanto, los errores, representados por la
diferencia entre los valores de Y
i
y las ordenadas de la recta de regresin,
siguen una distribucin normal. El
homocedasticidad.

Si la varianza de los errores no es la misma para todos los valores de X,
existe heterocedasticidad. La figura 5 b) indica que a medida que X
aumenta, la varianza de los trminos de error se hace ms pronunciada. La
curva normal en X = 11 est ms extendida que la
indica una mayor dispersin de los errores.

Figura 5

Heteroceasticidad. Los trminos del error no tienen la misma varianza

La heterocedasticidad es corriente cuando se manejan datos transversales.
Suelen utilizarse estos datos, por ejemplo, en investigaciones sobre los
hbitos de gasto de los consumidores. En estos estudios se suelen recoger
el consumo y la renta de muchos individuos, que abarcan pobres, ricos y
personas de clase media. Este conjunto de daos se llama transversal porque
traviesa diferentes grupos de reta. Como se podra esperar, los ricos
presenta un modelo de compor ento respecto de su esquema de
consumo muy diferente del resto de nosotros. Esta diferencia provoca una
variacin de los trminos de e or que pone de manifiesto la
heterocedasticidad.

a
tami
rr
Cuando existe heterocedasticidad, los coeficientes de regresin pierden
eficiencia. Es decir, la varianza de los valores de b sufre un incremento. El
valor de b obtenido con una muestra difiere del obtenido con otra distinta.
En estos casos es difcil depositar mucha fe en los coeficientes de
regresin.
Se puede detectar la heterocedasticidad si se representan en un grfico los
valores de Y frente a los trminos de error. Si aparece una estructura, es
do existe
eterocedasteicidad. La figura 6 c), por el contrario, no sugiere un
esquema detectable: parece no existir heterocedasteicidad.

Figura 6

probable que haya heterocedasticidad. Las figuras 6 a) y 6 b) indican
posibles estructuras que a menudo se encuentran cuan
h

Si se sospecha que hay heterocedasticidad, se recomienda utilizar el
mtodo de mnimos cuadrados generalizado (GLS). En textos superiores se
puede encontrar una explicacin del GLS.
Aunque las pautas que siguen los residuos son una buena indicacin de la
heterocedasticidad, su lectura requiere ms de una facultad artstica que un
procedimiento cientfico. Las pautas rara vez cooperan y son tan claras
como las que acabamos de ver. Necesitamos mtodos ms concretos de
detectar la heterocedasticidad. El resto de esta seccin se dedica a presentar
mtodos frecuentes de descubrir la existencia de heterocedasticidad.

Prueba de heterocedasticidad de White. En 1980 Halbert White ofreci
uno de estos mtodos, basado en la distribucin
2
. Su mtodo comprende
varias fases bien definidas:

1. Ejecutar la regresin original y obtener el trmino de error que
presenta cada observacin.
2. Elevar al cuadrado los trminos de error para obtener e
2
y hallar su

dientes X
1
, X
2
, X
2
, habra que hallara la
n de e respecto de X
1
, X
2
, X
3
, X
1
2
, X
2
2
, X
3
2
, X
1
X
2
, X
1
X
3
,
X
2
X
3
. Este modelo de regresin se llama modelo auxiliar.
ay que tomar determinadas precauciones al ejecutar la fase 2. La ms
importante para nuestros fines es el peligro derivado de utilizar variables
ficticias en el modelo. Si X
i
es una variable ficticia, entonces no se debe
incluir X
2
en la ecuacin auxiliar porque X es igual a X
2
y existe

dar clic en Grficos/ dispersin. Se ingresar en el eje Y
evaluar. En la hoja de
sultados se analiza la grfica.

lvo los propios coeficientes de
y vigila en anlisis
e regresin.
regresin con todas las variables independientes, los cuadrados de
todas esas variables y los productos cruzados de todas ellas. Si
hubiera tres variables indepen
2
regresi
3. Calcular nR
2
, donde n es el nmero de obsrvaciones y R
2
el
coeficiente de determinacin no ajustado de la ecuacin auxiliar.
4. Si nR
2
>
,k
, rechazar la hiptesis nula de que las varianzas de error

son iguales y suponer que existe heterocedasticidad.

H
i i i
multicolinealidad perfecta. Adems, el producto cruzado de dos variables
ficticias tambin se debe excluir puesto que es igual a cero.

Heterocedasticidad en SPSS

En la barra de men
el error y en el eje X la variable que se desea
re

Coeficiente de determinacin ajustado

A causa de su importancia, R
2
se calcula en la mayora de los paquetes
informticos.
Es una forma fcil y rpida de evaluar el modelo de regresin y determinar
el grado en que se ajusta a los datos. Sa
regresin, quiz sea R
2
el estadstico que ms se observa
d
Per
artific to de R con la mera inclusin
de ue se incorpore una
var aumentar.
Es
el coeficiente de determinacin ajustado. Con el smbolo de R , que se
lee
explic s grados de libertad de
SS
variable independiente adicional que aada al modelo, porque cada variable
exi
variable que no aada suficiente poder explicativo al modelo para justificar
prdida de un grado de libertad. El valor de R
2
disminuir. Si baja
demasiad, habr q esa variable del
modelo. En casos extremos, el coeficiente de determinacin ajustado puede
o los estadsticos poco cuidados o faltos de escrpulos pueden inflar
ialmente R
2
. Se puede lograr un aumen
2
otra variable independiente en el modelo. Aunq
iable sin sentido que no aporte ningn poder explicativo, R
2
prctica comn en el anlisis de regresin y correlacin mltiple indicar
2
R con barra al cuadrado, este estadstico ajusta la medida del poder
ativo con el nmero de grados de libertad. Lo
E son n k 1. El investigador pierde un grado de libertad por cada
ge el calculo de otro bi. R2 penalizar al investigador por incorporar una
la
ue considerar la conveniencia de excluir
llegar a valer menos de cero.
Para obtener este coeficiente ajustado se dividen SSE y SST por sus grados
de libertad respectivos:

) 1 /(
1
) 1 /(
2

=
k n SSE
[ ]
n SST
R 21 . 14

Una frmula ms conveniente para calcular
2
R es:
1
) 1 ( 1
2 2
1

=
k n
R R
n
[ ] 22 . 14

Como el numerador de la formula (14.21) es el MSE, puede decirse que R
2
,
es una combinacin de dos medidas del cumplimiento de un modelo de
regresin: el error cuadrtico medio y el coeficiente de determinacin.

Existencia de multicolinealidad

Ya hemos anunciado antes el peligro de la multicolinealidad. Surge este
problema cuando una de las variables independientes mantiene una relacin
lineal con una o ms de las dems variables. Esta situacin transgrede una
de las condiciones de la regresin mltiple. En concreto, existen
multicolinealidad cuando hay una alta correlacin entre dos variables
independientes X
i
y X
j
. En el capitulo 13 explicamos explicamos el
coeficiente de correlacin r de la variable dependiente y la nica variable
independiente. Si en regresin mltiple aplicamos este mismo concepto a
dos variables independientes X
i
y X
j
, podremos calcular el coeficiente de
un problema de grado. En cualquier medida en que
s del Mercado.
2
=Todas las mujeres del mercado.
3
= Poblacin total del mercado.
s evidente que X
3
es una combinacin lineal de X
1
y X
2
(X
3
= X
1
+X
2
). La
orrelacin r
13
entre X
1
y X
3
y la correlacin r
23
entre X
2
y X
3
son bastante
ltas. Estas relaciones dejan clara la presencia de multicolinealidad, de la
ue surgen numerosos problemas en el uso de las tcnicas de regresin. A
ontinuacin se exponen algunos de los problemas ms corrientes.

Problemas de la multicolinealidad
problemas ms fastidiosos de la multicolinealidad proviene de
Cuando existe multicolinealidad, es imposible
esenmaraar los efectos de cada X
i
. Supongamos que en el modelo:
Y = 40 + 10X
1
+ 8X
2

coeficientes de regresin se convierten en poco fiables y no se pueden
correlacin r
ij
. Si r
ij
es alto, existe multicolinealidad.
Qu se entiende por alto? Lamentablemente no hay respuesta a esta
pregunta crtica. No hay ningn punto mgico de separacin en el cual la
correlacin se pueda decir que es demasiado alta y que existe
multicolinealidad. Es
dos o ms variables independientes tengan una relacin lineal, existe un
grado de multicolinealidad. Si sta es demasiado pronunciada, el modelo
quedar perjudicado. Ahora bien, lo que se considere demasiado alto es
algo que queda al buen criterio del investigador. En esta seccin daremos
algunos consejos necesarios par alcanzar este criterio.
Supongamos que est utilizando tcnicas de regresin para estimar una
curva de demanda (o funcin de demanda) de su producto. Para reconocer
que el nmero de consumidores est relacionado con la demanda elegira
como variables explicativas:

X
1
= Todos los hombre
X
X

E
c
a
q
c

Uno de los
nuestra incapacidad para separar los efectos individuales de cada variable
independiente sobre Y.
d

X
1
y X
2
mostrasen un grado de correlacin alta. En este caso, el coeficiente
10 de X
1
puede no representar el efecto verdadero de X
1
sobre Y. Los
tomar como estimaciones de la variacin de Y cuando la variable
independiente vara en una unidad.
Adems, los errores los errores tpicos de los coeficientes, S
bi
, se
ao, se hara
rva de demanda, se podra encontrar
ue tomase un signo positivo. Esto significa que a medida que el precio de

e la multicolinealidad

ariables del modelo, como se muestra
n la 14-4. El valor de r
12
= 0.8698 que indica la correlacin entre las dos
ariables independientes muestra que existe una ntima relacin entre NI y
estra muestra, queremos contrastar la hiptesis de que
correlacin entre X
1
y X
2
es cero a nivel poblacional. Contrastaremos la
desbordan. Si se tomasen dos o ms muestras del mismo tam
una variacin grandes de los coeficientes . En el modelo que acabamos de
especificar, en lugar de 10 como coeficiente de X
1
, una segunda muestra
podra dar un coeficiente de 15 o 20. Si b
1
vara tanto de una muestra a la
siguiente, deberemos poner en duda su exactitud.
La multicolinealidad puede causar incluso que el signo del coeficiente sea
el opuesto al que la lgica dictara. Por ejemplo, si se incluye el precio
como variable en la estimacin de la cu
q
una mercanca aumenta los consumidores compran ms, lo que constituye
una trasgresin evidente de la lgica que informa la teora de la demanda.

Deteccin d
El camino ms directo para comprobar la multicolinealidad es elaborar una
matriz de correlacin de todas las v
e
v
ADV. Aunque no hay un valor predeterminado de r
ij
que seale la
aparicin de la multicolinealidad, el valor de 0.8698 es lo bastante elevado
para indicar que existe un problema significativo.
Algunas de las dudas se pueden eliminar utilizando una prueba t para
determinar si el nivel de correlacin entre X
1
y X
2
difiere
significativamente de cero. Dada la relacin distinta de cero entre X
1
y X
2

(r
12
= 0.8698) de nu
la
hiptesis de que:

H
0
: 0
12
=
0 :
12

a
H

donde
12
es el coeficiente de correlacin poblacional entre X
1
y X
2
. Esto
podemos hacerlo con las tcnicas aprendidas anteriormente. Donde
demostramos que:
t =
r
S
r
12

donde:
2
1
2
=
r
S
n
r

Como ilustracin, la hiptesis de , donde es el coeficiente de
correlacin poblacional de las dos variables independientes, es:

36 . 6
01367
8698 . 0
1367 . 0
2 15
8698 . 0 1
2
=
= t

Si se pone
=
= S
r

al 5%, el t crtico es 16 . 2
13 , 05 . 0
= t . Hay n 2 grados de libertad.
Como t= 6.36>2.16, Ace puede rechazar la hiptesis nula de que no existe
correlacin entre X
1
y X
2
( 0
12
= ). Existe algo de multicolinealidad. Ello
no significa que el modelo tenga un defecto irreparable. De hecho, muy
pocos modelos esta olinealidad. Pronto
Explicaremos la manera de hacer frente a este problema.
poco por
ejorar la capacidad del modelo para explicar el nmero de pasajeros.
ya suministrada por la publicidad. Ello indica que
odra existir multicolinealidad.

variable idependiente es una medida del grado de multicolinealidad
on que contribuye dicha variable.

ran libres por completo de la multic
Otra forma de detectar la multicolinealidad es comparar los coeficientes de
determinacin entre la variable dependiente y cada una de las variables
independientes. Ya vimos que la correlacin entre pasajeros y publicidad
era r
2
= 0.815. Pero las dos variables independientes juntas revelaban un R
2

de solo 0.957. Si se toma por separado, las variables independientes
explican el 93.7% y el 81.5% de la variacin de Y, pero combinadas
nicamente explican el 95.7%. En apariencia, existe un solapamiento de su
poder explicativo. La inclusin de la segunda variable NI hizo
m
Vemos que la variable NI se limita a duplicar mucha de la informacin
sobre los pasajeros
p
Una tercera forma de detectar la multicolinealidad es estudiar el factor de
inflacin de la varianza (VFI). El VFI asociado a cualquier variable X se
halla mediante el estudio de la regresin de dicha variable en funcin de
todas las dems variables X. El R
2
resultante se utiliza despus para
calcular el VIF de la variable. El VIF de cualquier X
i
representa la
influencia de la variable sobre la multicolinealidad.

Factor de inflacin de la varianza. El factor de inflacin de la varianza
de una
c

Puesto que en el modelo Hop Scotch slo hay dos variables independientes,
la regresin de X
1
sobre todas las dems variables independientes (X
2
) o la
regresin de X
2
sobre todas las dems variables independientes (X
1
) nos da
l mismo coeficiente de correlacin (r
12
= 0.8698). El VIF de cualquier e
variable independiente X
i
es:

VIF =
i R
2
1
1

Donde R
i
2
es el coeficiente de determinacin obtenido en la regresin de X
i
sobre todas las dems variables independientes. Como ya se ha dicho, la
ulticolinealidad produce un incremento de la variacin o error tpico del
oeficiente de regresin. El VIF mide el incremenbto d ela varianza del
ficiente de regresin por encima de la que existira si no hubiera
ulticolinealidad.
l VIF de la publicidad en el modelo de Ace es:
VIF =
m
c
coe
m
E

2
) 8698 . 0 ( 1
1
= 4.1

ara X
2
se hallara el mismo VIF, puesto que slo hay dos variables
dependientes.
Si una variable independiente no tiene ninguna relacin en absoluto con
tra variable independiente, su VIF es igual a 1. La varianza en b y b es
tras indicaciones de multicolinealidad pueden ser las variaciones grandes
sin de una variable produce cambios grandes de los coeficientes o de
us signos, puede haber multicolinealidad.
sobre Y.
2. Un error tpico exagerado de los coeficientes b.
3. Signos algebraicos o coeficient contrarios a la lgica.
P
in
o
1 2
por consiguiente mayor que cuatro veces la que habra sin
multicolinealidad en el modelo. Pero, en general, la multicolinealidad no se
considera un problema significativo a menos que el VIF de una X
i
valga 10
como mnimo, o que la suma de ellos VIF de todas la X
i
sumen 10 como
mnimo.
O
de los coeficientes o de sus signos cuando hay un cambio pequeo del
nmero de observaciones. Adems, si la relacin F es significativa y los
valores de t no lo son, puede haber multicolinealidad. Si la inclusin o
supre
s
En resumen, si existe multicolinealidad encontraremos:

1. Una incapacidad para separar el efecto neto de las variables
independientes individuales
es
4. Una elevada correlacin entre variables independientes y un VIF
significativa combinada con relaciones t no
significativas.
mitigar la influencia de la
ulticolinealidad? Acaso la solucin ms lgica sea suprimir la variable
de todo, y a causa del solapamiento, la
clusin de la segunda variable aade poco a la explicacin de Y.
En relacin con el mode consejable eliminar NI,
ado que su correlacin con Y es menor que la de la publicidad. Las
ero la simple eliminacin de una de las variables puede conducir al sesgo
de
fundam o. Por ejemplo, se podra evitar la multicolinealidad si se
liminara la renta de una expresin de una expresin funcional de la

a una
asgresin de los principios tericos se denomina sesgo de especificacin.
i eliminar una variable se excluye por el sesgo que ello pueda producir, si
ariable. Quiz fuera beneficioso dividir los valores originales de la
ariable causante por la poblacin para obtener una cifra por persona. Es lo
ue sugera con el NI al comienzo de este captulo. Adems, dividir
eterminadas medidas monetarias por un precio ndice (como el ndice de
recios al consumo) a fin de obtener una medida en trminos reales,
uede ser otro mtodo eficaz de eliminar la multicolinealidad. Tambin
sto se podra aplicar al NI.
elevado.
5. Variaciones grandes de coeficientes o de sus signos si el nmero de
observaciones vara en una solo observacin.
6. Una relacin F
7. Variaciones grandes de los coeficientes o de sus signos cuando se
incluye o suprime una variable.

Tratamiento de la multicolinealidad

Qu se puede hacer para eliminar o
m
causante. Si X
i
y X
j
estn en ntima relacin, una de ellas se puede excluir
del modelo sin ms. Despus
in
lo de Hop Scotch, ser a a
d
pruebas t realizadas antes tambin sugieren que NI no era significativa al
nivel del 5%.
P
especificacin, en el cual la forma del modelo est en desacuerdo con su
ento teric
e
demanda de los consumidores. Pero la teora econmica y tambin el puro
sentido comn, nos dice que la renta se debe incluir en cualquier intento de
explicar el consumo.

Sesgo de especificacin: La especificacin incorrecta de un modelo, por
haber incluido o excluido determinadas variables, que de lugar
tr

S
que podemos disminuir la multicolinealidad cambiando la forma de la
v
v
q
d
p
p
e
Otra medida posible es combinar dos o ms variables. Es lo que podra
hacerse co empleaba
X
1
= hombres, X
2
= mujeres y X
3
= poblacin total. Las variables X
1
y X
2
se
podran sumar para formar X
3
. El modelo constara entonces de una sola
n cualquier caso, es preciso reconocer que en la mayora de los modelos
star nada a la utilidad del modelo, porque el problema de la
ulticolinealidad puede no ser grave. La multicolinealidad causar grandes
ntroduccin a las series de
or ingenieros ficos
ara examinar diferentes procesos y sistemas fsicos y matemticos. Un
n el modelo de la demanda de los consumidores, que
variable explicativa.
E
de regresin que contienen dos o ms variables independientes existe algn
grado de multicolinealidad. Cuanto mayor sea el nmero de variables
independientes mayor ser tambin la probabilidad de multicolinealidad.
Pero ello no re
m
errores en coeficientes individuales, pero el efecto combinado de esos
coeficientes no se altera de manera drstica. De todos modos, un modelo
predictivo ideado para predecir el valor de Y a partir de toda las Xi
tomadas en combinacin poseer una exactitud considerable. Solamente los
modelos explicativos.

I
Tiempo.
Mtodos de atenuacin.
Promedios movibles.

INTRODUCCION

La nocin de modelo ha sido bastante utilizada p y cient
p
modelo se convierte en una manera de experimentar con la realidad sin
tener que invertir en una unidad operativa a escala natural. Este tipo de
modelo tambin se conoce como modelo de simulacin.

Un modelo de prediccin (Makridakis y wheelwrigtht, 1989)
Consiste en los procedimientos utilizados para desarrollar un pronstico.
Por supuesto, existe una gran variedad de modelos, pero en cuanto a los
modelos cuantitativos solamente existen dos tipos bien definidos: las serie
e tiempo y los mtodos causales. Si el analista comprende las propiedades
isas que constituyen la
ase de las tcnicas de prediccin y de las ventajas y desventajas de su
do de tiempo a usar.
trapolar dicho patrn pueden
redecirse y desarrollarse los periodos de tiempo subsecuentes. Una
te modelo no es
articularmente til para la gerencia en caso de que de que se desee
pre sado por las decisiones tomadas antes y durante el
pro

Cu
prcticamente la misma prediccin para el siguiente periodo, sin importar
ules sean las acciones tomadas por la gerencia. As, un modelo de serie
e tiempo sera apropiado para predecir factores ambientales, nivel de la
tasa de desempleo o patrones de costo, donde las
ecisiones individuales tienen poco impacto. Sin embargo, este modelo de
en esos
odelos de prediccin.
era de operar de este tipo
e modelos, ya que la tecnologa de series de tiempo trata la informacin
d
de ambos, puede tener una mejor visin de las prem
b
utilizacin en situaciones especificas.

En este capitulo se abordar el primer tipo: el modelo de series de tiempo.
Para aplicar esta tecnologa es necesario definir dos factores importantes:

a) Las series de datos a utilizar en el proceso de prediccin.
b) El perio

Un modelo de series de tiempo supone que a lo largo del tiempo existe un
cierto patrn o una combinacin de

patrones recurrentes. As, al identificar y ex
p
premisa importante es que el patrn base se identifica slo en relacin con
datos histricos de dicha serie de tiempo. Por ello, es
p
decir el impacto cau
ceso estadstico.
alquier metodologa de serie de tiempo que se utilice debe producir
c
d
economa nacional,
d
serie de tiempo es totalmente inapropiado para predecir ventas mensuales
resultantes de cambios en los precios, o en la publicidad.

Una de las mayores ventajas de los modelos de series de tiempo es que las
reglas bsicas de la contabilidad tambin estn orientadas a periodos
secunciales de tiempo, lo que significa que en gran parte de las empresas
siempre existe disponibilidad de informacin que puede aplicarse
m

En ocasiones puede parecer decepcionate la man
d
como una caja negra, sin intentar descubrir los factores que afectan el
comportamiento del sistema o la informacin que se analiza (Vase figura
2.1). El sistema se contempla de manera simple como un proceso no
identificado (Puede ser cualquier tema: ventas, economa, meteorologa,
etctera).

Figura de un modelo de de tiempo
Existen tres r por l s que e odelo neja lo os com
c : la pr era es pue o enten , y aun
fuese, puede ser extremadamente difcil medir la relacin que rige su
omportamiento. La seg jetivo principal de un
ON PARA LOS METODOS DE PREDICCION
de produccin de
X es el nmero de artculos vendidos en un periodo dado, es
c nar nmeros
suceden secuencialmente.
s, en un periodo de dos aos, el mes se identifica como 1, 2, 3, 4,..., 24.

2.1 Relacin series

azones a l m ma s dat o una
omo una caja negra im que de n derse que lo

Sistema

t

c unda razn es que el ob
ejercicio de prediccin es justamente hacer una prediccin y no existe
razn especial para saber el porqu. La tercera razn es cuando lo nico
que desea saberse es qu va a suceder, realmente es de poca la utilidad
saber el porque. El costo de saber el porqu puede ser muy alto.

NOTACI
CUANTITATIVA

Cuando se prepara la informacin a utilizar con cualquier mtodo de
prediccin, inicialmente se compilan valores observados, datos histricos u
observaciones. Estas observaciones pueden representar muchas cosas,
esde unidades de algn producto vendido hasta el costo d
dichas unidades, o inclusive el numero de empleados que hay en cada
seccin de produccin. Debido a que estos valores varan aleatoriamente,
en general se representan por una variable X, donde sta es el smbolo del
valor de algn artculo, por ejemplo las lavadoras vendidas en un periodo
dado.

ebido a que D
ne esario identificar dicho periodo. Esto se logra al asig
consecutivos a cada uno de los periodos que se
A
Cap ura de datos
Pro Resultad ceso
generador
Res
s
cualquier interv l periodo, ste
e identifica como subndice de la variable aleatoria; as, X
10
corresponde
al periodo 10 y X
13
es el valor 13 de la serie numrica. Necesariamente, la
decisin del cul es el primer valor (X
1
) es arbitraria, y a partir de ah los
nmeros subsecuentes aumentan de forma consecutiva en la serie.

Cuadro 4.1 Notacin utilizada en los modelos de prediccin de series de tiempo

n general, puede decirse que el smbolo X identifica los valores histricos
dica el valor
ronosticado del periodo t+1.
los valores de
rediccin, denotada como sigue:

ulta evidente que es necesario predefinir la longitud del periodo: puede
er un da, una semana, un bimestre, un trimestre, un semestre, un ao o
alo temporal posible. Una vez establecido e
s

E
VALORES DE PREDICCION

Valores observados X
1
X
2
X
3
... X
t-2
X
t-1
X
t
F
t+1
F
t+2
F
t+3
F
t+m
Periodo i

1

2

3 t-2 t-1 t t+1 t+2 t+3 t+m
Valores estimados X
1
X
2
X
3
... X
t-2
X
t-1
X
t
X
t+1
X
t+2
X
t+3
X
t+m

F
1
F
2
F
3

F
t-2
F
t-1
F
t
Valores de error e
1
e
2
e
3

e
t-2
e
t-1
e
t

Presente

Valor real =patrn + aleatoriedad
observados, y para indicar los valores de prediccin se utiliza otro smbolo
que suele ser la letra F
t-1
(del ingls Forecast)o bien
1
+ t
X (notacin
matemtica de valor estimado) donde el subndice (t+1) in
p

La premisa bsica de su utilizacin en cualquier tcnica de prediccin es el
valor real observado se determina por algn tipo de patrn e influencias
aleatorias. Esta notacin puede observarse con todo detalle en el cuadro
4.1.

Debido a que el mundo de los negocios no es determinstico, la
aleatoriedad siempre est presente, lo cual significa que siempre existe una
diferencia o desviacin entre los valores reales observados y
p
e
t
= X
t
- F
t

Donde el subndice t indica que en el periodo i hay un error que est
examinndose. Como se muestra en el cuadro 4.1, cada valor individual
tiene asociado un error e para el cual siempre existe un valor observado X y
un valor de prediccin F.

Para simplificar la manipulacin de las expresiones presentes en la adicin
de muchos nmeros, conviene utilizar matoria. El uso de
ste signo y de los elementos de notacin matemtica puede ejemplificarse
dro 4.1: X
t
es el valor real y F
t
es el valor de prediccin; por lo tanto,
t
l error o dife rvados X
t
y los valores
pronosticados F
t
de

Si se desea conoc bservaciones,
dicha suma puede obte
el signo de la su
e
del cua
e es e rencia entre los valores obse
po t. un periodo de tiem
er la suma de los errores y se tienen n o
nerse de

e
1
+ e
2
+ e
3
+ + e
n
=
=
4.2 ENFOQUE DE LA ATENUACIN PARA LAS SERIES DE
s desarrollados para procesar las series de tiempo, desde
l mtodo de atenuacin de promedios movibles hasta el mas sofisticado de
.
n
t 1
e
t

La expresin de la derecha puede leerse como la suma de los valores de
error, e
t,
tomados desde t=1 hasta t=n (Inclusive).

TIEMPO

Se ha observado que los tcnicos que utilizan el mtodo de las series de
tiempos para proyectar un grupo de datos lo hacen examinando los
movimientos pasados (histricos). Este proceso se denomina
extrapolacin de patrones de los datos hacia el futuro. Existe una gran
variedad de mtodo
e
Box-Jenkins (ARIMA) pasando por los mtodos de descomposicin

Atenuacin por promedios Atenuacin exponencial

Mtodo Naive(directo)
Promedios movibles simples
Promedios movibles dobles
Atenuacin exponencial simple
Atenuacin exponencial doble
Brown: lineal de un parmetro
Holt: dos parmetros comprende
TENDENCIA
Atenuacin exponencial triple
Brown: Cuadrtica, un parmetro
Winters: Tres parmetros
ESTACIONALIDAD Y TENDENCIA
Otras tcnicas de promedios
movibles(combinacin)

Figura 4.2 Clasificacin de los mtodos de atenuacin (Makridakis y Wheelwright)

Patrones de d

atos (Holton y Keating, 1994)

Antes de avanzar ms en este tpico es necesario explorar los tantas veces
ede decirse que en cualquier
erie de datos hay cuatro patrones: cclico, tendencia, estacionalidad y
d econmica
El nio).
a que el ciclo
mbargo, el ciclo de1979 a 1981 solamente dur 20 meses(de noviembre
les que ocurren cada seis
os.
l patrn mas familiar es el de tendencia, que representa el decremento o
de una serie de datos en cierto periodo de tiempo.
s brir por lo menos un ciclo comercial. De aqu que los
atrones de tendencia y ciclo estn interrelacionados; es decir, la direccin
eneral que sigue un ciclo o un periodo de tiempo es la tendencia. Por lo
resultado de costumbres sociales, fiestas y
limas. Es evidente que las ventas de helados aumentan durante los meses
de verano debido las al eraturas de esta estacin. Este es el patrn
de estacionalidad n em ebe notarse que la estacionalidad se anula
si misma dentro del mismo ao, razn por la que los incrementos en el
es estacionarios.
l ltimo patrn, la aleatoriedad, refleja las variaciones inexplicadas de los
datos. Estos movimientos al azar pueden ser resultados de coleccin de
errores o de circunstancias inesperadas como s, guerras, etctera.

mencionados patrones. En forma simple pu
s
aleatoriedad.

Un patrn cclico representa los altibajos de la activida
(aunque tambin se presenta en meteorologa, por ejemplo:
Este patrn es fcil de identificar y de anticipar. As, se calcul
macroeconmico en los pases industrializados es de cuatro aos; sin
e
de 1979 a julio de 1981), en tanto que el ciclo anterior duro 6 aos. En
cuanto a Mxico, podra decirse que los ciclos macroeconmicos han
seguido hasta la fecha los cambios presidencia
a

E
incremento horizontal
Este periodo uele cu
p
g
mismo, muchos analistas no intentan separar ambos patrones (aunque el
mtodo de descomposicin si trata de hacerlo).

El tercer patrn es la estacionalidad, que son los movimientos recurrentes
en el lapso de un ao como
c
a tas temp
; si bargo, d
a
mismo ao no contienen patron

E
huelga
En resumen, una serie de datos consta de patrones cclicos, de tendencia,
opsito de los mtodos de las series de
empo es eliminar estas irregularidades e influencias estacionales y
estacionales y aleatorios. El pr
ti
proyectar una serie de datos ms bien con base en sus patrones de
tendencia/ciclo.

Medicin de la precisin

Sin importar cul mtodo se aplique para generar una proyeccin el mejor
indicador para medir una prediccin es la exactitud (o precisin). Todos los
comparativos de desempeo, simplicidad, costo, etctera., deben someterse
al hecho de que el mejor mtodo es aquel que muestre la mayor precisin
en el pronostico. Una compaa puede evaluarse segn sus utilidades, y los
analistas de mtodos de prediccin pueden medirse con base en su
xactitud.
o obstante, tambin debe notarse que la precisin tiene otra connotacin
en el
es r
re n
cu

D o
con

2. Error medio a ion).
3. Promedio del error al cuadrado(MSD: Mean square deviation).
e

N
proceso de prediccin, ya que la construccin del modelo depende de
te concepto; en efecto, el analista escoge el modelo y los datos que mejo
producen los datos histricos. Esto es, las medidas de exactitud muestra
al modelo tiene menor error de prediccin.
ebido a que la exactitud pasada y futura son tan importantes es necesari
ocer las medidas mas usuales del error de prediccin:
1. Error promedio.
bsoluto(MAD: Mean absolute deviat
4. Error absoluto medio porcentual(MAPE: Mean absolute percent
error).

Error promedio

En el cuadro 4.2 se ilustran las cuatro medidas de error y sus capacidades y
mitaciones correspondientes. El error promedio se calcula como la
que las variaciones negativas son iguales a las positivas . As,
ste error es inapropiado para medir la exactitud de la prediccin.
li
diferencia entre los datos observados(columna 2) y el valor de
prediccin(columna 3). Como puede verse, los errores individuales de
prediccin(columna 4) se compensan, de manera que la suma de los errores
es cero por
e

Promedio de la desviacin absoluta (MAD)

Una mejor medida de la variacin en la prediccin es la desviacin
absoluta o MAD, que considera los valores absolutos (Sin tomar en cuenta
el signo) de los errores calculados en la columna 4, de manera que los
alores positivos no se compensan con los valores negativos. En la
columna 5 los error a
suma de MAD es 8 y su promedio es 4.7. La ev acin d error la
prediccin se ve mas justa.
v
se ha eliminado el signo de es de la columna 4. L
alu el de

(1) (2) (3) (4) (5) (6) (7)
Tiempo Real Prediccin Error
Error
Absoluto
Error
cuadrado
Error
Absoluto
Porcentual
1 10.0 11.0 -1.0 1.0 1.0 10.0%
2 20.0 16.0 4.0 4.0 16.0 20.0%
3 15.0 18.0
Suma
-3.0
0.0
3.0
8.0
9.0
26.0
20.0%
50.0%
Media o promedio 0.0 2.7 8.7 16.7%
Cuadro4 edicin ecisin

E colum tambin ica c os v son ativos unto n
positivos; esto es, cuntos valores queda
de los datos histricos. En la tabla se ve que dos estn por encima y uno por
debajo, lo cual proporciona al analista confianza de que no hay sesgo en
los datos.

.2 M d pr e la
sta na ind unt alores neg c y s so
n por encima y cuntos por debajo
Promedio de la desviacin al cuadrado (MSD)

Al elevar al cuadrado los errores, la suma tambin elimina el signo. El
MSE tiene ad se penaliza
ucho mas a las variaciones grandes que a las pequeas.
que la prediccin con el MAD ms pequeo tambin tiene el
enor MSD.
ems otra funcin ya que al elevar al cuadrado
m

Este impacto puede verse en el cuadro 4.2, donde el promedio del error
absoluto es 4.7, en tanto el promedio MSD es 8.7. Debido a esta
caracterstica se prefiere el MSD al MAD, ya que el MSD muestra mejor
las variaciones mayores(amplificndolas); sin embargo, en la practica
puede verse
m

Error absoluto medio porcentual(MAPE)

Esta medida tambin es muy popular. Igual que el MAD y el MSD, usa
los valores absolutos(sin signos); no obstante, consume un paso ms en el
proceso, ya que mide el error en porcentaje.

100
t
t t
t
X
F X
PE
=
(4.1)

n
PE
MAPE
n
t
t
=
=
1
(4.2)

Al sustituir en las formulas anteriores se obtiene que el resultado es de
16.7. La ventaja del MAPE es que se expresa en forma porcentual, lo que
permite comparar series de datos divergentes porque los porcentajes se
constituyen en comn denominador. As por ejemplo, las predicciones de
ventas de computadoras de IBM pueden compararse con la prediccin de
ventas de automviles Chrysler o con las ventas de cualquier otra empresa,
sin importar cun diferente es el producto manufacturado.

Nivel de precisin

Una vez que se han analizado las medidas de exactitud para un modelo de
erie de tiempo, es necesario preguntarse Cul es el nivel de exactitud
ue debe perseguirse al procesar un modelo de prediccin?.
e no una r ivame
variaciones aleatorias pueden ser bastante voltiles, en cuyo caso las
proyecciones elaboradas no son
confiables. En cambio, datos homog curso con erm er
icos n un a ivel d confianz

l i io de rabajo de prediccin los primeros intentos generan
errores considerables, si estos modelos se enfocan desde una perspectiva
ta si pre existe una amplia posib lidad jor

odo e aten in dos directos (Naive).
s
q

Aunqu existe espuesta p
con los
recisa, intu
modelos
neos de
it nte se sab
lo sufici
stante p
e que las
entemente
ite hac
pronst co lto n e a.
Cuando a nic los t s
optimis em i de me a.

Mt s d uac . Mto

Estos mtodos pueden considerarse como puntos de referencia para decidir
sfuer vale l na ra qu pueden compararse los resultados
del modelo que est trabajndose(Benchmark)(Thomopoulus,1980).
El primer mtodo, NF1(Naive Forecast 1), usa la informacin mas reciente
m e q e si est p parndose una
diccin para un izonte de un solo periodo, el valor ms reciente
liz par decir el valor del siguiente periodo. La formula es
muy simple:
si el e zo a pe y cont

disponible referente al valor real, de
pre
odo d u re
hor
puede uti arse a pre

t t
X F =
+1
(4.3)
nde
= Ultimo valor real(para el periodo t)

En estadstica este modelo se conoce como modelo aleatorio
caminante(Random Walk Model ) y en ciertas ocasiones, debido ala inercia
de los datos observados, puede ser el mejor predictor. Por ejemplo, en los
mercados de valores de futuros, frecuentemente los datos se manejan con
estos modelos caminantes, que hacen de la ecuacin (4.3) la mas apropiada
para efectuar pronsticos. Lo anterior quiere decir que existe fluctuacin en
los datos, pero es difcil predecir los giros bruscos.

Si el mtodo de evaluacin MAPE se utiliza con n-1 trminos incluidos en
este mtodo de prediccin (NF1), prediccin empieza realmente con el
periodo 2. La aplicacin de este mtodo facilita obtener medidas
comparativas de mejora obtenible a travs de mtodos formales de
prediccin. El MAPE se presta mejor para benchmark que otros mtodos
de evaluacin como el MSD, ya que permite observar la exactitud relativa
de los resultados .

Mtodos de atenuacin. Promedios mviles simples.(SMA):

do
1 + t
F
= Periodo a predecir para t+i
t= Periodo actual
i = Numero de periodos futuros a predecir
t
X

El mtodo de promedios mviles simples es un mtodo de primer orden; es
decir, se considera simple en el sentido de que el promedio de un nmero
dado de observaciones(periodos) se utiliza para predecir el valor del
periodo siguiente. Cada autor maneja este mtodo de diferente manera, y en
este caso se utiliza la interpretacin Moore, (1989). En el cuadro 4.3 se
utiliza un prom
pro
(co
edio movible (SMA) de tres aos (base tres), donde se
la media
lumna
n los valores 20, 60 y 40 de el p e 40
3), que se convierte en la prediccin para el cuarto
(columna 4).
a cada nuevo punto de datos a obser y
la mas antigua. Por lo tanto, ahora en el ao 4 se obtien
UE DE LA ATENU AS R
PO
Cuadro 2.3 Promedios m
lor de 50 que , agregado a los valores de 40 y 60, genera el promedio
+40+50)/3 o se con
tico para el s
caso, la f vible p

columna 2. rom dio es
vacin
e
IES DE
vierte en
les es:
per

Se
se
iodo
av
elim
anza
ina
, se agrega la nuev

ENFOQ ACIN PARA L SE
TIEM
ovibles simples. Ejercicio 2.1: Ventas

Un
de
el

va
50
pro
[(60
nos
bse
igu
rva
ien
cio
te p
ne
er
s].
iod
Es
o (
te n
A
ue
o 5
vo
).
promedio
En

este ormula general para los promedios mo s sim

=

=
+ + +
n
X X X
F
1 K
(2.4)

esta el pr
representan los valores observados de
pe os pasados hasta n . Al sustituir en la ecuacin (4.4) , se tienen
que 40+60+20 correspon
t-3
y al sustituir 3

=
t 1
t
X
n t t t
t
n n
2 1

En formula F
t
es la prediccin de los SMA para esente periodo,
donde los valores de x, t-1,t-2,...,t-n ,
los riod
entonces
por n se calcula lo siguiente :
de a x
t-1 +
x
t-2 +
x
3
6 ) 20 0 + 40 (
40
+
= y para
3
6 ) 0 5 0 40 (
50
+ +
= ,

(1
A
)
o

Ventas Promedios movibles Prediccin
Reales de tres aos
(2) (3) (4)

1 20 _ _
60 _ _

50 40
_ _ 50

2
3
4
5

40

40
50

_

por lo que ahora la formula es

+
+
+
=
1
2
1
1
n
t
t t
X
n
F
(2.5)
os SMA:

Caracterstica de l
a primera caracterstica importante de este mtodo es que los promedios
ovibles(y para todos los mtodos de series de tiempo) se utilizan
predicciones a corto plazo. Otra caracterstica
portante es que cada observacin se pondera con el mismo peso; as, en
prediccin. Cuando se incorpora un nuevo valor (50) y del
alculo se elimina el ms antiguo(20, ecuacin 4.5), se procede
exactamente igual. Con lo anterio ye que las observaciones fuera
el marco de la base del tiempo(n=3)no tiene ningn peso en la obtencin
io mviles SMA:

L
m
primariamente para
im
el ejemplo se promediaron los valores 20, 40, y 60 para obtener el valor de
40. Cada una de las tres observaciones tiene un tercio de representacin
para llegar a la
c
r se conclu
d
del promedio movible que est calculndose.

Desarrollo de un modelo de promed
o a que en gran medida este mtodo es puramente mecnico; el
proceso a seguir est bastante estandarizado. El nico hecho que puede
alterar el modelo es el numero (base) de observaciones a promediar. En
este caso, de manera arbitraria se escogi una base de 3 aos, pero en la
practica pueden escogerse trimestre, cuatrimestre, semestres o cualquier
res de prediccin.
inexactitud de los
una prediccin de

Debid
otra combinacin. En el cuadro 4.4 se efecta el ejercicio 4.2, donde se
comparan dos bases, de 3 y de 5 meses. En este libro, y para efectos
didcticos la comparacin se simplificar utilizando solamente el MAD y
el MSD para determinar cul base genera la mejor exactitud histrica para
proyectar los valo

En efecto, debido a que se conoce bastante bien la
ronsticos climticos , en el ejercicio 4.2 se estudia p
temperaturas por los ltimos 14 aos y se genera una proyeccin para la
temperatura ms fra (promedio de 24 horas) que podr experimentarse
para el prximo ao. Si esta prediccin es correcta ser de gran utilidad de
granjeros, la compaa de electricidad, etc., para enfrentar los efectos del
clima.

El cuadro 4.4 examina promedios movibles base 3 y base 5 para ver qu

modelo, MSD o MAD, produce el menor error. Es claro que la base 5,
genera el menor error indica una mejor reproduccin de los datos
histricos.

Otra cuestin importante es que la base 5 asigna menor peso a cada
observacin (1/5 contra 1/3). Por lo tanto, el efecto atenuador de la base 5
es mayor, ya que reacciona menos a cada punto individual. De este hecho
puede deducirse una regla general: En las regiones en que una serie de
tiempo exhibe variaciones amplias alrededor de una lnea estacionaria, una
base ms grande genera un mejor ajuste de la prediccin a los datos
histricos (menor error).

Promedio de tres aos SMA Promedio 5 aos SMA
1

Ao
s
2
Temperatu
ra
actual
3

Predicci
n
4
Error
cuadrad
o
5
Error
cuadrad
o
6

Predicci
n
7

Absolut
o
8

Cuadra
do
1 31
2 44
3 31
4 49 35 14 187
5 28 41 13 178
6 25 36 11 121 37 14 135
7 21 34 13 169 35 4 207
8 35 25 10 107 31 12 18
9 44 27 17 289 32 6 154
10 37 33 4 13 31 4 41
11 28 39 11 114 32 1 19
12 32 36 4 19 33 13 1
13 22 32 10 107 35 8 174
14 41 27 14 187 33 0 71
15 32

MAD
= 11 7

MSD
= 135 91
Cuadro 4.4 Temperatura diaria mas fra (grados Fahrenheit).Ejercicio 2.2
s importante hacer notar que como base puede fijarse cualquier n. En el
cuadro 4.5 puede verse que la b la que genera mejor ajuste (6
rados); es decir que ninguna rplica de los datos histricos genera un
riencias permite

E
ase 7 es
g
resultado que mejora en promedio tales 6 grados. Esta expe
apreciar las dificultades presentes a tratar de predecir las variaciones
climticas.
onclusiones a las ya mencionadas:
l

Pueden agregarse algunas nuevas c

Debido a que las variaciones de los datos afectan menos la

Periodo SMA MAD
3 11
5 8
7 6
9 7
Cuadro4.5 Medidas de exactitud en grados Fahrenheit
prediccin, si se utiliza una base ms grande (periodo de tiempo ms
largo), se tiene que el factor de atenuacin es mayor. El tamao de la base
uede
base ms a
los va ores histricos observado

Como u punto de este capitulo cabe hacer notar que existe una gran
variedad de combinaciones dios movibles dobles hasta los
prom s lineales de orde r ejemplo, este mtodo lineal
utiliza promedios simp resolver tendencias no
estacionarias. En suma, puede decirse(Makridakis y Wheelwrigth) que
cualquier tipo de promedio movible plica una ponderacin de los datos
istricos ms tiles suavizando y atenuando (ms que pronosticando)
eries de datos, ya que a su vez se muestra mejor como predictor (Mtodo

p determinarse empricamente haciendo varios ensayos, y la mejor
es aquella que genera el menor error; es decir el que se acerca
l s.
ltimo
de prome
edio n ms alto. Po
les y dobles para
im
h
s
de promedios movibles) para datos que son ms homogneos hacia la
media (tendencia central, datos estacionarios).

Mes Period
o de
tiempo

Promedio
s
movibles
Base 3
Promedio
s
movibles
Base 5
Promedio
s
movibles
Base 3
Promedio
s
movibles
Base 5
Enero 1 200
0

Febrero 2 135
0
MAD 71.46 51.00
Marzo 3 195
0
MAP
E
34.89 27.88
Abril 4 197
5
1767 MSD 6395.66 3013.25
Mayo 5 310
0
1758
Junio 6 175
0
2342 2075
Julio 7 155
0
2275 2025
Agosto 8 130
0
2133 2065
Septiembr
e
9 220
0
1533 1935
Octubre 10 277
0
1683 1980
Noviembr
e
11 235
0
2090 1914
Diciembr
e
12

2440 2034
Ejercicio 4.3 Se tienen 11 embarques de abridores de latas y se plantea un
odulo de prediccin de atenuacin de promedios movibles simples para el
periodo 12 tanto de base 3 como de base 5. Compagine los resultados del
pitulo

m
modelo con lo que aprendi en este ca

Mes Periodo
de
tiempo
Promedios
movibles
Base 3
MSD
Base
3
Promedios
Movibles
Base 5
MSD
Base
5
Promedios
Movibles
Base 7
MSD
Base
7
Promedios
Movibles
Base 9
MSD
Base
9
Promedios
Movibles
Base 11
MSD
Base
11
Enero 1 19.0
Febrero 2 15.0
Marzo 3 39.0
Abril 4 102.0 24 6032
Mayo 5 90.0 52 1444
Junio 6 29.0 77 2304 53.0 576
Julio 7 90.0 74 267 55.0 1225
Agosto 8 46.0 70 560 70.0 576 54.9 78
Septiembre 9 30.0 55 625 71.4 1714 58.7 825
Octubre 10 66.0 55 114 57.0 81 60.9 26 51.1 222
Noviembre 11 80.0 47 1067 52.2 773 64.7 234 56.3 560
Diciembre 12 89.0 59 920 62.4 708 61.6 752 63.6 647 59.8 854
Enero 13 82.0 78 13 62.2 392 61.4 423 69.1 166 59.6 501
Febrero 14 17.0 84 4444 69.4 2746 69.0 2704 66.9 2489 60.5 1889
Marzo 15 26.0 63 1344 66.8 1665 58.6 1061 58.8 1074 59.7 1135
Abril 16 29.0 42 160 58.8 888 55.7 714 58.4 867 56.2 738
Mayo 24 48.6 55.6 51.7 53.1

Error
MSD
1484 1031 757 861 1024
Eje
La
r muestra la ve per enero 981
g ccin para el mes de mayo de 1982 utilizando promedios movi base
los resultados del model ue aprendi en e apitulo
cicio4.4 El cuadro siguiente
erencia desea conocer la predi
11. Compagine
nta de cuchillos elctricos en el
o co
iodo de
ste c
de 1
bles
.
a abril1982.
3, 5, 7, 9 y
n lo q

Mtodos de atenuacin
exponencial simple,
NTRODUCCION
lineal y no lineal.

I

Una manera de representar el mtodo de promedios movibles simples,
segn se estudi en el capitulo anterior (vase ecuacin 4.4), es con la
formula (5.1)

N
X X X
F
N t t t
t

+ + +
=
K
2 1
(5.1)

Lo anterior significa que una vez obtenida la prediccin para el periodo t
(de F), la prediccin para el periodo t +1 puede obtenerse, a su vez,
sumando X
t
/N y luego restando X
t-N
/N.
El valor de F
t+1
en la ecuacin (5.1) tambin puede representarse con la
ecuacin

t
N t t
t
F
N
X
N
X
F + =
+1 (5.2)

Escrita de manera, cada nueva prediccin basada en promedios movibles
es un ajuste a la prediccin anter anera que se comprueba que el
efecto de atenuacin se incrementa a hacer cada vez mayor a N; esta es,
entre cada prediccin se hace menor.
NE CIAL.
Seg n pu todo de promedios mviles hay dos
lim e iere siempre un
ero N de valore
ulas y clculo para lograr una prediccin. Segundo, el mtodo de
ior, de m
l

TEORIA DE LA ATENUACIN EXPO N

ede observarse, en el m
itaciones(Makridakis y Wheelwright). Primero, se r qu
toma un espacio considerable en nm s observados, lo que
frm
promed odas las N observaciones
y no considera las observaciones del periodo anterior a (t-N).

l recordar el mtodo directo (Naive) puede argumentarse que las
obs c
puede suceder en le futuro, por lo que
q e s.
reque res
e
m
v cc
ec

ios mviles pondera con un mismo peso t
A
ervaciones ms recientes ontienen informacin actualizada de lo que
deberan ponderarse con mayor peso
ue las obs rvaciones anteriore El mtodo exponencial satisface este
rimiento y elimina la necesidad de almacenar gran nmero de valo
histricos. El principio operativo d atenuaciones similar al de los
promedios mviles para eliminar la aleatoriedad. El procedimiento
atemtico es algo diferente; as, si se modifica la ecuacin (5.2)
incorporando un estimado ms reciente, en lugar del valor t-N y si este
alor estimado fuese la predi in del periodo precedente, entonces la
uacin (5.2) quedara

t
t t
F
F
+
t
N N
X
F =
+1 (5.3)

Dicha ecuacin tambin puede escribirse de la siguiente manera

t t t
F
N
X
N
F
+ =
+
1
1 (5.4)

Ahora se tiene una prediccin que ha dado un peso de 1/N a la

1 1
observacin
nt eso de 1-1/N a la prediccin que se obtuvo de dicha
observacin, y si luego la notacin 1/N se sustituye con la letra alfa( ),
entonces se obtiene
m s recie e y un p
t t t
F X F ) 1 (
1
+ =
+
(5.5)

es la ecuacin general utilizada por el mtodo de atenuacin
xponencial simple. P o la necesidad
os con bases
d s. Si la ecuacin (5.5) se desarrolla sustituyendo el valor de F
t
dado

Esta
e uede comprobarse que se ha eliminad
de manejar varias observaciones para obtener promedi
gran e
por
t t t
F X F ) 1 (
1
+ =
+
, entonces se tiene

] ) 1 ( ) 1 (
1 1 1 +
[ + + =
t t t t
F X X F

1
2
1 1
) 1 ( ) 1 (
+
+ + =
t t t t
F X X F

(5.6)
Sin embargo,

2 2 1
1 (
+
)
+ =
t
F
t
X
t
F
(5.7)

Al co inuar sus ndo se la sig e ecua

nt tituye obtiene uient cin:
2 2
2
) X
1 t 1 + t
) 1 ( )

+ =
t t t
F X F
(5

y as sucesivame

De esta ecuacin puede verse la atenuaci onenc
limitacin de los promedios movibles, ya que adjudica pesos decrecientes a
lm
d 5.1.

Cuadro 5.1 Peso decreciente para los valores ms antiguos
= 0.1
1 ( + 1 ( + X
.8)
nte.
n xp e ial limina la segunda e
las observaciones anteriores; es decir, debido a que el valor es un
nmero entre 0 y 1, entonces (1- ) tambin es un nmero entre 0 y 1, y por
tanto los pesos (1- ), (1- )
2
, etc., tienen valores que decrecen
exponencia ente. De aqu el nombre de atenuacin exponencial. Holton
muestra claramente lo anterior en el cua ro

Sin importar el valor que se elija para la constante , la suma de los pesos
alcanzar finalmente el valor de 1. el valor escogido de la constante hace
que la suma de los pesos converja rpidamente o lentamente.
Tiempo Clculo Peso
t 0.1
t-1 0.9 x 0.1 0.090
t-2 0.9 x 0.9 x 0.1 0.081
t-3 0.9 x 0.9 x 0.9 x 0.1 0.073

Total 1

Si se escoge =0.9, la suma de los pesos converge mucho mas rpido que
con =0.1, como se muestra en el cuadro5.2.

Cuadro 5.2 Peso decreciente

Tiempo
=
Clc
para los valores ms antiguos
0.9
ulo

Peso
t 0.9
t-1 0.1 x 0.9 0.09
t-2 0.1 x 0.1 x 0.9 0.009
t-3 0.1 x 0.1 x 0.1 x 0.9 0.0009

Total 1

omo simple gua para escoger , si la serie numrica tienen amplias
ariaciones aleatorias deben seleccionarse valores cercanos a 0. Si se desea
ambios ms recientes de los valores
no a 1. El valor de tambin puede
icamente dicho valor y procesando el
tes valores de , para seleccionar
ensayo que obtenga el menor MSD(Mean Square
eviation).

Para efectos del proceso pueden utilizarse las siguientes ecuaciones alternas
a la ecuacin 5.5:

C
v
que la prediccin dependa de los c
reales, debe elegirse un valor cerca
seleccionarse haciendo variar empr
modelo varias veces con diferen
osteriormente el p
D
) (
1 1 t t t
F X F F + =
+
o bien
t t t
e F F + =
+1
(5.9)

Como =1/N, en un modelo de promedios movibles tambin podra
interpretarse que una cercana a 0 corresponde a un valor mayor de N
(mayor nmero de observaciones), en tanto que un valor de grande
corresponde a un menor valor de N (correspondiente a un menor nmero de
observaciones).

3.3 ATENUACIN EXPONENCIAL SIMPLE

Varios aspectos de este modelo se ilustran con el ejercicio 5.3 del capitulo
anterior. En el cuadro 5.3 (ejercicio5.1) se muestran los valores
pronosticados utilizando la ecuacin (5.5) o la ecuacin (5.9). El nico
punto importante a recordar es que para el primer periodo no existe
pronostico disponible(este hecho se enfrentar recurrentemente para cada
modelo de series de tiempo). En este caso, el valor de la primera
observacin(la demanda de enero) puede utilizarse tambin para el primer
pronostico. As, F
2
= X
1
=2000. A continuacin, tomamos este valor de
2000(el pronostico previo) y le sumamos el resultado de 0.1(1350-2000)
para obtener 1935, que puede utilizarse como prediccin para el periodo
nmero 3.
En la f en
la cantidad de atenu rvados. Un valor
rande(0.9) logra muy poca atenuacin, mientras un valor pequeo de
.1) genera una atenuacin considerable.
s de dos bases
e promedios movibles (3 y 5), entonces es posible evaluar la exactitud de

igura 5.1 se observa el efecto que tiene el valor de la constante
acin lograda en los valores obse
g
(0

En la grafica puede observarse que el valor 0.1 de muestra una lnea que
casi no flucta. Al calcular el error MSD se observa que =0.1 genera un
error menor que aquellos errores MSD correspondientes a valores mayores
de . Como en el capitulo anterior ya se calcularon los errore
d
ambos mtodos.

3000
3500
0
500
1000
1500
2000
0 1 2 3 4 5 6 7 8 9 10 11 12 13
D
e
m
a
n
d
2500
Periodo de tiempo
a
Demanda observada
?=0,1
?=0,5
?=0,9
Figura 5.1 Comparacin de la atenuacin exponencial simple para
prediccin con valores 0.1, 0.5 y 0.9 (ejercicio5.1)

Cuadro 5.3 Pred a para cuchillos elctricos para el
mes de Dici nuacin exp le
(Ejercicio5.1)
cin exponencial
s
iccin de la demand
embre utilizando la ate onencial simp

Atenua
imple
Periodo Mes
Demanda
observada
=0.1 =0.5
1 Enero 2000
=0.9

2 Febrero 1350 2000 2000 2000 MSD0.1=3431
3 Marzo 1950 1935 1675 1415 MSD0.5=4338
4 Abril 1975 1937 1813 1897 MSD0.9=5034
5 Mayo 3100 1940 1894 1967
6 Junio 1750 2056 2497 2987
7 Julio 1550 2026 21
8 Agosto 1300 1978 1837 15
9 Septiembre 2200 1910 1568 1328
10 Octubre 7 2123
11 Noviembre 3 2330 2709
12 Diciembre 0 2386
23 1874
82
2
2
75 1939 1884
50 2023
2056 234

Puede observarse que el mejor de los dos mtodos computados es el
promedio movible de 5 me 0.1. Tambin es
fcil observar que los de cmputo con el mtodo
exponencial simple son ms sencillos, y el hecho de apreciar
intuitivamente que la pond el exponencial se basa en los datos
ms recientes, hace que mente prefiera el mtodo
exponencial, en lugar del movibles con base mayor. Esta
evaluacin mostrado
petidamente que el mtodo exponencial produce resultados sencillos y
onfiables en una amplia gama de aplicaciones de prediccin (forecasting).
DO
DO

Ya
mu
dat
efe
pat dente o descendente), entonces el mtodo
xponencial simple ya no es tan efectivo.
Par
ma
pue
de

Si ncial simple se utiliza para datos con tendencia, la
pre
pos
dat
aju
pro
exp
ses y es muy semejante al de =
requerimientos
eracin para
el analista normal
de promedios
ha sido comprobada por la experiencia, que ha
re
c

BLE ATENUACIN EXPONENCIAL LINEAL DE HOLT DE
S PARMETROS, PARA TENDENCIA
se ha mostrado ampliamente que cuando los datos son homogneos y
estran poca variacin con respecto a la media(el patrn histrico de los
os es estacionario),estas tcnicas de atenuacin pueden utilizarse
ctivamente y a muy bajo costo. No obstante, si los datos muestran
rones de tendencia(sea ascen
e

a enfrentar este problema Holt (1957) y Brown (1956) desarrollaron de
nera independiente, y casi simultnea, mtodos de atenuacin lineal que
den resolver procesos de prediccin con datos que exhiben algn patrn
tendencia y que, como en el caso anterior, son efectivos y de bajo costo.
el mtodo expone
diccin resultante tendra un error sistemtico amplio negativo o
itivo, dependiendo de la tendencia descendente o ascendente de los
os originales. La prediccin mejora notablemente si esta tendencia se
sta utilizando algunos mtodos lineales de atenuacin: el doble de
medios movibles, el exponencial lineal de un parmetro de Brown o el
onencial lineal de Holt de dos parmetros.

Para efectos prcticos, el mtodo de Holt se tiene ventaja sobre los otros
dos por tres razones principales: ante todo, su simplicidad, ya que slo
req
est
exp remento (o de
factor de tendencia) a la ecuacin de la atenuacin exponencial para as
pod

uiere de dos constantes: y y de tres ecuaciones; en segundo lugar,
e mtodo no es ms que una extensin del modelo de atenuacin
onencial simple y, en tercer lugar, agrega un factor de inc
er ajustar dicha tendencia
) )( 1 (
1 t t t t
T F X F + + =
+

(5.10)

t t t t
T F F T ) 1 ( ) (
1 1
+ =
+ +
(5.11)

1 1 + + +
+ =
t t m t
mT F H
(5.12)
don

de:
1 + t
F

= valor atenuado para el periodo 1 + t

= constante de atenuacin
r de los d les
diccin p iodo
X
t
= valo atos rea

t
F
= pre ara el per t (valor atenuado 1 t )
tor de te
1 + t
= fac
T
ndencia

=constante de de la tend
odos fut decir
prediccin para el per
atenuacin encia
m = peri uros a pre
m t
H
+
= de Holt iodo m t +

in (5.10 para el iento del periodo
anterior sumando al valor atenuado del periodo anterior. El estimado
de la tendencia se calcula en la ecuaci ), donde se a la
diferencia de los dos l res
La ecuac ) ajusta
1 + t
F
crecim
t
T
t
T
t
F
1 + t
T
n (5.11 comput
timos valo F atenuados. Debido a que estos dos
valores ya han sido atenuados, e asum ue la d ferencia entre un
estimado de la tendencia de los datos. La segunda constante de atenuacin
e q i ambos es
(
)de la ecuacin(5.11) se obtiene utilizando el mismo principio empleado

para determinar la constante ( ) de la atenuacin exponencial simple. El
lor ms reciente de la tendencia
) ( F F
va
1 t t
+
se pondera por la constante
) y, entonces, el ultimo valor

t
T
atenuado de la tende a s ncia es u vez (
ponderado por
) 1 (
. La suma de los valores ponderados es el nuevo
valor de la tendencia .

La ecuacin (5.10) se utiliza pa periodos de
tiem n el futuro sumando el producto del componen
y el o do alor do .

Este d o ex el a es a
un factor de tendencia. El
mod o er s d nda ta s c
ejecutados pueden verse para el periodo 8, utilizando
1 + t
T
ra llegar a la prediccin de m
po e te de tendencia
1 + t
T

nmer de perio s m al v atenua actual
+ t
F
1

mto o aplica c n bastante actitud juste nec ario par predecir
cuadro5.4 (ejercicio 5.2)
ie de dato
ilustra la aplicacin del
de inven elo H lt a una s e dema rios. Lo lculos
= 0.2,
m
=0.3 y =1, as,
7 7 8
(5
don

7
F
.10)

m
mT + F H =
con .12)
de:
)
6
T +

( 8 . 0
6
F + 2 . 0 X =
2 . 0
con (5
6
87 . 168 ) 39 . 5 2 . 170 ( 8 . 0 ) 174 ( = + +

T T
=

6 6 7 7
7 . 0 ) F ( 3 . 0 F + =
.1

7 .
con (5 1)
37 . 3 ) 39 . 5 ( 0 ) 174 2 14 ( 3 . 0 = + =

as:
25 . 172 ) 1 ( 37 . 3 8 . 168
8
= + = H

Cuadro 5.4 Mtodo de exponenciacin lineal de dos parmetros de Holt.
Demanda de inventarios (ejercicio5.2)
= 0.2
=0.3 =1 m
X S b
1 143 143.00 9.00
2 152 152.00 9.00
3 161 161.00 9.00 161.00 0
4 139 168.80 7.14 170.00 961
5 137 164.15 5.10 170.94 1152
6 174 170.2 5.39 169.26 23
1128
7.50
4270
610.07
7 142 168.87 3.37 175.59
2.25 8
9
141
16
166.00
16 .4
1.50
17
17 976
30 2 6 1. 16

El proceso de inicializacin del modelo de atenuacin lineal de Holt de dos
parmetros requiere dos estimados: uno para obtener el primer valor
atenuado y otro para obtener el valor de la tendencia. El primer
valor coge
t
F
t
T
t
es fcil de obtener: se es
F
t t
X F =
.
El estimado de la tendencia es bastante problemtico algunas veces. En
principio, se requiere un estimado de tendenc de u eriodo
siguiente, de manera que exis varias p ilidades
X
la ia n p al
ten osib :
1
X
2 1
T =

3
) ( ) ( )
1
(
3 4 3 2
X X X X
T
2
X
1
X + +

u omportan bien, la alternativa escogida no es
lver predicciones de
sin embargo, estos
pronsticos de datos que muestren
=
1
=un estimado a ojo de la pendiente, despus de graficar los datos
T
C ando los datos se c
crtica, pero los datos del ejercicio 5.2 presentan una cada dramtica en
los periodos 3 y 4, de manera que si se utiliza la segunda alternativa, que
incluye la diferencia X
4
-

X
3
, entonces el mtodo requiere gran cantidad de
periodos para dirigir la tendencia otra vez hacia arriba, sobreponindola a
influencia de tan notable cada. la

TRIPLE ATENUACIN EXPONENCIAL: MTODO DE WINTERS
DE TRES PARMETROS, PARA TENDENCIA Y
ESTACIONALIDAD

Todos los modelos utilizados hasta ahora pueden reso
atos estacionarios, no estacionarios y con tendencia; d
modelos no son efectivos para hacer
variaciones estacinales.
) )( 1 (
1 1
+ + =
t t
p t
t
t
T F
S
X
F

Este mtodo de prediccin est
basado en tres ecuaciones y es
similar al mtodo de Holt, una
ecuacin adicional para la
stac

e ionalidad.
p t
t
t
F
t
S + ) 1 (

1 1
) 1 ( ) (

+ =
t t t t
T F F T

t t t m t
S mT F W ) ( + =
+

Donde P indica la longitud de
estacional en nmero de
s y S significa el estimado
de estacionalidad

tiempo
periodo
X
S =

Figura 5.2 Triple exponen iple exponenciacin de Winters para tendencia y
e tres parmetros
dizar mucho en este modelo (vase figura 5.2), el mtodo de
iones estacionarias, la
egunda para la tendencia y la tercera para la estacionalidad.
mtodos de atenuacin.
el anlisis de stos surge tres conceptos de mejora y utilizacin
elos, de tal manera que
se resuelvan situaciones especiales de prediccin. Al respecto, pueden
mencionarse el m delo de tr atenua expone al cuadrtica de
Bro e a er les l mtodo
de a uacin armnica d la simplicidad de los
mtodos de atenuacin, pero trata de introducir transformaciones de
Fou i e of (Pegels,
Gar

Triple exponenciacin cuadrtica Mtodos de atenuacin
e ncia
ciacin de Winters para tendencia y
e tres parmetros
dizar mucho en este modelo (vase figura 5.2), el mtodo de
iones estacionarias, la
egunda para la tendencia y la tercera para la estacionalidad.
mtodos de atenuacin.
el anlisis de stos surge tres conceptos de mejora y utilizacin
elos, de tal manera que
se resuelvan situaciones especiales de prediccin. Al respecto, pueden
mencionarse el m delo de tr atenua expone al cuadrtica de
Bro e a er les l mtodo
de a uacin armnica d la simplicidad de los
mtodos de atenuacin, pero trata de introducir transformaciones de
Fou i e of (Pegels,
Gar

Triple exponenciacin cuadrtica Mtodos de atenuacin
e ncia
estacionalidad d estacionalidad d

Sin profun

Sin profun
Winters se basa en tres ecuaciones de atenuacin (de hecho, sigue la misma
lgica que el modelo Holt):una para las variac
Winters se basa en tres ecuaciones de atenuacin (de hecho, sigue la misma
lgica que el modelo Holt):una para las variac
ss

OTROS MTODOS DE ATENUACIN

Al igual que el mtodo de Winters, existen otros

OTROS MTODOS DE ATENUACIN

Al igual que el mtodo de Winters, existen otros
D D
(Makridakis y Wheelwright): (Makridakis y Wheelwright):

a) Incorporar la transformacin de datos en los mod a) Incorporar la transformacin de datos en los mod
o
wn de un parm
ten
o
wn de un parm
ten
iple iple cin cin nci
no linea
ne
nci
no linea
ne
tro p tro p r resolv
e Harrison
r resolv
e Harrison
tendencias
, que mantie
tendencias
, que mantie
o e o e
rier a f n de agr rier a f n de agr gar s gar s isticacin matemtica a dicho m isticacin matemtica a dicho modelo odelo
dner). dner).
xpone xpone l l
'
+
t
S Pr
1
'
) 1 (
=
t t
X S i at n mera enuaci
' '
1
'
1 (
+
t t
S Se
' '
) =
t
S S a n ti
ple, de Brown, de Chow
gunda tenuaci Adapta vos:
Sim
' ' '
1
' '
) 1 (
+
t t
S Te
' ' '
=
t
S S atenuacin rcera
Jenk re metros
utiliza residuales y
autocorrelacin.
Box ins de t s par
' ' ' ' ' '
3
t t t
S S + 3
t
S a =
todo a o rrison M rmnic de Ha
' ' ' ' ' '
3
t t
S S + 3
t t
S a = liza m
ie
uti transfor aciones de
Four r

)
Es
2
1 (
' ' ' ' ' '
t
c
=
te do
in
iza
cuando Los
datos
muestran una
Sistema nitoreo Trigg
(
)
2
t t t
S S S +
2
mto
de predicc
se util
de mo
2
2
1
m c b + a F
m t
+ =
+

tendencia no
lineal
(cuadrtica,
cbica o de
orden mayor)

t tm t
Figura 5.3 Otros mtodos de atenuacin exponencial

b) Incorporar el enfoque adaptativo a los modelos de atenuacin, lo cual
implica que, en lugar de tener un valor nico de cualquiera de los
parmetros utilizados ( , o ), este valor puede variar, de manera
controlada, segn los cambios que vayan ocurriendo en los patrones,
sean aleatorios, de tendencia o de estacionalidad. Esta caracterstica es
atractiva cuando se tienen cientos o miles de observaciones para lograr
una prediccin, y en done este enfoque permite cambios automticos en
los valores delos parmetros, segn vayan cambiando los patrones de
variacin de la informacin.

c) Todos los de computacin, como SAS, SYSTAT, SPSS o MINITAB,
con izacin de los mtodos de atenuacin tanto por
pro ios movibles como por exponenciales, transformaciones y
enfoque adaptativo en forma transparente para el usuario; es decir el
paquete presenta una pantalla de dialogo donde solicita, en forma
, quieren calcular: aleatorio, de tendencia y/o
En el mismo dialogo, el paquete solicita el valor que el usuario desea
adjuntar al parmetro o parmetros que se aplican a los patrones
mencionados y, entonces, adems de algunas otras indicaciones de orden
computacional (impresora, almacenamiento, etc.), procede a calcular el
pronostico solicitado, generando la prediccin con tantos valores como
templan la util
med
practica qu patrones se re
de estacionalidad.
el usuario solicite, gratificando dichos valores y presentando el error de
serie de datos procesados. Cada paquete presenta los erro la res
computados estndar de cada modelo y ensayo, que son los ya
Atenuacin exponencial simple:
mencionados en el capitulo 2 y 3: MSD, MAD y MAPE.

Debe mencionarse que, en general, los paquetes no indican cul mtodo
ha sido programado. Es factible suponer, entre otras razones, que en la
mayor parte de los casos el modelo es elegido en funcin de
consideraciones pragmticas. Como ejemplo, y dada simplicidad, para el
calculo de la tendencia suele preferirse el modelo Holt de dos
parmetros al de Brown, de un parmetro .

EJERCICIOS

or cuadrado
Con las ventas de detalle de farmacias a partir de enero de 1980 realice
la atenuacin exponencial simple. Se escogi arbitrariamente un valor de
=0.168
Fecha Datos Error Err
1980-Ene 2410.73
1980-Feb 2295.97 -114.76 13170
1980-Mar 2405.33 13.88 193
1980-Abr 2458.69 64.91 4213
1980-May 2512.29 107.60 11579
1980-Jun 2468.3 2074 45.54
1980-Jul 2451.35 20.94 438
1980-Ago 2515.78 81.85 6699
1980-Sep 2455.28 7.60 58
1980-Oct 2628.81 179.85 32347
1980-Nov 2582.01 102.84 10575
1980-Dic 2731.78 235.33 55380
1981-Ene 136725
MSD= 12430
Doble atenuacin exponencial lineal de Holt :
Con los mismos datos del ejercicio anterior, desarrolle la atenuacin
exponencial lineal de Holt, con =0.052 y =0.294. Valor inicial T=40

Fecha Datos Atenuacin Tendencia Prediccin Error Error
cuadrado
1980- 2410.73 2410.73 40.00
Ene

1980-
Feb
2295.97 2448.65 39.93
1980-
Mar
2405.33 2478.05 36.45 2488.04 -82.71 6840.69
1980- 2458.69 2508.83 34.7
Abr
8 2514.50 -55.81 3115.10
1980- 2512.29 2539.19 33.48 2543.61 -31.32 980
May
.89
1980-
Ju
2468.3 2569.54 32.56 2572.68 - 10894.81
n 104.38
1980- 2451.35 2595.14 30
Jul
.52 2602.10 -
150.75
22725.46
1980- 2515.78 2616.59
Ago
27.85 2625.66 -
109.88
12073.22
1980- 2455.28 2637.75 25.88 2644.45 - 35783.57
Sep 189.17
1980-
Oct
2628.81 2652.80 22.70 2663.64 -34.83 1213.07
1980- 2
Nov
582.01 2673.08 21.99 2675.50 -93.49 8740.99
1980-
Dic
2731.78 2689.18 20.26 2695.06 36.72 1348.34
1981-
Ene
2710.60 20.60 2709.44 103716.14
MSD= 10372

Otros mtodos atenuacin :
Utilizando la serie no aleatoria 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, calcule
la prediccin del periodo 11 utilizando el mtodo exponencial simple y
el mtodo exponencial lineal de Holt. Qu valor de debe usarse en
el exponencial simple?A la luz de la ecuacin 4.9, por que?Cul
debera ser el valor inicial de T en el exponencial lineal?por qu?

=0.1 =0.001 =0.1
Datos Exp. Simp. Error Atenuacin T Holt Error
2 2 2 2
4 2 2 4 2 4 0
6 4 2 6 2 6 0
8 6 2 8 2 8 0
10 8 2 10 2 10 0
12 10 2 12 2 12 0
1 4 12 0 2 14 2 14
1 6 14 2 16 2 16 0
18 16 18 0 2 18 2
20 0 0 18 2 2 2 20
20 22

ATENUACIN O IAL TADA A TE
T

U i co enci manej ten li se
denomina Mtodo de dos parmetros de Holt
EXP NENC AJUS A L NDENCIA:
MTODO DE HOL
na tcn ca que se usa n frecu a para ar una dencia neal
( )( )
1 1
1
+ +
t
=
t t
T Y
t
A A
. La Tcnica de Holt atena
e te a y ndient pleando diferentes
c tantes de aten n da un las.

Con esta ecuacin se atena la serie en forma exponencial de manera
si e so de avizaci one m la
d encia radica ue rega u rmino para toma u la
te .

L c s n en e cnica s

La serie exponencialmente atenuada

La estimac de
El pronstico de p periodos en el futuro

Donde :
A v
= Constante de atenuacin de los datos (0< <1)
n forma direct
ons
a la ndenci la pe e em
uaci para ca a de el
milar a como se
ifer
hacia n el ca la su n exp ncial si ple,
en q se ag n t r en c enta
ndencia
as tres e uaciones que e utiliza sta t on:
in de la ten ncia
t
= Nue o valor
( ) ( )
1 1
1

+ =
t t t
T A A
t
T
( )
p L t t t
p t S pT A Y
+
+
+ =
atenuado
Y Nueva observacin o valor real de la serie en el periodo t
= Constante de atenuacin de la estimacin de la tendencia (0< <1)
T Estimacin de la tendencia
p = Nmero de periodos a estimar
Y Pronstico de p periodos a futuro
Ejemplo : Los datos del cuadro siguiente muestran las ventas trimestrales
en el perodo 1988-93. Pronosticar las ventas de 1994, usando la tcnica de
Holt con
.3 y = 0.2. Considerar adems como valor inicial atenuado 500 y el
v c stimacin inicial de la tendencia.

Solucin : to a los valores iniciales : El valor inicial atenuado puede
estimarse promediando unos cuantos valores de la serie, adems, el valor
inicial de la tendencia se puede estimar utilizando la pendiente de la
ecuacin de tendencia obtenida de datos anteriores.

Pronstico usando Atenuacin Exponencial ajustada a la Tendencia

Variable : Ventas de piezas metlicas, segn aos

m.
Yt
At
valor
atenuado
Tt
estimac.
Tendencia
Yt+
p
et
t
=
t
=
t+p
=
= 0
alor de 0 omo e
Respec
Ao Tri
T
88 1
1
6
4
500
350
0
400
150
400
0
250
500.0
455.0
390.4
385.9
219.5
277.5
377.0
354.1
0
-4.5
-10.5
-9.9
-17.8
-10.2
0.8
-1.6
500.0
500.0
450.5
379.8
202.9
206.2
321.7
296.5
0
-150
-200.5
20.2
-52.9
194
28.3
-46.5
2 25
2
3
3
4
4
89 1
5
2
450
350
200
300
350
200
398.2
378.3
311.9
295.6
303.0
260.3
-7.7
-8.9
-14.2
-14.4
-12.2
-15.3
376.0
390.5
338.8
305.5
293.2
271.2
74.0
-40.5
-169.4
-5.5
56.8
-71.2
3 550 364.7 -0.5 287.6 262
7 35
8 550 403.1 3.5 404.9 145
90 1
9
550
400
426.4
437.5
5.5
6
490.3 59.7
2
4
12
13
14
3
15
16
92 1
17
2
3
350
400
650
450.1
546.4
546.4
6.7
12.1
10.9
387.3
337.6
430.9
687.3
1.9
12.7
12.4
-30.9
-37.3
10
3
11

600
750
500
471.9
531.8
548.8
8.2
13.4
13.7
554.1
591.0
491.7
45.9
159
8.3
91 1 75
2
4
18
19
4
20
93 1
21
2
22
3
23
4
24
94 1
25
EMC = 21 488.5
(1 )(
1
)
1
+ +
t
=
t
L t
t
A
S
Y
Y
A LA VARIACIN ESTACIONAL: MODELO DE WINTER
l modelo de atenuacin exponencial lineal y estacional de tres parmetros
de Winter, que es una extensin del modelo de Holt, y puede reducir el
error d e iz cu io a ra determinar la
estacionalidad. Esta estima d dice estacional y se
calcula l muestr que l in del ndice
estacional
t t
lic , se suma despus a la estimacin
estacio ult a por ). divide
entre A e r al orma de ndice en vez de hacerlo en
trminos absolutos, de modo que pueda promediarse con el ndice
estacio u p o

Esta tcnica s ate n forma directa la tendencia y la
estacio fer onstantes de atenuacin para cada uno
de ellos.

Las cuatro ecua q p odelo de Winter son:

Serie exponencial atenuada :

Ajusta io m os estacinales que pudieran existir
en el v original Yt

Estimacin de la Tendencia :

Estimacin de la Estacionalidad :
El pronstico de p perodos en el futuro :
ATENUACIN EXPONENCIAL AJUSTADA A LA TENDENCIA

E
t
A T
e pron stico. S util a una e
cin est
acin adic
ada por un
n l pa
n
con la ecuaci
(Y/A) se m
n 3, a cual a a ecuac
ultip a por
nal anterior (S
t-
t
, para xpresa
L
), m iplicad (1 - La razn Y
t
se
el v or en f
nal aten ado al eriod t L.
e basa en nuar e
nalidad empleando di entes c
ciones ue em lea el m

la estac nalida
alor
d, eli ina efect
( ) ) (
1 1
1 + =
t t
A
t t
T A T
( )
L t
t
t
t
S
A
Y
S
+ = 1
( )
L t t t
p t S pT A Y
+ =
p +

Este ndice ajusta el pronstico a la estacionalidad.

Donde
A
t
= Valor atenuado
= Constante de atenuacin (0< <1)
Y
t
= Nueva observacin o valor real de la serie en el periodo t
= C e la tendencia (0< <1)
T
t
= Estimacin de la tendencia
= Constante de atenuacin de la estimacin de la estacionalidad (0<
<1)
S
t
= Estimacin de la estacionalidad
p = N ro de periodos a estimar
L = Longitud de la estacionalidad
Y
t+p
= Pronstico de p periodos a futuro

uestran las ventas trimestrales
do icar las ventas de 1994, usando la tcnica de
Winter con
= 0.4, = 0
atenuado 500, el valor de 0 com tendencia y el
la estimacin inicial de estacionalidad.
de
e
e

:
onstant de atenuacin de la estimacin de
me
Ejemplo : Los datos del cuadro siguiente m
n el pero 1988-93. Pronost e
.1, y = 0.3. Considerar adems como valor inicial
o estimacin inicial de la
valor de 1 como

Solucin : Respecto a los valores iniciales : El valor inicial atenuado pue
estimarse promediando unos cuantos valores de la serie. El valor inicial d
la tendencia se puede estimar utilizando la pendiente de la ecuacin d
tendencia obtenida de datos anteriores. Las estimaciones de estacionalidad
se pueden calcular para datos anteriores mediante la descomposicin de la
serie de tiempo.
Pronstico usando: Atenuacin Exponencial ajustada a la Tendencia y
a la Variacin Estacional

Yt valor estimac. estimac. et

Ao Trim.
At Tt St
Yt+
T
atenuado Tendencia estacional.
p
88 1
1
2
2
500
350
250
500
440
360.4
0
-6
-13.4
1.00
0.94
0.91
500.0
500.0
500.0
0
-1
3
3

4
14
3
15
4
400
450
350
550
0
368.2
394.2
381.2
426.4
548.8
-11.2
-7.5
-8.1
4.4
5.5
6
13.7
1.03
1.04
0.93
0.83
1.02
1.08
0.88
0.78
1.15
1.21
0.90
0.76
1.21
1.23
0.90
0.77
1.23
1.28
0.90
0.76
1.22
500.0
357.0
362.9
338.8
305.5
293.2
271.2
202.9
206.2
287.6
321.7
296.5
404.9
490.3
387.3
337.6
554.1
591.0
491.7
430.9
687.3
751.9
546.2
449.6
718.8
50
-250
-100
93
-12.9
-139
-5.5
56.8
-71.2
-52.9
194
262
28.3
-46.5
145
59.7
12.7
12.4
45.9
159
8.3
-30.9
-37.3
4 200
300
311.9
295.6
-14.2
-1
89 1
5
350
200
303.0
260.3
-12.2
-15.3
2 150 219.5 -17.8
6 400 277.5 -10.2
3
7
550
350
364.7
377.0
-0.5
0
4 250 354.1
.8
-1.6
8 550 403.1 3.5
90 1
9
2
400
350
437.5
450.1 6.7
10 600 471.9 8.2
3 750 531.8 13.4
11 50
4
12
400
650
546.4
546.4
12.1
10.9
91 1
13
2
16
92 1
17
2
18
4

22
3
23
4
24
94 1
25
2
26
3
27
4
28
3
19
20
93 1
21
2
ECM = 12431.5

El modelo de Winter resulta mejor en minimizar el EMC y proporciona una
forma fcil de explicar la estacionalidad en un modelo, cuando los datos
tienen un patrn estacional. Un mtodo alternativo consiste en
desestacionalizar primero o ajustar estacionalmente los datos. Despus se
aplica el modelo de pronstico a los datos sin estacionalidad y
posteriormente los resultados se estacionalizan de nuevo para proporcionar
pronsticos precisos.

ATENUACIN EXPONENCIAL AJUSTADA A LA TENDENCIA:
MTODO DE HOLT

se Una tcnica que se usa con frecuencia para manejar una tendencia lineal
denomina Mtodo de dos parmetros de Holt. La Tcnica de Holt atena
en forma directa la tendencia y la pendiente empleando diferentes
constantes de atenuacin para cada una de ellas.

Con esta ecuacin se atena la serie en forma
( )( )
1 1
1

+ + = Y A
t t t t
T A
exponencial de manera
imilar a como se hacia en el caso de la suavizacin exponencial simple, la
a la
a estimacin de la tendencia
El pronstico de p periodos en el futuro

Donde :
= Constante de atenuacin de los datos (0< <1)
< <1)
Ejemplo : Los datos del cuadro siguiente muestran las ventas trimestrales
en el perodo 1988-93. Pro
olt con
00 y el
olucin : Respecto a los valores iniciales : El valor inicial atenuado puede
est
inicial la
ecuacin de tendencia obtenida de datos anteriores.

s
diferencia radica en que se agrega un trmino para tomar en cuent
tendencia.

Las tres ecuaciones que se utilizan en esta tcnica son:

La serie exponencialmente atenuada

L
( ) ( )
1 1
1

+ =
t t t t
T A A T
( )
p L t t t
p t S pT A Y
+
+ + =
A
t
= Nuevo valor atenuado
Y
t
= Nueva observacin o valor real de la serie en el periodo t
= Constante de atenuacin de la estimacin de la tendencia (0
T
t
= Estimacin de la tendencia
p = Nmero de periodos a estimar
Y
t+p
= Pronstico de p periodos a futuro
nosticar las ventas de 1994, usando la tcnica de
H
= 0.3 y = 0.2. Considerar adems como valor inicial atenuado 5
valor de 0 como estimacin inicial de la tendencia.

S
imarse promediando unos cuantos valores de la serie, adems, el valor
de la tendencia se puede estimar utilizando la pendiente de
Pro


Ao Trim.
Yt
At
valor
Tt
estimac.
Yt+
et
nstico usando Atenuacin Exponencial ajustada a la Tendencia
T
atenuado Tendencia
p
88 1
1
500
350
500.0 0 500.0 0
2
2
3
3
10
3
12
91 1
13
2

450
350
00
600
750
650
455.0
398.2
378.3
303.0
260.3
471.9
531.8
-4.5
-7.7
-8.9
-12.2
-15.3
7
8.2
13.4
9
500.0
376.0
390.5
293.2
271.2
6.5
337.6
554.1
591.0
687.3
751.9
-150
74.0
-40.5
56.8
-71.2
-46.5
12.4
45.9
159
-37.3
4
4
89 1
200
300
311.9
295.6
-14.2
-14.4
338.8
305.5
-169.4
-5.5
5
350
2
2
6

150
400
219.5
277.5
-17.8
-10.2
202.9
206.2
-52.9
194
3
7
550
350
364.7
377.0
-0.5
0.8
287.6
321.7
262
28.3
4 250 354.1 -1.6 29
8
90 1
9
2
550
550
400
350
403.1
426.4
437.5
450.1
3.5
5.5
6
6.
404.9
490.3
387.3
145
59.7
12.7
11
4
500
400
548.8
546.4
546.4
13.7
12.1
10.
491.7
430.9
8.3
-30.9
14
3
15
4
16
250
400
390.4
385.9
-10.5
-9.9
450.5
379.8
-200.5
20.2
92 1
17
2
19
4
20
93 1
21

22
3
23
4
24
94 1
25
18
3
2
EMC = 21 488.5

CAPITULO 6
METODOS DE DESCOMPOSICIN

ntroduccin
estos se empl as matemticas sencillas que permiten separar los
trones componentes de una serie de tiempo: estacionalidad,
toriedad. Al eliminar la estacionalidad (por mtodos
atoriedad se obtiene la curva de ciclo / tendencia, que
es el elemento ms importante de los pronsticos comerciales. Es
importante hacer notar que la sencillez del mtodo no le resta exactitud;
nto as que se utiliza ampliamente no slo en todos los medios de
negocios, sino tambin en las reas tcnica y cientfica (de hecho, una de las
aplicaciones de mayor importancia es su uso en actividades censales).

Los mtodos de descomposicin producen tres ventajas prcticas muy
impo
1.Una vez co
utilizar.
I

Los mtodos de prediccin ms antiguos son los de descomposicin. En
ean frmul
cuatro pa
tendencia, ciclo y alea
e atenuacin) y la ale d
ta
rtantes:
mputada la prediccin, su presentacin es simple y fcil de
2.Los resultados, totales y parciales, brindan una perspectiva histrica que
tambin se entiende fcilmente, con base en los conocimientos del analista
y en su apreciacin intuitiva.
3.Finalmente, aunque otros mtodos pueden ser ms exactos (Box-Jenkins),
no se emplean tanto en el mbito de los negocios debido a su dificultad de
interpretacin e integracin en el proceso de toma de decisiones.

El mtodo clsico es tan sencillo que puede resolverse con simples
calculadoras. Esto no o por ser algo ms
complicado des
organi
estadstica.

Mtodos de descomposicin

L todos de descom sicin a
principios de siglo, por una parte tratando de
elim

E cia, e 911 deb o a las
econmicas, decidi
econmicas para poder predecir los efectos de
las depresiones.

E 5, en E ados U s, don
microeconom requer ejores e
separar los componentes estacionales para
predecir las ventas.

En actualid , la ma aplicac los
sist as de c sos seg l Dept
C io de tados U os y se a en
funciones desde 1955 c ocas ione

curre con el mtodo censal, que
requiere computadoras para su utilizacin por las gran
zaciones y las dependencias gubernamentales de geografa y

os m po surgieron
inar tendencia y variaciones estacionales.
n Fran n 1 id crisis
se separar las actividades
n 91 1 st nido de la
a a m maneras d
la ad yor in es en
em en n e o. de
omerc Es nid encuentr
on p modificac s.

Cuadro 6.1 Sumarizacin de los
rincipios del mtodo de
descomposicin.

Mtodo clsico de
descomposicin

El mtodo de descomposicin supone
que los datos estn constituidos de la
siguiente manera:
DATOS = patrn + error

Es decir,

DATOS = f ( tendencia-ciclo,
estacionalidad, error )

En otras palabras, agregado al patrn
existe un elemento de aleatoriedad que, asimismo, est presente en
cualquier dato de serie de tiempo.
Este componente aleatorio tambin se denomina error o residuo. Resulta
evidente que no es posible predecir la aleatoriedad, pero al menos s puede
identificarse y cuantificarse para determinar la confiabilidad o margen de
error de la prediccin generada por los datos ( vase cuadro 6.1 ).

Tericamente el punto de vista es estadstico, el mtodo de descomposicin
tiene varios inconvenientes. Sin embargo, como ya se mencion, en la
prctica se ignoran muchas desventajas y el mtodo se utiliza con bastante
xito.

Este mtodo se origin desde principios de siglo, aunque desde 1884
Poynting
3
trat de eliminar la tendencia y las variaciones estacionales para
los precios del trigo sobre una serie de tiempo de varios aos. Hooker
4

(1901) logr resultados ms precisos y posteriormente Spencer
5
(1904) y
Anderson
6
(1914) generalizaron el procedimiento para eliminar la
tendencia.

Los economistas tambin participaron en este mtodo con el objetivo de
predecir las depresiones, tratando as de aislar los ciclos de la actividad


La ecuacin general para los
mtodos de descomposicin es:

X
t
= f ( S
t
, T
t
, C
t
, E
t
)

Donde:

S
t
= Componente estacional de la
variable Xt.
T
t
= Componente de la tendencia.
C
t
= Componente cclico.
E
t
= Componente aleatorio ( error
).

El modelo puede ser aditivo, pero
se ha impuesto el multiplicativo
basado en promedios movibles:

X
t
= S
t
x T
t
x C
t
x E
t

p
econmica de otros patrones. En 1915, Coperland
7
intent aislar los ciclos
estacionales y, finalmente, el mtodo tal y como se conoce ahora fue
introducido en 1930 por Macauley
8
, quien present los promedios
movibles como la base de los ndices estacionales.

El uso de computadoras e inado un amplio
esarrollo y utilizacin de estos modelos, tanto por economistas como por
nalistas de administracin y mercadotecnia. La sencillez de estos mtodos
a ate de los stas, qu los han o ms
sofisticados sin perder su enfoque y atractivo intuitivo. En la Oficina del
Censo de Estados Unidos se han incorporado variantes no slo de regresin,
sino inclusive del mtodo ARIMA.

La representac mti del es la te:

X
t
= f ( S
t
, T
t
, C
t t
) )

X
t
(datos originales) en el perodo
t
= Componentes estacionales (o ndices) en el perodo t.
t
= Componente de la tendencia en el perodo t.
C
t
= Componente cclico en el perodo
R
t
= Componente aleatorio (random) o error en el perodo t.
ponen uede asu arias f
desde la aditiva (simplement umar los ro elementos), la
multiplicativa (m tiplicndolo ), la logartmica, etc. La ms usual es la
multiplicativa. Lo anterior se debe a que la estacionalidad y el ciclo son
proporcionales a la tendencia, or lo q n cfica es:

t t
x
t t
(6.2)

Segn Majani, para desco a p at
co nte e s re se
estacionalid n ed

lcular un prome on base en la estacio lidad:
para la anual y 4 trimestres para las cuatro estaciones tradicionales.
n las ltimas dcadas ha orig
d
a
ha llamado l ncin anali ienes hech
in mate ca bsica mtodo siguien
, R (6.1
Donde
= Valores de la serie de tiempo t.
S
T
t.

La funcin de relacin de estos com tes p
cuat
mir v ormas,
e al s
ul s
p ue la represe tacin espe
X = ( S T x C
t
x R )
mponer un serie de tiem o en sus cu ro
mpone s se requier
ad y elimina
n cinco paso
la aleatori
, donde los t
ad:
s primeros paran la
1. Ca dio mvil c na 12 meses

MA
t
= ( X
t 6
X
t 5
+ X
t

t + 1
+ + X
t + 5
) / 12 ; Datos mensuales
.3)

MA
t
= ( X
t 2
+ X
t 1
+ X
t
+ X
t + 1
) / 4 ; Para datos trimestrales
(6.4)

2. Dividir los datos reales entre el valor promedio y multiplicar por 100,
con lo que se obtienen las variaciones porcentuales por cada estacin
contra el promedio.

X

/ MA = ( S x T

x C x R ) / (T

x C) = S x R
(6.5)

Donde MA = T x C , ya que al promediar se eliminan la
estacionalidad y

3.
los

En jorar
el p o que
per

ad

sos:
1.
2.
3.
+ + X
(6
La aleatoriedad.
Promediar sistemticamente las estaciones homlogas para eliminar
la
aleatoriedad de las variaciones porcentuales. Este proceso genera
ndices estacionales (vanse cuadros 6.2 y 6.3).
forma prctica pueden agregarse dos pasos: uno que permita me
roceso de atenuacin para eliminar la estacionalidad y otr
mita ajustar los ndices estacionales.
Cuadro 6.2 Proceso de eliminacin de aleatoriedad y clculo de
estacionalid
La tabla se ha construido con los siguientes pa

Se promedian los valores trimestrales de un ao y se centran en el tercer
rengln.
Por definicin, los promedios eliminan las variaciones estacionales.
Al dividir las observaciones X / MA entre los promedios movibles se
obtiene la variacin de la observacin contra la media, que al
multiplicarse por cien da un valor porcentual.
Los valores superiores a 100 indican ventas mayores que la media y
viceversa.
Estos valores se organizan horizontalmente, con lo que puede
observarse claramente la estacionalidad.
4.
5.

Y p
me
or definicin, como el error es aleatorio, es igual a cero con respecto a la
dia
X

/ MA = ( S x T

x C x E ) / (T

x C) = S x E

0
1000
2000
3000
4000
5000
13579
1
1
1
3
1
5
1
7
1
9
Serie1

Grfica de los datos originales, donde se observan la tendencia ascendente y
estacionalidad.

a r, segn se vio, es igual
cero.
segn efectos climticos, sociales o religiosos.
la

Donde:
MA = T x C, ya que
L estacionalidad desaparece al promediar, y el erro
a

cionalidad es cclica, pero lo es dentro de cada ao y en general es La esta

Cuadro6.3 Promedios movibles dobles y ajuste de los ndices de
estacionalidad.

Mtodos de descomposicin.
Clculo de la estacionalidad (%);veamos la tabla:
(Venta de papel francs por promedios movibles centrados)

ad

A
o

Trimestr
e
Period
o
Observacione
s
Promedi
o
Movible
Movibl
e doble
Estacio
-
nalid
1997 1 1 3017.60
2 2 3043.54
3 3 2094.35 2741.33 2773.48 75.51
4 4 2809.84 2805.63 2820.60 99.62
19 115.39 78 1 5 3274.80 2835.57 2838.06
2 6 3163.28 2840.56 2867.40 110.32
3 7 2114.31 2894.24 2900.83 72.89
4 8 3024.57 2907.41 2948.69 102.57
1979 1 9 3327.48 2989.96 3030.66 109.79
2 10 3493.48 3071.37 3129.64 111.63
3 11 2439.93 3187.92 3232.62 75.48
4 12 3490.79 3277.32 3298.29 105.84
1980 1 13 3685.08 3319.26 3311.57 111.28
2 14 3661.32 3303.88 3299.98 110.95
3 15 2378.43 3296.07 3316.64 71.71
4 16 3459.55 3337.21 3342.20 103.51
1981 1 17 3849.63 3347.20 3380.19 113.89
2 18 3701.18 3413.19 3428.93 107.94
3 19 2642.38 344.68
4 20 3585.52

n s es o

Trimestre 1ro 2do 3ro Sumas

dices e tacional crud s
4to
Ao
1977 75.51 9 2 175.13 9.6
1978 .39 110.32 . 0 115 72 89 102.57 4 1.17
1979 109.79 111.63 5.48 105.84 402.74 7
1980 .2 110.95 71.71 7.45 111 8 103.51 39
1981 113.89 107.94 221.83
9 15 8.32
Suma 450.35 440.84 295.59 411.54 1598.32
Promedio 112.5875 110.21 73.8975 102.885 399.58
1.00105 Factor de Ajuste

ndices Estacionales Ajustados

Tr 4to Sumas imestr 1ro 2do 3ro
e
Ao
1977 75.5893688 99.724710
9
175.31408
1978 115.51128
7
110.43595
8
72.1966614
9
102.67781
2
401.59167
1
1979 109.90540 111.74733 75.559373 105.9
1 5
5124
9
403.16332
1
1
7 1
980 111.39696 111.06662 71.7853746 103.6188 397.86776
1981 114.00971 108.05345
6
222.06316
6
1600
Suma 450.82336 441.30336 295.900696 411.97257 1600
5 9 1
Pr 2.70584 110.32584
2
73.9751739 102.99314
3
400 omedio 11
1

s inclu ediana ( Newbold
9
) o eliminan los
valores extremos; aq os a akridakis
10
para el primer
paso, que consiste en centrar los valores de atenuacin (promedio
movible) y en seguida hacer un promedio movible doble (vanse
cuadros 6.2 y 6.3):

MA
dt
= ( MA
t
+

MA
t + 1
) / 2
(6.6)

. El ajuste de los ndices estacionales se lleva a cabo al elaborar un
cuadro horizontal de las razones porcentuales X / MA por cada
perodo y ao (cuadro 6.3). En seguida se promedian verticalmente
dichos promedios y luego todos ellos se suman horizontalmente. Por
supuesto, la suma debe ser igual a 400. Si sta es inferior a 400,
entonces se divide 400 entre el valor resultante (el cociente es
superior a 1) y este nmero se utiliza como valor de ajuste. A
continuacin todos los ndices parciales se multiplican por este
factor, de manera que en la nueva tabla ahora los valores
promediados son iguales a 400. Si la suma inicial es superior a 400,
entonces se invierte la divisin, con el 400 como divisor, de manera
que el factor de ajuste ahora es inferior a uno.

Los dos ltimos pasos son: el cuarto para aislar y calcular la tendencia, y
el quinto para aislar y calcular el ciclo.

Aislamiento y clculo de la tendencia

Es importante hacer notar que la tendencia puede ser un componente
temporal del ciclo, el cual muestra primero una tendencia ascendente y
luego descendente, dependiendo si la serie de tiempo plantea la fase de
crecimiento o la de depresin econmica de dicho ciclo (figura 6.1a).

1. Algunos autore yen la m
u aplicam M
2
Pero tambin puede plantearse una tendencia que trascienda al ciclo, en
uyo caso los movimientos de crecimiento y depresin forman parte de
un crecimiento sostenido (por ejemplo el crecimiento de la poblacin)
como se muestra en la figura 6.1b del ejemplo del cuadro 6.3 (y que
contina en el cuadro 6.4), en el que se estudia parcialmente la venta de
papel en Francia de 1968 a 1980 y pueden apreciarse varios altibajos de
tipo cclico, pero donde el esquema integral es de crecimiento sostenido.

PNB

0 1 6 x
Aos

Figura 6.1 (a) Ciclo sin Tendencia

Venta de papel en Francia
y

$

c

Probablemente una de las caractersticas ms afortunadas del modelo de
descomposicin es que al calcular la tendencia se plantea en forma
simplificada una ecuacin, lineal o exponencial, que al tener agregados
los ndices estacionales y cclicos correspondientes se genera este
sencillo modelo, denominado de descomposicin.

Ciclo sexenal en Mxico
y
12

0 1968 1980 x

EJE

de 1968 a 1980, puede verse que aunque
hay tres recesiones, una leve en 1969, una serie en 1974 - 1975 y una
que comenz en 1980, la tendencia en general muestra una pendiente
lineal de crecimiento sostenido. Si se hicieran estudios parciales con
intervalos cortos de tiempo, podra caerse en la parte ascendente de cada
ciclo, donde el crecimiento precedente a una depresin es rpido
(exponencial) tanto para los aos previos a 1974 como para los
anteriores a 1980. Resulta evidente que para cubrir el ciclo y la
tendencia se requiere un nmero considerable de aos que muestren el
esquema general en toda su amplitud, ya que de otra manera los
resultados de tendencia y ciclo podran ser engaosos.

No existe ninguna seguridad de que cualquier anlisis matemtico sea
capaz de prever con exactitud los cambios de tendencia o ciclo, aunque
la descomposicin en sus integrantes permite que el analista tenga una
visin bastante razonable de todo el proceso de prediccin (vase cuadro
6.4).

La solucin matemtica es muy simple, ya que al utilizar un modelo de
mnimos cuadrados y graficar los perodos de tiempo en el eje de las
abscisas y las ventas trimestrales en el de las ordenadas, la ecuacin
queda como
T
t
= a + bx
t
(6.7)

(b) Ciclo con Tendencia de Crecimiento

RCICIO 6.1

Al considerar los datos del cuadro 6.3 y de la figura 6.1b sobre la venta
de papel peridico en Francia

posicin

Cuadro 6.4 Clculo de la tendencia en el mtodo de descomposicin.

Mtodos de descom
(Clculo de Tendencia)
Se utiliza el mtodo de regresin lineal, tomando como la variable
Independiente el periodo (trimestre) y como variable
Dependiente las ventas (observaciones)

A
os
Tri-
mest
re
Pe-
riod
o
Datos Prome
dio
movibl
e
Prome
dio
Doble
nd.
esta-
cional
Tenden
cia
Ind.
Est.
ajusta
do
Predi-
ccin
1 2 3 4 5 6 7 8 9 10
4/5*1
00
3xb+a 8x9/10
0
199 1 1 3017. 2554.7 112.7 2879.4
7 6 8 1 97
2 2 3043.
54
2610.6
7
110.3
3
2880.3
49
3 3 2094.
35
2741.3 2773.4
83
75.5 2666.5
5
73.98 1972.7
14
4 4 2809. 2805.6 2820.6 99.6 2722.4
84 3
102.9
9
2803.8
35
197
8
1 5 3274.
8
2835.6 2838.0
63
115.4 2778.3
2
112.7
1
3131.4
42
2 6 3163.
28
2840.6 2867.3
99
110.3 2834.2
0
110.3
3
3126.9
75
3 7 2114.
31
2894.2 2900.8
25
72.9 2890.0
9
73.98 2138.0
85
4 8 3024. 2907.4 2948.6 102.6 2945.9 102.9 3034.0
57 85 7 9 53
197 1 9 33
9
27.
48
2990.0 3030.6
63
109.8 3001.8
5
112.7
1
3383.3
88
4 3129.6 111.6 3057.7 110.3 3373.6 2 10 3493. 3071.
48 43 4 3
3187.9 3232.6 75.5 3113.6 73.98 2303.4
56
3 11 2439.
93 2 2
.3 3298.2 105.8 3169.5
0
102.9
9
3264.2
71
4 12 3490. 3277
79 89
198
0 08 7
3225.3
9
112.7
1
3635.3
33
1 13 3685. 3319.3 3311.5 111.3
2 14 3661.
23
3303.9 3299.9
78
110.9 3281.2
7
110.3
3
3620.2
26
3 15 2378.
43
3296.1 3337.1
5
73.98 2468.8
27
4 16 3459.
55
3393.0
4
102.9
9
3494.4
89

Donde
T
t
= Valor de la tendencia a predecir en el perodo t.
x
t
= Dato observado (real) del perodo t a predecir.
b = Coeficiente de regresin de la pendiente de la tendencia.
a = Constante de interseccin de la pendiente con el eje de las
ordenadas.

En el cuadro6.5 se muestra el resultado de la regresin para 16 valores
de las ventas de papel; con los coeficientes obtenidos se procedi a
elaborar los resultados que aparecen en el cuadro6.4 .

Cuadro 6.5 Clculo de la tendencia por el mtodo de descomposicin.

(Clculo de tendencia)

Resultado Regresin
Constante 2498.9
Error de estim. Y 534.6414
Coef. determinac. (r
2
) 0.171589
Tamao de la muestra 14
Grados de libertad 12

Coeficiente a
Coeficiente b
donde

Y =a +b
t

y

t =Periodo
Coeficiente(s) X 55.8836
Error coef. X .4 38 35 46

Tendencia a
estac
islada,
ionalidad
elimina la
0
000
2000
000
4000
13579
1
1
1
3
1
5
1
7
1
9
1
3
Serie2

La frmula de prediccin es muy simple:

Se clcula, como base y representacin de los datos, una
lnea recta donde:

Y = a + Xb

T = a + Periodo * b

Donde:
T = Tendencia
a = Constante
b = Coeficiente de regresin

Y el valor t obtenido, se multiplica por el ndice estacional
ajustado, restituyndole as sus variaciones estacionales:

F
t
= (Periodo x b + a) x ndice estacional

A

Lo
est o occidental. Este
pre ha sido de gran inters debido a las razones de
En Estados Unidos se ha mostrado que los ciclos estn constituidos por
5 hasta 105 meses y por
variaciones de contraccin que han durado de 6 a 65 meses, de manera
que un ciclo
1945 se registraron 30 ciclos, y desde 1945 hasta 1994 otros ocho, con
econmicos y bancarios de
los pases industrializados.

En trminos algebraicos, la separacin del ciclo es muy sencilla, ya
si los promedios movibles se dividen entre la tendencia se obtiene

C = ( T x C) / T = MA / T , lo que multiplicado por 100 (6.8)
es el ndice de ciclo.

F
t
= (Periodo Xb

E multiplica por 100 para obtener
un valor porcentual. Debido a que las actividades cclicas son fenmenos
a largo plazo, result
observaciones de un nmero mltiplo de aos correspondientes al de los
os, etc.
caracterstica de detectar los cambios cclicos con bastante exactitud y
oportunidad, especialmente en los casos en los que existen cambios
bruscos donde la deteccin tempran bio de tendencia
ascendente n la toma
de deci
nlisis del ciclo
s factores cclicos han recibido bastante atencin desde los primeros
udios de los trabajos economtricos en el mund
fenmeno siem
extrema miseria y sufrimiento que causan dichas variaciones cuando
alcanzan niveles extremos.

variaciones de expansin que van desde 2
completo puede variar de 17 a 117 meses. Entre 1854 y
un patrn recurrente que desafortunadamente es bastante irregular. Las
causas pueden variar: desde eventos aleatorios como malas cosechas,
sequas, etc., hasta reajustes en los sistemas
que
+ a)*ndice estacional*ndice de ciclo
l ciclo, igual que la estacionalidad, se
a evidente que se requiere, por lo menos, tener

ciclos que se estudian, sean macroeconmicos, meteorolgic

Como ya se mencion, es posible que este mtodo no sea tan preciso,
por ejemplo, como el Box-Jenkins (ARIMA). Sin embargo, tiene la
a de un cam
hacia uno descendente puede ser muy importante e
siones. Aparentemente, el mtodo Box-Jenkins con toda su
exactitud no es capaz de determinar este tipo de cambios en el momento
requerido.

Otras aplicacion

Mtodo II del censo

Este mtodo fue desarrollado en 1955 por la Oficina del Censo del
Departamento de Comercio estadounidense. Como es de suponer, el

ya sin
nunca
in de la
e
s meses. Esta prueba fue capaz de detectar
los cambios en la estacionalidad causados por el embargo
estadounidense en Medio Oriente, que provocaron aumentos de
precio, lo cual llev a la crisis del petrleo.
3. Prueba de la igualdad: Algunas veces se hacen ajustes exagerados a
los datos ya sin estacionalidad, por lo que esta prueba es de gran
valor para detectar estos tipos de ajuste, que no deben exceder de 90
a 110% de los valores regulares en el resto de los datos del ao.
e composicin s de los mtodos de des
censo no requiere la estacionalidad y el personal de la oficina del censo
descubri la forma de separar los cuatro componentes de las series de
tiempo, uno por uno.
Otra mejora aportada por la oficina del censo fue ajustar la
estacionalidad, ya que las variaciones en el tamao de los meses hacen
que algunos sean de cuatro semanas y otros de cinco, de modo que slo
por este hecho se genera hasta 10% de error adicional. Ajustar los
coeficientes segn la duracin del mes ha permitido mejorar la
prediccin.

Adems de las mejoras operativas del mtodo aportadas por la oficina
del censo, ah tambin se disearon tres pruebas para determinar la
precisin del mtodo de descomposicin:

1. Prueba del mes adyacente: Prueba la razn entre los valores
estacionalidad y el promedio del mes adyacente. Esta razn
debe exceder de 95 a 105% para que el proceso de eliminac
estacionalidad sea adecuado.
2. Prueba del mes de enero: Trata de evitar cambios importantes al
pasar de un ao al siguiente y consiste en comparar los resultados d
enero con los de los dem

Pronsticos comerciales

No hay duda de que los pronsticos no constituyen una ciencia exacta, ya
que la mayor parte de los datos proporcionados por los administradores
carece de un anlisis profundo que les quite su carcter especulativo. El

tes
atemtico,
principalmente porque no entienden el alcance, las ventajas y/o las
todos
ios entiendan
fcilmente los resultados del proceso de pronstico. Los mtodos de
pronsticos deben ser no solamente exactos, sino tambin convincentes,
y es en este rengln donde los mtodos de descomposicin resultan
ar.
ntender
te

Aunque todo mundo sabe que los presupuestos se generan con base en
pronsticos, curiosamente en el rea financiera el presupuesto no tiende a
ser de lo ms exacto ni homogneo, sino a expresar las aspiraciones, el
optimismo y/o las necesidades polticas a resolver. El analista estadstico
pocas veces puede aportar nada mejor que la precisin matemtica, los
mrgenes de error y el procesamiento rpido y oportuno.

Por supuesto, cuando el financiero a cargo de presupuestar incluye un
factor de exceso en la prediccin real para forzar cuotas de venta, motivar
al personal administrativo o generar una nota de optimismo en la
empresa, el analista estadstico que hace el pronstico no debe caer en la
tentacin de alterar sus resultados matemticos a fin de generar un
optimismo injustificado: su funcin es pronosticar el futuro, no
objetivo principal de los mtodos de prediccin es obtener informacin
suficiente para ayudar al ejecutivo en la toma de decisiones. Bastan
hombres de negocios se niegan a usar un enfoque altamente m
limitaciones que implica el enfoque matemtico.

Resulta evidente que para solventar este problema, el analista de m
de prediccin debe buscar la manera en que los usuar
sumamente atractivos porque son muy intuitivos y fciles de interpret
El ejecutivo puede acudir a su experiencia y sentido comn para e
los conceptos de ciclo-tendencia, por lo cual puede decirse que es
mtodo permite un buen grado de sinergia entre el analista estadstico y
el ejecutivo que asume la responsabilidad de las decisiones.

Pronsticos de presupuestos

mejorarlo. El analista debe considerar, sin entrar en ms detalle, los
siguientes puntos:

La economa nacional.
El mbito internacional, especialmente en las compaas
multinacionales.
La demanda de los productos de la compaa.
El volumen de ventas.
La participacin en el mercado.
El precio de los productos de la empresa.

La labor de prediccin (forecasting) en las compaas modernas se cubre
parcialmente por el departamento de estadstica de la empresa y/o por
empresas externas que realizan estas labores para los departamentos de
Mercadotecnia, Recursos Humanos, etc. Este punto puede resumirse al
notar que el mtodo de descomposicin es una herramienta bastante til
que permite que la empresa moderna haga predicciones mejores y ms
sencillas, de fcil empleo y muy atractivas desde el punto de vista de la
interpretacin de los resultados.

EJERCICIO 6.2

Venta de ropa de playa en el Pacf illones de dlares
estadounidenses.

ico mexicano, en m

Periodo Trimestre X T MA C I.E. F SSE
1 1 362 353,12
2 2 385 368,28
3 3 432 383,44391,02 1,02 1,15447,8 249,9
4 4 341 398,6 406,181,0190,87351,9 119,5
5 1 382 413,76421,341,0180,98411,5 869,7
6 2 409 428,92 436,5 1,0181,01441,61062,8
7 3 498 444,08451,661,0171,15517,3 371
8 4 387 459,24466,821,0170,87404,5 305,4
9 1 473 474,4 481,981,0160,98470,7 5,2
10 2 513 489,56497,141,0151,01 503 100,9
11 3 582 504,72
12 4 474 519,88
MSE = 385,6

Tendencia de la serie
0
200
400
600
800
2 3 4 5 6 7 8 9 10 11 1 12
Serie2
Serie3

Resultado Regresin
Constante 337.954545

Error de est.Y 49.1877024

Coef. determ (r) 0.57600721

Tamao de Muestra 12
10 Grados de Libertad
Coeficiente(s)

Error co
X 15.1608392
ef. X 4.11328231
Aj uste del elo
300
400
500
600
1 2 3
Mod
0
100
200
4 5 6 7 8
Serie2
Serie3

Indices estacionales ajustados
1 2 3 4
113.2 88.1
96.
2 99.2 116.2 85.1
99.
2 103.2 114.2

97.
7 101.2 114.5 86,6 400

Indices estacionales sin ajustar
1 2 3 4
113 88
96 99 116 85
99 14 103 1

98 101 114 86,5
399
Factor de ajuste= 1,001669

Resumen matemtico

El mtodo de descomposicin trata de aislar y predecir los patrones que
integran la informacin histrica de la empresa como base para
xtrapolar los resultados hacia pronsticos tiles en planeacin y toma de
decisiones. Estos patrones son:

1. Tendencia: Es el comportamiento de los datos a largo plazo y puede
ser creciente o decreciente. Cuando no cambia puede utilizarse para
abreviar el proceso de prediccin.
por

ones.
as
en forma de onda, que se relacionan con la
temperatura, la lluvia, el fro, los meses del ao, festividades o bien
con polticas gubernamentales o corporativas.

El elemento error se refiere a la aleatoriedad de los daros y es la
diferencia entre el efecto combinado de los tres subpatrones de una serie
real de tiempo.

El desarrollo matemtico es como sigue:

MA = ( X
1
+ X
2
+ X
3
+ X
4
) / 4 = T x C ; (6.9)

Donde MA = promedios movibles. Dado que al atenuar los valores
ias
) = S ;
(6.10)

cuadrados),
tomando como variable dependiente a los valores reales (o los atenuados)
y como variable independie nte dichos para
obtener
.11)
e
2. Ciclo: Este factor representa las bajas y altas causadas
condiciones macroeconmicas o industriales. El ciclo sigue a menudo
el patrn de fluctuaciones en forma de ondas, con altas y depresi
3. Estacionalidad: Los factores estacionales se refieren a l
variaciones, tambin
(promediando) stos pierden estacionalidad y variaciones aleator
(recurdese que X
i
X = 0 ), entonces

X

/ MA = ( S x T

x C x R ) / (T

x C
T se calcula por medio del mtodo de regresin (mnimos
nte a los perodos propiame
T
t
= a + b( P
t
) ; (6

A su vez, para calcular el ciclo se tiene

MA / T = ( T

x C ) / T = C ;

Ya que T en el numerador y en el denominador se anul .
(6.12)
an

Por ltimo, el error tambin puede determinarse algebraicamente con la
nica finalidad de conocer el margen de confianza de la prediccin.

MA = T

x C por lo que S = X / ( MA ) ; entonces

( S x T x C x R ) / S = X / S = T x C x R, de donde
( T x C x R ) / MA = ( T x C x R ) / ( T x C ) = R ; (6.13)

ya que el producto T x C se elimina en el numerador y en el
denominador.

CAPITULO 7

AUTOCORRELACION
Construccin de modelos de prediccin basados en tcnicas de
Autocorrelacin.

El problema practico que se abordara en este capitulo, es si es posible, con
base solo en la informacin del pasado de las variables de una serie de
tiem os dada, pronosticar los valores futuros de las mismas. En la
atenuacin exponencial se aplica un algoritmo a una serie de tiempo sin
investigar las propiedades de esta. En este capitulo se asume que el
investigador cuenta con los recursos necesarios para llevar a cabo su
anlisis y desarrollar una funcin de prediccin idnea para una serie de
tiempo que tiene ciertas propiedades observadas. Entonces, el algoritmo
escogido para pronosticar esta determinado por dicha investigacin sobre el
comportamiento de los valores de una serie de tiempo.
El primer paso en este intento analtico debe ser ajustar un modelo a los
datos, de forma que ste genere una serie de datos de prediccin que se
ap
cul es la mejor manera de predecir el futuro de una serie dada?
INDEPENDENCIA DE VARIABLES ALEATORIAS

p
roximen al proceso inicial que les dio origen. Si se logra lo anterior, se
tendr una buena herramienta que permitir plantear la pregunta:

Esta cuestin puede desglosarse en las tres preguntas siguientes:

1. Que clase de modelo debe considerarse como el posible generador
una serie de tiempo observada?

2. Cmo debe proceder el analista para ajustar un modelo es
de
pecfico de una
lase general de modelos a un grupo panicular de datos?

3. Cmo se desarrollarn los valores futuros de prediccin de un modelo
que se ajuste a los datos originales?
s
es importantes que limitan en forma considerable esta
cantidad:
n
ccin de modelos de prediccin es buscar
iempre el modelo ms sencillo que describa mejor las caractersticas de los
ia.
upuesto, el primer paso ser siempre graficar los datos originales y
enseguida desarrollar el paso de autocorrelacin, que describe la relacin
ntre los diversos valores de la serie de tiempo segn k desplazamientos de
dichos valores entre s. Box y Jenkins resumieron los pasos de anlisis para
analizar series de tiempo invariadas. Una vez que se encuentra el mejor
modelo, el paso final es utilizarlo para la prediccin requerida vase la
siguiente figura.

c

Por tanto, cualquier prediccin es una funcin de los datos mismos, segn el
modelo que mejor se ajuste a ellos. En principio, existiran tantos modelo
como series de datos individuales (una infinidad); sin embargo, hay por lo
menos dos restriccion

1. Las predicciones son funciones lineales de los datos observados.
2. La meta es encontrar parmetros eficientes que permitan una descripci
adecuada de las caractersticas de dicha serie de datos, siempre y cuando
logre minimizarse el MSD con el nmero ptimo de parmetros.

La limitacin lineal es simplemente una manera prctica de restringir el
nmero posible de funciones disponibles y, aun as, las posibilidades son
amplias y suficientes para las necesidades prcticas del analista (debe
recordarse la posibilidad de transformar los datos no lineales:
Una buena estrategia en la constru
s
datos. Esta estrategia tambin se conoce como principio de la parsimon
En este captulo se sentarn las bases del proceso de autocorrelacin por
s
e

FIGURA 1. Esquema de la metodologa Box-Jenkins
para modelacin de series de tiempo.

Anlisis autocorrelacionales en una serie de datos

La clave de estos modelos se encuentra en el coeficiente de autocorrelacin
(para las series de tiempo que se correlacionan consigo mismas con
desplazamientos de 1, 2 o ms periodos). La ecuacin para determinar el
oeficiente de Autocorrelacin es c

+ =

=
n
k t
n
k t
t
k
Y Y
Y Y Y Y
r
2
1
) (
) )( (
(1)
= t
t
1
donde indica cmo los valores sucesivos de Y se relacionan consigo
mismo

tre s, y as sucesivamente. Al agrupar dichos coeficientes r como
Autocorrelacin. A su vez, esta funcin puede graficO.

Ejemplo 1: considere una tabla de 10 nmeros aleatorios, como se
muestra en el siguiente cuadro.
Autocorrelacin
Calculo de coeficientes de autocorrelacion

Observacion
es
Cuadrados
diferencial
es vs.
media
Producto
diferencia
s
1er
desplaz.
2do.
Desplaz. 3ro 4to 5to
1
r
s,
2
r

indica cmo los valores de Y separados por dos periodos se relacionan
en
desplazamientos 1, 2, 3,., se obtiene la denominada funcin de
13 9 -6 15 -18 -18 6
8 4 -10 12 12 -4 -2
15 25 -30 -30 10 5 -15
4 36 36 -12 -6 18 -24
4 36 -12 -6 18 -24 -12
12 4 2 -6 8 8 4
11 1 -3 4 2
7 9 -12 -6
14 16 8
12 4

100 144 -27 -29 26 -19 -47
10 14.4 -3 -3.625 3.7142857 -- -9.4
Coeficiente de
-
0.2013888
0.180555
-
0.1319444
-
0.3263888
9 Autocorrelacin -0.1875 9 5 4

Cuadro 1. Diez nmeros aleatorios
autocorrelacionados con cinco
d mien si .

esplaza tos de mismos

ANALISIS AUTOCORRELACIONALES EN UNA SERIE DE
DATOS

Veamos el siguiente ejemplo: autocorrelacin

Cuadro 2.Resumen del calculo de los coeficientes de
autocorrelacin Para 10 nmeros aleatorios.

uvo utilizando 10 nmeros no relacionados (aleatorios) en
el rango de 0 a 20; sin embargo, si este hecho no fuera conocido, sera fcil
Esta serie se obt
determinar que los nmeros son independientes y no se encuentran
relacionados entre s al someterlos a la tcnica de autocorrelacin. Para cada
desplazamiento calculado, si no hay Autocorrelacin, el coeficiente debe
estar muy prximo a cero. Al sustituir en (1) se obtiene lo siguiente:

) 10 12 ( ..... ) 10 15 ( ) 10 8 ( ) 10 13 (
) 10 12 )( 10 14 ( .... ) 10 4 )( 10 15 ( ) 10 15 )( 10 8 ( ) 10 8 )( 10 13 (
2 2 2
+ + + +
+ + + +
=
k
r
2 2 2 2 2
2 4 .... 5 ) 2 ( 3
) 2 )( 4 ( .... 2 ) 6 ( ) 6 ( 5 ) 5 )( 2 ( ) 2 ( 3
+ + + + +
+ + + + +
= 188 . 0 =

Validacin de los coeficientes de correlacin

El coeficiente de Autocorrelacin es una herramienta muy valiosa para
investigar las propiedades empricas de una serie de tiempo, y aunque para
efectos de este texto la teora subyacente es bastante complicada, si se
utiliza la distribucin probabilstica de Autocorrelacin es posible validar
los coeficientes obtenidos.

Existen dos mtodos estadsticos para validar los coeficientes de auto-
correlacin: el primero utiliza el error estndar que prueba si cada uno de
los coeficientes es estadsticamente diferente de cero (ver figura 8.2) y el
segundo considera un grupo completo de valores de coeficientes de
Autocorrelacin dado un nmero k de desplazamientos como en este caso,
donde k = 5 (r
1
, r
2
, r
3
, r
4
y r
5
). A continuacin se desarrolla una prueba
global de significancia, donde se desea saberse si desde el punto de vista
estadstico todas las variables del grupo son diferentes de cero. Esta prueba
es la estadstica Q Box-Pierce y se resuelve con la distribucin
probabilstica x
2
.

En cuanto al error estndar de un coeficiente de Autocorrelacin rk ais-
lado, con los diez valores observados en el ejemplo 1 se obtuvieron cinco
autocor
elaboracin de la grfic figura 3 (la
laboracin de la grfica se hizo con SYSTAT).

Se observa el margen de confianza calculado segn la frmula

relaciones que se muestran en la figura 2 (el clculo y la
a se hicieron con Excel) y en la
e
n
se
rk
1
96 . 1 = A 95% de probabilidad (2)
Lo que se interpreta tericamente como sigue: los coeficientes de auto-
correlacin para una serie de tiempo generada por nmeros aleatorios deben
tener un valor prximo a cero. Si se toma una infinidad de muestras de
nmeros aleatorios, de la misma forma y en promedio los coeficientes de
autocorrelacin tendran un valor cercano a cero. Si para denotar la
Autocorrelacin de toda la poblacin se utiliza la , entonces los valores
de r debe formar una distribucin probabilstica alrededor de

k
p
k
p

FIGURA 2. Utiliza rror estndar de rib
orr
ar los coeficien oc n

arios autores (entre otros Anderson,

Bartlett

y Quenouille) demostraron
que dicha distribucin tiende a la normal con media cero y desviacin
estndar
cin del e la dist ucin de
autoc elacin
para valid tes de aut orrelaci .
V
n / 1 . Esta informacin puede utilizarse (ecuacin 2) para
desarrollar una prueba de significancia de los coeficientes de
Autocorrelacin

FIGURA 3. Grficas de los datos observados y de cinco coeficientes de
utocorrela rgenes de error (no excedidos pro los valores de )
os
tro de un rango
specificado por la media ms o menos 1.96 desviaciones estndar, puede

a cin y los m
k

como las pruebas t de Student o F de Fisher, que permiten determinar si
alguna de las r
k
proviene de una poblacin cuyos valores son cero para k
desplazamientos. Debido a que n = 10 y como a 95% de probabilidad tod
os coeficientes de autocorrelacin deben quedar den
r
l
e
concluirse que la serie de tiempo est formada por valores aleatorios si los
coeficientes de autocorrelacin quedan dentro de los lmites

), 3162 . 0 ( 96 . 1 ) 3162 . 0 ( 96 . 1 +
k
r
62 . 0 62 . 0 +
k
r

En las figuras 8.2 y 8.3 puede verse que ninguno de los cinco valores r
k

excede los lmites establecidos por el e r a lo que

Ahora bien, puede observarse que r
5
=

0.33, y aunque con una muestra de
slo 10 observaciones este valor de r es estadsticamente igual a cero, si tal
valor de r se hubiese obtenido con una muestra de 360 observaciones en
lugar de 10, donde los lmites de confianza hubieran sido 0.105 en lugar
de 0.3162, estara hablndose de la presencia de algn tipo de patrn (no
aleatorio), ya que el valor de r habra excedido ampliamente el lmite
establecido por el error estndar. Es claro que con un nmero tan elevado de
observaciones sera bastante difcil que un coeficiente de autocorrelacin
llegara a alcanzar el valor de 0.33, aunque en casos como el que se ha
escrito es importante utilizar en forma terica algn otro modo de asegurar
adstico Q desarrollado por Box-Pierce
(1970) que computa rk como sigue:
r or estndar, lo cual confirm
ya se saba: que la serie de datos estudiada est compuesta por nmeros
aleatorios. Esto se conoce como ruido blanco y se ver en mayor detalle en
el captulo siguiente.
d
la significancia de los valores rk.

Para este efecto se utiliza el est

=
=
5
1
2
k
r n Q (3)

[ ] 343 . 2 ) 33 . 0 ( ) 13 . 0 ( ) 18 . 0 ( ) 20 . 0 ( ) 19 . 0 ( 10
2 2 2 2 2
= + + + + =

Este estadstico se considera de la distribucin de x
2
con (m - p - q) grados
de libertad. En el prximo captulo se estudiar el nmero de parmetros
AR (p) que se utilizan para hacer una prediccin, as como el nmero de
armetro p s (q) MA para establecer un modelo de promedios movibles,
onde (m) es el nmero total de parmetros a utilizar en cualquier modelo
ruido blanco (autocorrelacin de nmeros
aleatorios), todos ellos son iguales a cero. Al consultar la tabla de x
2
con 5
d
ARIMA: en el caso del
grados de libertad se encuentra que el valor es 11.07 al 95% de probabilidad
y que entonces el valor calculado de Q = 2.343 est muy lejos de exceder el
punto crtico de tablas. El estadstico Q confirma una vez ms que este
grupo de datos no puede considerarse diferente de cero (en trminos
estadsticos).

Ljung y Box
8
afirman que la ecuacin

=
h
2 1
ene una distribucin ms cercana a la de x
2
Para los efectos prcticos del
curso Pronsticos para la toma de decisiones para el que est destinado este
texto, la prueba Q debe ser suficiente para validar modelos que no requieren

stas pruebas normalmente aceptan las series de datos
omo significativamente autocorrelacionados si el valor de Q cae en el
extremo 5% de la cola del lado derecho de la distribucin de x
2
Es decir
que el valor de Q es mayor que el valor crtico de tablas a 95% (0.05) de
probabilidad. Desafortunadamente, a menudo estas pruebas fallan al no
rechazar modelos que no dan un buen ajuste, por lo que es conveniente
advertir que un modelo no debe aceptarse nicamente con base en la prueba
estadstica Box-Pierce o en la de Ljung-Box.

Coeficiente de autocorrelacin parcial

En un anlisis de regresin conviene determinar cuanta capacidad tiene
cada variable independiente para explicar su relacin con la
variable independiente y. las regresiones de cada variable independiente se
parcializan individualmente para obtener los residuales de este anlisis
individual y encontrar la correlacin de dichos residuales con la variable
independiente X
i
. En autocorrelacin existe una tcnica similar.

La autocorrelacin parcial se utiliza como una medida del grado de
asociacin entre Y
t
y Y
t-1
cuando se han eliminado los efectos de otros
desplazamientos como 1,2,3,..., k-1.
+ =
k
k
r k n n n Q
1
) ( ) 2 (

ti
un grado tan alto de precisin, sea en los campos tcnico o cientfico.

Cabe hacer notar que e
c
n
x x x ,....., ,
2 1

Al observar la autocorrelacin entre Y
t
y Y
t-1
del ejercicio 1, tambin se ve

entre
recisamente lo que hace la autocorrelacin parcial.
que entre Y
t-1
y Y
t-2
existe autocorrelacin porque la distancia entre ambos
es de una unidad, por lo que entre Y
t
y Y
t-2
debe haber una relacin debido
a que ambas estn relacionadas con Y
t-1
. Para medir la correlacin real
Y
t
y Y
t-2
es necesario eliminar el efecto intermedio de Y
t-1
, que es
p

El coeficiente de autocorrelacin parcial de orden k se denota como
k
y
puede calcularse haciendo la regresin de Y
t
contra Y
t-1
, Y
t-2
, ..., Y
t-k
.

y b y b y b b y
k t k t t t
+ + + + = .... (5)
2 2 1 1 0

Esta es una regresin mltiple que viola la premisa de independencia entre
variables independientes ya que, como bien se sabe. los valores Y son
desplazamientos de la variable misma, por lo que este proceso se denomina
autorregresin (AR) y se utiliza para describir la ecuacin

Figura 4. coeficiente de autocorrelacin parcial (PACF)

Entonces la autocorrecin parcial
k
es la estimacin del coeficiente b
k
de la
regresin mltiple. Es de notar que la primera autocorrelacin parcial es
exactamente igual a la primera autocorrelacin, y si se hace variar el
nmero de trminos del lado derecho de la ecuacin se obtienen las
autocorrelaciones parciales para los diferentes valores de K.

As como sucede con los coeficientes de autocorelacin, los coeficientes
parciales deben estar muy prximos a cero en el caso de las series de ruido
b
normalmente distribui
lanco, donde dichas autocorrelaciones parciales son independientes y estn
das con un error estndar = n / 1 . De aqu que los
mismos valores crticos de 1.96( ) n / 1 pueden utilizarse con PACF para

riod a o a s espe

Otra manera de analizar una serie de tie s desc onerla en ondas o
ciclos d erentes frecuenc Este mtodo era m pular de
a enim o de l mput n conserva m
aunque cada vez se menciona menos en las ediciones modernas de los
tratados sobre mtodos de prediccin para negocios.

A nque mto arece lejo, al menos tiene la virtud de ayudar a
entifica la aleatoriedad y la estacionalidad en las series de tiempo. En
ste sen es necesario hacer una descripcin de las tres caractersticas
sicas d las onda inoidale
1 da edi sigu inv n
relacionada con la frecuen

2. Amplitud de onda, que se mide en altura o fortaleza de la onda.
. Fase, que se refiere al desplazamiento (o posicin) horizontal de la
ond

En las series de tiempo, el ancho de onda traduce o unidades de
tiempo (o nmero de observaciones que fo an una onda) y la fase se trata
e orm ar. C lquier de tiem est com esta por
observaciones equidistantes, ajustadas por mnimos cuadrados a un nmero
de ondas sinoidales con frecuencia, amp y fase d das. Los r ultado se
conocen como per gram huster
9
, 98) y tam in como nlisis
rmnico o anlisis de Fourier. Para efec s de las s ies de tiempo,
xaminar las amplitudes de onda tiene cualquiera de los tres objetivos
guiente
1. Ayuda a identificar la aleatoriedad e las sede de tiempo o de los
resi ales). E uadro 8. y la figura muestran claramente que no
ex ning rn i able, al conf a la total alea-
tor d de la e de , hech e ya se ostr a iame .
evaluar el ruido blanco.
Pe ogram nlisi ctral
mpo e omp
e dif ias. uy po antes l
dv ient as co adoras personales y a cierto rito,
u este do p comp
id r
e tido
b e s s s:
. Ancho de on , m da de una cresta a la iente, e ersame te
cia.

3
a.
se com
rm
n f a simil ua serie po pu n
litud a es s
iodo a (Sc 18 b a
a to er
e
si s:

(d s
du l c 3 8.5
iste n pat dentific lo cu irm
ieda sed tiempo o qu dem mpl nte

2. Ayuda a identificar estacionalidad en la sede de tiempo.

Ayuda a determ inancia de autocorrelacin negativa o
positiva, ya que para sta predomi las baj recuencias, mientras
para tocorr n n lo hac as altas.

ebe adv rtirse que sta tcn a no es central para lo modelos ARIMA,
unque e algun utilida siem cil t ide e
odelo apropiado para una se e de tiem
Frecuencias de
ndice Real
Imaginari
a
Magnitu
d Fase
Periodogram
a
3. inar la predom
nan as f
au elaci egativa en l
D e e ic s
a es d a d en la pre dif area de ntificar l
m d po.

1 0.0 9.250 0.0 9.250 0.0 217.883
2 0.12500 1.037 0.119 1.043 0.114 2.772
3 0.25000 -1.125 -1.125 1.591 -2.356 6.446
4 0.37500 1.213 1.119 1.650 0.754 6.936
5 0.50000 1.500 0.0 1.500 0.0 5.730

onentes Fourier de ruido blanco (archivo aleatorio)

Cuadro 3. Comp

Figura 5 . Periodograma de una serie de ruido blanco (nmeros aleatorios)
s
jos de tiempo (un ao). Si el patrn es consistente, los coeficientes en el
desplazamiento 12 (para series mensuales) o en el desplazamiento 4 (para

IDENTIFICACIN DE LA ESTACIONALIDAD

La estacionalidad puede definirse como un patrn que se repite a intervalo
fi
series trimestrales) son altos y positivos, lo que indica la presencia de
stacionalidad. Si no hubiera ningn coeficiente diferente de cero, indicara
m e distancia no estn correlacionados, o
g
l-
erar qu los valores de p, q y m son iguales
cero, en la tabla de x
2
puede verse, para 95% de probabilidad y 12 grados
e libertad, que el valor es 21
autocorrelaciones no es significativo, aunque el valor 0.7 del
desplazamiento 8 e igual a 0.42
mbin a 95% de probabilidad.
EJERCICIO 2
de los ndices de
un patrn
n
rios, sino que tambin se identifica claramente el patrn de
e
que los eses o trimestres a un ao d
que no existe un patrn que pueda identificarse de un ao al si uiente.
Datos de esta clase no tendran estacionalidad.

or lo general, en un desplazamiento estacional o en alguno de sus m P
tiplos puede identificarse un coeficiente de autocorrelacin significativo
(ver ejercicio 8.2, desplazamientos 4 y 8). Como era de esperarse, en la
autocorrelacin parcial se observa una autocorrelacin altamente sig-
nificativa y en los ndices 1,5 y 9

(cada 4) del periodograma se aprecia
claramente un aumento considerable en magnitud, as como en el
periodograma propiamente dicho. El valor de Q que se obtiene en la prueba
Box-Pierce es 11.61 y al consid e
a
d .02. Este hecho indica que todo el grupo de
s mayor que el margen de error, que es
ta

Considere los datos del siguiente cuadro, donde por medio
estacionalidad del mtodo de descomposicin se identific
estacional. En este ejercicio no slo se establece que los datos no so
estaciona
estacionalidad.

Ejercicio 2. Desplazamientos, ACF, PACK, periodograma y

grfica de los datos originales

Fourier componentes del archivo Papel

Frecuencia
ndice
Real Imaginaria Magnitud Fase periodograma
1 0.0 3029.891 0.0 3029.891 0.0 4.67545E+0.7
2 0.06250 -28.208 141.826 144.604 1.767 106494.711
3 0.12500 -43.021 18.218 46.720 2.741 11116.538
4 0.18750 -5.558 24.204 24.834 1.797 3140.862
5 0.25000 267.371 36.049 269.790 0.134 370700.469
6 0.31250 -25.977 21.598 33.783 2.448 5812.393
7 0.37500 -33.829 23.411 41.139 2.536 8619.604
8 0.43750 -17.727 36.650 40.712 2.021 8441.446
9 0.50000 -238.394 0.0 238.394 3.142 289440.656

ANLISIS DE DATOS ESTACIONARIOS EN UNA SERIE DE
TIEMPO

El trmino estacionado se refiere a que en los datos de una serie de tiempo
tos deben estar
orizontales a lo largo del eje de tiempo y fluctan alrededor de una media
no existe patrn de crecimiento ni decrecimiento. Los da
h
constante independiente del tiempo. La varianza de dichas fluctuaciones
tambin permanece constante a lo largo del tiempo.

La visualizacin de las sedes de tiempo basta muchas veces para convencer
al analista si los datos son estacionarios o no. La grfica de autocorrelacin
CF) se abate a cero rpidamente. En una serie de tiempo no estacionaria
n varios de los desplazamientos aparecen uno o varios coeficientes
diferentes de cero orrelacin en el
jercicio 2 ) la autocorrelacin de los datos no estacionarios decrece len-

(A
e
. En estos casos (vase la grfica de autoc
e
tamente al aumentar el nmero de desplazamientos. En el siguiente

FIGURA 6. esta grfica es de datos que no cambian la media a lo largo
del tiempo. Se dice que esta serie de tiempo estacionaria en la media.

FIGURA 7. esta grfica tiene variacin en la media, pero evidentemente no
una serie de tiempo
stacionaria en la varianza.
se observa cambio en la varianza. Se dice que sta es
e

FIGURA 8. sta es una grfica de serie de tiempo que no es
estacionaria ni en la media ni en la varianza. La media vaga (cambios
en el tiempo) y la varianza no es razonablemente constante sobre el
empo.
n observarse varios modelos donde se describirn en detalle
s caractersticas de stos usando las herramientas presentadas en este
atrones no estacionarios. Antes de
ecesario eliminar la no estacionariedad para permitir la aparicin de otras
s aplicando la tcnica de diferenciacin. Esta tcnica se define como el
laro que en una serie de tiempo el nmero de valores di-
renciados ser n -1.
ti

captulo podr
la
captulo.

ELIMINACIN DE LA NO ESTACIONARIEDAD DE LAS SERIES
DE TIEMPO

Muchas veces los diagramas de autocorrelacin son dominados por la
tendencia, la estacionariedad y otros p
proceder a construir un modelo de prediccin, en muchas ocasiones es
n
estructuras de autocorrelacin. Una manera de lograr lo anterior

e
cambio que hay entre cada observacin de la serie original:

1
'
=
t t t
Y Y Y

Debido a que no es posible calcular la diferencia para la primera ob-
servacin, es c
fe

EJERCICIO 3

Se obtiene una serie de tiempo con una tendencia ascendente y se procede a
n las tres series de tiempo puede observarse que el primer valor de Q est
o al valor de
blas (11.02 < 11.07), ya no es significativo y el tercero, despus de
desplazamiento tiene un valor alto (-0.32), pero
xcedan el margen de error.
presan como
efectuar las primeras diferencias, encontrndose que aun no desaparece la
tendencia (la ACF muestra pendiente). Se procede a aplicar segundas
diferencias y ahora la serie de tiempo se convierte en ruido blanco.

E
bastante prximo al valor de tablas (11.79 > 11.07 a 95% de probabilidad)
aunque es significativo; el segundo valor, tambin prxim
ta
diferenciar por segunda vez, ha perdido toda significancia.
Puede notarse que el quinto
es necesario recordar que pueden aceptarse hasta 5% de valores cuyos picos
e

Como se ha observado en este ejercicio, al hacer las primeras diferencias no
siempre se logra eliminar la no estacionariedad de la serie de tiempo, por lo
que es necesario recurrir a las segundas diferencias, que se ex

( ) ( )
2 1 2 1 1
'
1
' ' '
2

+ = =
t t t t t t t t t
Y Y Y Y Y Y Y Y Y Y
t

FIGURA 9. Grficas de autocorrelacin de la serie de la pgina
iguiente. La primera grfica muestra la tendencia con el primer
esplazamiento significativo, la segunda todava conserva tendencia y
tercera ya es ruido blanco.

s
d
la

REDUCCIN DE LA ESTCIONARIEDAD POR MEDIO DE PRIMERAS
Y SEGUNDAS DIFERENCIAS

t Y Dif Cuad. Desplazamiento
1 2 3 4 5 6
1 2,44 -35,38 1251,45 1150,27 1020,45 846,75 645,11 382,97 66,01
2 5,3 -32,52 1057,28 937,95 778,29 592,95 352,01 60,67 -261,56
3 8,97 -28,85 832,08 690,45 526,03 312,28 53,82 -232,04 -515,88
4 13,88 -23,94 572,92 436,49 259,13 44,66 -192,54 -428,07 -707,16
5 19,58 -18,24 332,55 197,42 34,03 -146,69 -326,13 -538,76 -762,52
6 26,99 -10,83 117,2 20,2 -87,08 -193,61 -319,84 -452,67 -588
7 35,95 -1,87 3,48 -15,01 -33,37 -55,12 -78,02 -101,34
8 45,86 8,04 64,71 143,86 237,66 336,36 436,91
9 55,7 17,88 319,84 528,37 747,81 971,36
10 67,36 29,54 872,86 1235,36 1604,67
11 79,63 41,81 1748,42 2271,1
12 92,13 54,31 2950,03

37,82 10122,82 7596,47 5087,6 2708,94 571,32 -1309,25 -2769,12
0,75043 0,502587 0,267607 0,056439 -0,12934 -0,27355
Suma de cuadrados: 0,98 0,563145 0,252594 0,071614 0,003185 0,016728 0,0074831
Q = 11,785155 X tablas =12,592
2

Primeras diferencias
1 2,86 -5,29 28,02 23,73 17,17 12,99 3,94 -4,27 -9,3
2 3,67 -4,48 20,1 14,54 11 3,33 -3,62 -7,87 -7,56
3 4,91 -3,24 10,52 7,96 2,41 -2,62 -5,7 -5,47 -11,37
4 5,7 -2,45 6,02 1,82 -1,98 -4,31 -4,14 -8,6 210,1
5 7,41 -0,74 0,55 -0,6 -1,31 -1,25 -2,61 -3,06 -3,23
6 8,96 0,81 0,65 1,42 1,36 2,83 3,32 3,5
7 9,91 1,76 3,08 2,96 6,16 7,23 7,63
8 9,84 1,69 2,84 5,91 6,94 7,33
9 11,66 3,51 12,29 14,43 15,24
10 12,27 4,12 16,94 17,89
11 12,5 4,35 18,89

8,15 119,93 90,08 57 25,53 -1,17 -25,77 -41,56
0,751091 0,475275 0,212881 -0,00974 -0,2149 -0,34657
Suma de cuadrados 1,0017343 0,564138 0,225886 0,045318 9,49E - 05 0,046183 0,120113
Q = 11,019077 <12,592 No significativa

1 0,81 -0,15 0,023716 -0,04 0,03 -0,11 -0,09 0 0,16
2 1,24 0,28 0,076176 -0,05 0,21 0,16 0 -0,29 0,24
3 0,79 -0,17 0,030276 -0,13 -0,1 0 0,18 -0,15 0,06
4 1,71 0,75 0,556516 0,44 -0,01 -0,77 0,64 -0,26 -0,55
5 1,55 0,59 0,343396 -0,01 -0,61 0,5 -0,21 -0,43
6 0,95 -0,01 0,000196 0,01 -0,01 0 0,01
7 -0,07 -1,03 1,069156 -0,89 0,37 0,76
8 1,82 0,86 0,732736 -0,3 -0,63
9 0,61 -0,35 0,125316 0,26
10 0,23 -0,73 0,538756

0,96 3,49624 -0,7052 -0,75989 0,543452 0,527216 -1,12638 -0,09048
-0,2017 -0,21735 0,155439 0,150795 -0,32217 -0,02588
Suma de cuadrados 0,2392854 0,040683 0,047239 0,024161 0,022739 0,103793 0,00067
Q = 2,3928543 <12,592

Y se denomina diferencias de segundo orden. Esta serie tiene n-2 valores.
En la prctica casi nunca es necesario ir ms all de las segundas
diferencias porque las series de datos solamente tienen no estacionariedad
de primer o segundo nivel.

MODELO NAIVE

En las ecuaciones 3.3, 8.8 y 9.5 se describe el modelo Naive o random
walk, de gran utilidad prctica para las sedes de datos que han sido
transformadas en ruido blanco por medio de la tcnica de diferenciacin.

t T T
e Y Y + =
1

rgos periodos co Tpicamente estos modelos tienen la
encia ascendente o descendente que
n patrones de ten-
pueden cambiar de direccin en forma
impredecible (vase figura 8.8). Este modelo se utiliza frecuentemente en
econometra y en el anlisis de las fluctuaciones financieras de las acciones
s de valores.
RUEBAS PARA LA ESTACIONARIEDAD
do para rificar la ta-
las series de tiempo, la ms conocida es la Dickey-Fuller.
d
en las bolsa

P

De las diversas pruebas que se han desarrolla ve es
ionariedad de c

' '
2 2
'
1 1 1
'
...
p t p t t t t
Y b Y b Y b Y Y

+ + + =

donde Y denota la serie diferenciada
'
t 1
t t
alrededor de tres desplazamientos (p = 3) y si la sede original
t
Y requiere
diferenciacin, entonces el valor estimado de se aproxima a cero. Si Y, ya
es estacionaria, entonces el valor de es negativo.

Y Y . En general se ejecutan
l valor de se estima a partir de la regresin (8.9) utilizando la tcnica
os cuadrados. Si se requiere diferenciacin, entonces ya
a . En vez de lo anterior, el
res de tablas creadas por Fuller
976 , entonces puede considerarse que la
.

CAPITULO 8
egresvos de alto orden ARIMA (2,0,0) o ARIM
odelos de regresin simple y mltiple cuya forma
general es

Y = b0 + b1X + b2X2 + +bpXp + e (8.1)

Donde Y es la variable a predecir, X1 hasta Xp son las variables
explicatorias, b0 hasta bp son los coeficientes de regresin y e es el trmino
que denota el error aleatorio de la serie de tiempo. En la ecuacin (8.1) los
E
ordinaria de mnim
no es vlido el supuesto de la prueba t par
valor de debe compararse con los valo
(1 ). Si el parmetro es significativo
serie a prueba es estacionaria

Mtodo Box-Jenkins (ARIMA)

Objetivos
8.1 Introduccin
8.2 Modelo autorregresivo de orden 1 (cuando p = 1)
8.3 Modelo de promedios movibles de primer orden Ma (1)
8.4 Modelos autorr
(p, o, o)
8.5 Modelos de promedios movibles (MA) de alto orden...

8.1 Introduccin
Antes se discutieron los m
valores X1, X2 . Xp pueden representar cualquier factor como
precio, ingreso per cpita, existencias de inventario, etctera.

Si ahora estas variables se definen como X1 = Yt-1, X2 = Yt-2, ., Xp
=Yt-p , la ecuacin (8.1) se convierte en

Yt = b0 + b1Yt-1+ b2Yt-2 + +bpYt-p + et (8.2)

que todava es una ecuacin de regresin pero difiere de la (8.1) porque en
sta las variables del miembro derecho son diferentes variables ex-
s de la
mente
esplazados en tiempo; de ah el trmino auto regresin (AR) que se utiliza
razn para tratar en forma
iferente la auto regresin de la regresin? La respuesta es doble:
gresin es muy fcil violar el supuesto de la indepen-
igualdad usualmente se relacionan entre s (de hecho, cada
ariable independiente es un desplazamiento de la misma variable de serie
de tiempo).
2. No siempre es tan sencillo determinar el nmero de valores previos
de Yt a utilizar en la ecuacin (8.2).
qu, explcitamente la relacin de dependencia se hace a lo largo de los
errores (o residuales) y la ecuacin se denomina de promedios movibles o
ver ges).
les no debe confundirse con la que se estudi en
los mtodos de atenuacin y en los de descomposicin. Aqu se denomina
plicatorias, en tanto que en la ecuacin (8.2) son los valores previo

misma variable Yt a pronosticar. Estos valores han sido simple
d
para describir ecuaciones de la forma (8.2). Este tipo de ecuaciones ya se
us en el captulo anterior sobre auto correlacin.

La primera pregunta que se plantea es: cul es la
d

1. En la auto re
dencia del error entre variables independientes porque las variables del lado
derecho de la
v

Otro concepto interesante es que as como se auto correlacionan los valores
pasados de las observaciones de las series de tiempo, tambin es posible
utilizar los errores (residuos) como variables explicatorias:

Yt = bO + b1ey-1+ b2et-2+... +bpet-p+et (8.3)

A
modelo MA (Moving A

La frase promedios movib
de promedios movibles porque se refiere a una serie de promedios movibles
de las series de errores et. En los captulos anteriores se trataba de los
romedios movibles de las observaciones propiamente dichas, Yt. En
Como se ver ms adelante, l ueden acoplarse fcilmente a
s modelos MA para formar una clase general y ms til de modelos de
procedimiento de diferenciacin se denomina promedios
ovibles auto regresivos integrados (ARIMA), y fue popularizado por Box
modelo no
stacional general se denomina ARIMA (p, d, q ), donde:
AR: p = orden (o nivel) de la porcin auto regresiva.
I: d = nivel de diferenciacin implicado.
MA: q = orden (o nivel).de la porcin de promedios movibles.

Los modelos de las ecuaciones (8.2) y (8.3) se escriben en esta notacin. Un
modelo de ruido blanco como el descrito por la ecuacin (8.4) se clasifica
como ARIMA (0,0,0) debido a que no hay aspectos AR (Yt no depende de
Yt-1). No hay diferenciacin implicada y tampoco hay porcin MA (Yt no
depende del error et-1). La variable Yt est formada por dos componentes:
el error mencionado y la constante c.
anera semejante, un modelo aleatorio Naive se clasifica como ARIMA

Obsrvese que los trminos no utilizados pueden descartarse en la
escripcin del modelo; por ejemplo, un modelo AR (2,0,0) tambin puede
p
este captulo el trmino MA se refiere a los errores.

os modelos AR p
lo
auto regresin: los ARMA. La limitacin ms importante de estos modelos
es que deben usarse slo con datos estacionarios aunque pueden extenderse
a series de tiempo no estacionarias utilizando la diferenciacin de las series
de tiempo. Este
m
y Jenkins en 1970. Existe gran variedad de modelos ARIMA. El
e

Yt = c + et (8.4)

e m D
(0,1,0) debido a que no contiene componentes significativos AR ni MA e
incorpora una diferenciacin. El valor ms reciente puede utilizarse para
redecir el valor del siguiente periodo, y en los modelos Box- Jenkins la p
ecuacin representativa sera

Yt =Yt-1 + et (8.5)

d
escribirse como AR (2), porque no implica diferenciacin (I) ni promedios
ovibles (MA). Un modelo ARIMA (1,0,1) tambin se escribe como
AR ),
etctera.

delos es muy laborioso y se utiliz hasta el advenimiento de
s computadoras.
ara desarrollar un modelo debemos seguir los siguientes pasos:
. Conceptualizacin de series de tiempo, visto en los modelos de
nes generales de ARIMA.
tadsticas que han probado su utilidad
uto correlacin, error estndar y prueba Q).
4. Ilustrar cmo los conceptos, notaciones y herramientas estadsticas
pueden combinarse para ayudar al anlisis de una amplia variedad de
variables ordenadas en series de tiempo.

Los modelos de atenuacin y descomposicin se presentaron en la forma
siguiente:
Ft-1 = Ft + (Xt Ft )
= Ft + (et) Ecuacin
(1)

Si sustituimos, la atenuacin es ahora

Ft = Ft+1 + (Xt+1 - Ft+1)
Ft-1 = Ft+1 + (Xt+1 - Ft+1) + (Xt Ft )

Y sustituyendo para Ft-1 = e (2)

(3)

m
MA (1,1) y un modelo ARIMA (0,1,1) se denominar IMA (1,1

Mtodos ARIMA de auto correlacin

Este tipo de mo
la

P

1
atenuacin(Smoothing).
2. Definicin de las notacio
3. Describir las herramientas es
(a
= Ft+1 + (et+1 ) + (et) Ecuacin
(2)
en l primer trmino d
Ft-1 = Ft-2 + (et-2 ) + a (et-1 ) + (et) Ecuacin
Los resultados de seguir expandiendo la ecuacin por sustitucin son claros.
Dada alguna prediccin inicial, llmese Ft-2 se pueden obtener nuevas
predicciones agregando un porcentaje de los errores entre el valor real y el
v
valor pronosticado inicial Ft+1 y qu
d

E
una serie de tiempo entre los elementos que la componen (estacionalidad,
tendencia, ciclo y aleatoriedad) calculando y pronosticando cada uno por
separado (excepto la aleatoriedad, que puede calcularse pero no predecirse)
y a continuacin recombinando estas pr
L
variaciones en alguna variable de inters (dependiente) con base en
variaciones en varios otros factores (variables independientes). Por ejemplo
en la regresin mltiple el modelo es:

alor pronosticado (por ejemplo: Xt-2 - Ft-2 )asi para cada valor real y su
e se acercara en promedio al patrn real
e lo datos de la serie de tiempo.
n el caso de la descomposicin el principio es el de partir o descomponer
edicciones.
a regresin, como ya sabemos, es una prediccin causal, trata de predecir
Y = b0 + b1X1 + b2X2 + . + bkXk +e
cuacin(4)
ariable dependiente, X1 hasta Xk son las variables
dependientes y bo hasta bk son los coeficientes de regresin lineal y e
cipios de atenuacin y los de regresin aplicados a
s series de tiempo como se indica a continuacin:
En la ecuacin (4) X1, X2,..., Xk pueden representar cualquier factor, como
entas mensuales, el producto nacional bruto, precios, etc. Si a estas
variables ahora las definimos como:
Xt = Yt-1 , X2 = Yt-2 , Xk = Yt-k entonces la ecuacin (4) se convierte en:

Y = a + b1Yt-1 + b2Yt-2 + .. + bkYt-k +e

La ecuacin (5) sigue
ecuacin (4) en que las variables de derecha (independientes) ahora son
valores previos de la misma variable Yt Estos valores son simplemente
valores con es iente y por lo
tanto se gener otacin de la
ecuacin (5

E

Donde Y es la v
in
es el error aleatorio.
Combinaremos los prin
la
v
Ecuacin(5)
siendo una ecuacin de regresin, pero difiere de la
la
pacio en tiempo de la misma variable depend
a una auto regresin (AR) presentada en la n
).
S
la a
re

1. En la auto regresin. el supue o bsico de independencia del error
(residuos) de los resultados se puede violar fcilmente dado que todas las
variables cin de
ependencia (son la misma variable).
. La determinacin del numero de valores anteriores de Yt, para
n (3).

e plantean entonces algunas preguntas acerca de la ecuacin (5): por que
regresin que se aplica a una auto correlacin debe tratarse en form
diferente de un clculo de mnimos cuadrados? Tenemos una doble
spuesta:
st
independientes de la ecuacin (5) tienen una rela
d

2
incluirse en la ecuacin (5) no es un mecanismo sencillo.

De igual manera, la ecuacin (5) puede escribirse en trminos de errores
anteriores, tal como se ve.
Yt = a + b1et-1 + b2et-2 +......+ bket-k + et Ecuacin (6)

Aqu, explcitamente se establece una relacin de dependencia entre
trminos sucesivos de error, y la ecuacin del modelo se denomina (MA) de
promedios movibles. Ntese la relacin con la ecuaci
Los modelos de auto regresin (AR) pueden acoplarse con los de promedios
movibles (MA) para generar modelos muy tiles de series de tiempo
llamados (ARMA) autoregressive/moving averages.

Mtodos AR y MA. Comparacin con la regresin:

Frmulas:

Regresin simple: Yt = a +bXt-1 = 1.043 + .83Xt-1
(7)

Regresin mltiple: Yt = a + b1Xt-1 + b2Xt-2 + +
bpXt-p (8)

Yt = 1Yt-1 + 2Yt-2 + +
gresivo residuos (MA): Yt = et - 1et-1 2et-2 - - qet-q
ecir que dos de los coeficientes r de
auto correlacin quedan fuera de los limites de confianza al 95% de
probabilidad. La flotacin es que ahora en lugar del coeficiente b tenemos
n coeficiente rp, denotado ahora con la letra griega p
ara un modelo MA (2), seguimos la misma lgica, excepto que el
, en
tendramos dos coeficientes r significativos.
Debe observarse que ahora no existe la constante a, se genera ahora una
onstante que es funcin de la media para el caso de los procesos AR en
donde se calcula la constante = - . En l caso de los procesos MA,
iliza la media
completa en lugar de la constante a.
Como indicamos, los modelos AR y MA pueden acoplarse para generar
nado de diferenciacin
) para lograr los modelos ARIMA. A continuacin se presentan los
Autorregresivo (AR):
pYt-p (9)

utorre A
(10)

or ejemplo, un modelo AR (2) quiere d P
u

Mtodo ARMA de auto correlacin

P
coeficiente r ahora se convierte en un coeficiente con notacin griega
donde

c
dado que son obtenidos de auto correlacin de residuales se ut

modelos combinados. incluyendo un ajuste denomi
(1
modelos de prediccin ARIMA tal y como lo desarrollaron Box y Jenkins.

Los modelos ARIMA para sedes de tiempo son:

Modelo aleatorio: ARIMA (0,0,0)

Loa tres nmeros se refieren al proceso AR, al grado de diferenciacin (1) y
al proceso MA.
en donde:

Yt = + et
Ecuacin (11)

onde la observacin Yt est formada de dos partes. Una media general ,
y un componente de error aleatorio et, el cual es independiente de periodo a
periodo.

Se clasifica como ARIMA (0,0,0) porque no hay proceso AR (no hay
ninguna r significativa por ser datos estacionarios), esto es, ninguna Yt,
depende de Yt-1. No hay diferenciacin implicada (los datos ya son
estacionarios) y no hay proceso MA (Yt no depende de et-1). La grfica de
los datos para este modelo es:
ARIMA (0,0,0
(a) ARIMA (0,0,0)
No tiene aspecto AR
No hay diferenciacin
No tiene aspecto MA

D

o: ARIMA (0,1,0)
acin (13) muestra que las primeras diferencias de la serie de
an un modelo aleatorio. Veamos las dos siguientes grficas

Modelo aleatorio no estacionari

La ecuacin (12), muestra los datos como si fueran AR (con tendencia) en
donde Yt, depende de Yt-1, pero en el caso de que el coeficiente Yt-1 es
unitario, la ecu
tiempo Yt form
y sus implicaciones:

(b)ARIMA(0,l,0)
Tiene aspecto AR
Necesita clculo de primeras diferencias para remover lo no estacionario
de la media
No tiene aspecto MA

Yt = Yt-1 + et Ecuacin (12)
Yy Yt-1 = et Ecuacin (13)

Matemticamente, es conveniente redefinir (Yt Yt-1) como Wt, la serie de
encias, de manera que podemos entonces hablar de W como
una serie estacionaria. Este concepto de ser estacionaria se puede describir
en trminos no estadsticos en la forma siguiente:
. Si una serie de tiempo se grafica y no hay evidencia de cambio en la
edia sobre cierto
periodo de tiempo grfica (a), entonces decimos que la serie es estacionaria
en la media.

2. Si la serie de tiempo graficada muestra que no hay cambio obvio en la
varianza a lo largo del tiempo, entonces se dice que se trata de una serie
estacionaria en la varianza.

3. La segunda grfica (b) muestra una serie de tiempo ARIMA (0,1.0)
tpica, donde la media varia sobre el tiempo (con una aparente tendencia).
sta es una serie de tiempo con una media no estacionaria.

4. La tercera grfica (c) muestra que la serie de tiempo no es estacionaria en
la media ni en la varianza. No es razonablemente constante sobre el tiempo.
(c) ARIMA (0.1,0)
primeras difer

1
m

No tiene aspecto AR
La media vara henaiite y la varianza cambiante, nos da una serie de
tiempo difcil de manejar
No tiene aspecto MA

Modelo de auto regresin ARIMA, estacionario de primer orden tipo
(1,0,0):
ARIMA (1,0,0)
a ecuacin (14) muestra la forma bsica de un modelo AR (1) o ARIMA
(1,0,0), hablando en forma ms general. La observacin Y, depende de la
Yt-1 y el valor del coeficiente autorregresivo est restringido a caer en el
rango -1 a + 1.

Yt = 1Yt-1 + + et Ecuacin (14)

(d) ARIMA(1,0,0) o AR(1)

L

donde 1 = r1 y et = NID(O , l0) (NID significa que el error est
istribuido normalmente, es independiente y con media = O y varianza =
10).

L A (1,0,0) para un modelo
onde et, es un error distribuido normalmente e independiente.

(e) ARIMA (1,0,0)0 AR (1)
d
a grafica (d) muestra una serie de tiempo ARIM
d

Cuya grafica muestra datos con una tendencia muy leve.

Modelo estacionario de promedios movibles MA de primer orden:
hablando en forma ms general. La observacin Yt, depende del
error et, y tambin del et-1 con el coeficiente -1 restringido a caer en el

ARIMA (0,0,1)

La ecuacin (15) muestra la forma bsica de un modelo MA (1) 0 ARIMA
(0,0,1),
rango -1 a + 1.

Yt = + et - 1e t-1 Ecuacin (15)

(f) ARIMA (0,0,1) 0 MA(1)
Yt =100 + et - te t-1
Donde t = 0.7 y et es NID (0,10)

a grfica (f) muestra un ejemplo de modelo ARIMA (0,0,1) o MA (1), con
el valor del coeficiente q de la ecuacin (15) restringido a quedar en el
rango entre -1 y + 1.
Modelo ARIMA simple combinado: ARIMA (1,0,1)

eden combinarse para
plo, la ecuacin (16)
bina un proceso AR de primer orden y un proceso MA de primer orden.
ARIMA (1,0,1) o ARMA (1,1)
dia y en la varianza. La grafica (g)
a un ejemplo de una serie que podra ser ARIMA (1,0,1) y que fue
ente (Makridakis).
n el ejercicio se observar que una tendencia que se resuelve con un
odelo AR (2) con un MSD muy pequeo, tambin se resuelve con un
odelo ARIMA (1,0,1) disminuyendo an ms el MSD.
L

Los elementos bsicos de los procesos AR y MA pu
producir una gran variedad de modelos. Por ejem
com

Yt = + 1 Yt-1 + et - 1 et-1 Ecuacin (16)

Aqu Yt depende de un valor Yt-1 anterior y un error previo et-1. La serie
de tiempo se pone estacionaria en la me
d
generada artificialm

E
m
m

(g) ARIMA (l,0,l)
Yt = 0.31 Yt-1 + 70 + et + 0.7 et-1.
onde et es NID (0,10)

d

Combinaciones ARIMA de afro orden (p, d, q):

Claramente no hay lmite a la variedad de modelos ARIMA. El modelo
general, que cubre todos los casos m uchos ms, se
conoce como ARIMA (p, d, q ).

donde
AR: p = orden del proceso de auto regresin
I: d = grado de diferenciacin involucrado
MA: q = orden del proceso de promedios movibles

En la prctica, raramente se hace necesario trabajar con valores de p, d o q
que sean diferentes de 0, 1 o 2. Es importante observar qu tan pequeo
rango de valores de p, d o q pueda ser capaz de generar a su vez tan amplia
variedad de modelos ARIMA para las diversas situaciones de prediccin
encionados antes y m
encontradas en el medio comercial, industrial o cientfico.

8.2 Modelo autorregresivo de orden 1 (cuando p = 1)

Yt = c + 1Yt-1 + et (8.6)
epresenta la forma bsica de un modelo ARIMA (1,0,0) o AR (1). La
bservacin Yt depende de Yt-1 y el valor del coeficiente de auto regresin
1 est restringido entre los valores -1 y +1. En este caso, el error et est
istribuido normalmente con media O y varianza 1.
Obviamente, si el valor de 1 es igual a cero, entonces el modelo Yt es
equivalente al modelo ruido blanco de la ecuacin (8.4). Cuando 1 = 1, Yt
es equivalente al modelo naive de la ecuacin (8.5).

Normalmente, dado que 1= r
1
, los modelos AR (1) oscilan entre estos dos
extremos, en cuyo caso la serie de tiempo slo tiene un coeficiente de auto
correlacin de un desplazamiento significativo (el primero, ver auto
correlacin parcial, donde los coeficientes restantes disminuyen
exponencialmente ). En el ejercicio 8.1 se estudia un caso AR (1)
-

Grfica de autocorre1acin Grfica de
autocorre1acin parcial

La ecuacin

R
o
d

Figura 8.2 Diagramas de auto correlacin y auto correlacin
parcial

Ejercicio 8.1
Serie de tiempo AR (1).

En el cuadro de la pgina siguiente se observan los datos del ejercicio 8.1
con una tendencia descendente y la ecuacin del modelo es

Yt = ` + 1Yt-1 + et

en donde la constante c = , est dada como funcin de la media de
la serie de tiempo, el desarrollo es como sigue

( Yt - ) = 1 (Yt-1 - ) + et donde = media de la
serie
Yt = 1Yt-1 + ( - 1 ) + et
Yt = 1Yt-1 + `+ et (8.7)

al sustituir en la frmula se encuentran los valores siguientes:

Yt = O.73 Yt-1

+ 40.71

188.1 = 0.73 x 203 + 40.71

Que es el resultado anotado en el primer rengln del cuadro de la pgina
anterior. Si la iteracin contina se obtienen todos los valores subsiguientes,
y para continuar la prediccin cada valor de pronstico ser utilizado para
predecir el que le sigue. Como se muestra en la figura 8.3 donde los valores
de prediccin que siguen se muestran con la lnea punteada.

Figura 8.3 SERIES

8.3 Modelo de promedios movibles de primer orden MA (1)

La ecuacin
Yt = c+ et - 1et-1

(8.8)

Representa un modelo MA (1), o sea un modelo ARIMA (0,0,1) en la
notacin ms general. La observacin. Yt depende del error, denotado por et
y tambin del error previo et-1

multiplicado por el coeficiente -1. Dado
que en este caso se trabaja con los residuos, es evidente que para obtener
valores de prediccin de la magnitud original la constante es la media no
modificada ().

Como ya se haba dicho, el valor del coeficiente 1 est restringido entre -1
y +1. En la ecuacin (8.8), ntese el signo negativo del coeficiente 1. Esta
es una convencin para los modelos ARIMA.

En la figura 8.1, que contiene el resumen de los modelos ARIMA Box--
Jenkins, se ha graficado la serie de tiempo MA (1), y en la figura 8.4
pueden apreciarse las grficas del ACF y el PACF. Ntese que en el primer
desplazamiento slo existe una auto correlacin significativa (diferente de
cero) y que las auto correlaciones parciales decaen exponencialmente.

Figura 8.4 Grficas de serie de tiempo, ACF y PACF de un MA (1)
desarrolladas en el paquete SYSTAT

8.4 Modelos auto regresivos de alto orden ARIMA (2,0,0) o ARIMA (p,0,0)

La ecuacin (8.9) representa un modelo AR de orden p (avo):
Y
1
= e + 1Yt-1 + 2Yt-2 + .....+ pYt-p + et

(8.9)

donde c = constante
j = parmetro autorregresivo j (avo)
et = el error del miembro t de la ecuacin
Existen restricciones aplicables a los valores de los parmetros auto
regresivos. Para p = 1, -1 < 1< 1. Para p = 2 se aplican las siguientes
restricciones:

-1 < 2< 1 2 + 1 < 1 2 - 1 < 1

Para p = 3 las restricciones son an ms complicadas; sin embargo, como
ya se mencion, aunque tericamente existe una gran variedad de
combinaciones de alto orden, puede observarse que en el ACF difcilmente
se encuentran ms de dos coeficientes de auto correlacin que sean
significativos, por lo que en la prctica es bastante excepcional utilizar un
modelo con p > 2.
En el ejercicio 8.2 de la pgina siguiente se han utilizado los datos no
estacionarios con pendiente ascendente del ejercicio 7.3. De inmediato
puede apreciarse que el MSD = 148 disminuye en AR (1) a 39.7 con AR
(2). Es claro que el coeficiente de auto correlacin del desplazamiento 1 es
significativo y que el correspondiente al desplazamiento 2 se encuentra en
el lmite (ver la grfica del ejercicio 8.2), ya que al parecer la tendencia no
es lineal y presenta concavidad izquierda (signo positivo del coeficiente de
autocorrelain 2). Sin embargo, en este ejercicio es posible observar
cmo puede generarse un mejor resultado simplemente explorando
empricamente el mejor ajuste (de manera muy similar a como se trabaja
con el mtodo Stepwise para el anlisis de regresin mltiple). En este caso
particular se explor la combinacin ARIMA (1,0,1) [tambin denominada
ARMA (1,1)] y en forma sorprendente se obtuvo un ajuste casi perfecto,
con un valor virtualmente igual a cero.

Ejercicio 8.2
Auto correlacin de una serie de tiempo no estacionaria con tendencia
ascendente.

8.5 Modelos de promedios movibles (MA) de alto orden
ARIMA (0,0,2) o ARIMA (0,0,q)

La ecuacin (8.10) representa un modelo MA de orden q (avo):

Yt = c - 1et-1 2et-2 - ..- pet-q

donde c = constante
j = parmetro de promedios movibles j (avo)
e
1
= el error del miembro t de la ecuacin

Las mismas restricciones mencionadas en los modelos AR tambin se
aplican a los modelos MA.

Puede verse que es posible producir una gran variedad de modelos de
promedios movibles, pero igual que con los modelos auto regresivos, en
general puede afirmarse que difcilmente se requerir un modelo de orden
mayor que el modelo MA (2).

MODELOS DE COMBINACIONES ARMA Y ARIMA

Los elementos bsicos AR y MA pueden combinarse para producir diversos
modelos, como se observa en cl ejercicio 8.2 donde la ecuacin (8.11)
muestra que el valor de Yt depende del valor previo Y (Yt-1) y del error
previo segn el trmino et-1. Se asume que estas series son estacionarias en
la media y en la varianza.

Yt = C + 1Yt-1 + et - 1et-1(8.11)

Los modelos ARMA de orden mayor pueden desarrollarse de la misma
manera
Yt =c + 1Yt-1 + p Yt-p + et - 1et-1 - ..... - qet-q
(8.12)

Si a un modelo ARMA se agrega la no estacionariedad, entonces s obtiene
un modelo ARIMA (p,d,q) donde la ecuacin para un caso simple como
ARIMA (1,1,1) se conserva igual a la notacin ARMA (ecuacin 8.11) y
los casos de orden mayor quedan como en la ecuacin (8.12). La variedad
de modelos generados al introducir la eliminacin de la no estacionariedad
por medio de primeras y segundas diferencias es enorme, de manera que es
casi imposible definir reglas que permitan identificar los modelos. En el
apndice 1 de este captulo se incluye una manera simple de manejar
empricamente tal tipo de variaciones utilizando la versin pblica y
gratuita para estudiantes del paquete de estadstica SYSTAT (que en
realidad no es diferente de cualquier otro paquete como SAS, SPSS,
etctera).

Igual que para los modelos ARMA y ARIMA, tambin debe mencionarse la
complejidad aadida al utilizar dichos modelos para predecir esta-
cionalidad. Exactamente de la misma manera en que puntos consecutivos de
una serie de tiempo exhiben una auto correlacin AR, MA, y/o mezclas
ARMA o ARIMA, los datos separados por una estacin completa
(normalmente un ao) pueden exhibir las mismas propiedades.

La notacin ARIMA puede extenderse fcilmente para manejar los aspectos
de estacionalidad de una serie de tiempo y la notacn que suele usarse es

ARIMA (p, d,q ) (P,D,Q )

Parte no Parte
estacional estacional
del modelo del modelo

El lgebra es simple pero puede ser laboriosa y por tanto rebasa los
alcances de este libro. Igual que para el manejo emprico de todos los
modelos de ARIMA, basta con examinar como funciona cualquier paquete
estadstico que contenga estos modelos.

Texto Regresión

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Texto Regresión

Cargado por

Copyright:

Formatos disponibles

CAPITULO 1

las dos ecuaciones igualadas a cero se tiene

iene una distribucin t estuden y la hiptesis nula

+ =2.7 3.1820.610.55 = 2.7 2 1.1= (3.8,1.6)

385 3025 253

r el mtodo de los mnimos cuadrados (se tomar

lar la estimacin de los

i mediante notacin matricial :

= 2.26379 + 2.74427X1 + 0.01253X2

)=+() ()= Puesto que ()=0

De la definicin de f se tiene que

)de la ecuacin(5.11) se obtiene utilizando el mismo principio empleado

) y, entonces, el ultimo valor

plicatorias, en tanto que en la ecuacin (8.2) son los valores previo

También podría gustarte