Está en la página 1de 34

1

TEMA VI
EL MODELO LINEAL GENERAL (II)
VALIDACION Y PREDICCION
Este tema est destinado a validar el modelo, esto es, decir si el modelo es vlido, o por
el contrario, tenemos que rechazarlo.
6.1.-DISTRIBUCIN EN EL MUESTREO DE LOS ESTIMADORES MNIMO
CUADRTICO ORDINARIOS. DISTRIBUCIONES MUESTRALES DE LOS ERRORES
MNIMO-CUADRTICOS ORDINARIOS. INDEPENDENCIA DE y 2 .
Sabiendo que:

N , 2 ( X X )

i N i , 2 ai ,i

Vamos a demostrar que:

2
1) (n k ) 2 n2k .

2) y 2 son independie ntes.


3) 2 es consistent e.
1) Demostracin.-

u u
n2
2

1
1
= X ( X X ) X + X ( X X ) X = M + D
1442443 142
4 43
4
M

u u u (M + D )u u Mu u Du
=
+
=
2
2
2
2
D)

u Du
IDEMPOTENTE 2 K2

TRAZA = k

M)

SIMTRICA

u Mu
IDEMPOTENTE 2 n2k

TRAZA = n - k

SIMTRICA

Adems, podemos demostrar que las matrices M y D son independientes:

) (

1
1
M D = X ( X X ) X X ( X X ) X =

= X ( X X ) X X ( X X ) X X ( X X ) X =
14243
1

= X ( X X ) X X ( X X ) X = 0
1

M y D son independientes, y en consecuencia:


u u u Mu u Du

=
+
2
2
2
23
123 1
n2 k

k2

u u
n2
2

Ya tan slo nos queda por demostrar que la matriz D es simtrica, idempotente y de
traza k:
SIMTRICA:

1
1
D = X ( X X ) X = X ( X X ) X = D

IDEMPOTENTE:

DD = X ( X X ) X X ( X X ) X = X ( X X ) X = D
14243
1

TRAZA= k

Traza (D ) = Traza X ( X X ) X = Traza X X ( X X )


1

) = Traza (

)= k

u Mu
n2 k
2
u Mu u MMu u M Mu
=
=
=
2
2
2
como e = Mu y e = u M

2
(n k )
n2 k
e e

2
= 2 =

e e
2
2
como =
(n k ) = e e
nk

(
n k ) 2

=
2

2) Independencia.-.
Queremos demostrar que el estimar de vector beta y el estimador de la varianza son
independientes, para ello basta con demostrar que Cov e , = 0

1
Cov e , = E e E = E Mu u X ( X X ) =

1
1
1
1
= M E[u u ]X ( X X ) = M 2 X ( X X ) = 2 X ( X X ) X X ( X X ) =

[ (

)]

Como

1
1
1
= 2 X ( X X ) X ( X X ) X X ( X X ) = 2 0 = 0
144424443 14243
=0
=

2 =
(e ) = e e
{
nk
y e
Trans. de Borel
, y adems,

transformacin de Borel de e
independientes.

y una
e e
2 =
n k son

son independientes,

tambin lo son. Por tanto, y

3) Consistencia del estimador


Un estimador es consistente si sus varianzas tienden asintticamente a 0.
DEMOSTRACIN:

(n k ) 2
2

n2k

y sabemos que

[ ]

Var m2 = 2m

, por tanto:

2
2
Var n2 k = Var (n k ) 2 = 2(n k ) 2(n k ) = (n k ) Var 2

2
2 4

2
2 (n k )

=
Var
Var (n k ) 2 =
Var

nk

4

( )

( )

( )

2 4
= 0
Lim Var 2 = Lim
n
n
nk

( ( ))

DISTRIBUCIONES DE MUESTREO:
T-STUDENT:

t n k =

N (0,1)
n2 k
nk

1-
/2

/2

F de SNEDECOR

n2
= n2
m
m

Fn, m

1-

12
= 12 = F1,n k
n k
nk
.

(t nk )2 = [N (02,1)]

n k
nk

6.2.- ESTIMACIN POR INTERVALOS


INTERVALO DE CONFIANZA PARA i

i N i , 2 aii

2
2
n
k

(
)

i i
a ii
2

t n k =

n2 k

N (0,1)

N (0,1)

nk

( )

2
n k

i i

i i

2 aii

2 aii

(n k ) 2

nk
2

Llamamos D i a la desviacin tpica de i

i i
a ii
123
= D ( i )
2

i i

( ) t

D i

n k

p t = 1
Prob i
2
D ( i )

i
p t = 1
Prob t p i
2
2
D( i )

Prob t D( i ) p i i p t D ( i ) = 1

2
2
Prob i t D ( i ) p i p i + t D ( i ) = 1

2
2

Prob i t D( i ) p i p i + t D ( i ) = 1
2
2

i i t D ( i )
2

CONTRASTE DE HIPTESIS

H 0 : i = i0
H 1 : i i0

t exp =
Estadstico:

i i
D( i )

Aceptamos la hiptesis nula cuando: t exp p t , siendo este ltimo el valor tabulado.
2

Para realizar un contraste de significacin individual de un parmetro, debemos


contrastar que el valor de dicho parmetro no sea cero, es decir, realizar el contraste
considerando: i0 = 0 . En caso de rechazar la hiptesis nula, H 0 , consideraremos que, con el
nivel de confianza del contraste, el parmetro es significativo.
2
INTERVALO DE CONFIANZA PARA

1-

/2
A

(
(

)
)

Prob 2 f A = , con A = 2
2
2
2
Prob f B = 1 , con B = 12
2
2

2
Prob B p (n k ) 2 p A = 1

2
1

1
p = 1
Prob p
2
B
A (n k )

(n k ) 2
(n k ) 2 = 1
p 2 p
Prob

A
B

2
(n k ) 2 = 1
(n k )
2
p
p

Prob

12
2
2

2
e e
e e
= 2 (n k ) 2 = (n k )
= e e
como
nk
nk

e e
ee
Prob 2 p 2 p 2
1

2
2

= 1

e e e e

2 , 2
, con un (1 - )% de confianza
1
2
2
2

6.3.-CONTRASTE DE UN CONJUNTO DE HIPTESIS LINEALES: CASOS


PARTICULARES
Para poder contrastar hiptesis que incluyan a ms de un solo parmetro, es necesario
realizar un desarrollo adicional:
Sea R una matriz de dimensin q k , con q k , y rg (R ) = q

R N R , 2 R( X X ) R

R R R( X X )1 R 1 R R

2
q
2

E R = R E = R


Cov R = E R R = R E R =

= R 2 ( X X ) R = 2 R( X X ) R
1

R R( X X )1 R 1 R

1
Al sustituir por ( X X ) X u , tenemos que :

=B
644444447
4444444
8
1
1
1
1
u X ( X X ) R R( X X ) R R( X X ) X u
2
u Bu
2

Queremos demostrar que B es simtrica, idempotente y que de rango q.

1
1
1
B = X ( X X ) R R( X X ) R R( X X ) X

) ([R( X X ) R] ) (X (X X ) R)
R[R( X X ) R ] R( X X ) X = B

B = R( X X ) X
1

B = X ( X X )

Simtrica

1
1
1
1
1
1
BB = X ( X X ) R R ( X X ) R R( X X ) X X ( X X ) R R( X X ) R R( X X ) X
1444444424444444
3 1444444424444444
3
1

BB = X ( X X ) R R( X X ) R R( X X ) X X ( X X ) R R( X X ) R R( X X ) X
14243
1

BB = X ( X X ) R R( X X ) R R( X X ) R R( X X ) R R( X X ) X
14444244443
1

BB = X ( X X ) R R( X X ) R R( X X ) X = B
1

Idempotente

Rg ( B ) = Traza (B ) por ser idempotente y simtrica

1
1
X )1 R R( X X )1 X =
)
Traza 1
X (42
X X 43
R 1
R(4
X4
44244443

C
D

Traza (C D ) = Traza (D C ) =

1
1
1
1
= Traza R( X X ) R R( X X ) X X ( X X ) R =
14243

1
1
1
R( X X ) R R( X X ) R = Traza ( q ) = q
= Traza 1
3 14243
44244
qxq
qxq
1444
442444
44
3

Rg ( B ) = q .

Con esto podemos definir el siguiente estadstico para realizar contrastes de hiptesis:

R R R( X X )1 R 1 R R

2
q2

q
q
= 2 = Fq ,n k
2
n k
(n k ) 2

nk
nk

R R R( X X )1 R 1 R R

q
Fq ,n k =
2

R R R( X X )1 R 1 R R

q
.
Fq ,n k =
e e
nk

Con este estadstico que acabamos de definir, podemos realizar los siguientes contrastes de
hiptesis:
1.- Contraste de significacin individual de un parmetro.
2.- Contraste de significacin global del modelo.
3.- Contrate de significacin de un conjunto de parmetros.
A la hora de realizar estos contrastes, el procedimiento es el mismo en todos los casos,
la nica diferencia se encuentra a la hora de elegir la matriz R, que ser lo que diferencia un
contraste de otro, as en los casos anteriores tenemos que:
1.- Contraste de significacin individual de un parmetro.

H 0 : i = 0
H1 : i 0
R = (0 L 0 1 0 L 0 )
1

2

M
R = (0 L 0 1 0 L 0 ) = i
i

M

k
R R = i i

R R = i i

R( X X )

F1, n k

a1,1

R = (0 L 0 1 0 L 0) M
a
k ,1

(
=

F1, n k =

) (a )
2

2
i
a i ,i
2

0

M
L a1, k 0

O M 1 = a i ,i
L a k ,k 0
M

0

i ,i

( ) =t

D i

n k

Con lo que nos queda el contraste de la misma forma que vimos anteriormente.
2.- Contraste de significacin global del modelo.

H o : 2 = 3 = L = k = 0
H o : 1 i 0
1 0 L 0

0 1 0 0
R=
0 0 O 0

0 L 0 1

3.- Contrate de significacin de un conjunto de parmetros.


Como la matriz R podemos elegirla libremente, podemos contrastar, con este mtodo,
cualquier hiptesis que se nos presente, por ejemplo, la siguiente:

10

1 2 3 + 4 = 5
Ho :
2 + 5 3 7 4 = 1
H o :: CASO CONTRARIO
1 0 2 1

R =
0 1 5 7
1 2 3 + 4 5
=
R =
2 + 5 3 7 4 1
6.4.- ANALISIS DE LA VARIANZA (ANOVA)

FUENTE
VARIACIN

DE SUMA
CUADRADOS

Variables Explicativas

(Y

= SCE

k 1

e = SCR
(Y Y ) = SCT

nk

2
t

Residuos

TOTAL

DE GRADOS
LIBERTAD

DE VARIANZAS
INSESGADAS

SCE
k 1
SCR
nk

n 1

Este mtodo permite realizar el contraste de significacin global del modelo de un modo
ms sencillo.

H o : 2 = 3 = L = k = 0
H o : 1 i 0
SCE
k 1 F
k 1, n k
SCR
nk

ACEPTACIN

1-

RECHAZO

Si

Fk 1,n k f F

Rechazamos

Si

Fk 1,n k p F

Aceptamos

H 0 El modelo es globalmente significativo

H 0 El modelo globalmente no es significativo.

Podemos relacionar la F con el coeficiente de determinacin, con objeto de obtener un


coeficiente de determinacin crtico, a partir del cual podamos afirmar que el modelo es
globalmente significativo.

11

nk
SCE
F
SCE
SCE
=
= SCR k 1 =
R2 =
SCE n k n k
SCT SCR + SCE
+F
1+
k 1
SCR k 1
Fexp
F
R2 =
R2 = R 2 crtico =
nk
nk
+ Fexp
+ F
k 1
k 1
As, cuando

R 2 p R2

, aceptamos

H 0 , la hiptesis nula, y la rechazamos en caso contrario.

6.5.- PREDICCIN PUNTUAL OPTIMA


Una vez que tenemos el modelo estimado, pretendemos obtener una prediccin para la
variable endgena a partir de los valores conocidos de las variables exgenas. Si hubisemos
construido un modelo para explicar las ventas en funcin del gasto en publicidad y el precio
de nuestro producto, utilizando datos de los ltimos aos, podramos , para el futuro ejercicio
fijar los gastos de publicidad y el precio del producto y tratar de predecir las ventas. En general
tendremos:

Yt
Y1
Y2
M
Yn
Yn+1

X 2t
X 2,1
X 2,2
M
X 2 ,n
X 2, n+1

X 3t
X 3,1
X 3, 2
M
X 3, n
X 3,n +1

L X kn
L X k ,1
L X k,2
O
M
L X kn ,n
L X k , n+1

Yi = 1 + 2 X 2,i + 3 X 3,i + L + k X k ,i
Vamos a definir el vector c, que contiene el conjunto de variables exgenas del modelo
correspondientes al perodo n+1. (Es decir el vector c, contiene la informacin futura conocida o
prefijada):

X 2, n+1
c = X 3, n+1

X k ,n +1
c = (1 X 2, n+1

X 3, n+1

1

2
L X k ,n +1 ) = 1 + 2 X 2, n+1 + L + k X k , n+1
M


k

12

Como sabemos por el Teorema de Gauss-Makov c : es el estimador ELIO (Estimador


Lineal Insesgado y ptimo) para c , pero si estamos en predecir Yn +1 , tenemos un problema
ya que Yn +1 no es iguala a c

Yn+1 = 1 + 2 X 2,n +1 + L + k X k ,n +1 + u n +1 c

E[Yn+1 ] = 1 + 2 X 2, n+1 + L + k X k ,n +1 + E[u n+1 ]


123
=0

Si rebajamos nuestras pretensiones y pretendemos estimar E [Yn +1 ] , podemos ver que

E[Yn+1 ] = c
E c = c E = c = E [Yn+1 ]

Var c = E c c c c = E c c =

1
= c E c = 2 c ( X X ) c

c = 1 + 2 X 2, n+1 + L + k X k , n+1 N E[Yn +1 ], 2 c ( X X ) c

c E[Yn+1 ]

2 c ( X X ) c
1

N (0,1) , Como esta distribucin de muestreo est tabulada, ya podramos

realizar tanto intervalos de confianza como contrastes de hiptesis, pero para ello debemos
salvar el problema que nos plantea el desconocimiento del valor de . Para ello vamos a
realizar un pequeo cambio que nos permita realizar estas operaciones prescindiendo de dicho
valor.
2

c E[Yn +1 ]
N (0,1)

nk
2
n k

2 c ( X X ) c
1

= t n k =

(n k ) 2
(n k ) 2

c E[Yn +1 ]

c ( X X ) c
2

t n k . En esta expresin, si nos

permite realizar el intervalo de confianza y el contraste, ya que tenemos todos los datos
necesarios para ello.

13

c E[Yn+1 ]
Prob - t p
p t = 1
2
1
2
2 c ( X X ) c

1
1
Prob - t 2 c ( X X ) c p c E [Yn+1 ] p t 2 c ( X X ) c = 1
2
2

1
1
Prob - t 2 c ( X X ) c c p E [Yn+1 ] p t 2 c ( X X ) c c = 1
2

2
1
1
Prob c - t 2 c ( X X ) c p E[Yn +1 ] p c + t 2 c ( X X ) c = 1
2

1
E[Yn+1 ] c t 2 c ( X X ) c
2

Ahora que tenemos construido el intervalo de confianza, vamos a seguir buscando la


estimacin puntual, para lo cual vamos a hacer el siguiente planteamiento.
El valor puntual tiene una importancia esencial ya que resulta que los datos obtenidos
son nicos y puntuales, por no tratarse de una disciplina experimental.
Para hacer una estimacin sobre el valor puntual que es el nico observable, introduciremos
el concepto de error de prediccin.
Vamos a llamar Z al ERROR DE PREDICCIN, que viene dado por:

Z = Yn +1 Yn +1 =
Yn+1

c
6444447
44444
8
= 1 + 2 X 2,n +1 + L + k X k ,n +1

Yn+1 = 1 + 2 X 2,n +1 + L + k X k ,n +1 + u n +1
144444244444
3
c

Z = c c u n +1
Por tanto Z, es una combinacin lineal de normales

[]

E[Z ] = Ec c un+1 = c E c E E[un+1 ] = c c 0 = 0


Z N (0,L)

14
=0
6444
47
4444
8
Var (Z ) = Var c c u n +1 = Var c + Var [u n +1 ] 2Cov c , u n +1 =

1
= Var c + Var [u n +1 ] 0 = 2 c ( X X ) c + 2

1
Z N 0, 2 1 + c ( X X ) c

Z 0

2 1 + c ( X X ) c
1

))

N (0,1)

Al igual que en el caso anterior, nos falta el valor de la


varianza para poder realizar estimaciones, para lo cual transformamos esta distribucin a una t
de Student del siguiente modo:

Z 0
N (0,1)
n2k
nk

2 (1 + c ( X X ) c )
1

= t n k =

nk 2
nk 2

Z
(1 + 2 c ( X X ) c )
1

t n k

Yn+1 Yn+1
Prob - t p
p t = 1
1
2
2
2 (1 + c ( X X ) c )

1
Yn+1 c t 2 (1 + c ( X X ) c )

[Yn+1 ] c t

1
2 (1 + c ( X X ) c

TEST DE HIPTESIS

H 0 : Yn+1 = B
H 1 : Yn+1 B
p t Aceptamos H0

1
2 (1 + c ( X X ) c ) f t 2 Rechazamos H0
c B

TEST DE PERMANENCIA ESTRUCTURAL


Una vez que ha transcurrido el periodo n+1, ya conocemos el valor real que a tomado la

[Y ]
0

variable para ese periodo n +1 , y podemos realizar este contraste para saber si el modelo que
estimamos con los datos de los periodos 1 al n, sigue siendo vlido para el periodo n+1 y en
consecuencia sigue siendo vlido para realizar estimaciones para periodos posteriores, en cuyo
caso decimos que existe permanencia estructural, o por el contrario, el modelo ya no es vlido y
por tanto tenemos que rechazar la existencia de permanencia estructural, y por tanto el modelo
ya no sirve para realizar predicciones de periodos posteriores.

15

H 0 : Yn +1 = Yn0+1
H 1 : Yn +1 Yn0+1

p t Aceptamos H0 Perm. estructural

1
2 (1 + c ( X X ) c ) f t 2 Rechazamos H0 / Perm. Estructural
c Yn0+1

6.6.- EL MODELO EN DESVIACIONES

EL MODELO EN DESVIACIONES

Con el objeto de presentar de forma simplificada el modelo en desviaciones, supongamos


que tenemos dos variables exgenas, los datos originales vendran dados en la tabla 1 , y para
ello siempre hemos utilizado letras maysculas

de las siguientes consideraciones, los datos originales estaran en la tabla 1


Tabla 1.- datos originales
Yt
Y1
Y2
Y3
......
Yn

X2t
X21
X22
X23
.
X2n

X3t
X31
X32
X33
..
X3n

El modelo, como sabemos seria:

Yt = 1 + 2 X 2t + 3 X 3t + u t (1)
Una vez estimado, el modelo seria

Yt = 1 + 2 X 2t + 3 X 3t

(2)

Como sabemos, este modelo cumplira, con la condicin siguiente:

Y = 1 + 2 X 2 + 3 X 3

(3)

Si a la expresin (2) le restamos la expresin (3), y llamamos

x jt = X jt X j ; t = 2,3

16

yt = Yt Y
Obtendramos la siguiente expresin

y t = 2 x 2t + 3 x 3t

(4)

Que conocemos como el modelo en desviaciones, ya que los datos vienen expresados como
desviaciones respecto a la media, los datos de este modelo quedaran recogidos en la tabla 2

Tabla 2.- Datos del modelo en desviaciones


:
yt
x2t
y1
x21
y2
x22
y3
x23
......
.
yn
x2n

x3t
x31
x32
x33
..
x3n

Todo el proceso de estimacin seria el mismo: y solo hemos de tener en cuenta las siguientes
consideraciones:
a) Tanto la matriz, del modelo, como el vector de las observaciones y el vector de los
parmetros , aparecern con un subrayado , para diferenciarse de los mismos elementos del
modelo en datos originales:
Elementos del modelo original

X
y

Matriz del modelo original, dimensin n x k


Vector de las observaciones del modelo original, dimensin n x 1
Vector de los parmetros modelo original, dimensin k x 1

y = X .
Elementos del modelo en desviaciones

X
y

Matriz del M. en desviaciones, dimensin n x (k-1)


Vector de las observaciones del modelo en desviaciones, dimensin n x 1
Vector de parmetros del modelo en desviaciones, dimensin (k-1) x 1

y = X .
b) la matriz del modelo en desviaciones no contiene ninguna columna para el parmetro 1 , ya
que este ha desaparecido del modelo , por lo tanto la matriz

17

x 2,1

x 2, 2
X = x2,3

x 2, n

x 3,1

x 3, 2
x 3, 3

..

x 3, n

y1

y2
y = .

.

yn

y el vector
c) Cuando estimamos el modelo, utilizamos la misma expresin que en el modelo original pero
con los elementos del modelo es desviaciones, es decir:

= ( X .X ) 1 X .y
Lgicamente, faltara estimar el parmetro 1 , esto se podra resolver sustituyendo en la
ecuacin (3) y despejando.
d) Como los datos estn expresados en desviaciones respecto a la media , las medias de los
datos transformados son todas iguales a cero, es decir las medias de los valores observados ( en
desviaciones ) es cero, y as ocurre con las medias de cualquier variable exogena ( expresada
en desviaciones respecto a la media)
d) Para estimar la varianza y el coeficiente de determinacin R , tendremos que calcular
antes SCR, SCE, SCT, las expresiones en desviaciones respecto a la media quedaran como
sigue:
2

SCT = y. y
SCR = y y X y
SCE = X y

e) Los contrastes se harn del mismo modo, en los de significacin individual no exite
ninguna diferencia, en cuanto al contraste de la F, la expresin quedara:

R R R( X X )1 R 1 R R

Fq ,n k =

(5)

La matriz R , tendr ahora una columna menos ya que no contiene ninguna para el
parmetro 1 ,.

d) Como podemos ver, en este caso el contraste de significacin global

18

H o : 2 = 0; 3 = 0;........., K = 0 ,
Tendr como matriz R a la matriz identidad de orden (k-1)x (k-1), en consecuencia , tenindo en
cuenta que R. = 0 , la expresin (5) quedara

Fk 1,n k =

[( X X )]

k 1 =

y y

(k 1)

SCE
SCR

k 1 .
nk

Que como vemos coincide, la expresin que derivamos del anlisis de la varianza

PREDICCION CON EL MODELO EN DESVIACIONES.Los datos originales vendran dados en la siguiente tabla:

Tabla 1.- datos originales


Yt
Y1
Y2
Y3
......
Yn

X2t
X21
X22
X23
.
X2n

X3t
X31
X32
X33
..
X3n

El modelo estimado en datos originales seria:

Yt = 1 + 2 X 2t + 3 X 3t

Para realizar predicciones en este modelo, llamaramos

1
1

=
c = X 2,n +1

X
3,n +1 ,
3 , la prediccin se hara utilizando Yn+1 = c
Nosotros conocemos, las siguientes varianzas

19

1
Var c = 2 c ( X X ) c = c 2 ( X X ) 1 c = ccov( )c

(6)

Var (Z ) = 2 (1 + c ( X X ) c ) = 2 + c 2 ( X X ) 1 c = 2 + ccov( )c (7)


1

Tabla 2.- Datos del modelo en desviaciones


:
yt
x2t
y1
x21
y2
x22
y3
x23
......
.
yn
x2n

x3t
x31
x32
x33
..
x3n

El modelo estimado seria:

y t = 2 x 2 t + 3 x 3t
como sabemos , en este modelo la matriz asociada seria

x 2,1

x 2, 2
X = x2,3

x 2, n

x 3,1

x 3, 2
x 3, 3

..

x 3, n

Para predecir en este modelo utilizaramos

y n +1 = 2 x 2, n+1 + 3 x3, n+1

, o sea

y n +1


x 2, n+1
= 2

c =
= c
3
x3, n+1 , y
, siendo

el problema es que en este modelo la prediccin se realizara no sobre los valores originales de
la endgena si no sobre sus desviaciones sobre la media , por lo tanto necesitamos un modelo
con el que poder predecir utilizando los valores de las variables exgenas expresados en
desviaciones respecto a la media y los valores de la variable endgena en valores originales ,

y = Y Y

t
t
para eso basta cambiar en la ecuacin anterior
, de tal modo que el modelo
quedara expresado del siguiente modo , como un modelo mixto ( endgenas en valores
originales , exgenas en desviaciones) de siguiente modo:

20

Yt = Y + 2 x 2t + 3 x3t

, para predecir con este modelo, a partir de los valores futuros de las
exgenas x 2,n+1 , x3,n+1 , utilizramos la expresin

Yn+1 = Y + 2 x 2, n+1 + 3 x 3, n+1

Yn+1 = c* * , siendo

, (8) que expresado en forma reducida seria

c* = x 2, n+1

x
3, n+1

, y,

Y

* = 2

3

Si utilizamos para predecir este ltimo modelo, para poder utilizar las formulas (6) y (7) , solo
nos faltaria conocer la Cov ( * ) , veamos cual es la matriz asociada a este estimador , que
llamaremos X*

1
X * = 1

x3,1

x 3, 2
x 3, 3

x 3, n

x 2,1
x2,2
x 2, 3
.
x 2 ,n

expresada en forma reducida X * = (i, X )

en consecuencia podramos obtener la covarianza de este estimador, del siguiente modo:

Cov * = ( X . X * )
2

Cov * = 2

t
*

it
= ( .(i
X
2

X ))

i`
=
X i
2

i X

X X

n
=
0

1
+ 2 ( X X ) 1
n

Y si esta expresin la sustituimos en las ecuaciones (6) y (7), obtendramos

X X

0
1 / n
= 2
1
0 ( X X )

21

Cov (c * ) = c Cov ( * )c = (1 x 2,n +1

1
+ (x 2,n +1
n

x3, n +1 ) n
0

x 2,n +1 =
1

( X X ) x
3, n + q
0

1
1 x 2 , n +1
= 2 + 2 c ( X X ) 1 c
x 3, n +1 )( X X )

n
x3, n +1

Y del mismo modo podrimos escribir:

Var ( Z ) = 2 + c Cov ( * )c = 2 + 2

1
+ 2 c ( X X ) 1 c
n

De este modo, la prediccin para el valor futuro de la endgena , en valores originales , lo


haramos , a partir de los valores futuros( pero supuestamente conocidos) de las exgenas en
desviaciones respecto de la media , recogidos en el vector

x 2, n+1

c =

x3, n+1 y de los valores de las exgenas en desviaciones pertenecientes al periodo de


estimacin del modelo y recogidos en la matriz

x 3,1

x 3, 2
x 3, 3

..

x 3, n

x 2,1

x 2, 2
X = x2,3

x 2, n

Los estadsticos del muestreo para establecer los correspondientes intervalos de confianza
vendran dados por:

E (Yn +1 ) Yn+1
1

+ 2 c ( X X ) 1 c
n

a t n k

Yn+1 Yn+1
1
+
+ 2 c ( X X ) 1 c
n
2

Para el valor medio

a t n k

Para el valor puntual

Volvemos a repetir que la estimacin, es decir el valor de Yn +1 , en ambos casos se realizara a


partir de la expresin (8)

22

EJERCICIO
Dadas las siguientes observaciones muestrales
Yt
3
1
8
3
5

X2t
3
1
5
2
4

X3t
5
4
6
4
6

1.-Estimar el siguiente modelo lineal Yt = 1 + 2 X 2 t + 3 X 3t + u t


2.-Calcular el coeficiente de determinacin
3.-Verificar el significado de la regresin completa
4.-verificar la significacin de 3
5.-Contrastar la hiptesis de que 2 = 3
6.-Hallar el intervalo de confianza para 2

7.-Regin de confianza conjunta para 2 , 3


8.-realizar las predicciones para el periodo 6, sabiendo que X 2 , 6 = 10; X 3, 6 = 10
Resolver en mismo ejercicio en desviaciones:
1.-Si expresamos el modelo en forma matricial:

3 1

1 1
8 = 1

3 1

5 1

3 5
u1

1 4 1 u 2

5 6 2 + u 3 ,

2 4 3 u 4

4 6
u5

Sabemos que = ( X X )

5 15 25

X X = 15 55 81 ;
25 81 129

y = X + u

X y .(1)

( X X )

8
20
26,7 4,5

= 4,5
1
1,5 ; X = 76
109
8 1,5 2,5

Por lo tanto, utilizando la expresin (1) , podemos obtener la estimacin de los parmetros de posicin:

1 26,7 4,5
8
20 4

2 = 4,5
1,5 2,5 76 = 2,5
1

109 1,5

2 8 1,5
Por lo tanto el plano estimado ser Yt = 4 + 2,5 X 2t 1,5 X 3t , para estimar el parmetro de
dispersin , recordemos:

23

2
2
2
2
Y =
(Yi Y ) = Yi + Y + 2Y Yi = Yi + nY + 2Y
{i
2

ny
2

Yi
= Yi 2 + nY 2 2nY 2 = Yi 2 nY 2 = y y n
=
n
SCT = y y

( Yi )2
n

; (2).

SCR = y y X y ; (3)
SCE = X y

( Yi )2
n

; ( 4)

3

1
20 2
aplicando (2) SCT = (3 1 8 3 5) 8
= 108 80 = 28

5
3
5

aplicando (4):

20
20 2

= 106,5 80 = 26,5
SCE = (4 2,5 1,5) 76
5
109

Y aplicando la relacin SCT=SCE+SCR, podemos despejar:


SCR=SCT-SCE=28-26,5=1,5

En consecuencia el estimador puntual de la varianza de la perturbacin aleatoria ser:

2 =

SCR
1,5
=
= 0,75
nk 53

De este modo podemos dar por estimado el modelo:

2.- Como sabemos , el coeficiente de determinacin es:

R2 =

SCE 26,5
=
= 0,9464
SCT
28

3.-Verificacin de la regresin completa:


Recordemos que toda la inferencia del modelo se basa en el siguiente estadstico

24

R R R( X X ) 1 R 1 R R

Fq, n k =

La hiptesis a contrastar ser:

H 0 : 2 = 0; 3 = 0 , por lo tanto la matriz R deber de tener tres columnas ( una por cada
parmetro) y dos filas ( una por cada condicin)

0 1 0

R =
0 0 1
1
4
2,5
0 1 0 2 0
0 1 0
2 = =
; R =
2,5 =
R =
0 0 1 3 0
1,5
0 0 1

3
1,5
y en consecuencia:

2,5

R R =
1,5
Por otro lado calculamos

8 0 0
26,7 4,5
1

1,5
0 1 0

4,5
R( X X ) R=
1
1,5 1 0 =

1
,
5
2
,
5

0 0 1

8 1,5 2,5 0 1
1

A continuacin calcularemos:

[R( X X )

10 6
, y definitivamente podremos calcular:
=
6 4

R R R( X X )1 R 1 R R

F2, 53 =

(2,5
2

10 6 2,5 1
.

1,5)
2
6 4 1,5
= 17,67
0,75

Si miramos en las tablas de la F , para un nivel de significacin del 0,95 con dos grados de libertad en
0, 05

el numerador y denominador , obtenemos F2, 2

= 19 , como la F experimental es menor que la F

terica, aceptamos la hiptesis y concluimos que el modelo no es globalmente significativo:

Tambin podamos haber realizado estos clculos recordando :

25

Ho : 2 = 3 = L = k = 0
H o : 1 i 0
SCE
k 1 F
k 1, n k
SCR
nk
26,5
En este caso

F22

2 = 17,67

1,5

Si hubisemos querido realizar el contraste con el R

R2 =

crtico , podramos haber calculado:

F
19
=
= 0,95
nk
2 + 19
+ F
2
k 1

Y podemos ver como el R

crtico es superior al R

experimental obtenido anteriomente 0,9464..

4.- Verificar la significacin de un solo coeficiente 3 :

Se trata e contrastar la hiptesis

H0 : 3 = 0
H1 : 3 0

podramos utilizar el estadstico de la t de Student , pero

en este caso lo haremos con el estadistico general:


La matriz R ser R = (0

1)

1
4

R = (0 0 1) 2,5 = 1,5; R = (0 0 1) 2 = 3 = 0; R R = 1,5



1,5
3

8 0
26,7 4,5

1
R( X X ) R = (0 0 1) 4,5
1,5 0 = 2,5
8 1,5 2,5 1

La F experimental ser:

26

F1, 2

(1,5)(2,5) 1 (1,5)
=
= 1,2
0,75
0, 05

Si buscamos la F terica en las tablas tendremos F1, 2

= 18,51 , por lo tanto acotaremos la hiptesis

nula y el coeficiente 3 , no ser significativo.


Si Hubisemos utilizado la t de Student el estadstico hubieses sido:

t 5 3 =

3
2 a 33

1,5
0,75.2,5

= 1,2

Recordemos, que una t con n grados de libertad es lo mismo que la raiz cuadrada de una F1, n

5.- Contrastar la hiptesis H 0 : 2 + 3 = 0


En Este caso, la matriz R ser:

R = (0 1 1) , los clculos sern como sigue:

R = (0 1 1) 2,5 = 1; R = 2 + 3 = 0; R R = 1
1,5

8
26,7 4,5

1
R( X X ) R= (0 1 1) 4,5
1,5 (0 1 1) = 0,5
8 1,5 2,5

F1, 2 =

1.(0,5) 1 .1
= 2,67 si buscamos en las tablas, obtendremos
0,75

F10, 2, 05 = 18,95 , como el valor

experimental es menor que el valor terico aceptamos la hiptesis


6.-Intervalo de confianza al 95% para el parmetro 2 .Si utilizamos el estadstico de la F me bastara con elegir adecuadamente la matriz R, en este caso, solo
incluye al parmetro 2 .

R = (0 1 0) , q=1
teniendo en cuenta que ahora no hay hiptesis, R = 2 y

R R = 2,5 2 , su traspuesto es el mismo por ser un escalar y , por otra parte

27

8 0
26,7 4,5

1
1
R( X X ) 1 R= (0 1 0 ) 4,5
1,5 1 = 1 ; R( X X ) 1 R = 1
8 1,5 2,5 0

El estadstico F , tendr 1 y 2 grados de libertad , como sabemos, su raz cuadrada , sigue un t con dos
grados de libertad, si buscamos en las tablas tendremos:

F10, 2, 05 = 18,5158;
t 20,05 = 4,303
con cualquiera de los dos podemos establecer el intervalo de confianza

F1, 2 =

(2,5 2 ).1(2,5 2 )
0,75

Resolviendo obtenemos el intervalo

t2 =

(2,5 2 ) 2
0,75

1,2 2 6,2

7.- Regin de confianza conjunta, al 95% para 2 ; 3 .En este caso tenemos que utilizar el estadstico F, que es el nico que contiene simultneamente varios
parmetros de posicin, lo que tenemos es que elegir adecuadamente la matriz R, como regla general, la
matriz tendr una fila por cada parmetro que entre en el calculo de la regin de confianza, en este
caso:

0 1 0
2,5 2
, y R R =

R =
0 0 1
1,5 1
por tanto

F2, 2

10 6 2,5 2
.1 / 2

(2,5 2 ;1,5 3 )
26,5 32 2 18 3 + 12 2 3 + 10 22 + 4 32
6 4 1,5 3
=
=
0,75
0,75

Este estadstico siguen una distribucin F de Snedecor con 2 y 2 g.l. bastara buscar en la tabla un valor
A que cumpla pr ( F A) = 0,95 , este valor es 19 y entonces el intervalo de confianza ser:

26,5 32 2 18 3 + 12 2 3 + 10 22 + 4 32
19
0,75
realizando las operaciones quedar

10 22 + 12 2 3 + 4 32 32 2 18 3 2 0 , esto como podemos ver es el interior de un


elipsoide en el espacio centrado en el punto (2,5,-1,5)
8.- Prediccin puntual, dados los valores futuros X 2 , 0 = 10; X 3, 0 = 10 .-

28

En primer lugar elegiremos el vector c , que contiene la informacin conocida para el periodo siguiente
de las variables exogenas

1

c = 10 , Como sabemos la prediccin puntual optima se obtendr como.10

El intervalo de confianza, para la prediccin de Y0 , viene dado por :

Y0 Y0
Prob - t p
p t = 1
1
2
2
2 (1 + c ( X X ) c )

1
Y0 c t 2 (1 + c ( X X ) c )
2

Si calculamos:

8 1
26,7 4,5

1
c( X X ) c = (1 10 10) 4,5
1,5 10 = 6,7
8 1,5 2,5 10

0 ,05

El valor en la tablas de la t 2

= 4,303 , por lo tanto

Y0 14 4,303 0,75(1 + 6,7) , El intervalo de confianza ser (3,66; 24,34)


Si quisiramos realizar la prediccin sobre el valor medio de la endgena E (Y0 ) , utilizaramos el
siguiente estadstico:

c E[Y0 ]
Prob - t p
p t = 1
2
1
2
2 c ( X X ) c

1
E[Y0 ] c t 2 c ( X X ) c
2

Sustituyendo los valores que ya tenemos calculado obtendramos

E [Y0 ]14 4,303 0,75.6,7 , realizando las operaciones el intervalo seria:

4,36 E[Y0 ] 23,64


Como vemos este intervalo es mas reducido que el intervalo para la prediccin de Y0, como es lgico
EJERCICIO EN DESVIACIONES

29

En primer lugar expresaremos las variables en desviaciones respecto de la media, restando a cada una de
ellas su media.

Y = 4; X 2 = 3; X 3 = 5 , detal modo que el cuadro de datos iniciales quedar( expresados en


desviaciones respecto a la media del siguiente modo):

yt

x 2t

x3t

-1
-3
4
-1
1

0
-2
2
-1
1

0
-1
1
-1
1

Debemos observar que la media de cada una de estas nuevas observaciones es cero , esto facilitar los
clculos.
El modelo expresado matricialmente, como sabemos, seria:

0
e1
1 0


e
3 2 1
2 2

4 = 2
1 + e3 o en general



1 1 1 3 e4


1
e5
1 1

y1 x 21

y 2 x 22
y = x
3 23
y 4 x 24
y x
5 25

x31

x32

x33 2 + e

x34 3

x35

de tal modo que los elementos bsicos del modelo serian:

y1 1

y2 3
y = y3 = 4 ;

y4 1

y5 1

x 21

x 22
X = x 23

x 24

x 25

x31 0
0

x32 2 1

x33 = 2
1 ; = 1


2
x34 1 1

x35 1
1

A partir de aqu podemos proceder exactamente igual que lo hacamos con el modelo expresado en
valores originales, las formulas son las mismas, solo que las coordenadas estn expresadas en minsculas
y las matrices son mas pequeas , solo habr que tener cuidado con la prediccin.
Sabemos que:

= ( X X ) 1 X y

30

0
0

2 1
10 6
0 2 2 1 1
;
. 2
X . X =
1 =
6 4
0 1 1 1 1
1 1

1
1
1,5
4 6 1

=
( X X ) 1 = 1 / 4.
6 10 1,5 2,5

1

3
0 2 2 1 1 16
4 = .
; X y =
0 1 1 1 1 9
1

1

2 1
2 = 2,5
1,5 16 2,5

= 1,5 2,5 9 = 1,5 ; como antes: = 1,5


3
3

Finalmente: =

El modelo estimado en desviaciones sera y t = 2,5 x 2t 1,5 x3t , si quisiramos estimar el modelo en
variables originales nos faltara calcular 1 , para lo cual utilizaremos la expresin

Y = 1+ 2 X 2 + 3 X 3 , de manera que: 4 = 1 + 2,5.3 1,5.5 , de donde

1= 4 + 1,5.5 2,5.3 = 4 . En definitiva nuestro modelo de regresin estimado sera


Yt = 4 + 2,5 X 2t 1,5 X 3t , igual que antes
Para estimar la varianza necesitamos calcular la suma de los cuadrados totales

1

3
SCT = y y = ( 1 3 4 1 1) 4 = 28

1
1

16
SCE = X y = (2,5 1,5) = 26,5
9
Entonces la SCR=SCT-SCE=28-26,5=1,5

Y el valor estimado de la varianza de la perturbacin aleatoria ser:

2 =

SCR
1,5
=
= 0,75
nk 53

2.-Calcula el coeficiente de determinacin


El coeficiente de determinacin ser : R =
2

SCE 26,5
=
= 0,9464
SCT
28

nota
para realizar las inferencias, el resultado general que tenemos que utilizar ser el mismo de antes, solo
cambia la notacin y el significado de los vectores y matrices, detal modo que el estadstico que debemos
utilizar es:

31

Fq, n k =

( R R ) R( X X ) 1 R

(R R ) / q

(2)

La matriz R tendr q filas, una por cada condicin y k-1 columnas, ya que ahora no tenemos el
parmetro 1
3.- Verifica la significacin de la regresin completa:
Para contrastar la hiptesis nula H 0 : 2 = 0, 3 = 0 , debemos de elegir la matriz R que en este caso
ser:

1 0
1 0 2 0
y la hiptesis se puede expresar matricialmente R. =
=
R =
0 1
0 1 3 0
entonces:

1 0 2,5 0 2,5
;
=

R R =
0 1 1,5 0 1,5
1,5
1,5 1 0 1
1 0 1

R( X X ) 1 R=
0 1 1,5 2,5 0 1 1,5 2,5
10 6

( R( X X ) 1 R) 1 =
6
4

Fq, n k =

(2,5

( R R ) R( X X ) 1 R

(R R ) / q

10 6 2,5
/ 2

1,5)
6 4 1,5 = 26,5 / 2 = 17,67
0,75
0,75

Como vemos se trata del mismo resultado que obtuvimos con variables originales. Es fcil pasar de la
expresin (2), a la expresin (1) que utilizamos anteriormente y que proceda del anlisis de la varianza,
basta con tener en cuenta que para contrastar la significacin global en desviaciones sobre la media, la
matriz R siempre ser la matriz identidad, por lo que la expresin (2) se reducir a :

0
R = I ; R. = , la expresin (2) quedar:
0

Fk 1,n k =

X X /(k 1)
SCR /(n k )

y.y /(k 1)

SCR /(n k )
4.- Verificar la significacin del coeficiente 3 .-

SCE /(k 1)
SCR /(n k )

Utilizaremos el estadstico (2) , en este caso la hiptesis

ser: R = (0 1) .

nula ser H 0 = 3 = 0 , la matriz R,

32

2,5
= 1,5
R( R ) = (0 1)
1,5
1,5 0
1
= 2,5
R( X X ) 1 R= (0 1)
1,5 2,5 1

( R ( X X ) 1 R) 1 = 1

2,5

= 0,4

Por lo que el estadstico(2) quedar

F1, 2 =

(1,5)(0,4)(1,5) / 1
= 1,2 que como vemos es el mismo resultado anterior
0,75

5.- Contrasta la hiptesis 2 + 3 = 0


En este caso debemos elegir la matriz R, del siguiente modo


R = (1 1) la hiptesis matricial R = (1 1) 2 = 2 + 3 = 0
3
2,5 0
= 1
R( ) = (1 1)
1,5 0

1,5 1
1
= 0,5
R( X X ) 1 R= (1 1)
1,5 2,5 1
sustituyendo en (2) quedara: F1, 2 =

( R ( X X ) 1 R) 1 = 1

0,5

=2

1.(2).1 / 2
= 2,67 , igual que antes.
0,75

6.-Intervalo de confianza al 95% para 2 .Seguimos utilizando el mismo estadstico y tomamos R = (1 0 ) y q = 1

2,5 2
= 2,5 2
R( ) = (1 0)
1,5 3

1,5 1
1
= 1
R( X X ) 1 R= (1 0 )
1,5 2,5 0
El estadstico quedar:

F1, 2 =

(2,5 2 )2
0,75

( R( X X ) 1 R) 1 = 11 = 1

y la raz cuadrada seguir una t con dos grados de

libertad, todo ser como antes:


7.-Regin de confianza conjunta , al 95% para 2 , 3 .-

1 0
,q=2
1

Tomamos R =
0

33

1 0 2,5 2 2,5 2

R ( ) =

1
,
5
1
,
5
0
1

3
3

1,5
1,5 1 0 1
1 0 1

R( X X ) 1 R=
0 1 1,5 2,5 0 1 1,5 2,5
10 6

( R( X X ) 1 R) 1 =
6
4

y aplicando (2), vemos que queda todo como antes


8.-Realiza las predicciones para X 2, 0 = 10; X 3,0 = 10 .
Aqu si tenemos una variacin importante, ya que como vimos en la teoriza ,queremos utilizar las
variables exgenas en desviaciones pero predecir la variable endgena en valores originales , el vector
c, ahora seria expresado en desviaciones

7
c =
5
Los estadsticos del muestreo para establecer los correspondientes intervalos de confianza vendran dados
por:

E (Yn +1 ) Yn+1
1

+ 2 c ( X X ) 1 c
n

a t n k

Para el valor medio

Yn+1 Yn+1
1
+
+ 2 c ( X X ) 1 c
n
2

a t n k Para el valor puntual

lo nico que tenemos que calcular es

1,5 7
1
= 6,5
c( X X ) 1 c = (7 5)
1,5 2,5 5
de este modo, los intervalos quedaran

Yn +1 Yn+1
1
+
+ 2 c ( X X ) 1 c
n
2

14 Y0
0,75(1 + 1 / 5 + 6,5)

a t 2 para el valor puntual

34

E (Yn+1 ) Yn+1
1

+ 2 c( X X ) 1 c
n
2

E (Y0 ) 14
0,75(1 / 5 + 6,5)

a t 2 para el valor medio

Los intervalos de confianza serian los mismos que antes como podemos comprobar

También podría gustarte