Econometria Basica

Chapter 2
Conceptos Estadsticos
2.1 Funciones Aleatorias

Uno de los elementos ms importantes de la econometra y estadstica se
refiere al concepto de funcin o variable aleatoria. En esta seccin se desar-
rollan los conceptos necesarios para entender a profundidad en qu consiste
una funcin o variable aleatoria, ilustrada con una serie de ejemplos.
Definicin. Sea S un conjunto y sea S una familia de subconjuntos de S.
S se denomina -algebra si se dan tres condiciones.
1. , S S
2. A S Ac = SA S
3. An S, n = 1, 2, 3....,
n=1 An S
Ejercicio. S = {1, 2, 3, 4}. Evaluar si S = {, {1, 2, 3, 4}} es -algebra.

Este ejemplo muestra que la condicin (1) se cumple. Adems si A = {}
entonces vemos que su complemento Ac = {{1, 2, 3, 4}} tambin pertenece a
S (condicin 2). Por ltimo, verificando la condicin (3), si A1 = , A2 =
{1, 2, 3, 4} entonces la unin de ambos conjuntos tambin pertenece al -
algebra: 2n=1 An S.
Ejercicio. S = {1, 2, 3, 4}. Evaluar si el conjunto S es -algebra: S =

{, {1}, {2}, {2, 3, 4}, {1, 3, 4}, {1, 2}, {3, 4}, {1, 2, 3, 4}}
3
4 CHAPTER 2 CONCEPTOS ESTADSTICOS
Aqu se puede apreciar que las dos primeras condiciones se cumplen f-

cilmente. Para el caso de la segunda condicin, si por ejemplo se define
A = {2}, entonces su complemento Ac est en el conjunto S y esto se d para
todo conjunto potencial A. Cada uno de los ocho elementos que pertenecen a
S pueden ser operados con el operador U ni on para todo n, y siempre es posi-
ble verificar que dicha unin pertenece al conjunto S, el conjunto -algebra.
Ejercicio. S = {1, 2, 3, 4}. Evaluar si el conjunto S es -algebra: S =

{, {1}, {2}, {2, 3, 4}, {1, 3, 4}, {1, 2, 3, 4}}
Aqu se puede apreciar que las dos primeras condiciones se cumplen f-
cilmente. Para el caso de la segunda condicin, si por ejemplo se define
A = {2, 3, 4}, entonces su complemento Ac est en el conjunto S y esto se
d para todo conjunto potencial A. Cada uno de los seis elementos que
pertenecen a S pueden ser operados con el operador Uni on para todo n. En
este caso es posible verificar que dicha unin no siempre pertenece al conjunto
S, por ejemplo {1, 2} / S. Luego, el conjunto S no es -algebra.
Definicin. Un par (S, S), conformado por un conjunto S y su -algebra

S de sus subconjuntos se denomina espacio medible. Cualquier conjunto
A S se denomina conjunto medible.
Definicin. Sea A el conjunto de intervalos abiertos en < :
(, b), (a, b), (a, +), (, +)

Cada -algebra que contenga A debe tambin contener todos los inter-
valos cerrados (complementos). La menor -algebra que contenga todos los
conjuntos o intervalos abiertos se denomina Borel-algebra, y se denota por
B. Cualquier conjunto que pertenezca a B se denomina conjunto de Borel.
Definicin. Sea (S, S) un espacio medible. Una medida es una funcin

real extendida : S <, tal que se dan las siguientes tres condiciones
< {, +}):
(<
1. () = 0
2. (A) 0, A S
3. Si {An }
n=1 es un conjunto de secuencias
P disjuntas numerables (conta-

bles) en S, entonces (n=1 An ) = n=1 (An ).
2.1 FUNCIONES ALEATORIAS 5
Definicin. Un espacio medida es una tripleta (S, S, ), donde S es un

conjunto, S es el -algebra de sus subconjuntos, y es una medida definida
en S.
Definicin. Si (S) = 1, entonces no se denomina medida sino que

medida de probabilidad, y la tripleta (S, S, ) se denomina espacio de prob-
abilidad, en lugar de espacio de medida. Luego en este caso el conjunto
medible A S se denomina evento, y (A) se denomina probabilidad del
evento A. Aqu usualmente se cambia la notacin a P(A), es decir la tripleta
es (S, S, P).
Definicin. Dado un espacio medible (S, S), una funcin de valor real
es medible con respecto a S, es decir es S-medible, si:
{ S|() < x} S, x < (2.1)

Si este espacio es un espacio de probabilidad, entonces se denomina
VARIABLE ALEATORIA.
Ejemplo. Considere el conjunto S = {1, 2, 3, 4}, y el -algebra S =

{, {1}, {2}, {2, 3, 4}, {1, 3, 4}, {1, 2}, {3, 4}, {1, 2, 3, 4}}. Sea : S <,
donde:
(1) = 20
(2) = 5
(3) = 6
(4) = 7
Para verificar si es una funcin medible, se debe analizar la condicin
representada en la definicin de lo que es una funcin medible:
Si x = 1 { S|() < x} = S
Si x = 6.5 { S|() < x} = {2, 3}
/S
Si x = 7.5 { S|() < x} = {2, 3, 4} S
Luego dado que para x = 6.5 la condicin no se cumple, entonces no es
una funcin medible.1
1
S hubiese sido el caso que (3) = (4) = c, para alguna constante c, entonces la funcin
habra sido medible.
Finalmente, dado que { S|() < x} S, se le puede aplicar el

es decir:
operador , puesto que : S <,

({ S|() < x}) <
en donde si es una medida de probabilidad, entonces:
P ({ S|() < x}) [0, 1]
2.2 Funciones de Distribucin de Densidad

Toda variable aleatoria X puede ser representada a travs de una funcin de
probabilidad de conjuntos, la cual en su representacin contnua se denota
por: Z
P (A) = f (x) dx
A
o para el caso generalizado de un conjunto A con k = 1, 2, ..., K elementos:
Z Z
P (A) = ... f (x1, x2, x3, ...xK ) dx1 dx2 dx3 ...dxK
A
La funcin de probabilidades asociada a un evento se puede represen-
tar por la figura N 2.1, donde el rea sombreada denota la probabilidad de
ocurrencia del evento A = {X = x|a < x < b}, asociada a que la variable
aleatoria X tome un valor entre a y b.
Considerando que A S, las funciones de probabilidad son no negativas,
es decir f (x) 0, y tienen la caracterstica de que P(S) = 1, lo cual puede
ser representado por: Z
P (S) = f (x) dx = 1
S
o para el caso generalizado de un conjunto S con n elementos:
Z Z
P (S) = ... f (x1, x2, x3, ...xn ) dx1 dx2 dx3 ...dxn = 1
S
Ejemplo. Considere el evento A = {x|0 < x < 1}. Si f (x) = ex ,

entonces: Z Z 1
1
P (A) = f (x) dx = ex dx = 1
A 0 e
2.2 FUNCIONES DE DISTRIBUCIN DE DENSIDAD 7
Figure 2.1: Funcin de Distribucin Univariada

6x2 y si x (0, 1), y (0, 1)
Ejercicio. Sea la funcin de densidad f (x, y) = .
0 en otro caso

La probabilidad de que ocurra el evento A = (x, y)|0 < x < 34 , 13 < y < 2
R 3 R1
se denota por 04 1 6x2 ydxdy = 38 .
3
2.2.1 Distribuciones Condicionales y Marginales
El teorema de Bayes que di existen dos eventos A y B, entonces P [A, B] =

P [A] P [B|A] = P [B] P [A|B] y que para el caso en que A,B son eventos
independientes, P [A, B] = P [A] P [B].
De igual manera podemos analizar funciones de distribucin contnuas. Si
por ejemplo x1 , x2 son v.a. con una funcin de distribucin conjunta f (x1 , x2 )
entonces podemos definir a la funcin de distribucin marginal de x1 y de x2
respectivamente como:
Z
0
f (x1 ) = f (x1 , x2 ) dx2
Z

f 0 (x2 ) = f (x1 , x2 ) dx1

Dado la definicin de la funcin de distribucin marginal y en conjunto

con el teorema de Bayes, es posible definir la distribucin para x1 condicional
en x2 , y la distribucin para x2 condicional en x1 respectivamente como:
f (x1 , x2 )
f (x1 |x2 ) =
f 0 (x2 )
f (x1 , x2 )
f (x2 |x1 ) =
f 0 (x1 )
R R
donde es posible verificar que f (x1 |x2 ) dx1 = f (x2 |x1 ) dx2 = 1:
Z Z
f (x1 , x2 )
f (x1 |x2 ) dx1 = 0
dx1
f (x2 )
Z
1 1
= 0 f (x1 , x2 ) dx1 = 0 f 0 (x2 )
f (x2 ) f (x2 )
= 1

2, si 0 < x < x < 1
1 2
Ejercicio. Si f (x1 , x2 ) = , entonces:
0 en otro caso
Z Z 1
0
f (x1 ) = f (x1 , x2 ) dx2 = 2dx2 = 2|1x1 = 2 (1 x1 )
Z Zx1x2
f 0 (x2 ) = f (x1 , x2 ) dx2 = 2dx1 = 2|x0 2 = 2x2
0
f (x1 , x2 ) 2 1
f (x1 |x2 ) = 0
= =
f (x2 ) 2x2 x2
f (x1 , x2 ) 2 1
f (x2 |x1 ) = 0
= =
f (x ) 2 (1 x1 ) (1 x1 )
Z Z 1
2 1
f (x1 |x2 ) dx1 = dx1 = (x2 0) = 1
2x2 x2
Z
Z
2 1
f (x2 |x1 ) dx2 = dx2 = (1 x1 ) = 1
2 (1 x1 ) (1 x1 )
2.2.2 Funcin Generadora de Momentos

La funcin generadora de momentos, si existe (condicin de integrabilidad),
y dado que es nica, permite obtener todos los momentos de una distribucin
que sea factible generar. Para el caso en que tenemos X1 , X2 , ...., Xn v.a.,
podemos definir a la funcin generadora de momentos M como:

M (1 , 2 , ..., n ) = E e1 X1 +2 X2 +...n Xn

= E e1 X1 e2 X2 ...en Xn

= E e1 X1 E e2 X2 .....E en Xn
= M (1 ) M (2 ) .....M (n )
= ni=1 M (i )
expresin vlida si las v.a. son independientes entre s.

Al deribar dos veces la funcin generadora de momentos con respecto al
parmetro i y evaluando tales deribadas en un vector de i = 0, se obtiene:
M (0, 0, ..., 0)
= E [Xi ]
i
2 M (0, 0, ..., 0)
2 = E Xi2
i
de manera que la varianza de una v.a. Xi se puede generar a partir de:
2
2 M (0, 0, ..., 0) M (0, 0, ..., 0) 2
2
= 2 = E Xi [E [Xi ]]2
i i
2.2.3 Independencia Estocstica

Sean X1 , X2 , ...., Xn v.a. Entonces sern estocsticamente independientes si
se da que la funcin f (x1 , x2 , ...., xn ) que se denomina de verosimilitud, se
puede expresar como multiplicaciones de densidades marginales de cada v.a.,
es decir:
f (x1 , x2 , ...., xn ) = f 0 (x1 ) f 0 (x2 ) ...f 0 (xn ) = ni=1 f 0 (xi )

Ejercicio. Verifiquemos si X1, X2 son estocsticamente independientes,

cuando la funcin de densidad conjunta est definida por:

x1 + x2 si 0 < x1 < 1 y 0 < x2 < 1
f (x1 , x2 ) =
0 en otro caso
En este caso tenemos que las funciones marginales sern:
R 1
0 (x1 + x2 ) dx2 = x1 + 12 si 0 < x1 < 1
0
f (x1 ) =
0 en otro caso
R 1
0 0
(x1 + x2 ) dx1 = 12 + x2 si 0 < x2 < 1
f (x2 ) =
0 en otro caso
?
Luego es posible verificar si f (x1 , x2 ) = f 0 (x1 ) f 0 (x2 ).
1
x1 + x2 si 0 < x1 < 1 y 0 < x2 < 1 ? x1 + 12 2
+ x2
=
0 en otro caso 0 0

Claramente (x1 + x2 ) 6= x1 + 12 12 + x2 , luego X1 , X2 NO son estocsti-
camente independientes.
2.2.4 Funciones de Distribucin ms Conocidas
Existen diversas formas funcionales para describir una variable aleatoria,

dependiendo primordialmente de si es contnua o discreta. A continuacin se
detalla las principales funciones de probabilidades para variables aleatorias
discretas y continuas, presentando las principales caractersticas de cada una
de ellas.
Table 2.1: Funciones de Distribucin Discretas

Nombre Notacin Funcin FGM Media-Varianza
n!
px (1
x!(nx)! 1
p1 )nx , x = 0, 1, 2, ....
n
B in o m ia l x b (n, p) [(1 p1 ) + p1 et ]
np1 np1 (1 p1 )
n!
px py
x!y!(nxy)! 1 2
(1 p1 p3 )nxy , x, y = 0, 1, 2, ....
n
[(1 p1 p2 ) + p1 et1 + p2 et2 ]
Trin o m ia l x, y t (n, p1 , p2 )
E [X]= n p 1 E [Y ]= n p 2
2 2
x = n p 1 (1 p1 ) y = n p 2 (1 p2 )
x e
x!
, x = 0, 1, 2, ....
e(e 1)
t
P o isso n x P ()

Una de las funciones ms utilizadas en econometra con el fin de testear

hiptesis sobre algun parmetro (o combinacin lineal de parmetros) es la
t-Student. Como ancdota, W. S. Gossett fue quien descubri esta distribu-
cin mientras trabajaba en la empresa de cervezas Guinness. Esta estipulaba
que no era permitido publicar el trabajo de los miembros de su equipo, lo
cual lo llev a publicarla bajo el pseudnimo de Student. La siguiente figura
presenta una grfica entre la normal estandarizada y una t-Student de 4 gra-
dos de libertad.
y 0.5
0.375
0.25
0.125
0
-4 -2 0 2 4
Funcin de Distribucin N(0, 1) y t-Student con = 5 (azul)
Existen teoremas que permiten relacionar distintas funciones de distribu-

cin. Entre los ms utilizados consideremos los siguientes:
Teorema. Si una v.a es generada por una funcin de distribucin normal
estandarizada, entonces el cuadrado de esa variable se distribuye segn una
chi-cuadrada con un grado de libertad. Es decir, analticamente, si xN(0, 1)
enronces x2 2 (1).
Teorema. Si existe un vector de v.a cada una generada por una distribu-
cin 2 cada una con sus respectivos grados de libertad, entonces la suma
de ellas tambin posee una distribucin chi-cuadrada y posee los grados de
libertad que resultan de sumar individualmente los grados de libertad de sus
componentes. Es decir, analticamente,
P Psi x1 2 (r1 ), x2 2 (r2 ), x3 2 (r3 ),
...., y xn 2 (rn ), entonces ni=1 xi 2 ( ni=1 ri ).
Ejercicio. Considere una funcin de distribucin Poisson definida por:

x e
para x = 0, 1, 2, .....
x!
f (x) =
0 de otra manera
La funcin generadora de momentos para esta Poisson es:
X

x e X

(et )
x
tx
M (t) = e =e
x=0
x! x=0
x!
P x
y se sabe que x=0 x! e , entonces:
M (t) = e ee = e(e 1)
t t

M 0 (0) =
= = 2P =
M 00 (0) = + 2
Dado lo anterior, si asumimos que = 2, entonces cul es la probabili-

dad de que x 1?
P [X 1] = 1 P [X = 0]
= 1 f (0)
20 e2
= 1
0!
= 1 e2
= 0.865
Siguiendo con la funcin de distribucin Poisson, cul es la probabilidad
de que X est entre 0 y 8, excluyendo 0 y 8?
P [0 < X < 8] = P [X 7] P [X = 0]
= 0.949 0.018
= 0.931
Ejercicio. Si sabemos que:

2
1t
2
1 t+
x1 N (1 , 21 ) = Mx1 (t) = e 2

2
2t
2
2 t+
x2 N (2 , 22 ) = Mx2 (t) = e 2
entonces cul es la distribucin de Y = X1 + X2 , si ambas son variables

estocsticamente independientes?

My (t) = E etY = E et(X1 +X2 ) = E etX1 E etX2

2
1t
2 2
2t
2
1 t+ 2
2 t+ 2
= e e !
(1 +2 )t+
( 1 + 2 )t
2 2 2
2
= e

= Y N 1 + 2 , 21 + 22
Ejercicio. Si XN (0, 1), entonces cul es la distribucin de Y = X 2 ?

Para responder esta pregunta podemos partir de la funcin generadora de
momentos de Y :
tY h 2 i Z etx2 x2
My (t) = E e = E etX = e 2 dx
2
Z
1 (12t)x 2
= e 2 dx
2
p
Mediante una transformacin de variables z = x (1 2t), por lo tanto:
z 2 = x2 (1 2t)

dz = dx 1 2t
es decir que:
Z z2
1 e 2
My (t) = dz
2 1 2t
R 2
z2
pero como 1 e dz = 1, entonces:
2
1
My (t) = (1 2t) 2
Recordando que la funcin generadora de momentos para una chi-cuadrado

es r
M2 (t) = (1 2t) 2
entonces podemos decir que Y 2 (1) .
Ejercicio. Sabemos que si V 2 (r) y W N (0, 1), entonces T = WV t (r).
r
Dado lo anterior, cul es la distribucin de t2 ?
2
Sabemos que t2 = WV donde en numerador es 2 (1) y el numerador del
r
denominador sigue una 2 (r). ESto implica que la funcin t2 sigue una
distribucin Fisher, con grados de libertad 1 y r, es decir t2 F (1, r) .
2.3 Momentos de una Distribucin

Sea x una v.a. cuya pdf se representa por f (x).
Definicin. La expectativa matemtica de U(X) se representa por:
2.3 MOMENTOS DE UNA DISTRIBUCIN 15
Z X
E [U (X)] = U (x) f (x) dx = U (x) f (x)
x
Para el caso de un vector de eventos X1 , X2 , X3 , ..., Xn se tiene que:
Z Z
E [U (X1 , X2 , X3 , ..., Xn )] = ..... U (x1 , x2 , x3 , ..., xn )

f (x1 , x2 , x3 , ..., xn ) dx1 dx2 dx3 ....dxn
Como tal, es posible demostrar que la expectativa matemtica de una

poderacin de v.a. es equivalente a la ponderacin de las expectativas matemti-
cas, es decir: " n #
X Xn
E hi xi = hi E [xi ]
i=1 i=1

2 (1 x) , x (0, 1)
Ejercicio. Sea f (x) = .
0, x
/ (0, 1)
Z Z 1
1
E [X] = xf (x) = 2 (1 x) dx =
0 3
Z Z 1
2 2 1
E X = x f (x) = 2x (1 x) dx =
0 6
2 2
E 6X + 3X = 6E X + 3E [X] = 2
2.3.1 Media y Varianza

Los primeros momentos ms comunes en el anlisis de cualquier serie es
la media y la varianza (o desviacin estndar). Utilizando la nomenclatura
anterior, es posible decir que para el caso especial donde U (X) = x, entonces
la media poblacional se define por, E [X] = , y si ahora
U (X)
= (X )2 ,
entonces la varianza poblacional se definir por: E (X )2 = 2 .
El clculo de la varianza se simplifica al utilizar el siguiente resultado,
que indica que la varianza de una v.a es equivalente a la diferencia entre el
valor esperado del cuadrado de la variable y el cuadrado del valor esperado
de la variable, es decir:

2 = E (X )2 = E X 2 2X + 2

= E X 2 2E [X] + 2

= E X 2 {E [X]}2
De esta ltima expresin se verifica por qu en el campo de las finanzas

es usual asumir que la varianza de los retornos de un activo son equivalentes
al promedio de los retornos histricos del activo, especialmente cuando se
trabaja con series de tiempo de alta frecuancia como pueden ser datos diarios.
Es comn asumir que el valor esperado de un activo utilizando datos diarios
es nulo, de manera que tal aproximacin es vlida. En captulos posteriores
se analizan aplicaciones cuando la volatilidad de los retornos de un activo
es variable y se modela a partir de los retornos histricos (vase modelos
GARCH).
2.3.2 Skewness
El tercer momento de una pdf se denomina skewness, y determina el grado
de asimetra que posee una distribucin. Para el caso de funciones simtricas
como la normal o la t-student, este coeficiente es cero, y analticamente se
representa por:
1 X
T
Sk = 3
(xi )3
T t=1
donde T representa al tamao muestral.

Este indicador indica si la cola ms larga de la distribucin se encuentra
desviada hacia la derecha, centrada o desviada hacia la izquierda de la dis-
tribucin. Si la cola ms larga se encuentra hacia la izquierda (derecha) de
la distribucin, el coeficiente de skewness ser negativo (positivo) y se dir
que la distribucin es sesgada a la izquierda (derecha).
Como todo estimador, el coeficiente tiene su propia distribucin que se
deriva asintticamente, y que permite hacer inferencia con muestras finitas.
La distribucin es una normal, con media cero y varianza 6/T , lo cual rep-
resentamos para T = 20, 50, 100 por la funcin de densidad:

2
1 s
0.5 6/T
f (s) = q e
2 T6

a 6
Sk N 0,
T
y
1.5
1.25
0.75
0.5
0.25
0
-2 -1 0 1 2
Funciones de Distribucin para el Coeficiente de Skewness: T = 20, 50, 100
La hiptesis nula H0 : Sk = 0 se evala a travs de una tabla normal

estandarizada con el siguiente estadstico:
Sk
zSk = q N (0, 1)
6
T
En la medida que este estadstico sea superior en valor absoluto a 1.96 se

dir que rechazamos la hiptesis nula de que el coeficiente de skewness tiene
un valor cero, es decir cumple con una de las caractersticas que posee una
distribucin normal.
Una alternativa es trabajar con los valores de probabilidad, que entregan
el rea bajo la curva evaluada desde el valor del estadstico zSk y el infinito.
Si esta probabilidad P [ > zSk ] > %, entonces diremos que rechazamos la
hiptesis nula con un % de significancia.
2.3.3 Kurtosis
El cuarto momento se denomina kurtosis, y determina si las colas tienen una

masa o altura superior, igual, o inferior a la de una distribucin normal. El
coeficiente de Kurtosis adopta un valor de 3 si las v.a. son generadas de una
normal, y analticamente se representa por:
1 X
T
K= 4
(xi )4
T t=1
La medida de referencia de este coeficiente para una distribucin normal

es de 3 (mesokrtica), de manera que si el estadstico es mayor que 3, entonces
la funcin tiene caractersticas de leptokurtosis (K > 3), mientras que si
la distribucin tiene un coeficiente menor a 3, entonces esta se denomina
platykrtica (K < 3).
p
2
La
funcin
de distribucin del
coeficiente de kurtosis es 1/ (2 24/100)
2
exp 0.5 (x 3) / (24/100))

(s3)2
1 0.5 24/T
f (s) = q e
2 24T

a 24
K N 3,
T
y 1
0.75
0.5
0.25
0
0 2 4 6
Funciones de Distribucin para el Coeficiente de Kurtosis: T = 20, 50, 100
Para testear la hiptesis nula de que K = 3 debemos calcular el estads-

tico:
3
K
zK = q N (0, 1)
24
T
En la medida que este estadstico sea superior en valor absoluto a 1.96 se

dir que rechazamos la hiptesis nula de que el coeficiente de kurtosis tiene
un valor de tres, es decir cumple con una de las caractersticas que posee una
distribucin normal.
2.3.4 Test de Normalidad de Jarque-Bera

Tal como se menciona en la seccin de funciones de distribucin, si sumamos
dos funciones de distribucin chi-cuadradas, la funcin resultante tambin
obedece a una distribucin chi-cuadrada, teniendo los grados de libertad
que resultan de sumar los grados de libertad de las funciones de densidad
individuales.
Con este antecedente Jarque y Bera desarrollaron un estadstico que
evala en forma conjunta la hiptesis nula si el coeficiente de skewness y
Kurtosis toman valores de 0 y 3 respectiva y conjuntamente.
Para generar el estadstico requiero sumar el cuadrado de dos funciones

de distribucin estandarizadas como son zSk y zK :
(zSk )2 + (zK )2 2 (2)

2 2

Sk
K3
= q + q 2 (2)
6 24
T T
2
T 2 1
= JB = S + K3 2 (2)
6 k 4
Tal como se genera el estadstico cabe mencionar que este indicador tiene
una cota inferior en cero, es decir que no puede ser inferior a cero, de manera
que en la medida que se aleja de 0, ya sea porque el coeficiente de skewness
se aleja de 0 o porque el coeficiente de kurtosis difiere de 3, aumenta la
probabilidad de rechazar la hiptesis nula de que la distribucin generadora
de los datos proviene de una distribucin normal.
2.3.5 Aplicacin: Indice Accionario NASDAQ

Utilizando datos diarios del ndice NASDAQ desde el 5 de febrero de 1971
(fecha de su creacin) al jueves 8 de marzo del ao 2001, analicemos las
conclusiones que podemos obtener al analizar los cuatro primeros momentos
de la distribucin de los retornos de este ndicador. La figura N 2.2, elaborada
entrega los estadsticos relevantes para este anlisis, junto con un histograma
de los retornos accionarios del NASDAQ.
El retorno promedio diario es de 0.044518% de manera que el retorno anu-
alizado (multiplicando por 240 das hbiles) corresponde a 10.68% promedio.
De igual manera la desviacin estndar diaria del NASDAQ alcanza a 0.89%,
lo cual a tasa anualizada (multiplicando por 240 ) representa un 13.78%.
El coeficiente de skewness del 1.24 genera un estadstico z de:
1.24
zSk = q = 42. 674
6
7106
lo cual permite rechazar la hiptesis nula de que el coeficiente de skewness

es cero.
2500
Serie: Retornos del NASDAQ
Sample Febrero 1971 - Marzo 2001
2000 Observations 7106
Media 0.044518
1500 Mediana 0.109189
Mximo 7.086021
Mnimo -12.04784
1000 Dev. St. 0.889491
Skewness -1.238488
Kurtosis 17.14976
500
Jarque-Bera 61097.15
Probabilidad 0.000000
0
-12.5 -10.0 -7.5 -5.0 -2.5 0.0 2.5 5.0 7.5
Figure 2.2: Histograma y Estadsticos Bsicos del NASDAQ
De igual manera el coeficiente de kurtosis que alcanza a 17.15, genera un

estadstico z de:
17.15 3
zK = q = 243. 48
24
7106
es decir rechazamos con fuerza que los retornos puedan ser representados por
una funcin con coeficiente de kurtosis de 3. Las caractersticas de leptokur-
tosis son muy tpicas de los retornor de precios de activos financieros. Gran
presencia de retornos alejados del centro de la distribucin (outliers) posi-
tivos y negativos hacen que esta sea muy concentrada en la media y adems
en los extremos de la distribucin.
El test de Jarque-Bera viene a complementar este resultado. El estadstico

toma un valor de 61,097.15, lo cual claramente queda fuera del nivel crtico
de una chi-cuadrado con dos grados de libertad. La probabilidad que se
reporta es cercana a cero, indicando en este caso que la probabilidad de que
los retornos del NASDAQ provengan de una distribucin normal es casi nula.
Cdigo GAUSS: Estadsticos Descriptivos
Un cdigo en GAUSS que se puede utilizar para generar el clculo

de estos estadsticos se presenta a continuacin (utilizando los datos
del NASDAQ):
load p[7107,1]=a:\nasdaq.txt;
r=ln(p./lag1(p))*100;
r=r[2:rows(r)];
La Media es : ;;meanc(r);
La STDC es : ;;stdc(r);
La STDCs es : ;;stdc(r)*sqrt((rows(r)-1)/rows(r));
La Minc es : ;;minc(r);
La Maxc es : ;;maxc(r);
s=1/(rows(r)*stdc(r)^3)*sumc((r-meanc(r))^3);
La Skewness : ;;s;
El P-Value del Skewness es : ;;cdfnc(abs(s));
k=1/(rows(r)*stdc(r)^4)*sumc((r-meanc(r))^4);
La Kurtosis : ;;k;
El P-Value del Kurtosis es : ;;cdfnc(abs(k));
jb=rows(r)/6*(s^2+.25*(k-3)^2);
El Jarque-Bera Statistic es : ;;jb;
El P-Value del JB es :;;cdfchic(jb,2);
2.4 Inferencia
Dado que no es posible conocer los valores de los parmetros poblacionales,

la econometra nos ayuda a obtener una aproximacin de estos a travs de
los parmetros estimados con al muestra disponible. El punto consiste en
tener una mtrica para evaluar la exactitud de estos estimadores puntuales.
Sesgo, eficiencia y error cuadrtico medio son tres propiedades que se pueden
estudiar para los estimadores.
2.4 INFERENCIA 23
2.4.1 Sesgo
Definicin. Un estimador de un parmetro poblacional se dice insesgado
si su media muestral es . Es decir:
h i
E =
O alternativamente, si definimos sesgo como la diferencia entre el valor

se dir insesgado
esparado y el valor poblacional de un parmetro, entonces
si su sesgo es cero, es decir:
h i h i

Sesgo | =E =0
Ejercicio. Demuestre que la definicin para la varianza poblacional s2 es

insesgada:
Pt=T
2 )2
t=1 (xt x
s =
T 1
Para demostrar esta proposicin, es suficiente recordar que el siguiente
estadstico tiene una distribucin chi-cuadrado con (T 1) grados de libertad,
es decir que:
s2 2
(T 1) 2 (T 1)

Como el valor esperado de una chi-cuadrado es equivalente a sus grados de
libertad, es decir en este caso T 1 (y la varianza es igual al doble de sus
grados de libertad, 2(T 1)), entonces dado que:

E 2 (T 1) = (T 1)
2
= s2 2 (T 1)
(T 1)
2 2
= E s = (T 1)
(T 1)

= E s2 = 2
es decir el valor esperado del estimador s2 es insesgado pues su esperanza

matemtica es igual al valor poblacional del parmetro analizado 2 .
2.4.2 Eficiencia
Puede darse el caso en que se tenga dos estimadores insesgados y sea necesario
decidir cul se utilizar para hacer la estimacin del parmetro poblacional.
Idealmente si tenemos dos estimadores insesgados "es mejor" escoger aquel
que es "ms certero" en su estimacin, es decir aquel que posee una distribu-
cin "ms angosta" o centrada en su valor medio. Un concepto que est
ligado a este segundo momento de la distribucin es el de eficiencia.
Definicin. Un estimador insesgado 1 es ms eficiente que otro estimador

insesgado 1 , si la varianza muestral del primer estimador es inferior a la
varianza muestral del segundo estimador. Es decir, 1 es ms eficiente que
2 si:

V 1 < V 2
Sin embargo, existe la posibilidad de verse obligado a escoger entre dos

estimadores, uno de los cuales es insesgado pero de gran varianza, mientras
existe otro que est levemente sesgado pero es de menor varianza. Para
solucionar tal ambiguedad se ha desarrollado el concepto de Error Cuadrtico
Medio (ECM), el cual pondera de manera equivalente el sesgo (al cuadrado)
y la varianza de los estimadores, de manera que uno puede descanzar en este
criterio para escoger el estimador que posee menor ECM.
Definicin. El Error Cuadrtico Medio (ECM) se define por:
2

ECM = E
2

= E E +E
2 h i
= E E +E 2 E
E +
2
E E
2 2
= E E +E E
h i2

= Sesgo + V arianza
Ejercicio. Los estimadores ms conocidos para la varianza poblacional

2.4 INFERENCIA 25
son el s2 y el estimador de mxima verosimilitud 2MLE . Analice las carac-

tersticas de los ambos estimadores:
Pt=T
2 )2
t=1 (xt x
s =
T 1
Pt=T
)2
t=1 (xt x
2MLE =

T
2
Es til considerar que (T 1) s 2 2 (T 1) de manera que analicemos
primero las caractersticas de sesgo de ambos estimadores:
2
s2 (T1) 2 (T 1)
2 (T 1) 2
2MLE T 2 (T 1) =
T
s
2MLE es ses-
Al aplicar operador expectativa podemos ver que el estimador
gado mientras que s2 es insesgado:
h 2 i 2
E [s2 ] = E (T1) 2 (T 1) = (T1) E [2 (T 1)] = 2
2 h 2 i
MLE = E T 2 (T 1) = (T T1) E [s2 ] = (T T1) 2 < 2
E
2
E MLE < 2 = E [s2 ]
2MLE es distinto de cero:

Esto nos indica que el sesgo de
2 (T 1) 2
E MLE 2 = 2
T
1 2
= <0
T
Con respecto a la varianza de ambos estimadores, sabemos que la varianza
de una distribucin chi-cuadrado es equivalente al doble de sus grados de
libertad, de manera que fcilmente podemos verificar el valor de las varianzas
para ambos estimadores:
h 2 i 2 2 2 2
V [s2 ] = V (T1) 2 (T 1) = (T1) V [2 (T 1)] = (T1) 2 (T 1)
2 h 2 i 2 4
V MLE = V T 2 (T 1) = (T T1) V [s2 ] = T 2 2 (T 1)
2
MLE < V [s2 ]
V
podemos constatar que la varianza del estimador 2MLE es menor a la

varianza del estimador insesgado s2 , de manera que para escoger procedamos
a calcular el ECM de cada estimador, y el criterio consistira en escoger aquel
estimador con menor ECM:
4 h i
ECM (s2 ) = (T 1)2 2 (T 1) = 4 (T 1)
2
2 4 4
ECM MLE = T 2 + T 2 2 (T 1) = 4 2TT1 2
2
Considerando que ECM MLE < ECM (s2 ), vemos que el estimador ses-
gado es ms preciso pues la menor varianza de este ms que compensa la
ponderacin que recibe el sesgo en la funcin ECM.
2.5 Generacin de Nmeros Aleatorios

2.5 GENERACIN DE NMEROS ALEATORIOS 27
Table 2.2: Funciones de Distribucin Continuas

Nombre Notacin Funcin FGM Media-Varianza
x
1
()
x1 e , 0<x<
G am m a x (, ) (1 t)
2
ex , 0 < x <
1
E x p o n en c ia l x 1, 1 1 t
1 1
2
r x
1
r x 2 1 e 2 , < x <
( r
2 )
22
r t
C h i-C u ad ra d a x 2 (r, ) (1 2t) 2 e (12t)
r + 2r + 4
2
1 (x)
1 e 2 2 , <x<
22
2 2
t+ 2t
N o rm a l x N (, 2 ) e
2
zN(0,1)
T = q
V 2 (r)
T -S tu d ent t t(r) r
r
0 r2
u 2 (r1 )
r1
F -F ish e r F (r1 , r2 ) F = v 2 (r2 )
r2
Part II
Modelos de Regresin
29
Chapter 3
Modelo con una Variable

Explicativa
3.1 Modelo Simple
El modelo de regresin simple con una variable explicativa la podemos rep-

resentar por:
yt = 0 + 1 xt + t para todo t = 1, 2, ...., T (3.1)
Esta expresin se puede representar grficamente considerando por ejem-

plo un modelo cuyo coeficiente de posicin es 100 y cuya pendiente o coefi-
ciente de sensibilidad (semielasticidad) es 0.9, es decir para el modelo terico
y = 100 + 0.9 x.
31
32CHAPTER 3 MODELO CON UNA VARIABLE EXPLICATIVA
y
104
102
100
98
96
-5 -2.5 0 2.5 5
Ecuacin de la Lineal Recta: y = 100 + 0.9 x
Dado que E [yt |xt ] = 0 + 1 xt entonces se puede decir que:

yt = E [yt |xt ] + t
En general toda variable puede descomponerse en una parte determins-
tica y una estocstica . Una vez que estimamos el modelo poblacional con
datos muestrales llegamos a que la variable dependiente o endgena yt se
descompone en una parte estimada y un residuo muestral:
yt = 0 + 1 xt + et
yt = 0 + 1 xt
yt = yt + et
et = yt 0 + 1 xt
El mtodo de los mnimos cuadrados ordinarios consiste en estimar los
coeficientes a travs de un proceso de minimizacin de la siguiente funcin
de prdida, conocida como la suma de los residuos al cuadrado (SRC ):
X
t=T
$ ( 0 , 1 ) = e2t
t=1
X
t=T 2
= yt 0 1 xt
t=1
3.1 MODELO SIMPLE 33
Analticamente lo que el mtodo de mnimos cuadrados hace es encontrar

un punto mnimo en la superficie de una cierta funcin $ encontrando el par
de coeficientes 0 y 1 a travs restringir que el gradiente o las pendientes
de esta funcin es cero en ambas dimensiones. Graficamente se representa
por la siguiente funcin correspondiente al sigueinet problema cuto mnimo
se encuentra en el punto (0.005, 0.4158):
P P P
xi = 6 yi = 3 yi xi = 15
P 2 P 2
xi = 36 yi = 10 T = 100
Vizualizacin del Mtodo de los Mnimos Cuadrados
Para esto se requiere de obtener las condiciones necesarias de primer orden

(CNPO) que correspponden a las primeras derivadas las cuales se igualan a
cero para generar un ptimo:
$ ( 0 , 1 )
= 0
0
$ ( 0 , 1 )
= 0
1
Segn nuestro modelo estas ecuaciones se denominan ecuaciones normales
y se pueden escribir como:
t=T
X
2 yt 0 1 xt = 0
t=1
X
t=T
2 xt yt 0 1 xt = 0
t=1
o de manera equivalente y de ms fcil recordacin (al dividir por 2):
X
t=T
et = 0
t=1
X
t=T
xt et = 0
t=1
El nmero de ecuaciones normales es equivalente al nmero de incgnitas
del modelo, es decir el conjunto de parmetros a estimar. Utilizando una
representacin extensiva de las ecuaciones normales, estas se pueden escribir
como:
X
t=T X
t=T

yt = T 0 + 1 xt
t=1 t=1
X
t=T X
t=T X
t=T
yt xt = 0 xt + 1 x2t
t=1 t=1 t=1
lo cual implica que la solucin (en representacin recursiva) de este sis-

tema es:
Pt=T Pt=T
t=1 yt xt
0 = 1 t=1 = y 1 x
T T
Pt=T Pt=T
t=1 (xt x
) (yt y) (xt x) yt
1 = Pt=T 2
= Pt=1t=T
t=1 (xt x
) t=1 (xt x )2
Ejercicio. A partir de la siguiente informacin para Y y X, determine los
estimadores mnimo cuadrados para 0 y 1.
Y 2 4 6 8 10
X 1 2 3 4 5
Claramente los valores estimados corresponden a 0 = 0 y 1 = 2.
3.1 MODELO SIMPLE 35
3.1.1 Aplicacin: Betas Financieros en Indice Dow Jones

Consideremos los datos semanales (marzo 1994 a marzo 2001) del ndice
de precios de acciones americano Dow Jones y a seis de sus componentes
(Citigroup, General Electric, Wal-Mart, Microsoft, Exxon, y Phillip Morris).
El parmetro estimado 1 representa el coeficiente beta que representa la
correlacin que existe entre los retornos de una accin y el valor de mercado.
Analticamente el modelo a estimar corresponde a:
(Rit Rf t ) = 0 + 1 (RDJt Rf t ) + t , i = 1, 2, ...6, y t.
donde Rit corresponde al retorno en t de la accin i, Rf t es la tasa libre

de riesgo, medida a travs de la letra del tesoro americano a tres meses, y
RDJt es el retorno diario del Dow Jones en t.
Activo 0 1
Citigroup 0.135131 1.609109
General Electric 0.115481 1.205445
Wal-Mart 0.040995 1.150044
Microsoft 0.383609 0.941912
Exxon 0.077849 0.639781
Phillip Morris 0.110858 0.631160
La gran volatilidad relativa de la accin de Citigroup versus los retornos

del mercado se deduce de que el parmetro beta asociado alcanza un valor
de 1.61, es decir que si el Dow Jones cae en 2%, entonces el valor de las
acciones de Citigroup caer en 3.2%, es decir un 61% adicional. De igual
manera si el Dow Jones sube en un 5% entonces la accin de Citigroup subir
en un 8% aproximadamente. Esta caracterstica hace que esta accin sea
altamente riesgosa y deba tener una baja (alta) ponderacin en un portafolio
conservador (agresivo).
Phillip Morris tiende a ser la accin ms estable en relacin al mercado,
por lo que su porcentaje debiera ser alto (bajo) en un portafolio conservador
(agresivo).
3.2 Caractersticas del Modelo de Regresin

La metodologa de la estimacin de mnimos cuadrados, introduce ciertas
caractersticas a los residuos y estimaciones de la variable dependiente que
son interesantes de destacar.
3.2.1 Suma de residuos muestrales es nulo
La primera tiene que ver con que el valor medio de los residuos es nulo, lo
cual implica que la suma de los residuos es igual a cero.
X
t=T
et = 0
t=1
Esta caracterstica es bastante trivial pues se deduce de la misma metodologa

de los mnimos cuadrados, la cual impone a travs de su primera ecuacin
normal que esta suma sea cero.
Si el modelo de regresin posee una constante entonces la primera derivada
parcial, o primera expresin de ecuacin normal, indicar que la suma de los
residuos muestrales es cero. Sin embargo si el modelo no posee una constante
en su formulacin, esta condicin no necesariamente se cumplir pues nunca
surge como condicin necesaria de primer orden al no tener nunca que derivar
con respecto a este parmetro. Puede sin embargo darse el caso que la rep-
resentacin de la data haga que este parmetro sea efectivamente cero, por
ejemplo si las series Y, X se entregan en forma de desviacin de sus propias
medias, lo cual implicara que la suma de estos residuos tambin lo ser.
3.2.2 Las series actuales y estimadas tienen igual me-

dia
Esta caracterstica se deduce de la nocin que el valor actual de la variable

dependiente se puede descomponer en lo que estima el modelo y el residuo
3.2 CARACTERSTICAS DEL MODELO DE REGRESIN 37
(lo que no estima el modelo):

yt = yt + et
X
t=T X
t=T X
t=T
= yt = yt + et
t=1 t=1 t=1
1 Xt=T
1 X
t=T
1X
t=T
= yt = yt + et
T t=1
T t=1
T t=1
pero como sabemos los residuos muestrales tienen una media de cero, es
decir su sumatoria es nula, luego:
1X 1X
t=T t=T
yt = yt
T t=1 T t=1
_
= y = y
Una implicania de esta condicin es que la metodologa de los mnimos
cuadrados hace que la curva de regresin que pasa a travs de la nube de
puntos pase justo por el punto que representa a la media de X y la media de
Y.
3.2.3 Los residuos no se correlacionan con la variable

independiente
Sabemos que el coeficiente de correlacin entre es
Pt=T
t=1 (et e ) (x x)
eX = qP qP t
t=T
t=1 (et e)2 t=T
)2
t=1 (xt x
Pt=T
t=1 et (xt x )
= qP qP
t=T
t=1 (et e)2 t=T
)2
t=1 (xt x
Luego para verificar si el coeficiente de correlacin muestral entre el

residuo y la variable independiente es nulo, bastara con demostrar que la
covarianza entre ellos es nula tambien. Es as coo trabajando numricamente
con el numerador se tiene:
X
t=T X
t=T X
t=T
et (xt x) = et xt x et
t=1 t=1 t=1
Pero como sabemos de las condiciones de ortogonalidad, las ecuaciones

normales para 0 y 1 nos indican que los residuos ponderados por unos y
por la variable independiente x suman cero, es decir:
X
t=T
et = 0
t=1
X
t=T
xt et = 0
t=1
P
luego podemos decir que t=T t=1 et (xt x
) = 0, de manera que el coefi-
ciente de correlacin es tambin cero: eX = 0.
3.2.4 Los residuos no se correlacionan con la variable

dependiente estimada
Al igual que para el caso anterior, es suficiente analizar que el numerador de
la definicin sea nulo, es decir:
Pt=T
t=1 (et e y y)
) (
eX = qP qP t
t=T
t=1 (et e)2 t=T
yt y)2
t=1 (
Pt=T
yt y)
t=1 et (
= qP qP
t=T
t=1 (et e)2 t=T
yt y)2
t=1 (
P
luego debemos analizar si t=T yt y) = 0.
t=1 et (

Dado que yt = 0 + 1 xt , entonces podemos decir que:
X
t=T X
t=T X
t=T X
t=T
et yt y et = et yt = et 0 + 1 xt
t=1 t=1 t=1 t=1
X
t=T X
t=T
= 0 et + 1 et xt
t=1 t=1
= 0
Esta ltima
Pt=T igualdad proviene
Pt=T de las dos ecuaciones normales arriba men-
cionadas: t=1 et = 0 y t=1 et xt = 0.
3.3 EVALUACIN DEL AJUSTE: R2 39
3.3 Evaluacin del Ajuste: R2

Qu tan buen ajuste efecta el modelo a los datos es la pregunta que con-
testa el coeficiente de determinacin R2 . Este explica que porcentaje de la
volatilidad de la variable dependiente es explicada por el modelo.
Para llegar a tal representacin es necesario recordar que:
yt = yt + et
= yt = 0 + 1 xt + et
z }| {
= yt = y 1 x + 1 xt + et
= yt y = 1 (xt x) + et
2
= (yt y)2 = (xt x)2 + e2 + 2 1 (xt x) et
1 t
X
t=T
2X
t=T X
t=T X
t=T
= (yt y) = 1
2 2
(xt x) + e2t + 2 1 (xt x) et
t=1 t=1 t=1 t=1
Pt=T
pero sabemos que el trmino de la derecha t=1 (xt x) et es igual a
cero, luego:
X
t=T
2 X
t=T X
t=T
= (yt y) = 1
2 2
(xt x) + e2t
t=1 t=1 t=1
= SCT = SCE + SCR
Pt=T 2
SCE SCR e
2
= R = =1 = 1 Pt=T t=1 t 2
SCT SCT t=1 (yt y
)
De esta ltima expresin se puede concluir que el mtodo de los mnimos

cuadrados lo que hace indirectamente es maximizar el R2 de un modelo, pues
el denominador no es modificable ni dependiente del vector de parmetros
de manera que exiete una dualidad en ambos objetivos, es decir Min
,
Pt=T 2 2
t=1 et Max R .
Adicionalmente n o es difcil demostrar que existe una equivalencia entre
el coeficiente de determinacin y el coeficiente de correlacin entre Y y X.
2P
Para esto, recordemos que SCE = 1 t=T )2 y que el parmetro de
t=1 (xt x
P t=T
x)(yt
(xt y)
semielasticidad 1 = t=1P t=T 2 , entonces reemplazando esta expresin
x)
(xt
t=1
en la definicin de R2 llegamos a:
Pt=T
2 SCE 2 (xt x)2
R = = 1 Pt=1t=T
=
SCT t=1 (yt y )2
"P #2 P
t=T t=T
(x t x ) (y t y
) t=1 (xt x)2
= R2 = t=1
Pt=T P
t=1 (xt x )2 t=T
t=1 (yt y)2
hP i2
t=T
t=1 (xt x ) (yt y)
= R2 = Pt=T P
t=1 (xt x )2 t=T t=1 (yt y )2
2
Pt=T
t=1 (xt x ) (y y)
= R2 = qP qP t
t=T 2 t=T 2
t=1 (xt x ) t=1 (yt y
)
= R2 = [Y X ]2
Ejercicio. Considere la siguiente informacin generada de una base de
datos de coeficiente intelectual (variable y) y horas promedio de ver televisin
(variable exgena x) de un grupo de n = 50 adolecentes:
y = 30 x = 15 n = 1, ..., 50
P P P
(yi y)2 = 200 (xi x)2 = 80 (xi x) (yi y) = 45
Se le pide computar el valor de los coeficientes considerando un modelo de
regresin lineal del tipo yi = 0 + 1 xi + i . Adicionalmente obtenga el R2
de la regresin estimada.
Para primero determinar el valor de los coeficientes debemos recordar las
frmulas de ambos estimadores y de all comenzar a reemplazar los datos que
se nos entregan en la matriz anterior:
Pi=N Pi=50
(xi x
) (yi y
) i=1 (xi x) (yi y)
1 = i=1
Pi=N = P i=50
i=1 (xi x )2 )2
i=1 (xi x
45
1 = = 0.562 5
80
Reemplazando en la funcin que determina el coeficiente de posicin 0 :
0 = y 1 x
0 = 30 (0.562 5) 15 = 38. 438
3.4 SUPUESTOS BSICOS SOBRE LOS RESIDUOS POBLACIONALES41
Ahora para calcular el coeficiente de deternminacin R2 debemos calcular la

razn de la suma de los cuadrados del modelo (o explicada) con la suma de
los cuadrados totales, es decir R2 = SCESCT
.
Pi=50
SCE 2 (xi x)2 80
R2 = = 1 Pi=1
i=50
2
2 = (0.562 5) = 0.126 56
SCT i=1 (yi y) 200
Es decir el modelo explica solamente un 12.656% de la volatilidad de la
variable endgena o dependiente y, y la relacin encontrada y = 38. 438
0.562 5 x, se puede representar por la siguiente grfica:
y 41.25
40
38.75
37.5
36.25
-5 -2.5 0 2.5 5
Representacin Grfica del Modelo Estimado
3.4 Supuestos Bsicos sobre los Residuos Pobla-

cionales
Un paso absolutamente necesario para hacer inferencia consiste en imponer
ciertos supuestos sobre los residuos poblacionales del modelo de regresin lin-
eal. Estos permitirn que las distribuciones resultantes nos permitan efectuar
diferentes tests de hiptesis a partir de las estimaciones de los coeficientes.
Consideremos el modelo
yt = 0 + 1 xt + t
La siguiente lista conforma los supuestos estndares que permitirn hacer

inferencia sin tener que correjir el modelo estimado, y que permite tener
estimadores insesgados y eficientes (consistentes):
1. Los errores tericos tienen un valor esperado cero, es decir que de
existir una distribucin para estos residuos, ella se asume centrada en cero:
E [t ] = 0 t
2. Existe homoscedasticidad de los residuos tericos, de manera que la

varianza de los errores poblacionales es similar e independientemente de t:
V [t ] = 2 t
3. No hay autocorrelacin de los residuos, esto indica que los residuos

entre si son ortogonales:
Cov [t , tk ] = 0 t y k 6= 0
4. No hay correlacin entre el residuo poblacional t y la variable exgena

xt , es decir con esto se impone una condicin de ortogonalidad de los residuos
con la variable exgena:
Cov [xt , tk ] = 0 t y k
5. Finalmente el supuesto ms importante se refiere a la necesidad de que

los residuos provengan de una distribucin normal:
t N
Estas cinco condiciones se asumen presentes en un modelo de regresin

simple y se pueden resumir notacionalmente al decir que el residuo tiene una
distribucin normal, idntica, e independiente distribuida, con valor esperado
cero y varianza constante 2 . Es decir:
iid
t N 0, 2 t
Estos supestos permitiran determinar cul es la distribucin de los esti-

madores mnimo cuadrados de manera de que podamos comenzar a evaluar
hiptesis que involucren a los parmetros poblacionales 0 y 1 .
3.5 DISTRIBUCIN DE LOS ESTIMADORES 43
3.5 Distribucin de los Estimadores

iid
Partamos del supuesto general ya discutido que seala que t N (0, 2 ) t.
El procedimiento de determinacin de las distribuciones de los estimadores
pasa por distorcionar o cambiar la forma de la distribucin de los residuos
para as llegar finalmente a la distribucin de 0 y 1 .
Entonces si modificamos la distribucin por una constante 0 + 1 xt (es
decir se traslada o "mueve" por una constante 0 + 1 xt ) se obtiene:
iid
0 + 1 xt + t N 0 + 1 xt , 2 t
pero sabemos que yt = 0 + 1 xt + t lo cual indica que la distribucin de

la variable endgena es equivalente a la distribucin del residuo poblacional,
pero desplazada por una constante:
iid
yt N 0 + 1 xt , 2 t
Esto indica que E [yt |X = xt ] = 0 + 1 xt pues el residuo tiene un valor
esperado de cero E [t ] = 0.
Teniendo esto en cuenta recordemos que:
Pt=T Pt=T
(xt x
) (yt y
) t=1 (xt x
) yt
1 = t=1
Pt=T = P
t=1 (xt x)2 t=T
)2
t=1 (xt x
Si reemplazamos la definicin de yt en el modelo y multiplicamos cada factor

se llega a:
Pt=T Pt=T
(xt x
) y t (xt x) ( 0 + 1 xt + t )
1 = Pt=1t=T 2
= t=1 Pt=T =
t=1 (xt x) t=1 (xt x )2
Pt=T Pt=T Pt=T
t=1 (xt x) t=1 (xt x ) xt (xt x) t
= 0 Pt=T 2
+ 1 Pt=T 2
+ Pt=1t=T
t=1 (xt x ) t=1 (xt x ) t=1 (xt x )2
P P
Pero se puede demostrar que t=T (xt x) = 0 y que t=T
t=1 (xt x
) xt =
Pt=T 2
t=1

t=1 (xt x
) , de manera que llegamos a que el estimador para 1 se rep-
resenta por:
Pt=T
(xt x) t
1 = 1 + Pt=1t=T
t=1 (xt x )2
A partir de la expresin anterior es posible derivar los dos primeros mo-

mentos de este estimados, como una primera etapa antes de determinar es-
pecficamente cul es la funcin de distribucin que la genera.
3.5.1 Sesgo
Sabemos que:
Pt=T
(xt x) t
1 = 1 + Pt=1
t=T
t=1 (xt x )2
" Pt=T #
h i (x x
)
t t
= E 1 = E 1 + Pt=1 t=T
t=1 (xt x )2
"P #
h i t=T
(x x
)
t t
= E 1 = 1 + E Pt=1 t=T
t=1 (xt x )2
h i Pt=T
t=1 (xt x ) E [t ]
= E 1 = 1 + P t=T
t=1 (xt x )2
pues las covarianzas son nulas, entonces dado que el valor esperado del error
es cero se llega finalmente a que el estimador 1 es un estimador insesgado
de 1 : h i
E 1 = 1
3.5.2 Varianza
Al igual que en caso del sesgo, partimos de la ecuacin fundamental que nos
seala que:
Pt=T
(xt x) t
1 = 1 + Pt=1
t=T
t=1 (xt x )2
" Pt=T #
h i (x x
)
t t
= V 1 = V 1 + Pt=1 t=T
t=1 (xt x )2
"P # " Pt=T #
h i t=T
(x x
) (x x
)
t t t t
= V 1 = V [ 1 ] + V Pt=1 t=T 2
+ 2Cov 1 , Pt=1
t=T
t=1 (x t x ) t=1 (xt x)2
sin embargo las covarianzas entre los errores y la variable exgena son nulas,
y adems la varianza de una constante como 1 tambin es nula, de manera
que:
"P #
h i t=T
(xt x) t
V 1 = V Pt=1
t=T
t=1 (xt x )2
hP i
t=T
h i V t=1 (xt x) t
= V 1 = P 2
t=T 2
t=1 (xt x
)
h i P t=T
t=1 (xt x)2 V [t ]
= V 1 = P 2
t=T 2
t=1 (xt x
)
luego dado que por supuesto de homoscedasticidad V [t ] = 2 entonces:

h i Pt=T 2 2 Pt=T
t=1 (xt x
) 2 )2
t=1 (xt x
V 1 = P 2 = P 2
t=T 2 t=T 2
t=1 (x t x
) t=1 (x t x
)
h i 1
V 1 = 2 Pt=T
t=1 (xt x )2
Con este procedimiento se ha demostrado entonces que:
!
1
1 1 , Pt=T
2
)2
t=1 (xt x
de igual manera para el estadstico 0 :

" #!
2
1 x

0 0 , 2 + Pt=T
T )2
t=1 (xt x
3.5.3 Gauss-Markov
Bajo las condiciones de Gauss-Markov, que indican t:
(i) E [t ] = 0,
(ii) V [t ] = 2 ,
(iii) Cov [t , t+k ] = 0, k 6= 0,
(iv) Cov [xt , t+k ] = E [xt t ] xE [t ] = E [xt t ] = 0, k = 0,

entonces los estimadores mnimo cuadrados, sern los mejores estimadores
lineales insesgados, es decir los estimadores que son una funcin lineal a la
data, insesgados y de menor varianza.
La demostracin consiste en demostrar que un estimador que cumple con
estas condiciones, efectivamente es el estimador de mnimos cuadrados.
Demostracin Teorema Gauss-Markov para 1
Sabemos que el estimador de mnimos cuadrados para 1 es:
Pt=T
) yt X
t=T
t=1 (xt x
1 = Pt=T = at yt
)2
t=1 (xt x t=1
(xt x)
donde a
t = P t=T (x x)2
.
t=1 t
Supongamos que existe un estimador alternativo definido por:
GM X
t=T
1 = at yt
t=1
La demostracin consiste en encontrar at y verificar que efectivamente

t definido en el estimador 1 .
sea equivalente al a
Que deba ser linela a la muestra significa que el potencial estimador debe
cumplir con la condicin de que:
GM X
t=T
1 = at yt
t=1
Utilizando la definicin del modelo yt = 0 + 1 xt + t , podemos generar la

restriccin de insesgamiento requerido:
GM X
t=T X
t=T
1 = at yt = at ( 0 + 1 xt + t )
t=1 t=1
GM X
t=T X
t=T X
t=T
1 = 0 at + 1 at xt + at t
t=1 t=1 t=1
h GM i X
t=T X
t=T
E 1 = 0 at + 1 at xt
t=1 t=1
P Pt=T
pues t=T
t=1 at t = t=1 at E [t ] = 0. Luego las condiciones de insesgamiento
sern que:
X
t=T
at = 0
t=1
X
t=T
at xt = 1
t=1
Ya hemos exigido a nuestro potencial estimador que sea lineal e insesgado,

y lo que queda ahora es exigir que sea el mejor, es decir el de menor varianza
GM
disponible. Para esto definamos la varianza del estimador 1 :
" t=T #
h GM i X X
t=T X
t=T
V 1 = V 0 at + 1 at xt + at t
t=1 t=1 t=1
X
t=T
= a2t V [t ]
t=1
X
t=T
2
= a2t
t=1
Luego el problema se reduce a encontrar el parmetro at que cumpla

con las condiciones de insesgamiento y de mnima varianza, problema que
podemos representar por:
X
t=T
Min a2t
t=1
s.a.
X
t=T
at = 0
t=1
X
t=T
at xt = 1
t=1
El lagrangeano asociado a este problema ser:

!
Xt=T X
t=T X
t=T
$ = a2t + at + 1 at xt
{at ,,}
t=1 t=1 t=1
Las condiciones necesarias de primer orden (CNPO) son:
$
= 2at + xt = 0
at
$ X
t=T
= at = 0
t=1
$ X t=T
= 1 at xt = 0
t=1
De la primera CNPO podemos decir que:
2at xt + xt x2t = 0
X
t=T X
t=T X
t=T
= 2 at xt + xt x2t = 0
t=1 t=1 t=1
X
t=T X
t=T
= 2 + xt x2t = 0
t=1 t=1
Adems sumando directamente sobre la primera CNPO se tiene:
X
t=T X
t=T
2 at + T xt = 0
t=1 t=1
Pt=T
pero como t=1 at = 0, entonces:
=
x
Reemplazando esta ltima expresin en:
X
t=T X
t=T
2+ xt x2t = 0
t=1 t=1
X
t=T X
t=T
2 +
x xt x2t = 0
t=1 t=1
2
= = Pt=T
t=1 x2t T x2
luego dado que 2at + xt = 0 entonces reemplazando para llegamos a:

xt
at = = (xt x)
2 2
(xt x) (xt x)
at = Pt=T 2 = Pt=T
t=1 xt T x2 t=1 (xt x)2
Queda as demostrado que el estimador que cumple con las condiciones de
Gauss-Markov es el estimador de mnimos cuadrados ordinarios.
3.5.4 Normalidad
A partir del supuesto de normalidad de los residuos es posible determinar la
distribucin que adoptan los estimadores mnimo cuadrado. Sabemos que:

t N 0, 2 / (xt x)
X
t=T
(xt x) t N 0, (xt x)2 2 /
t=1
!
X
t=T X
t=T
2 1
(xt x) t N 0, (xt x) 2 / Pt=T
t=1 t=1 (xt x)2
t=1 " #2 t=T
Pt=T X
(xt x) t 0, 2 P 1
Pt=1t=T 2
N t=T 2
(xt x)2
t=1 (xt x) t=1 (xt x ) t=1
Pt=T !
t=1 (xt x ) t 2
Pt=T 2
N 0, Pt=T 2
/ + 1
t=1 (x t x
) (x t x
)
Pt=T t=1 !
2
(x t x
) t
1 + Pt=1 t=T 2
N , Pt=T
t=1 (x t x
) t=1 (xt x )2
!
2

1 N 1 , Pt=T
t=1 (xt x )2
Siguiendo igual procedimiento para el estimador 0 podemos resumir la
distribucin multinormal del vector de estimadores del modelo de regresin
simple como:
h i
2 1 P t=T x2 P t=T x
2
0 T
+ 2 2
N 0 , x)
t=1 (xt t=1 (xt x)
1 1 2x

P t=T (x x)2 P t=T 2
t=1 t (x x)2
t=1 t
Pero aqu surge el primer problema al querer efectuar un anlisis inferen-

cial. Se desconoce la varianza del error 2 .
Dado que el residuo tiene una distribucin t N (0, 2 ), entonces sabe-
mos que 2 = E [2t ] (E [t ])2 = E P [2t ]. Luego parecera natural que el
t=T 2
t
estimador de la varianza fuera 2 = t=1 T
. Sin embargo este estimador
no cumple con la condicin de insesgamiento. Recordemos que el estadstico
2 2
(T k) s 2 2 (T k). Entonces s2 (Tk) 2 (T k), lo cual implicar que
dado que el valor esperado de una funcin de distribucin chi-cuadrada es
equivalente a sus grados de libertad, entonces:

2 2 2
E s = E (T k)
(T k)
2
E s2 = E 2 (T k)
(T k)
2
E s2 = (T k)
(T k)

E s2 = 2
P t=T
e2
Luego el estadstico s2 = Tt=1
k
t
ser un estimador insesgado de la varianza
2
poblacional . El costo de utilizar un estimador para la varianza poblacional
consiste en que ya no es posible tericamente utilizar la distribucin normal
para hacer inferencia.
Recordemos que si tenemos dos variables aleatorias independientes zN (0, 1)
y V 2 (r), entonces la razn zV tiene una distribucin t de student con
r
r grados de libertad. Es decir en nuestro caso tenemos:

r 1 1
2
P t=T
x)2
t=1 (xt
t 1 = r
2
(T k) s 2

(T k)
1 1
t 1 = q 2
t (T 2)
P t=T s
x)2
t=1 (xt
De igual manera para 0 :


s 0 0

1 2
2 + P t=Tx
T x)2
t=1 (xt
t 0 = r
2
(T k) s 2

(T k)
0
t 0 = r h 0 i t (T 2)
1 x
2
s2 T + P t=T (x x)2
t=1 t
Este estadstico nos permite hacer inferencia respecto al valor que toma
el parmetro estimado 0 y 1 . Adems podemos construir intervalos de
confianza para los parmetros a partir de un nivel de significancia subjetivo
y de las estimaciones de varianzas de los parmetros. Por ejemplo si definimos
como la desviacin estndar estimada del parmetro estimado 0 como 0 ,
entonces el intervalo de confianza para 0 ser:
0 0 |t |
0
Es decir:
0 |t |
0 0 0 + |t |
0
De igual manera para el parmetro 1 se tiene:
1 |t |
1 1 1 + |t |
1
3.5.5 Areas de Confianza

Dado que sabemos que

0 0 2 0 1
N , (x x)
1 1
donde C = (x0 x)1 es una matriz simtrica y definida positiva, entonces

existe una matriz P que cumple con la condicin C 1 = P 0 P .
Definamos las variables z1 y z2 como:

z0 0 0
=P
z1 1 1
entonces la varianza del vector ser:

z0 0 0 0
V = PV P
z1 1 1

z0
V = P 2 CP 0
z1
como C 1 = P 0 P = C = P 1 (P 0 )1 , entonces:

z0
V = P 2 CP 0
z1

1
= P 2 P 1 (P 0 ) P0
= 2I
lo que nos indica que z0 N (0, 1) y z1 N (0, 1). Es decir que z0 N (0, 2 ) y
z1 N (0, 2 ), de manera que los cuadrados de estos estadsticos obedecen a
una distribucin chi-cuadrada con un grado de libertad:
2 2
z0 (1) 2 2
2
= z0 + z1 (2)
z12 2 (1)
Trabajando este concepto matricialmente llegamos a que:

h i 0
z0 0 0 0 0
z0 z1 = 0
PP
z1 1 1 1 1
0
0 0 1 0 0
= C 2 (2)
1 1 1 1
Dado que desconocemos 2 la estimamos a travs de s2 , lo cual nos obliga a

utilizar una distribucin alternativa para el test o creacin del trea de confi-
anza. Como (T k) s2 2 2 (T k), entonces la razn de dos chi-cuadradas
ponderadas por sus grados de libertad genera una F de Fisher:

[01
0
0 C 1 0 0 0 0 0 0 0
1 ] [1 1 ] C 1

22 1 1 1 1
= (T k)s2
= F (2, T k)
2s2
2 (T k)
La regin o rea de confianza es equivalente a:
P ( < F ) = 1
y estar definido por la siguiente ecuacin de la elipse:

2 2
= a00 0 0 + a11 1 1 + 2a01 0 0 1 1
1
Cij 1
con aij = 2s2
= 2s2 (x0 x)1
.
ij
Ejercicio. Consideremos un modelo que entrega los siguientes resulta-
dos como producto del proceso de estimacin de una base de datos de 100
observaciones:
1.45
0
1 0.84
con una matriz de varianzas y covarianzas estimada para los parmetros de:

0.136 31 0.171 48
=

0.171 48 0.266 04
La inversa de la matriz de varianzas y covarianzas estimada de los parmet-

ros estimados obtenida ser:
1

38.8 25.01
1 V 0 =

1 25.01 19.88
Como sabemos
que2la expresin
para
2calcularla reginorea de confianza
es
= a00 0 0 + a11 1 1 + 2a01 0 0 1 1 , entonces
reemplacemos los valores que se obtienen de los clculos anteriores, con-
siderando un nivel de significancia del 95% y 99%, para T k = 100 2
grados de libertad, es decir para F0.95 (2, 98)
= 2.9 y F0.99 (2, 98)
= 4.4.
1
38.8 (1.45 0 )2 + 19.88 (0.84 1 )2 + 2 25.01 (1.45 0 ) (0.84 1 ) = 2.9
2
1
38.8 (1.45 0 )2 + 19.88 (0.84 1 )2 + 2 25.01 (1.45 0 ) (0.84 1 ) = 4.4
2
Si desearamos evaluar la hiptesis puntual de que ambos estimadores sumaran

por ejemplo 2, es decir si H0 : 0 + 1 = 2, entonces podemos vizualizar dicha
hiptesis en el grfico incorporando la ecuacin 0 + 1 = 2 en la figura sigu-
iente. Si esta pasa por la regin de confianza entonces no rechazamos la
hiptesis. La elipse ms grande representa el rea de confianza del 99%
mientras que la elipse concentrica interior representa el rea de 95%.
Beta 1 3
0
0 0.5 1 1.5 2 2.5 3
Beta 0
-1
Areas de 95 y 99% de Confianza para 0 , 1 .
Ejercicio. A partir de estimar el siguiente modelo de regresin Y =

X + , y considerando la siguiente informacin:
e0 e = 100
T = 70
50 0
x0 x =
0 50

0
x0 y =
300
Encuentre analtica y grficamente el intervalo de confianza del 95% para

los coeficientes ( 0 , 1 ). A la luz de su figura, rechazara la hiptesis H0 :
0 + 1 = 0?
El rea de confianza se obtiene de aplicar la frmula:
1 0 h i1
F = V F95% (2, T k)
2
Para esto requerimos de los estimadores de los parmetros y de la matriz de
varianzas y covarianzas estimada de estos parmetros:
1
1 50 0 0 0.0
= (x0 x) x0 y = =
0 50 300 6.0
1
e0 e 140 50 0 0.04 0.0
1
V = (x0 x) = =
T k 72 2 0 50 0.0 0.04
Luego aplicamos la frmula:
1 0 h i1
F = V F95% (2, T k)
2
1
1 0.04 0.0 0 1
F = 0 1 6 2
2 0.0 0.04 6 2

1 25.0 0.0 0 1
F = 0 1 6 2
2 0.0 25.0 6 2
F = 12. 5 21 + 12.5(6 2 )2 = 3.13 = F95% (2, 70)
Esta es la ecuacin de un circulo que est centrado en las ordenadas (0, 6).
Recordemos que la frmula del crculo es:
( 1 1 )2 + ( 2 2 )2 = r2
lo cual aplicado a nuestro problema ser:
12.5 21 + 12.5(6 2 )2 = 3.13

3.13
21 + (6 2 )2 = = 0.250 4 = 0.50042
12.5
De manera que el radio de esta circunferencia ser de 0.500 40 para una rea
de confianza generada con 95%. El crculo concentrico exterior se gener con
un nivel de confianza del 99%:
F = 12. 5 21 + 12.5(6 2 )2 = 4.92 = F99% (2, 70)
y 7
6.5
5.5
5
-1 -0.5 0 0.5 1
Grfico de la Elipse (Crculo)
2.5
0
-5 -2.5 0 2.5 5
-2.5 x
-5
Grfico de la Restriccin o Hiptesis Nula

Con respecto al anlisis de la hiptesis nula, desde un punto de vista grfico,
dado que la recta que representa a la hiptesis nula 0 = 1 no pasa cerca
del rea de confianza calculado, locual nos hara rechazar la hiptesis nula.
Chapter 4
Modelo de Regresin Mltiple
El modelo de regresin mltiple permite estudiar la relacin existente entre

una variable dependiente y y un conjunto k 1 de variables independientes
o exgenas, adems de la constante. Su forma general se representa por:
yt = 1 + 2 x2t + 3 x3t + ... + k xkt + t
Los supuestos asociados a este modelo difieren levemente del caso simple,
y se presentan a continuacin:
1. Los errores tericos tienen un valor esperado cero:
E [t ] = 0

1 E [1 ]

2 E [2 ]
E [] = E

= =0

... ...

T E [T ]
T x1
= E [Y ] = X
2. Existe homoscedasticidad y no autocorrelacin de los residuos tericos,

de manera que la varianza de los errores poblacionales es similar V [t ] = 2 ,
Cov [t , tk ] = 0. Matricialmente recordemos que dado el supuesto (1),
57
58 CHAPTER 4 MODELO DE REGRESIN MLTIPLE
entonces la matriz de varianzas y covarianzas puede representarse por:

1 1 1 2 1 3 ... 1 T

2 1 2 2 ... ... 2 T

0
E [ ] = E 3 1 ... ... ... 3 T

... ... ... ... ...

T 1 ... ... ... T T

E [1 1 ] E [1 2 ] E [1 3 ] ... E [1 T ]

E [2 1 ] E [2 2 ] ... ... E [2 T ]

= E [3 1 ] ... ... ... E [3 T ]

... ... ... ... ...

E [T 1 ] ... ... ... E [T T ]

2 0 0 ... 0

2
0 ... ... 0

= 0 ... ... ... 0 = 2 IT

... ... ... ... ...

2
0 ... ... ...
Una manera alternativa de analizar estos dos supuestos es utilizando la de-

scomposicin matricial de la matriz de varianzas y covarianzas. Esta se
conforma de tres matrices:
E [0 ] =
59
donde cada matriz se define por:

0 ... 0 0
1

0 2 0

= ... ... ...

0 ... ...

0 0 ... T

1 1,2 ... 1,T 1 1,T

2,1 1 2,T

= ... ... ...

T 1,1 ... ...

T,1 T,2 ... 1
Luego se puede escribir la anterior expresin como:

0 ... 0 0 1 1,2 ... 1,T 1 1,T 0 ... 0 0
1 1

0 2 0 2,1 1 2,T 0 2 0

E [0 ] = ... ... ... ... ... ... ... ... ...

0 ... ... T 1,1 ... ... 0 ... ...

0 0 ... T T,1 T,2 ... 1 0 0 ... T
Al asumir homoscedasticidad estamos diciendo que la matriz es una matriz

escalar con en su diagonal, es decir la matriz identidad multiplicada por :

0 ... 0 0 0 ... 0 0 1 0 ... 0 0
1

0 2 0 0 0 0 1 0

= ... ... ... = ... ... ... = ... ... ...

0 ... ... 0 ... ... 0 ... ...

0 0 ... T 0 0 ... 0 0 ... 1
= IT
De igual forma si incorporamos el supesto de no autocorrelacin de los

residuos estamos imponiendo la condicin que la matriz sea la identidad,
cuyos elementos fuera de la diagonal (unos) son nulos. Es decir entonces:

1 0 ... 0 0

0 1 0

= ... ... ... = IT

0 ... ...

0 0 ... 1
Con esto entonces podemos representar los dos supuestos de la siguiente

forma:
E [0 ] = = IT IT IT = 2 IT
3. No hay correlacin entre el residuo poblacional t y la variable exgena

xt :
Cov [xt , tk ] = 0 t y k
4. No existe multicolinealidad, es decir se garantiza que la matriz X 0 X es

no singular, es decir su inversa existe y es nica, lo cual ayuda a determinar
con unicidad el vector de parmetros a estimar.
5. Finalmente el supuesto ms importante para fines de inferencia se re-
fiere a la necesidad de que los residuos provengan de una distribucin normal:
t N
Los anteriores supuestos pueden resumirse en que el vector de residuos

tiene distribucin normal multivariada, idntica e independiente, con media
cero y matriz de varianzas y covarianzas 2 IT , es decir IIDN (0, 2 IT ).
A partir del modelo en su versin matricial y = x + e, donde x es la
matriz de datos de las variables exgenas incluyendo una primera columna
de unos, podemos obtener los estimadores mnimo cuadrados optimizando la
siguiente funcin de prdida:
0

min $ = y x
y x = e0 e
{}
61
Tomando la gradiente o derivada vectorial sobre el vector estimamos los

parmetros del modelo, es decir:
$
= x0 x x0 y = 0

lo cual puede representarse alternativamente por el siguiente sistema de ecua-

ciones normales, denominadas condiciones de ortogonalidad:
x0 e = 0
Una representacin ampliada y similar a la utilizada en el modelo de

regresin simple consiste en escribir este sistema de ecuaciones normales o
condiciones necesaria de primer orden como:
$ X
= 2 yt 1 2 x2t 3 x3t ... k xkt = 0
1
$ X
= 2
x2t yt 1 2 x2t 3 x3t ... k xkt = 0
2
$ X
= 2
x3t yt 1 2 x2t 3 x3t ... k xkt = 0
3
....
$ X
= 2 xkt yt 1 2 x2t 3 x3t ... k xkt = 0
k
lo que al simplificar por 2 nos deja un sistema de k ecuaciones con k incog-

nitas:
$ X
= yt 1 2 x2t 3 x3t ... k xkt = 0
1
$ X
= x2t yt 1 2 x2t 3 x3t ... k xkt = 0
2
$ X
= x3t yt 1 2 x2t 3 x3t ... k xkt = 0
3
....
$ X
= xkt yt 1 2 x2t 3 x3t ... k xkt = 0
k
Al recordar que la expresin entre parntesis no es ms que el residuo mues-

tral, podemos simplificar an ms la ltima expresin:

$ X
= et = 0
1
$ X
= x2t et = 0
2
$ X
= x3t et = 0
3
....
$ X
= xkt et = 0
k
lo que en el fondo nos lleva a repetir la expresin de ortogonalidad men-
cionada ms arriba:
x0 e = 0
Asumiendo rango completo de la matriz x0 x es decir que esta es invertible
(de aqu la importancia del supuesto de no multicolinealiad), entonces el
vector de estimadores se puede obtener de despejar el vector del sistema
anterior llegando a:
1
= (x0 x) x0 y
Una forma alternativa de determinar la expresin anterior consiste en
partir del modelo estimado y = x + e. Si a esta expresin se le multiplica
por x0 (debe ser por la izquierda pues la multiplicacin debe hacerse sobre
matrices conformables) nos queda:
x0 y = x0 x + x0 e
pero la expresin de la derecha x0 e no es ms que la representacin matricial

del sistema de ecuaciones normales que es igual a cero, luego de aqu tambien
se deduce que = (x0 x)1 x0 y.
Ejercicio. Un profesor de la Escuela de Economa desea evaluar si la playa
que est a minutos de la universidad, es una mala influencia en el desempeo
de los alumnos, medido por las notas finales promedio de cada alumno. Para
esto se toma una muestra de diez alumnos con el sigueinet resultado de la
encuesta:
Estime los parmetros de un modelo de regresin lineal simple. Obtenga
la matriz de varianzas y covarianzas y evale la hiptesis al 95% de que la
playa no tiene influencia en las notas obtenidas por los alumnos.
63
Promedio de Notas 5.5 6 4.8 5 5.1 6.1 6.2 4.2 5.5 4.9
Horas Semanales en Playa 2 3 1 4 3 2 1 5 1 2
Dada la informacin sabemos que:

1 1 1 1 1 1 1 1 1 1
x0 =
2 3 1 4 3 2 1 5 1 2
h i
y0 = 5.5 6 4.8 5 5.1 6.1 6.2 4.2 5.5 4.9
De manera que el vector de estimadores se obtiene de resolver:
1
= (x0 x) x0 y
1
1 2 5. 5

1 3 6

1 1 4. 8

1 4 5

1 1 1 1 1 1 1 1 1 1 1 3 1 1 1 1 1 1 1 1 1 1 5. 1

=

2 3 1 4 3 2 1 5 1 2 1 2 2 3 1 4 3 2 1 5 1 2 6. 1

1 1 6. 2

1 5 4. 2

1 1 5. 5

1 2 4. 9

5. 932 9
=
0.251 22
La matriz de varianzas y covarianzas se obtiene de resolver la siguiente ex-

presin:
= e0 e 1 y 0 y y 0 x 0 1
V () (x0 x) = (x x)
T k
T k
53. 3 X
como x0 y = , y0 y = y 2 = 287. 85
123. 8
0 0
= y y y x (x0 x)1
V ()
T k
h i 5. 932 9
287. 85 53.3 123.8
0.251 22
=
10 2
0.451 22 0.146 34

2
0.146 34 6. 097 6 10

0.451 22 0.146 34
= 0.340 93
2
0.146 34 6. 097 6 10

2
0.153 83 4. 989 2 10
=
4. 989 2 102 2. 078 9 102
Para testear H0 : 1 = 0 debemos efectuar un test t:
1 1
tc = t (T k)

1
Reemplazando con los datos obtenidos se tiene:

0.25122
tc =
2
= 1. 742 4
2. 078 9 102
De manera que al comparar con un test t-Student al 95% para 8 grados de
libertad (test de dos colas) cuyo valor es t0.975 (8) = 2.306 vemos que el test
calculado es inferior al t de tabla luego no rechazamos la hiptesis de que el
parmetro es cero, es decir la playa no tendra incidencia en el desempeo
acadmico de los alumnos.
4.1 TEST DE RESTRICCIONES 65
4.1 Test de Restricciones
Es comn estar interesado en testear si combinaciones lineales de parmetros

obedecen a cierto valor en particular, o de manera general, si un conjunto de
combinaciones de parmetros obedece a valores especficos.
4.1.1 Testeo de Restricciones Escalares H0 : r0 = q
Ejercicio. A partir de la siguiente informacin y considerando el modelo
yt = 0 + 1 x1t + 2 x2t + 3 x3t + t
evaluar la hiptesis nula H0 : 3 1 2 = 5:

1 4.8
=
2 5.7
0
e e = 60
T = 34

60 13 20 100

5 3 25
=
1
(x0 x)
8 15

9
Para resolver esta pregunta debemos generar el estimador de la matriz de

varianzas y covarianzas de los parmetros estimados:
= e0 e 1
V () (x0 x)
T k
60 13 20 100

60 13 5 3 25
=
V ()
34 4
20 3 8 15

100 25 15 9

120.0 26.0 40.0 200.0

26.0 10.0 6.0 50.0

V () =

40.0 6.0 16.0 30.0

200.0 50.0 30.0 18.0
De manera que el test corresponde a un t-Student pues tenemos una sola

restriccin que evaluar:
3 1 2 (3 1 2 )
tc = r t (T k)
2
V 3 1 2
3 4.8 5.7 (5)

tc = p = 0.442 23
2
32 (10) + (16) 2 3 6
Al comparar con un test t con 95% (de dos colas, es decir con 0.975) y con
T k = 34 4 = 30 grados de libertad se tiene que t0.975 (30) = 2.042 es
superior al nuestro tc = 0.442 23 de manera que no rechazamos la hiptesis
nula.
4.1.2 Testeo de Restricciones Vectoriales H0 : R = q

Ejercicio. Supongamos que hemos estimado la siguiente ecuacin para una
muestra de 17 observaciones ( T = 17) utilizando la metodologa de los mn-
imos cuadrados ordinarios (todas las variables estn en logaritmos):
yt = 0 + 1 x1t + 2 x2t + t
4.1 TEST DE RESTRICCIONES 67
encontrndose los siguientes resultados:

1.37

= 1.14

0.83

1
y 0 I x (x0 x) x0 y = 0.0028

510.89 254.35 0.42

1
(x0 x) = 132.7 6.82

7.11
Calcule las varianzas estimadas de los estimadores 0 , 1 , 2 . Si la variable

x1 aumenta en un 1% y la variable x2 lo hace en un 2%, cul ser el efecto
final sobre la variable dependiente y? Finalmente utilice el test F y evale
la hiptesis nula H0 : 1 = 1, 2 = 1.
Para calcular las varianzas estimadas del vector de parmetros debemos
calcular s2 (x0 x)1 :

510.89 254.35 0.42
e0
e 0.0028
0 1
V () = (x x) = 254.35 132.7 6.82
T k 17 3
0.42 6.82 7.11

5
0.102 18 0.050 87 8. 4 10

= 0.050 87
V () 0.026 54 1. 364 103

5 3 3
8. 4 10 1. 364 10 1. 422 10

V ( 0 ) 0.102 18

V ( 1 ) = 0.026 54

V ( 2 ) 1. 422 10 3
Si la variable x1 se incrementa en 1% y la variable x2 lo hace en 2%, entonces

y lo hara en:
y = 1.14 1 0.83 2 = 0.52%
Es decir la variable dependiente y cae 0.52%.

Para testear la hiptesis conjunta H0 : 1 = 1, 2 = 1 hay que aplicar
la siguiente frmula de test F:
0
2 0 1 0 1
R q Rs (x x) R Rq
Fc =
J
0 1 0 1
donde R = yq=
0 0 1 1
entonces reemplazando los resultados conseguidos anteriormente:
0
1.37
0 1 0
1
1.14
0 0 1 1
0.83
1
0 1 0

0 0 1

0.102 18 0.050 87 8. 4 105

0.050 87 0.026 54 1. 364 103

8. 4 105 1. 364 103 1. 422 103

0
0 1 0

0 0 1

1.37
0 1 0
1
1.14
0 0 1 1
0.83
Fc =
2
39. 633 38. 016 0.14
0.14 0.17
38. 016 739. 7 0.17
Fc = = 11. 982
2
Al comparar con un F0.05 (2, 14) = 3.74 vemos que rechazamos la hiptesis
nula.
4.2 SIGNIFICANCIA DE LA REGRESIN 69
4.2 Significancia de la Regresin
Supongamos que tenemos elmodelo de regresin y = x + , modelo que en

su forma extendida se puede representar por:
yt = 1 + 2 x2t + ... + k xkt + t
Se sabe que si redefinimos a las variables en desviaciones de sus propias

medias, los estimadores mnimos cuadrados no se ven modificados y que
ahora la constante no debiera ser incluida en la estimacin pues se obtiene
de las medias de las otras variables a travs de 1 = y 2 x2 ... k xk
y que por supuesto en el caso hipottico de que los parmetros asociados
a las variables explicativas sean nulos, entonces este parmetro solamente
estar capturando la media de la variable dependiente. Este hecho hace
recomendable que el test no se contamine con el valor de la constante al
momento de evaluar la significancia del vector de parmetros.
En este caso entonces analicemos la hiptesis nula de que todos los parmet-
ros son cero (recordemos que la constante est fuera de este conjunto de
parmetros analizados), es decir testeemos H0 : 2 = 3 = ... = k = 0.
Paea testear esta hiptesis podemos utilizar nuestra expresin del test F
definido por (J = k 1):
0
0 1 0 1
R q R (x x) R R q / (k 1)
Fc =
e0 e/(T k)
Dado que en este caso es fcil verificar que:

1 0 0 0 0

0 1 0 0 0

R = 0 0 1 0 0 = Ik1

... ... ... ... ...

0 0 0 0 1

0

0

q = 0

...

0
k1
entonces podemos reescribir el test F como:

0 1
(x0 x)1 (k 1)
/
Fc =
e0 e/(T k)
0
(x0 x) T k
Fc =
e0 e k1
pero sabemos que = (x0 x)1 x0 y y ademas que a partir de y = x + e es

posible deducir que:
e0 e = y 0 y y 0 x
de manera que reemplazando estas dos representaciones en la expresin del
0
Fc , y recordando que la expresin x0 y es equivalente a y 0 x pues ambas son
expresiones escalares, nos queda:
0
(x0 x) (x0 x)1 x0 y T k
Fc =
y 0 y y 0 x k1
y 0 x T k
Fc =
y 0 y y 0 x k 1
4.2 SIGNIFICANCIA DE LA REGRESIN 71
dividiendo por y 0 y que es equivalente a la suma de los cuadrados totales

(recordemos que las variables estn en desviacin de sus propias medias) y
0e
recordando que el coeficiente de determinacin R2 = 1 y0eMy :
y0 x
T k
y0 y
Fc =
k1
y0 yy 0 x
y0 y

2

R T k
Fc =
1 R2 k1
Esta ltima expresin nos indica que aquellas regresiones que tienen bajo
coeficiente de ajuste, es decir un bajo R2 , tienen a su vez un test F tambin
muy bajo lo cual perimtira decir que la probabilidad de aceptar la hipotesis
nula es muy alta, o lo que esw lo mismo, que la probabilidad de rechazar la
hiptesis es muy baja. Este concepto se conoce como el valor de la probabili-
dad (P-Value) y est definido para este test como la integral de la funcin de
densidad f (s) desde el valor del test calculado (Fc ) a infinito (), es decir:
Z
P V alue = f (s) ds
Fc
Ejercicio. Supongamos que se dispone de la siguiente informacin pro-

ducto de estimar una regresin con T = 500 observaciones para el APT de
una accin i con un factor f asociado al volumen de actividad del sector
industrial asociado a la accin:
Rit = + Rmt + ft + t
= 0.03 + 1.14Rmt + 0.19ft
(0.08) (0.28) (0.03)
2
R = 0.67
El nivel de significancia de la regresin se puede evaluar analizando el test

F de esta ecuacin bajo la hiptesis nula de que todos los parmetros son
cero en la regresin, a excepcin de la constante. La hiptesis a testear es
H0 : = = 0 versus la alternativa de que al menos
uno de estos parmetros
R2
no es cero. Aplicamos la expresin Fc = 1R2 Tk1 k
considerando que
T = 500, k = 3 y que R2 = 0.67:

R2 T k
Fc =
1 R2 k1

0.67 500 3
=
1 0.67 31
= 504. 53
Si contrastamos este test Fc = 504.53 con el valor respectivo de tabla a
un nivel de significancia del 5%, F95% (k 1, T k) = F95% (2, 497) = 3,
entonces rechazamos la hiptesis nula de que ambos parmetros son estads-
ticamente iguales a cero.
4.3 Modelo Restringido - No Restringido

Una plicacin adicional del test F corresponde al analisis de modelos re-
stringidos versus no restringidos, entendiendo como que un modelo estar
restringido en la medida que un subconjunto de los parmetros tome valores
especficos asociados a una determinada hiptesis nula. Ejemplos podran
ser estimar una funcin Cobb-Douglas asumiendo que la eslasticidad capital-
producto es igual a 0.5, o estimar una funcin de demanda por dinero con
un coeficiente de elasticidad producto igual a 1.
Representemos a ambos modelos no restringidos y restringidos (identifi-
cados con el sub-ndice R) por:
y = x + e
y = x R + eR
Partiendo de la definicin del residuo restringido eR podemos decir:
eR = y x R
eR = y x R + x x
eR = y x x R + x
eR = e x R + x

eR = e + x R
de manera que el valor de e0R ser igual a:

0

eR = e + R x0
0 0
4.3 MODELO RESTRINGIDO - NO RESTRINGIDO 73
Multiplicando estas dos ltimas expresiones para generar una relacin entre la
suma del cuadrado de los residuos entre modelos restringidos y no restringidos
llegamos a (note que las multiplicaciones cruzadas no aparecen pues sabemos
por condiciones de ortogonalidad que x0 e = e0 x = 0):
0
e0R eR = e0 e + R x0 x R e0 e
Modelos Restringidos versus No Restringidos

Reordenando la expresin anterior podemos encontrar una relacin entre
esta y el numerador del test F analizado en la seccin anterior:
0
e0R eR 0 0
e e = R x x R
0 h i1
0 1 0
= R R R R (x x) R R R R
De esta forma podemos ver la relacin que existe entre el anlisis de la difer-
encia de la suma de los residuos al cuadrado entre ambos modelos y el test
F analizado. El test para la hiptesis nula de que H0 : = R se puede
representar entonces como (J es el nmero de parmetros involucrados en la
hiptesis nula):
(e0 eR e0 e) /J
Fc = R0 F (J, T k)
e e/(T k)
Considerando que la variable dependiente en ambos modelos es la misma,
entonces la suma de los cuadrados totales es tambin similar, de manera que
podemos dividir el numerador y el denominador por y 0 My para encontrar una
relacin de esta expresin en trminos de los coeficientes de determinacin
de ambos modelos:

e0R eR e0 e
y 0 My
y 0 My
/J
Fc = e0 e
y0 My
/(T k)
2 2
(R RR ) /J
Fc = F (J, T k)
(1 R2 ) /(T k)
Ejercicio. Una empresa de asesoras financieras y de marketing est es-

timando dos modelos de ventas de supermercado considerando dos modelos
alternativos:
vt = 1 + 2 yt + 2 gt + 3 pt + t
vt = 1 + 2 yt + 2 gt + t
donde v indica ventas del supermercado, y el nivel de actividad de la economa

(P IB), g representa el gasto en publicidad en medios como la TV, diarios y
revistas, y finalmente p mide el gasto en volantes distribudos a residencias
vecinas y automviles del sector.
Los resultados al estimar ambos modelos son los siguientes:
Modelo sin Restricciones

vt = 0.14 + 1.15yt + 0.21gt + 0.47pt
e0 e = 370.45
R2 = 0.89
T = 670
Modelo con Restricciones ( 3 = 0)
vt= 0.29 + 1.42yt + 0.35gt
0
eR eR = 399.23
2
RR = 0.88154
T = 670
Con estos antecedentes podemos analizar el modelo no restringido (modelo 1)

versus el modelo restringido (modelo 2) al cual se le ha impuesto la condicin
de que el parmetro asociado al gasto el volantes tiene un valor de cero.
Para este ejercicio compararemos los resultados de analizar el test en fun-
cinde las diferencias de las sumas de los residuos al cuadrsdo entre modelos
4.3 MODELO RESTRINGIDO - NO RESTRINGIDO 75
restringidos versus no restringidos, con el del test basado en diferenciales de

R2 entre ambos modelos. Si vemos primero la frmula en funcin de las
sumas de los cuadrsdos de los residuos tendremos:
(e0R eR e0 e) /J
Fc = F (J, T k)
e0 e/(T k)
(399.23 370.45) /1
Fc = F (1, 670 4)
370.45/(670 4)
Fc = 51. 741
Como este valor es superior a F95% (1, 666) = 3.84 entonces rechazamos la
hiptesis de que le parmetro es cero, lo cual implica que la variable gastos
en volantes es relevante como variable explicativa de las ventas del superme-
rcado.
Alternativamente podemos testear esta hiptesis utilizando el test en fun-
cin de los R2 :
(R2 RR 2
) /J
Fc = 2
(1 R ) /(T k)
(0.89 0.881 45) /1
Fc =
(1 0.89) /(670 4)
Fc = 51.741
De igual manera que con el formato de test anterior podemos decir que rec-
hazamos la hiptesis de que la variable p sea no significativa, recomendando
su inclusin en la estimacin.
Chapter 5
Evaluando Quiebres
Estructurales
5.1 Variables Mudas

Si es posible definir con certeza el momento del eventual quiebre estructural
ya sea en un parmetro como en una combinacin de parmetros entonces
podemos aplicar lo que se conoce como variables mudas.
Una variable muda o ficticia generalmente se asocia a una funcin indi-
cadora de un evento determinado. Esta nueva variable artificial tomar valor
unitario si el evento est presente y cero si no es as. Ejemplos de este tipo
de funciones son innumerables, por ejemplo:
Guerra Paz
Hombre Mujer
Profesional Tcnico
Gobierno A Gobierno B
Crisis Bancaria Normalidad
Tipo de Cambio Fijo Tipo de Cambio Flexible
Si estas variables no son directamente cuantificables entonces surge la

alternativa de utilizar variables dicotmicas mudas. Volvamos al modelo de
regresin simple para entender cmo testear cambios estructurales en algn
77
78 CHAPTER 5 EVALUANDO QUIEBRES ESTRUCTURALES
t yt xt dt
1 y1 x1 0
2 y2 x2 0
... ... ... ...
s ys xs 0
s + 1 ys+1 xs+1 1
s + 2 ys+2 xs+1 1
... ... ... ...
T yT xT 1
o algunos parmetros utilizando esta variable. Supongamos que el modelo a

estimar es:
yt = 1 + 2 xt + t t = 1, 2, ..., s, s + 1, ..., T
donde hemos identificado el perodo s, s + 1 como el del eventual quiebre

estructural. Para incorporar este hecho economtricamente, creamos una
nueva serie artificial (muda) dt que tomar valores de cero antes del perodo
s y de uno desde s + 1 hasta T . Una tabla ayudar a comprender esta
representacin:
Con esta nueva variable podemos testear cambio en el coeficiente de in-
tercepto 1 y/o en el de pendiente 2 .
5.1.1 Cambio Estructural de Intercepto

Para analizar esta hiptesis representada por:
H0 : 1 = t s
: 1 =6 t > s
5.1 VARIABLES MUDAS 79
podemos reescribir el modelo a estimar como:
yt = 1 + 2 xt + 3 dt + t t = 1, 2, ..., T

1 + 2 xt + t dt = 0 t = 1, 2, ..., s

yt = 1 + 2 xt + 3 + t

dt = 1 t = s + 1, s + 2, ..., T

( + ) + x +

1 3 2 t t
El test consiste en evaluar si el parmetro 3 es significativamente distinto

de cero o no. Para esto generamos un test t con la siguiente hiptesis nula:
H0 : 3 = 0

tc = r 3 3 = 3

3
V 3
Si tc (en valor absoluto) es menor a un test t(1 ) (T k) de tabla entonces

2
no rechazamos la hiptesis de que el parmetro es cero, no habiendo indicios
de quiebre estructural en el parmetro del intercepto.
5.1.2 Cambio Estructural de Pendiente

H0 : 2 = t s
: 2 =6 t > s
yt = 1 + 2 xt + 4 dt xt + t t = 1, 2, ..., T

1 + 2 xt + t dt = 0 t = 1, 2, ..., s

yt = 1 + 2 xt + 4 xt + t

dt = 1 t = s + 1, s + 2, ..., T

+ ( + ) x +

1 2 4 t t
El test consiste en evaluar si el parmetro 4 es significativamente distinto

de cero o no. Para esto generamos un test t con la siguiente hiptesis nula:
H0 : 4 = 0

tc = r 4 4 = 4

4
V 4
Si tc (en valor absoluto) es menor a un test t(1 ) (T k) de tabla entonces

2
no rechazamos la hiptesis de que el parmetro es cero, no habiendo indicios
de quiebre estructural en el parmetro de la pendiente.
5.1.3 Cambio Estructural en Pendiente e Intercepto

H0 : 1 = , 2 = t s
: 1 =6 , 2 6= t > s
yt = 1 + 2 xt + 3 dt + 4 dt xt + t t = 1, 2, ..., T

1 + 2 xt + t dt = 0 t = 1, 2, ..., s

yt = 1 + 2 xt + 3 + 4 xt + t

dt = 1 t = s + 1, s + 2, ..., T

( + ) + ( + ) x +

1 3 2 4 t t
El test consiste en evaluar si los parmetros 3 y 4 son en forma conjunta

significativamente distinto de cero o no. Para esto es necesario evaluar la
hiptesis a travs de un test F de Fisher pues los test t no son capaces de
testear ms de una restriccin en la hiptesis nula
H0 : 3 = 4 = 0
1
(R R)0 Rs2 (x0 x)1 R0 (R R)
Fc = F (J, T k)
J
1
(RR)0 [R(x0 x)1 R0 ] (RR)
J
Fc = e0 e
F (J, T k)
T k
5.2 SPLINES 81
lo cual aplicado a nuestro test implica:
1
(RR)0 [R(x0 x)1 R0 ] (RR)
2
Fc = e0 e
F (2, T 4)
T 4
Si Fc es menor a un test F( ) (2, T 4) de tabla entonces no rechaz-

2
amos la hiptesis de que ambos parmetros son cero, no habiendo indicios
de quiebre estructural en los parmetros de la pendiente y el intercepto.
5.2 SPLINEs
5.2.1 Regresin Spline

Los SPLINES son mtodos de interpolacin no-paramtrico de los cuales la
regresin spline es la ms usual. Una regresin spline consiste en estimar
una regresin por segmentos discretos pero continuos de la muestra. Se es-
tima una regresin desde la observacin 1 hasta la observacin s1 , despus
se estima el modelo para el intervalo s1 , s2 , despus se estima para el inter-
valo s2 , s3 , etc... hasta estimar un modelo con el intervalo final (hasta T ).
Analticamente para el caso de dos parmetros se representa por:
yt = s11 + s21 xt + t si t = 1, 2, ..., s1
yt = s12 + s22 xt + t si t = s1 + 1, s1 + 2, ..., s2
yt = s13 + s23 xt + t si t = s2 + 1, s2 + 2, ..., s3

...
yt = T1 + T2 xt + t si t = ..., T
Esta discontinuidad de pendientes se logra con la introduccin al modelo de

diferentes variables mudas asociadas a los vrtices de la curva estimada. Es
as como definimos a cada variable muda en funcin del intervalo de tiempo
asociado tomando un valor cero si la condicin del intervalo correspondiente
no se cumple:
d1 = 1 si t = s1 + 1, s1 + 2, ..., s2
d2 = 1 si t = s2 + 1, s2 + 2, ..., s3
...
dJ = 1 si t = ..., T
La expresin analtica de esta secuencia de curvas se representa por:
yt = 1 + 2 xt + 1 d1 + 1 d1 xt + 2 d2 + 2 d2 xt + .... + J dJ + J dJ xt + t
Lo cual en trminos de segmentos muestrales se traduce en:
yt = 1 + 2 xt + t di = 0
yt = 1 + 2 xt + 1 d1 + 1 d1 xt + t
d1 = 1
yt = ( 1 + 1 ) + ( 2 + 1 ) xt + t
yt = 1 + 2 xt + 1 d1 + 1 d1 xt + 2 d2 + 2 d2 xt + t
d2 = 1
yt = ( 1 + 1 + 2 ) + ( 2 + 1 + 2 ) xt + t
... ...
yt = 1 + 2 xt + 1 d1 + 1 d1 xt + ... + J dJ + J dJ xt + t
P P dJ = 1
yt = 1 + Ji=1 i + 2 + Ji=1 i xt + t
Esta expresin puede ser representada grficamente por una secuencia

de lneas rectas que deben cumplir con la condicin de ser contnuas para
tomar la connotacin de una regresin spline. Analticamente la continuidad
se representa por las siguientes condiciones:
1 + 2 xs1 = ( 1 + 1 ) + ( 2 + 1 ) xs1
( 1 + 1 ) + ( 2 + 1 ) xs2 = ( 1 + 1 + 2 ) + ( 2 + 1 + 2 ) xs2
etc...
Simplificando cada restriccin llegamos a:
i = i xsi i = 1, 2, ..., J
5.2 SPLINES 83
Figure 5.1: Regresin por Segmentos o Spline
Incorporando estas condiciones en la expresin generalizada llegamos a:

yt = 1 + 2 xt + 1 d1 + 1 d1 xt + 2 d2 + 2 d2 xt + .... + J dJ + J dJ xt + t
yt = 1 + 2 xt + 1 d1 (xt xs1 ) + 2 d2 (xt xs2 ) + .... + J dJ (xt xsJ ) + t
5.2.2 Cubic Spline y B-Splines

Un spline de orden n es una aproximacin polinmica, con polinomios de
grado n y diferenciables n 1 veces en toda su extensin. Donde se juntan
los polinomios adyacentes se conocen como nudos (knots). Por ejemplo un
cubic-spline es una curva representada por un polinomio de grado 3 en cada
intervalo, y que es diferenciable dos veces en todo punto de la curva. Tiene la
caracterstica de que en cada nudo las pendientes deben ser iguales y adems
las curvaturas de cada lado de esots nudos debe coincidir.
Una representacin general del cubic-spline es:
X
3
1X
n1
3
i
s (t) = i t + p t p +
i=0
3! p=1
| {z } | {z }
Polinomio Cbico Diferenciable 2 veces en los nudos

donde t p + = max t p , 0 . Es as como para un spline de n+1 nudos

{ 0 , 1 , ..., n }, un spline cbico tiene n+3 parmetros 0 , 1 , 2 , 3 , 1 , 2 , ..., n1 .
En general un grado spline tiene un equivalente a n + parmetros que

estimar.
Sin embargo es comn utilizar versiones generales de s(t) que se pueden
representar por combinaciones lineales de de splines generales, entre las cuales
se encuentran las B-Splines. Para un conjunto de n + 1 nudos { 0 , 1 , ..., n },
y para p = 0, 1, .., n 4 definimos un spline cbico Bp (t) por:
p+4
!
X Q
p+4 1 3
Bp (t) = t p +
i=p l=p,l6=i ( l i )
Aqu podemos ver que claramente

la funcin B-Spline es nula o cero para
intervalos que esten fuera de p , p+4 .
Ejercicio. Consideremos la siguiente estructura de tasas de inters nom-
inales:
Madurez Tasa
1 da 4.75
1 mes 4.52
3 meses 4.45
1 ao 4.98
2 aos 5.65
8 aos 7.00
20 aos 7.91
Aplicando la opcin spline de MATLAB a travs del siguiente cdigo podemos

estimar un cubic-spline con la siguiente estructura interpolada:
y=[4.75 4.52 4.45 4.98 5.65 7 7.91];
x=[1/365 30/365 90/365 1 2 8 20];
xx=0:.25:20;
yy = spline(x,y,xx);
5.3 TEST DE CHOW 85
plot(x,y,o,xx,yy);
7.5
6.5
5.5
4.5
4
0 2 4 6 8 10 12 14 16 18 20
Cubic-Spline de Estructura de Tasas

Ejercicio. Aplicaremos la interpolacin cubic-spline para proyectar el
comportamiento de una variable en una muestra estimada. Utilizando la es-
timacion del ejercicio anterior podemos analizar cul sera la tasa que un pa-
pel de 10 aos debiera tener. Analizando la curva estimada esta tasa debiera
ser del orden de 6.896%, cifra obtenida con la instruccin spline(t,y,10)
en MATLAB.
5.3 Test de Chow

La idea de este estadstico es testear la hiptesis de que al menos un parmetro
de los coeficientes de la regresin no es igual para toda la muestra. La filosofa
consiste en evaluar estadsticamente si el vector de parmetros estimado para

toda la muestra difiere de aquel que se calcula considerando dos o ms sub-
muestras.
Un modelo sin restricciones para cada submuestra permite tener vectores
de parmetros que difieren entre estas submuestras. Por ejemplo considere-
mos un modelo aplicado a tres perodos que conformarn un tamao muestral
total de T :
t = 1, ..., s1 y1 = x1 1 + 1
t = s1 + 1, ..., s2 y2 = x2 2 + 2
t = s2 + 1, ..., T y3 = x3 3 + 3
En trminos matriciales este sistema se puede representar por:

y x 0 0
1 1 1 1

y2 = 0 x2 0 2 + 2

y3 0 0 x3 3 3
T x1 T x3k 3kx1 T x1
Aplicando la frmula de los mnimos cuadrados ordinarios = (x0 x)1 x0 y

podemos estimar el vector de parmetros :
1
1 x01 x1 0 0 x01 y1

2 = 0 x02 x2 0 x02 y2

3 0 0
0 x3 x3 0
x3 y3
El Modelo restrtingido se obtine de estimar la ecuacin y = x + sin

considerar ninguna subdivisin o particin muestral, es decir considerando
toda la base de datos:
y = x + t = 1, ..., T
de manera que el vector de parmetros estimados ser = (x0 x)1 x0 y orig-

inndose una suma del cuadrado de los residuos para el modelos restringido
e0R eR .
Para testear la hiptesis nula de que los parmetros son iguales en cada
submuestra debemos aplicar el test F que se genera de comparar las sumas
5.4 TEST DE WALD 87
de los cuadrados de los residuos de cada sumuestra en relacin con la del

modelo restringido (e0R eR ):
e0 e = e01 e1 + e02 e2 + e03 e3
La ecuacin del test F que aplicaremos en esta situacin corresponde a:
(e0R eR e0 e) / (T k (T mk))
Fc = F (J, T k)
e0 e/(T mk)
(e0 eR e0 e) / ((m 1) k)
Fc = R F (J, T k)
e0 e/(T mk)
donde m corresponde al numero de submuestras consideradas (en nustro

ejemplo 3), T es el tamao total de la muestra, y k es el nmero de parmetros
a estimar en cada modelo.
5.4 Test de Wald

Una manera alternativa de testear quiebres estructurales consiste en el test
de Wald. Este test analiza eventuales quiebres entre submuestras. Si recor-
damos el teorema que dice que el cuadrado de una distribucin normal mul-
tivariada estandarizada de dimensin J tiene una distribucin Chi-cuadrado
con J grados de libertad, entonces podemos parmetros estimados de pares
de regresiones de la siguiente manera:
1 Nk ( 1 , 1 ) Primera Regresin
2 Nk ( 2 , 2 ) Segunda Regresin
Al asumir la hiptesis nula de que ambos vectores de parmetros kx1 es-

timados son similares (H0 : 1 = 2 ) al calcular la diferencia entre ambos
vectores y estandarizando tenemos:
1 2 Nk (0, 1 + 2 )
de manera que aplicando la deficin de la Chi-cuadrado tendremos:

0

W = 1 2 [1 + 2 ] 1
1 2 2 (k)
La expresin muestral para calcular este test asume conocida las matrices de
varianzas y covarianzas 1 + 2 , de manera que finalmente el test ser:
0 h i1

Wc = 1 2 1 + 2
1 2 2 (k)
Si se observa que el valor Wc es superior al valor de referencia obtenido de

tabla, entonces rechazamos la hiptesis nula de que los parmetros son los
mismos, es decir existira evidencia de que hay cambio estructural en estas
submuestras. Alternativamente, al igual que lo que se hizo con el test F ,
se puede analizar el valor de probabilidad (P V alue) correspondiente al
test Wc y si este es inferior a 0.05 entonces rechazamos la hiptesis al 5% de
significancia.
5.5 Tests CUSUM y CUSUMQ

Hasta ahora hemos asumido que conocemos el momento del eventual quiebre
estructural. es aqu donde se presenta la debilidad de los mtodos de testeo
anteriores. Si el investigador no posee una claridad de cuando ocurri el
quiebre (de existir) y a qu variable asociarlo, entonces es necesario aplicar
test que no requieran de esta informacin y ms bien que entregen o anuncien
el momento eventual de quiebre (denuevo, de existir).
Los tests que se aplican actualmente son los conocidos como CUSUM
y CUSUMQ, siglas que se refieren a la suma de los residuos o los residuos
al cuadrado de una secuencia de modelos estimados. La hiptesis nula es la
estabilidad de los parmetros del modelo H0 : t = , t versus la alternativa
de que para todo o algn t esta relacin se quiebra.
Conceptualmente estos tests se generan del anlisis de los residuos esti-
mando recursivamente ecuaciones lineales incorporando cada vez una base de
datos ms completa hasta que finalmente agotamos toda la muestra. Analti-
camente se representan por:
P
j=t cj
cusumt =
j=k+1 s
Pj=t 2
j=k+1 cj
cusumqt = Pj=T 2
j=k+1 cj
5.5 TESTS CUSUM Y CUSUMQ 89
donde:
yj xj [j1]
cj = s N 0, 2
0 1 0
1 + x0j Xj1 Xj1 xj
| {z }
Varianza Predicha del Residuo (por 2 )
Pj=T
2
)2
j=k+1 (cj c
s =
T k1
Pj=T
j=k+1 cj 2
c = N 0,
T k T k
Los intervalos
deconfianza
para el CUSUM se generan por la conexin
de dos lneas k, T k y T, 3 T k , donde el valor de es 0.948
si se desea un intervalo del 95% y 1.143 si el intervalo es del 99%.
Para generar los intervalos de confianza del CUSUMQ hay que partir de
la distribucin de la media de c:

2
c N 0,
T k
c
q N (0, 1)
2
T k
Al aplicar la definicin del test t student a esta distribucin sabremos cul

es el intervalo que debemos agregar al coeficiente cusumq:
q c
2
T k c
q = t(T k 1)
s2 s
2
(T k 1) /(T k 1) T k
es decir el intervalo para CUSUMQ ser:

Pj=t 2
Pj=t 2
j=k+1 cj c j=k+1 cj c
Pj=T 2 t (T k 1) s cusumqt Pj=T 2 +t (T k 1) s
j=k+1 cj T k j=k+1 cj T k
Su popularidad se debe a que estos han sido incorporados el software

economtrico y que adicionalmente para su testeo no es necesario contrastar
el estadstico con ningun valor de tabla o P-Value. Es suficiente hacer una
inspeccin visual a un par de figuras que presentan estos tests. Si los es-
tadsticos generados secuencialmente (CUSUM y CUSUMQ) se salen de los
intervalos de confianza predefinidos (por ejemplo la lnea que se sale por el
lmite superior de las figuras) entonces podemos decir que se rechaza la es-
tabilidad del modelo. Adicionalmente este test estara indicando cuando se
produce el quiebre estructural.
Test CUSUM: Intervalos de Confianza
Test CUSUMQ: Intervalos de Confianza

Chapter 6
Distorsiones del Modelo de

Regresin
El modelo de regresin simple multivariado asume que los residuos se dis-

tribuyen en forma identica e independiante con valor esperado 0 y matriz de
varianzas y covarianzas 2 I. Este captulo explora las implicancias y mtodos
disponibles para corregir el procedimiento de estimacin de mnimos cuadra-
dos cuando la matriz de varianzas y covarianzas no es 2 I.
6.1 Heteroscedasticidad
Una vez asumido que la matriz de varianzas y covarianzas de los residuos es

2 I, podemos devolvernos a entender el por qu de este resultado. Recorde-
mos que una matriz de varianzas y covarianzas puede ser descompuesta en
tres matrices, dos de las cuales son idnticas:
E [0 ] = =
91
92CHAPTER 6 DISTORSIONES DEL MODELO DE REGRESIN
donde cada matriz se define por:

0 ... 0 0
1

0 2 0

= ... ... ...

0 ... ...

0 0 ... T

1 1,2 ... 1,T 1 1,T

2,1 1 2,T

= ... ... ...

T 1,1 ... ...

T,1 T,2 ... 1

0 ... 0 0 1 1,2 ... 1,T 1 1,T 0 ... 0 0
1 1

0 2 0 2,1 1 2,T 0 2 0

E [0 ] = ... ... ... ... ... ... ... ... ...

0 ... ... T 1,1 ... ... 0 ... ...

0 0 ... T T,1 T,2 ... 1 0 0 ... T
Al asumir homoscedasticidad estamos imponiendo que las matrices

sean -escalares es decir = I, y a su vez al imponer no autocorrelacin
la matriz corresponde a la identidad, = I.
Al levantar el supuesto de homoscedasticidad ya no es posible definir a la
matriz de varianzas y covarianzas como 2 I, pues existir una matriz que
no es escalar, en donde los elementos de su diagonal no son constantes. Por
esta razn es que la matriz de varianzas y covarianzas se define ahora asum-
iendo solamente no autocorrelacin pero si errores heteroscedsticos por:
E [0 ] =
6.1 HETEROSCEDASTICIDAD 93
Si factorizamos la matriz por 2 entonces podemos renombrar a la matriz

de varianzas y covarianzas como:
E [0 ] = = = 2
donde la matriz corresponde a una matriz diagonal definida por:

0 ... 0
1

0 2 ... 0
=

... ... ... ...

0 0 ... T
Considerando la notacin anterior entonces ahora analizaremos los efectos

que produce en los estimadores mnimos cuadrados el asumir heteroscedasti-
cidad en los residuos, es decir ahora asumiremos que:

N 0, 2
donde no es la identidad.
6.1.1 Implicancias para Estimacin

Para verificar si existe algn efecto sobre los estimadores mnimo cuadrados
consideremos el caso de un modelo general en su versin matricial como
y = x + , donde asumiremos que N (0, 2 ). lo ms interesante es
verificar si los primeros momentos de este estimador se ven afectados, para lo
cual primero analizaremos el sesgo y segundo la varianza de los estimadores
bajo este nuevo escenario.
1. Sesgo. Si sabemos que = (x0 x)1 x0 y entonces reemplacemos el mod-

elo en esta expresin:
1
= (x0 x) x0 y
1
= (x0 x) x0 (x + )
1 1
= (x0 x) x0 x + (x0 x) x0
1
= + (x0 x) x0
Al aplicar el operador expectativa y considerando que E () = 0, ten-

dremos que:

1
E = + (x0 x) x0 E ()

E =
de manera que aun bajo presencia de errores heteroscedsticos los es-
timadores mnimo cuadrados siguen siendo insesgados.
2. Varianza. A partir de la expresin = +(x0 x)1 x0 podemos analizar
si los estimadores cumplen con la caracterstica de ser los mejores esti-
madores, es decir aquellos que tienen la mnima varianza.
Al aplicar varianza sobre esta expresin, y recordando que V () = =
2 y que las x son variables determinsticas, llegamos a:
1
= + (x0 x) x0

1
V = V + (x0 x) x0

1 1
V = (x0 x) x0 V () x (x0 x)

1 1
V = (x0 x) x0 x (x0 x)

1 1
V = 2 (x0 x) x0 x (x0 x)
Sabemos que de ser la matriz = I, entonces los estimadores mnimo
cuadrados son eficientes (es decir de mnima varianza), de manera que
sabemos entonces que:
1
I < x0 x (x0 x) , 6= I
La implicancia es que indudablemente los valores de las varianzas de los
estimadores sern mayores, de manera que si asumimos homoscedasti-
cidad y calculamos la varianza como 2 (x0 x)1 claramente estaremos
subestimando la verdadera volatilidad de los estimadores, creyendolos
eficientes cuando en realidad no lo son, lo cual implica que al aplicar
tests tstudent estemos rechazando hiptesis nulas cuando en realidad
estas son verdaderas (aumentando la probabilidad de error tipo I o er-
ror tipo ). En resumen, en presencia de errores heteroscedsticos los
estimadores mnimo cuadrados son ineficientes y los test estadsticos
pierden validez.
6.1.2 Tests de Heteroscedasticidad

Para iniciar el procedimiento de testeo de heteroscedasticidad es comn en se-
ries de tiempo partir con el anlisis visual de los residuos, puesto que al asumir
que su valor esperado es nulo entonces los cuadrados de estos pueden ser una
buena aproximacin de la varianza residual, es decir, dado que E () = 0,
entonces V (t ) = 2t = E (2t ) {E (t )}2 = E (2t ).
Estadsticamente los tests de heteroscedasticidad se construyen con la
idea de encontrar alguna dependencia o relacin de causalidad entre los resid-
uos (tpicamente sus cuadrados o el logartmo de ellos) y alguna otra variable
utilizando una ecuacin auxiliar (tpicamente lineal) a estimar. La hiptesis
nula se representa por:
H0 : 2t = 2 , t (Homocedasticidad)
versus la hiptesis alternativa de que para algun t esta relacin no se cumple,

representada por la ecuacin auxiliar siguiente:
Ha : 2t = 0 + zt
donde zt es un vector fila de tamao 1xm compuesto por m variables can-

didatas a explicar la heteroscedasticidad en el perodo t, es el vector de
tamao mx1 constante para todo t, y 0 corresponde al escalar que repre-
sentara el valor de la varianza ( 2 ) de existir homoscedasticidad, es decir si
no se rechaza la hiptesis de que = 0:
2t = 0 + zt
2t = 0 + zt 0
2t = 0
Empricamente la batera de tests que se han diseado se focalizan en

evaluar si este vector es estadisticamente cero, para lo cual se efecta una
estimacin por mnimos cuadrados de la ecuacin auxiliar 2t = 0 + zt
pero reemplazando la varianza por los cuadrados de los residuos
2 del modelo
principal y = x +, es decir se reemplaza 2 = e2 = yt xt y se estima
t t
e2t
alguna transformacin de = 0 + zt .
A continuacin se presentan los test ms utilizados para verificar la exis-
tenia de errores heteroscedsticos:
1. Breusch-Pagan-Godfrey (BPG, 1978-1979). Se estima la siguiente re-

gresin:
e2t = 0 + zt + t
y se testea segn el estadstico BP G = T R2 2 (m). T corresponde
[a]
al nmero de observaciones consideradas en la estimacin del modelo
2
auxiliar y R[a] es el coeficiente de determinacin de la ecuacin auxiliar.
Si el test calculado supera el valor de tabla entonces rechazamos
homoscedasticidad.
2. Glejser (1969). Aqu la variable dependiente es el valor absoluto de los
residuos muestrales, de manera que se estima:
|et | = 0 + zt + t
y el test que se distribuye como chi-cuadrado con m grados de libertad
se representa por ( es el vector de residuos estimados de la regresin
auxiliar):
G = hSCT 0 v
[a] v
i
1 2 s2[a]
v0 v
donde s2[a] = T (m+1)
,
y SCT[a] corresponden a la varianza residual
P _ 2
y la suma de los cuadrados totales |et | |et | de la ecuacin
auxiliar respectivamente. Luego si el estadstico G supera al 2 (m)
de tabla entonces rechazamos la hiptesis nula de homoscedasticidad
existiendo evidencia de errores heteroscedsticos.
3. Harvey (1976). Andrew Harvey en su artculo "Estimating Regression
Models with Miltiplicative Heteroskedasticity" (ECONOMETRICA,
Vol. 44, pag. 461-465) utiliza como variable explicativa el logaritmo de
los residuos al cuadrado, de manera que la ecuacin a estimar es:

ln e2t = 0 + zt + t
y el test que se distribuye chi-cuadrado con m grados de libertad es:
H = SCT[a]

4.9348
Al igual que en los casos anteriores, si H es superior al respectivo
2
valor de tabla (m) entonces existe evidencia de heteroscedasticidad
en los residuos.
4. Modelo Heteroscedstico con Media Condicional. En este caso se asume

que la variable explicativa es la variable dependiente estimada del mod-
elo principal (
yt ), de manera que el modelo a estimar es:
e2t = 0 +
yt + t
Para este caso el test posee un grado de libertad, y corresponde
al parmetro que acompaa a yt . El test a aplicar aqu corresponde
aun chi-cuadrado pero con un grado de libertad y se contrasta con el
estadstico:
MC = T R[a]
2
MC supera a 2 (1) entonces existe evidencia de heteroscedastici-

Si
dad.
5. Modelo Heteroscedstico con Media-Cuadrada Condicional. En este
caso se asume que la variable explicativa es la variable dependiente es-
timada del modelo principal al cuadrado ( yt2 ), de manera que el modelo
a estimar es:
e2t = 0 +
yt2 + t
Para este caso el test posee un grado de libertad, y corresponde
al parmetro que acompaa a yt2 . El test a aplicar aqu corresponde
aun chi-cuadrado pero con un grado de libertad y se contrasta con el
estadstico:
MCC = T R[a]
2
MCC supera a 2 (1) entonces existe evidencia de heteroscedastici-

Si
dad.
6. Modelo Heteroscedstico con log-Media-Cuadrada Condicional. En este
caso se asume que la variable explicativa es la variable dependiente
yt2 )), de
estimada del modelo principal al cuadrado y en logaritmo (ln (
manera que el modelo a estimar es:

e2t = 0 + ln yt2 + t
Para este caso el test posee un grado de libertad, y corresponde al
parmetro que acompaa a ln ( yt2 ). El test a aplicar aqu corresponde
aun chi-cuadrado con un grado de libertad y se contrasta con el es-
tadstico:
MLCC = T R[a]
2
MLCC supera a 2 (1) entonces existe evidencia de heteroscedasti-

Si
cidad.
7. Modelo Autoregresivo Heteroscedstico Condicional (ARCH). Este tests

est asociado a Robert Engle, quien en 1982 publica en el Journal
of Econometrics el artculo "A General Approach to Lagrange Mul-
tiplier Model Diagnostics". En este tipo de modelos la(s) variable(s)
explicativa(s) es el propio rezago de la variable dependiente, es decir
los cuadrados de los residuos rezagados q veces, representacin que por
lo dems ha sido muy difundida para analizar retornos de precios de
activos (especialmente retornos accionarios).
La representacin a estimar corresponde a:
e2t = 0 + 1 e2t1 + 2 e2t2 + ... + q e2tq + t
El test evala si los coeficientes j son conjuntamente cero (homoscedas-

ticidad) para lo cual se compara el estadstico:
ARCH = (T q) R[a]
2
ARCH supera al test chi-cuadrado con q grados de libertad, 2 (q),

Si
entonces hay evidencia de errores heteroscedsticos.
8. White (1980). En su artculo "A Heteroskedastic-Consistent Covari-

ance Matrix and a Direct Test for Heteroskedasticity" (ECONOMET-
RICA Vol. 48, pag. 421-48) presenta un test que no requiere de an-
temano listar qu variable o variables son las candidatas a explicar
el comportamiento heteroscedastico de los errores. Simplemente con-
sidera como potenciales variables explicativas a todas las que estn
involucradas en el modelo principal y = x + . Las introduce como
variables en la ecuacin auxiliar de tres formas simultneamente: en
niveles, al cuadrado y multiplicndose entre ellas.
La expresin a estimar ser entonces:
P
e2t = 0 + zt z + zt2 z2 + zit zjt ij + t
es decir si el modelo original y = x + posee k parmetros a estimar

(la constante y k 1 variables explicativas) entonces el modelo auxiliar

de White tendr que estimar un total de k0 = (k+1)(k+2)
2
parmet-
ros considerando la constante, las variables en niveles, las variables
al cuadrado, y los efectos cruzados de las variables (multiplicacin de
variables entre s).
El test estadstico se distribuye chi-cuadrado con (k0 1) grados de
libertad y se obtiene de:
W = T R[a]
2
W es superior al chi-cuadrado de tabla 2 (k0 ) entonces rechazamos

Si
la hiptesis nula de homoscedasticidad.
6.1.3 Correccin
Existen bsicamente dos formas de corregir bajo la presencia de heteroscedas-
ticidad. Una es el procedimiento de White o su versin ms general conocida
como el Mtodo de Mnimos Cuadrados Generalizados o Mnimos Cuadrados
Ponderados (MCG) y la segunda es estimacin por mximo verosimilitud,
esta ltima se deja para una discusin posterior.
1. Mnimos Cuadrados Generalizados (MCG). Dado que sabemos que en

general la matriz de varianzas y covarianzas de los parmetros esti-
mados se representa por (x0 x)1 x0 x (x0 x)1 y sabemos que los esti-
madores no son los de mnima varianza en este caso. Si conocieramos
la matriz podramos generar residuos cuya matriz sea escalar de man-
era que los estimadores generados a partir de ese modelo corregido si
entrege estimadores de mnima varianza. En esto consiste el mtodo
de mnimos cuadrados ponderados: aplicar mnimos cuadrados a una
transformacin del sistema original y = x + .
Para esto, dado que es una matriz simtrica y definida positiva,
entonces podemos definir una matriz H que satisfaga la condicin
HH 0 = I. En otras palabras vemos que = H 1 H 10 de forma
que 1 = H 0 H.
Si nuestro modelo original es:
y = x +
N (0, )
entonces el modelo transformado ser:

Hy = Hx + H
Hy = Hx +
N (0, I)
pues V (H) = H 0 V () H = H 0 H = I. Luego en este sistema si se
sabemos que los estimadores mnimo cuadrados son eficientes (de mn-
ima varianza) de manera que podemos hacer inferencia con los errores
estandar estimados. Los estimadores MCG sern al igual que en el
caso de mnimos cuadrados ordinarios generados a partir de la frmula
= (x0 x)1 x0 y, lo cual aplicado a nuestro sistema modificado ser:
1
MCG = ((x0 H 0 ) (Hx)) (x0 H 0 ) (Hy)
pero como hemos definido anteriormente que H 0 H = 1 , entonces
simplificamos la expresin anterior a:
1 0 1
MCG = x0 1 x x y
Dado que ahora el nuevo residuo tiene una varianza identidad, la
varianza de los estimadores MGC se deducir de al expresin anterior:
1 0 1
MCG = x0 1 x x y
0 1 1 0 1
MCG = x x x (x + )
0 1 1 0 1 1 0 1
MCG = x x x x + x0 1 x x
0 1 1 0 1
MCG = + x x x

Al aplicar varianza a la expresin MCG y simplificando nos
queda (recordando que V () = ):
h 1 0 1 i
0 1
MCG = V x x x
0 1 1 0 1 1
MCG = x x x V () 1 x x0 1 x
1 0 1 1 0 1 1
MCG = x0 1 x x x x x
0 1 1 0 1 0 1 1
MCG = x x x x x x
0 1 1
MCG = x x
de manera que finalmente sabemos que la distribucin de los esti-

madores MCG ser insesgada y con matriz de varianzas y covarian-
1
zas (x0 1 x) . Dado que el estimador MCG es de mnima varianza
en relacin al estimador de mnimos cuadrados bajo presencia de het-
eroscedasticidad entonces podemos decir que:
M CG MCO
0 1 1 1 1
x x (x0 x) x0 x (x0 x)
Naturalmente para hacer las estimaciones y la aplicacin de este pro-

cedimiento debemos tener un estimador de . Una vez que se encuentre
el estimador generamos las representaciones muestrales (estimadas)
de las expresiones para los estimadores EMCG y la matriz de varianzas
estimada
MCG :
1
EMCG = 1 x
x0 1 y
x0
1

1 x
= x0
MCG
White entrega un estimador para centrando su atencin en corregir la

matriz de varianzas y covarianzas con el fin de hacer inferencia, dejando
inalterado los estimadores mnimos cuadrados.
2. White (1980). En su artculo se presenta cmo obtener consistencia

para la matriz de varianza y covarainzas y as poder calcular errores
estndar correctos de los estimadores y efectuar con confianza tests
t student. Recordemos que en presencia de heteroscedasticidad la
matriz de varianzas y covarianzas se representa por:
1 1
= (x0 x) x0 x (x0 x)
La proposicin de White es reemplazar por su expresin muestral de

manera que si t N (0, 2t ):

1
= (x0 x) x0

1 P 0
T

= (x0 x) xt t t
t=1
entonces al aplicar operador varianza:

0 1 P
T
1
= (x x) V x0t t
(x0 x)
t=1
T
0 1 P 1
= (x x) xt V [t ] xt (x0 x)
0
t=1
T
0 1 P 0 2 1
= (x x) xt t xt (x0 x)
t=1
T
0 1 P 0 1
= (x x) xt xt t (x0 x)
2
t=1
entonces la matriz de covarianzas consistente se obtiene de reemplazar

2t = e2t en la expresin anterior:
T
0 1
P 0 2 1
= (x x) xt xt et (x0 x)
t=1
Esta matriz ser consistente y puede ser utilizada para hacer inferencia
sobre los parmetros estimados.
6.2 Autocorrelacin
La discusin de la autocorrelacin sigue un procedimiento muy similar la caso
de la heteroscedasticidad y los problemas que causa sobre los estimadores
mnimo cuadrados tambin.
Recordemos nuevamente que una matriz de varianzas y covarianzas puede
ser descompuesta en tres matrices, dos de las cuales son idnticas:
E [0 ] = =
donde al igual que en caso de la heteroscedasticidad cada matriz se define

6.2 AUTOCORRELACIN 103
por:

0 ... 0 0
1

0 2 0

= ... ... ...

0 ... ...

0 0 ... T

1 1,2 ... 1,T 1 1,T

2,1 1 2,T

= ... ... ...

T 1,1 ... ...

T,1 T,2 ... 1

0 ... 0 0 1 1,2 ... 1,T 1 1,T 1 0 ... 0 0
1

0 2 0 2,1 1 2,T 0 2 0

0
E [ ] = ... ... ... ... ... ... ... ... ...

0 ... ... T 1,1 ... ... 0 ... ...

0 0 ... T T,1 T,2 ... 1 0 0 ... T
Al asumir no autocorrelacin de los residuos estamos imponiendo que la
matriz sea la matriz identiodad, = I, y a su vez al imponer homoscedas-
ticidad la matrices corresponden a matrices escalares I.
Al levantar el supuesto de no autocorrelacin ya no es posible definir
a la matriz de varianzas y covarianzas como 2 I, pues existir una matriz
que no es la identidad. Por esta razn es que la matriz de varianzas
y covarianzas se define ahora asumiendo homoscedasticidad pero si errores
autocorrelacionados:
E [0 ] = = 2
Considerando la notacin anterior analizaremos los efectos que produce en
los estimadores mnimos cuadrados el asumir autocorrelacin en los residuos,
es decir asumiremos que:

N 0, 2
donde no es la identidad.
6.2.1 Implicancias para Estimacin

Para verificar si existe algn efecto sobre los estimadores mnimo cuadrados
consideremos el caso de un modelo general en su versin matricial como
y = x + , donde asumiremos que N (0, 2 ). lo ms interesante es
verificar si los primeros momentos de este estimador se ven afectados, para lo
cual primero analizaremos el sesgo y segundo la varianza de los estimadores
bajo este nuevo escenario donde 6= I.
1. Sesgo. Si sabemos que = (x0 x)1 x0 y entonces reemplacemos el mod-

elo en esta expresin:
1
= (x0 x) x0 y
1
= (x0 x) x0 (x + )
1 1
= (x0 x) x0 x + (x0 x) x0
1
= + (x0 x) x0
Al aplicar el operador expectativa y considerando que E () = 0, ten-

dremos que:

1
E = + (x0 x) x0 E ()

E =
de manera que aun bajo presencia de errores autocorrelacionados los

estimadores mnimo cuadrados siguen siendo insesgados.
2. Varianza. A partir de la expresin = +(x0 x)1 x0 podemos analizar

si los estimadores cumplen con la caracterstica de ser los mejores esti-
madores, es decir aquellos que tienen la mnima varianza.
Al aplicar varianza sobre esta expresin, y recordando que V () = =
2 y que las x son variables determinsticas, llegamos a:

1
= + (x0 x) x0

0 1 0
V = V + (x x) x

1 1
V = (x0 x) x0 V () x (x0 x)

1 1
V = (x0 x) x0 x (x0 x)

1 1
V = 2 (x0 x) x0 x (x0 x)
Sabemos que de ser la matriz = I, entonces los estimadores mnimo

cuadrados son eficientes (es decir de mnima varianza), de manera que
sabemos entonces que:
1
I < x0 x (x0 x) , 6= I
La implicancia es que indudablemente los valores de las varianzas de

los estimadores sern mayores, de manera que si asumimos no autocor-
relacin y calculamos la varianza como 2 (x0 x)1 claramente estaremos
subestimando la verdadera volatilidad de los estimadores, creyndolos
eficientes cuando en realidad no lo son, lo cual implica que al aplicar
tests t student estemos rechazando hiptesis nulas cuando en real-
idad estas son verdaderas (aumentando la probabilidad de error tipo
I o error tipo ). En resumen, en presencia de autocorrelacin de los
residuos, los estimadores mnimo cuadrados son ineficientes y los test
estadsticos pierden validez.
6.2.2 Tests de Autocorrelacin

Para iniciar el procedimiento de testeo de autocorrelacin de los residuos el
primer paso consiste en una inspeccin grfica de los residuos en el tiempo.
Este procedimiento es estadticamente muy dbil y solamente si la autocor-
relacin es muy fuerte entonces se observar algo en la grfica, pero de ser
uns correlacin dbil es necesario la aplicacin de una batera de tests espe-
cialmente diseada para tal efecto.
Estadsticamente los tests de heteroscedasticidad se construyen con la
idea de encontrar alguna dependencia o relacin de causalidad temporal entre
los residuos estimando una ecuacin auxiliar al igual que con la heteroscedas-
ticidad. La hiptesis nula se representa por:
H0 : = 0 , t (No Autocorrelacin)
versus la hiptesis alternativa de que para algn t esta relacin no se cumple.

La ecuacin auxiliar general se puede representar por:
Ha : t = 1 t1 + 2 t2 + ... + q tq
donde es un vector de tamao qx1. De no existir autocorrelacin de los

residuos el vector de parmetros compuesto por q residuos rezagados para
explicar la autocorrelacin. De no existir autocorrelacin residual de orden
q la hiptesis nula = 0 no es rechazada.
Empricamente la batera de tests que se han diseado se focalizan en
evaluar si este vector es estadisticamente cero, para lo cual se efecta una
estimacin por mnimos cuadrados de la ecuacin auxiliar pero reemplazando
t por los residuos muestrales
del modelo principal y = x + , es decir se
reemplaza t = et = yt xt y se estima et = 1 et1 +2 et2 +...+q etq +
t.
A continuacin se presentan los test ms utilizados para verificar la exis-
tenia de errores autocorrelacionados:
1. Durbin-Watson (1950, 1951). El estadstico de Durbin y Watson (d) es

uno de los test ms tradicionales para evaluar autocorrelacin residual
de primer orden (q = 1). A partir de la estimacin de modelo principal
se generan los residuos muestrales et . A partir de estos se calcula el
estadstico d como: PT
(et et1 )2
d = t=2PT 2
t=1 et
Este estadstico tiene una estrecha relacin con el coeficiente de au-

tocorrelacin de la regresin auxiliar. Si estimamos utilizando
el mtodo de los mnimos cuadrados aplicado a la ecuacin auxiliar
et = et1 + t , el coeficiente estimado sera (recordemos que e 0):
PT
et1 et
= Pt=2
T 2
t=2 et1
De la expresin para el test d se puede concluir que:

PT 2
t=2 (et et1 )
d = PT 2
t=1 et
PT 2 2

e + e 2e t et1
d = t=2 t
PT 2
t1
t=1 et
PT 2 PT 2 PT
t=2 et t=2 et1 t=2 2et et1
d = PT 2 + PT 2 P T 2
t=1 et t=1 et t=1 et
Dado que los dos

P primeros Ptrminos son bastante similares, y adems
reemplazando Tt=1 e2t Tt=2 e2t1 entonces podemos escribir esta l-
tima expresin como:
PT
t=2 2et et1
d 2 P T 2
t=2 et1
PT !
e e
t t1
d 2 1 Pt=2 T 2
t=2 et1
Note sin embargo que esta ltima expresin tambin se puede escribir
como: PT !
t=2 et et1
d 2 1 P T 2
t=2 et
P P
donde hemos utilizado la aproximacin Tt=2 e2t Tt=2 e2t1 de manera
que en la prctica el coeficiente lo podemos extraer de una estimacin
del tipo et = et1 + t o una expresin auxiliar inversa como et1 =
et + t1 . Este punto es relevante para otros tests que se presentarn
ms adelante.
Finalmente reemplazando por el coeficiente estimado del factor de au-
tocorrelacin llegamos a la expresin que relaciona el estadstico d
con el coeficiente de autocorrelacin de primer orden :
d 2 (1 )
Claramente la hiptesis nula = 0 indica implcitamente la hiptesis

H0 : d = 0. Para verificar los extremos del estadstico d analicemos los
valores posibles del coeficiente de autocorrelacin:
= 1 = d = 4 Autocorrelacin Negativa
= 0 = d = 2 No Autocorrelacin
= 1 = d = 0 Autocorrelacin Positiva
Este test es uno de los pocos que se contrasta con dos valores de una
misma tabla. Considerando un nivel de significancia de % se debe de-
terminar el nmero de parmetros estimados en la ecuacin o modelo
principal y = x + sin considerar la constante (k 1), y el nmero
de observaciones utilizadas en la estimacin (T ). Con esta informacin
la tabla entrega dos estadsticos dl , du , donde dl < du . Dado que el
estadstico d pertenece al intervalo [0, 4] los valores de tabla tambin
estarn acotados a ese mismo intervalo. Dependiendo del valor que
toma el estadstico d en relacin a los valores de tabla, rechazaremos o
no la hiptesis nula de no autocorrelacin de primer orden de los resid-
uos. La siguiente tabla entrega estas relaciones de la cual se concluye
que rechazamos la hiptesis nula de no autocorrelacin si el estadstico
d cae duera del intervalo [dl , 4 dl ]:

Rechazo H0
d < dl
Autocorrelacin Positiva
dl < d < du Regin Inconclusa

du < d < 4 du No Rechazo H0
4 du < d < 4 dl Regin Inconclusa

Rechazo H0
d > 4 dl
Autocorrelacin Negativa
Ejercicio. Supongamos que estimamos un modelo de demanda por

un producto q con dos variables explicativas: ingreso (y) y precio del
producto (p), con los siguientes resultados:
qt = 25.89 1.12pt + 0.89yt
d = 1.39
T = 85
Si observamos los valores de tabla de referencia al 5% para k 1 = 2

con 85 observaciones se obtiene:
dl = 1.600
du = 1.696
Dado que el estadstico d = 1.39 < dl = 1.6 entonces rechazamos la
hiptesis nula que los residuos no estn autocorrelacionados en favor
de que eventualmente existe autocorrelacin positiva.
Asumamos que esa autocorrelacin provendra del hecho de que de-
jamos fuera una variable relevante como es el precio del producto susti-
tuto (ps ) y estimamos el modelo con esta variable includa. Los resul-
tados son:
qt = 23.19 1.01pt + 0.94yt + 0.43pst
d = 1.89
T = 230
Ahora el estadstico d = 1.89 con k 1 = 3, y cae en el intervalo
[du , 4 du ] = [1.721, 2.279] de manera que ahora con el modelo cor-
regido e incorporando la variable causante de la autocorrelacin, no
rechazamos la hiptesis nula de no autocorrelacin de los residuos.
2. Durbin-h (1970). Este test se utiliza cuando la ecuacin principal tiene
como variables explicativas rezagos de la variable endgena o dependi-
ente, es decir variables ytj con j > 1. La hiptesis nula sigue siendo no
autocorrelacin de primer orden y el sistema a estimar se representar
por:
y = x + yj +
t = t1 + t
donde en este caso el parmetro posee una dimensin jx1 donde j es el
nmero de rezagos que presenta la variable y como variable explicativa.
Recordemos que el parmetro de autocorrelacin lo podemos tambin
calcular de la expresin auxiliar inversa t1 = t + t1
En este caso el test h se distribuye asintticamente como una normal
estandarizada definida por:
" # 12
= T j
h N (0, 1)
1 (T j) V [1]
donde j corresponde al nmero de rezagos utilizados de la variable

endgena como variable explicativa, [1] es el parmetro asociado al
primer rezago de estas variables endgenas explicativas, y T j cor-
responde al nmero de observaciones utilizadas en la estimacin del
modelo principal.
Dado que h N (0, 1) entonces si este estadstico pertenece al intervalo
[1.96, 1.96] al 5% (o al intervalo [1.645, 1.645] con un nivel de sig-
nificancia del 10%) no rechazamos la hiptesis nula de que los residuos
no siguen un proceso de autocorrelacin de primer orden.
Ejercicio. Supongamos que en una regresin para estudiar la inflacin
se utilizan dos rezagos de la inflacin como variables explicativas. El
resultado de las estimaciones es el siguiente (errores estndar entre
parntesis):
t = 2.21 + 0.65t1 + 0.12 t2 + 0.89 m

t
(0.04) (0.04) (0.06) (0.12)
d = 0.87
T = 180
donde es la inflacin en t, y m
es la tasa de crecimiento de la cantidad
de dinero en t.
A partir de estos resultados sabemos queno podemos aplicar el test
tradicional de Durbin-Watson. En este caso al existir variables de-
pendientes rezagadas en la ecuacin entonces debemos aplicar el test
h-Durbin:
" # 12
= T j
h
1 (T j) V [1]
12
h = 0.87 180 2
1 (180 2) (0.04)2
h = 13.725
Claramente este valor supera los valores relevantes de una tabla estads-
tica normal (1.645 1.96), lo cual implica que rechazamos la hiptesis
de no autocorrelacin de primer orden de los residuos.
3. Multiplicador de Lagrange para Correlacin Serial. Este test es muy

utilizado para evaluar modelos con procesos autoregresivos de los resid-
uos superiores a uno. A diferencia de los test anteriores, la ecuacin
auxiliar a estimar contiene el conjunto de variables explicativas del
modelo principal adems de los rezagos de los residuos por analizar:
y = x +
t = x + 1 t1 + 2 t2 + ... + q tq + t
Reemplazando los residuos poblacionales por los muestrales (t = et )

implementamos el test como:
LM = (T q) R[a]
2
2 (q)
Al igual que en los casos anteriores donde se aplicaron test de esta

clase, la hiptesis nula H0 : 1 = 2 = ... = q = 0 (no autocorrelacin
LM
de orden q de los residuos) ser rechazada si es que el estadstico
supera a su similar de tabla 2 (q).
4. Multiplicador de Lagrange para Correlacin Serial con Rezagos de y.
La diferencia de este test con respecto al del punto anterior es que
es ms general pues permite la existencia de variables rezagadas (yj )
como variables explicativas de y. La ecuacin auxiliar a estimar con-
tiene el conjunto de variables explicativas del modelo principal adems
de los rezagos de los residuos por analizar:
y = x + yj +
t = x + yj + 1 t1 + 2 t2 + ... + q tq + t
Reemplazando los residuos poblacionales por los muestrales (t = et )

implementamos el test como:
LME = (T (j + q)) R[a]
2
2 (q)
donde ahora restamos al nmero de observaciones T el nmero de ob-

servaciones perdidas en estimar el modelo original j y las del mod-
elo auxiliar q. Al igual que en el caso anterior, la hiptesis nula
H0 : 1 = 2 = ... = q = 0 (no autocorrelacin de orden q de los
LME supera a su sim-
residuos) ser rechazada si es que el estadstico
2
ilar de tabla (q).
5. Box-Pierce (1970) o test Q. Este test se basa en el anlisis conjunto de

los coeficientes estimados de la ecuacin auxiliar para verificar si son
estadsticamente ceros. Estos coeficientes son las correlaciones de los
residuos de manera que se analizan:
Cov (s , t ) E (s , t )
s t = =
V ar (t ) E (2t )
Tal como sabemos este coeficiente es equivalente al parmetro de la

ecuacin auxiliar inversa:
ts = s t + ts s = 1, 2, ..., q
donde el se calcula como la razn entre las covarianzas y la varianza

de la variable dependiente. Estimando la expresin anterior utilizando
los residuos et en lugar de t estimamos un vector de dimensin qx1.
Los autores demuestran que el estadstico relevante para evaluar la
hiptesis nula de que no existe autocorrelacin de residuos se define
por (expresiones equivalentes):
P
q
Q = T 2s 2 (q)
s=1
0
Q = T 2 (q)
de manera que si este estadstico supera a su equivalente 2 (q) entonces

rechazamos la nula presentndose evidencia de autocorrelacin de orden
q de los residuos.
6. Ljung-Box (1978) o test Q. Una perfeccin de este test lo presentan

Ljung y Box. Utilizando la misma ecuacin auxiliar del test Box-Pierce
definen al estadstico:

0
Pq 2s
Q = T (T + 2) 2 (q)
s=1 (T s)
Si el estadstico Q0 es mayor a su equivalente de tabla 2 (q), entonces

rechazamos la hiptesis nula H0 : 1 = 2 = ... = q = 0.

Econometria Basica

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Econometria Basica

Cargado por

Copyright:

Formatos disponibles

Chapter 2

2.1 Funciones Aleatorias

Ejercicio. S = {1, 2, 3, 4}. Evaluar si S = {, {1, 2, 3, 4}} es -algebra.

Ejercicio. S = {1, 2, 3, 4}. Evaluar si el conjunto S es -algebra: S =

Aqu se puede apreciar que las dos primeras condiciones se cumplen f-

Ejercicio. S = {1, 2, 3, 4}. Evaluar si el conjunto S es -algebra: S =

Definicin. Un par (S, S), conformado por un conjunto S y su -algebra

Definicin. Sea A el conjunto de intervalos abiertos en < :

(, b), (a, b), (a, +), (, +)

Definicin. Sea (S, S) un espacio medible. Una medida es una funcin

Definicin. Un espacio medida es una tripleta (S, S, ), donde S es un

Definicin. Si (S) = 1, entonces no se denomina medida sino que

{ S|() < x} S, x < (2.1)

Ejemplo. Considere el conjunto S = {1, 2, 3, 4}, y el -algebra S =

Finalmente, dado que { S|() < x} S, se le puede aplicar el

P ({ S|() < x}) [0, 1]

2.2 Funciones de Distribucin de Densidad

Ejemplo. Considere el evento A = {x|0 < x < 1}. Si f (x) = ex ,

Figure 2.1: Funcin de Distribucin Univariada

2.2.1 Distribuciones Condicionales y Marginales

El teorema de Bayes que di existen dos eventos A y B, entonces P [A, B] =

Dado la definicin de la funcin de distribucin marginal y en conjunto

2.2.2 Funcin Generadora de Momentos

expresin vlida si las v.a. son independientes entre s.

de manera que la varianza de una v.a. Xi se puede generar a partir de:

2.2.3 Independencia Estocstica

f (x1 , x2 , ...., xn ) = f 0 (x1 ) f 0 (x2 ) ...f 0 (xn ) = ni=1 f 0 (xi )

Ejercicio. Verifiquemos si X1, X2 son estocsticamente independientes,

En este caso tenemos que las funciones marginales sern:

2.2.4 Funciones de Distribucin ms Conocidas

Existen diversas formas funcionales para describir una variable aleatoria,

Table 2.1: Funciones de Distribucin Discretas

Una de las funciones ms utilizadas en econometra con el fin de testear

Funcin de Distribucin N(0, 1) y t-Student con = 5 (azul)

Existen teoremas que permiten relacionar distintas funciones de distribu-

La funcin generadora de momentos para esta Poisson es:

Dado lo anterior, si asumimos que = 2, entonces cul es la probabili-

entonces cul es la distribucin de Y = X1 + X2 , si ambas son variables

Ejercicio. Si XN (0, 1), entonces cul es la distribucin de Y = X 2 ?

Recordando que la funcin generadora de momentos para una chi-cuadrado

2.3 Momentos de una Distribucin

Para el caso de un vector de eventos X1 , X2 , X3 , ..., Xn se tiene que:

Como tal, es posible demostrar que la expectativa matemtica de una

2.3.1 Media y Varianza

De esta ltima expresin se verifica por qu en el campo de las finanzas

donde T representa al tamao muestral.

resentamos para T = 20, 50, 100 por la funcin de densidad:

Funciones de Distribucin para el Coeficiente de Skewness: T = 20, 50, 100

La hiptesis nula H0 : Sk = 0 se evala a travs de una tabla normal

En la medida que este estadstico sea superior en valor absoluto a 1.96 se

El cuarto momento se denomina kurtosis, y determina si las colas tienen una

La medida de referencia de este coeficiente para una distribucin normal

Funciones de Distribucin para el Coeficiente de Kurtosis: T = 20, 50, 100

Para testear la hiptesis nula de que K = 3 debemos calcular el estads-

En la medida que este estadstico sea superior en valor absoluto a 1.96 se

2.3.4 Test de Normalidad de Jarque-Bera

Para generar el estadstico requiero sumar el cuadrado de dos funciones

(zSk )2 + (zK )2 2 (2)

2.3.5 Aplicacin: Indice Accionario NASDAQ

lo cual permite rechazar la hiptesis nula de que el coeficiente de skewness

Figure 2.2: Histograma y Estadsticos Bsicos del NASDAQ

De igual manera el coeficiente de kurtosis que alcanza a 17.15, genera un

El test de Jarque-Bera viene a complementar este resultado. El estadstico

Cdigo GAUSS: Estadsticos Descriptivos