Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Por ejemplo, si θ = 20, y ε =0.1, la sentencia indicaría la probabilidad de que θ̂ n esté entre
19.9 y 20.1. O sea, es la probabilidad de que el valor absoluto de la diferencia ( θ̂ n - θ) sea
menor que 0.1.
lim Pr ( θˆ n − θ < ε) =1
n →∞
lim Pr ( θˆ n − θ > ε) = 0
n→∞
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
169
En palabras, esto significa que haciendo n suficientemente grande podemos hacer que la
probabilidad de que θ̂ n esté en un intervalo arbitrariamente pequeño alrededor de θ puede
ser tan cercana a uno como queramos. La convergencia en probabilidad implica que a
medida que aumenta n se hace más probable que θ̂ n tome valores cercanos a θ. O sea, la
masa de la distribución se va concentrando en los valores cercanos a θ.
Gráfico
Convergencia en media cuadrática: “Un estimador cuyo sesgo y varianza tienden a cero,
o sea su error cuadrático medio tiende a cero, es consistente.” Esta es una condición
suficiente pero no necesaria.
Así, si
lim E( θ̂ n - θ)2 = 0
n→∞
entonces θ̂ n es un estimador consistente de θ.
Esto implica que un estimador insesgado cuya varianza tiende a cero es consistente.
1) Pr(Xn ≥ δ) ≤ E(Xn)/ δ
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
170
Por lo tanto:
Cuando el límite de EXn es μ (o sea el sesgo tiende a cero) y la varianza tiende a cero, la
ecuación 4) implica:
EX n = μ; var(X n ) = σ 2 / n
Como ya se dijo, esto último es una condición suficiente de consistencia pero no necesaria.
De hecho, un estimador puede ser consistente aunque su error cuadrático medio no tienda a
cero. Esto se puede ver en el siguiente ejemplo:
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
171
Ejemplo 2:
Sea θ̂ n una variable aleatoria que puede tomar dos valores, θ y n, con probabilidades
(1-1/n) y 1/n.
1
= lim ( (θ-θ-1) 2 (1- )+(n-θ-1) 21/n )
n→∞ n
= lim ((1-1/n) + (n - θ -1))21/n) = ∞
n→∞
Gráfico:
Nótese que en el ejemplo el sesgo no tiende a cero, ya que permanece igual a 1 y, por otro
lado, la varianza de la distribución muestral tiende a infinito. A pesar de eso, el estimador es
consistente.
Existe otra definición de varianza asintótica, que está referida a la distribución asintótica (o
aproximada) que veremos más adelante, y es:
n →∞ ⎢⎣
{ ( n→∞
)}
= (1 / n) lim E ⎡ n (θˆn ) − lim E (θˆn ) ⎤
2
⎥⎦
Analizar sesgos y varianzas asintóticas y en muestra finita, de una variable que sigue el
siguiente proceso:
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
172
v
Xn = μ + a/n +
n
donde Ev = 0 y Ev2= σ2
plim g( θ̂ ) = g(plim θ̂ )
Por ejemplo:
plim( θ̂ 2) = (plim θ̂ )2
plim(X/Y) = plimX/plimY
plimA-1 = (plimA)-1
β̂ = (X'X)-1 XY
= β + (X'X)-1X'u
1 1
= β + ( X ' X ) −1 ( X ' u )
n n
1 1
Si X es fijo: plim ( X' X) = X' X
n n
Si las variables son estocásticas pero estacionarias, los momentos muestrales convergen a
los poblacionales, lo que se puede escribir como:
1
plim ( X ' X ) = ΣXX
n
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
173
⎡ ⎡1 ⎤ ⎤
⎢ p lim ⎢⎣ n ∑ ut⎥ ⎥
⎢ ⎦ ⎥
⎡
⎢ p lim ∑ X u ⎤⎥
1
1 ⎢⎣ n 2t t ⎥
p lim( X ' u) = ⎢ ⎦⎥
n ⎢ ⋅ ⎥
⎢ ⎥
⎢ ⋅ ⎥
⎢ p lim⎡ 1 ∑ X u ⎤⎥
⎢⎣ ⎢⎣ n kt t ⎥
⎦⎥⎦
1
Veamos el plim del segundo elemento es decir de ( ∑ X 2 t u t ) . Su valor esperado es
n
siempre = 0 si los X son fijos. Si los X fueran estocásticos e independientes de los u, el
valor esperado también será cero. Por otro lado, su varianza tiende a cero. Veamos esto
1
último. Bajo el supuesto de independencia, la varianza de (
n
∑ X 2tut ) se puede escribir
⎛ σ2 ⎞ ⎛ ∑t =1 X it ⎞⎟ .
n 2
como ⎜ ⎟⎜ El primer término converge claramente cero. El segundo
⎜ n ⎟ ⎜⎜ n ⎟⎟
⎝ ⎠⎝ ⎠
1
converge a una constante, ya que plim ( X' X) = ∑ XX. Luego el plim del producto es cero.
n
De la misma forma se ve que los plim de los otros elementos son también iguales a cero.
Por lo tanto:
1 1
plimβˆ = β + plim( X' X) −1 plim( X' u )
n n
= β + Σ−1 0
plimβ̂ = β
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
174
Esto significa que los estimadores MICO son consistentes aún con X estocásticos, siempre
que los X sean independientes de los errores.
d
Si Xn converge en distribución a X se anota como: X n → X
La distribución límite es la de una variable Bernoulli que tiene probabilidad 0.5 de salir 1 y
0.5 de salir 2:
Pr(X = 1) = 0.5
Pr(X = 2) = 0.5
d
1) Si X n → X y plim Yn = c
d
Entonces: X n Yn → cX
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
175
En forma similar:
d
2) ( X n / Yn ) → X / c si c ≠ 0
d
3) ( X n + Yn ) → X + c
d
4) Si X n → X y g(Xn) es una función continua, entonces,
d
g( X n) → g ( X )
Por lo tanto, según el teorema 4), la distribución límite de tn2 sería la distribución de la
2
normal al cuadrado (N2), la que sabemos es una χ1 , o sea:
d 2
tn2 → N(0,1)2 = χ1
tn2 = F(1,n)
d
5) Si Yn → Y y plim(Xn - Yn) = 0
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
176
En la mayor parte de los casos que vamos a ver, los estimadores tienen un plim. En estos
casos, la distribución límite se degenera, ya que si:
d
θ̂ → θ
donde θ es una constante, significa precisamente que plim θ̂ = θ.
Pero (aii), el elemento de la diagonal de (X'X)-1, tiende a cero a medida que crece n (ej, en
el caso de la pendiente del modelo lineal simple, aii es 1 / ∑ x 2 ). Por lo tanto, la
distribución se concentra en un punto debido a que la varianza tiende a cero. En este caso se
dice que la distribución límite se degenera.
En estos casos, para los efectos de encontrar una distribución aproximada cuando n es
finito, no podemos aplicar directamente la teoría de distribuciones límites. Es decir, no
podemos usar este concepto de distribución como aproximación de la distribución
verdadera para un tamaño n finito. Es necesario usar una transformación estabilizadora:
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
177
Z = n ( X − μ)
Donde:
EZ = 0, VarZ = n var( X ) = σ2
Z ~ N(0, σ2)
Z
Como X= +μ y Z es una normal con media 0 y varianza constante, aplicando el
n
σ2
teorema 4) la distribución límite de X ~ N( μ , ) . La distribución así derivada se llama
n
a
distribución “aproximada o asintótica” y se escribe X → N(μ, σ2/n). Nótese la “a” en vez
de la “d” sobre la flechita. La aproximación en este caso particular es perfecta ya que
coincide con la distribución en muestra pequeña.
Teorema del límite central de Lindberg-Levy (caso univariante): Si X1, X2, ..Xn son
variables aleatorias de cualquier distribución, con media μ y varianza finita σ2 y
Z = n ( X − μ) , entonces la distribución límite de Z es una normal, o sea:
d 2
Z = n ( X − μ) → N (0, σ )
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
178
d d
Aplicando el teorema 4) de que si X n → X ⇒ g ( X n ) → g ( X ) , podemos encontrar la
distribución límite de una función de Z:
Resumiendo:
n ( X − μ) d
= Z / σ → N(0, 1)
σ
X = Z/ n + μ
d
X = (Z/ n + μ ) → g(Z) = N(0, σ2)/ n + μ = Ν(μ, σ2/n)
X ~ AN(μ, σ2/n) o
a
X → N(μ, σ2/n)
y se expresa como que X se distribuye asintóticamente como una normal (aunque de hecho
lo es Z) con media μ y varianza σ2/n (que corresponden a X ). También se expresa como
que la N(μ, σ2/n) es la distribución aproximada de X .
El término σ2/n es la varianza asintótica (y también, en este caso, la varianza para muestra
pequeña).
El teorema del límite central es muy importante puesto que independiente de la distribución
de X, la distribución de la transformación Z converge a una normal.
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
179
Entonces:
_ _ d _
Z = n ( X n - μn ) → N(0, σ 2)
La utilidad de todo esto es que si un estimador es una función lineal de variables aleatorias,
aplicando el teorema del límite central se puede obtener la distribución aproximada (o
asintótica) de θ˜ , la que será normal.
~
Si θ es una función lineal de variables aleatorias:
~ d
Z= n ( θ − θ) → N (0, σ 2 )
d
( → significa que se trata de la distribución límite)
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
180
entonces:
~ a
θ → N (θ, σ 2 / n )
a
( → significa que se trata de la distribución aproximada)
Entonces:
~ a
θ → N (θ, ∑ / n )
~
∑/n es la matriz de covarianza asintótica (o aproximada de θ )
La eficiencia asintótica se refiere a una comparación entre varianzas (o matrices var) dentro
del conjunto de estimadores consistentes y asintóticamente normales, donde las matrices de
varianza se han obtenido como aproximaciones asintóticas.
~ d ~
Si: n ( θ − θ) → N (0, ∑) , donde θ es un escalar
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
181
~ d
n (g ( θ ) − g ( θ)) → N (0, (g ' ( θ)) 2 ∑)
Por lo tanto:
~ a
g (θ ) → N ( g ( θ ), ( g ' (θ )) 2 ∑ / n)
Ejemplo:
~ d ~
Si: n (θ −θ ) → N (0, ∑) , donde θ es un escalar, ¿cuál es la distribución aproximada de
~ α
θ ?
~
En este caso g (θ ) = θ
~α
Entonces se cumple:
~ α α d ⎛ ⎛ α −1 ⎞2 ⎞
n ( θ -- θ ) → N ⎜⎜ 0, ⎜ αθ ⎟ Σ ⎟⎟
⎝ ⎝ ⎠ ⎠
Por lo tanto:
~ α a ⎛ α ⎛ α −1 ⎞2 Σ ⎞
θ → N ⎜⎜ θ , ⎜ αθ ⎟ ⎟⎟
⎝ ⎝ ⎠ n⎠
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
182
~
La distribución asintótica de una función no lineal de un vector θ se obtiene en forma
~ ~
análoga. Si c( θ ) es un escalar que depende no linealmente de un vector θ de varios
elementos:
a
c(~
, ,
θ ) → N (c( θ), (C (θ) ∑ / n(C (θ))' )
∂c(θ)
C’ es ,
. Como la derivada vectorial es respecto al transpuesto de θ, se trata de un
∂θ
vector fila que contiene las derivadas respecto a cada elemento de θ. Nótese que el signo '
indica derivada cuando va antes del paréntesis (θ) e indica vector transpuesto cuando va
después.
Ejemplo:
~ ⎡ β1 ⎤
Si c(θ ) = ⎢ ⎥
⎣ 1 − β2⎦
⎛ 1 β1 ⎞⎟
C’= ⎜ −
⎜1− β
⎝ 2 (1 − β2 )2 ⎟⎠
Σ/n es la matriz de varianza covarianza asintótica de los distintos elementos de θ .
~
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
183
Por definición:
Si hay independencia:
βˆ = β + (X' X) −1 X' u
E(Y) = Ex(E(Y|X))
Descomposición de varianza:
En el caso de MICO:
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
184
β̂ = β + (X’X)-1X’u
E β̂ = Ex(E( β̂ |X))
= Ex(E(β + (X’X)-1X’u|X))
= β + Ex(E(X’X)-1X’u |X))
= β + Ex((X’X)-1X’E(u|X))
Si E(u|X) = 0
E β̂ = β + Ex((X’X)-1X’E(u|X)) = 0
Para la varianza:
Var (Y) = Varx(E(Y|X)) + Ex(Var(Y|X))
Esto es lo que ocurre cuando se estima un modelo con rezagos de la variable dependiente
(Yt-j dentro de las explicativas) pero con errores bien comportados.
En este caso se puede usar MICO, pero se obtienen estimadores sesgados porque no hay
total independencia (contemporánea y no contemporánea) entre una variable explicativa y
el error. Los estimadores, sin embargo, son consistentes porque no hay relación
contemporánea entre el término estocástico y alguna de las variables explicativas.
O sea:
cov(Yt-j,ut) = 0, j = 0, 1,2,..
pero:
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
185
Por lo tanto:
Si bien los estimadores son sesgados, ellos son consistentes. Para demostrar esto
necesitamos el siguiente teorema:
Teorema de Mann-Wald
Si:
i) E(u) = 0,
⎛ X' X ⎞
iv) plim ⎜ ⎟ = ∑ xx < ∞
⎝ n ⎠
Entonces:
⎛ X' u ⎞
a) plim ⎜ ⎟=0
⎝ n ⎠
X' u d
b) → N(0, σ 2 ∑ xx )
n
donde:
Σxx = plim(X’X/n)
Apliquemos la primera parte de este teorema, expresando primero a los MICO en una forma
adecuada para sacar plim:
−1
−1 ⎛ X' X ⎞ ⎛ X' u ⎞
β̂ = β + (X' X) X' u = β + ⎜ ⎟ ⎜ ⎟
⎝ n ⎠ ⎝ n ⎠
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
186
= β + (∑ XX ) 0 = β
−1
Respecto a la distribución:
d
ZY → (plimZ) f (Y)
El estimador MICO:
−1
⎛ X' X ⎞ ⎛ X' u ⎞
β̂ = β + ⎜ ⎟ ⎜ ⎟
⎝ n ⎠ ⎝ n ⎠
−1
⎛ X' X ⎞ ⎛ X' u ⎞
n (βˆ − β) = n ⎜ ⎟ ⎜ ⎟
⎝ n ⎠ ⎝ n ⎠
−1
⎛ X' X ⎞ ⎛ X' u ⎞
n (βˆ − β) = ⎜ ⎟ ⎜ ⎟
⎝ n ⎠ ⎝ n ⎠
Aplicando Mann-Wald (b) y el teorema para la distribución del producto de dos variables
sobre las cuales conocemos el plim de una de ellas:
d
n (β̂ − β) → (∑ xx ) −1 N(0, σ 2 ∑ xx ) = N ⎡0, σ 2 ∑
⎢⎣
(
xx
−1 ⎤
⎥⎦
)
2 (∑ XX )
a ⎛ −1
⎞
β̂ → N ⎜⎜ β; σ ⎟
⎟
⎝ n ⎠
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.
187
= (X’X)-1
n
⎛ X' u ⎞
En este caso plim ⎜ ⎟ ≠ 0 y los MICO en ese caso serían son inconsistentes. Esto es lo
⎝ n ⎠
que sucede, por ejemplo, cuando hay rezagos de Yt dentro de las variables explicativas y al
mismo tiempo hay un proceso AR(1) para los errores. Una de las formas de eobtener
estimadores consistentes es a través del uso de variables instrumentales, que veremos mas
adelante.
Nota: Apuntes de clases, sujetos a revisión, para uso exclusivo de los alumnos del curso de Teoría
Econométrica del Instituto de Economía de la Pontificia Universidad Católica de Chile, dictado por Juan
Eduardo Coeymans.