Está en la página 1de 26

Doctorado en Ciencias Económicas

Econometría: Autocorrelación
Geovanny Castro Aristizabal
Doctor en Economía
e-mail: gcastro@javerianacali.edu.co

Santiago de Cali
La Autocorrelación

En Síntesis…
 La autocorrelación corresponde a la violación del supuesto 5
del MCRL, los errores están correlacionados.
 Se da gracias a las expectativas adaptativas, la información
no disponible instantáneamente, sesgo en la especificación
del modelo.
 Bajo este problema si bien los estimadores MCO siguen
siendo insesgados ya no son eficientes (no son MELI). Los
intervalos de confianza son incorrectos.
 Las pruebas más utilizadas para su detección son Durbin-
Watson (1951) y Breusch-Godfrey (1978).
 Para su corrección se usa el MCG (r conocida) y el PF.
Endogeneidad y la FPE, América Latina PISA 2012.

El modelo clásico regresión lineal

El modelo múltiple:

𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1𝑖 + 𝛽2 𝑥2𝑖 … . + 𝛽𝑘 𝑥𝑖𝑘 + 𝜀𝑖 → 𝑦𝑖 = 𝛽0 + σ𝑘𝑗=1 𝛽𝑗 𝑥𝑗𝑖 + 𝜀𝑖

Donde yi var. independiente, xik var. independientes y ei error.

Supuestos
1. Linealidad en parámetros. 6. Número obs. mayor a 𝛽෡𝑗 .
2. Las xik son fijas o no aleatorias. 7. La var(X) = s2X
3. El valor medio de ei es cero: E(ei /x)=0 8. Independencia lineal entre las x .
ik
4. Homoscedasticidad: var(ei) = s2 9. Correcta especificación del modelo.
5. No autocorrelación: cov(ei, ej) = 0 10. cov(xik , ei,) = 0
Endogeneidad y la FPE, América Latina PISA 2012.

El modelo clásico regresión lineal


Teorema Gauss-Markov:

Los matemáticos Gauss (alemán) y Markov (ruso)


demostraron que los estimadores MCO tienen la
menor varianza dentro de la familia de estimadores
lineales e insesgados, bajo los supuestos del
MCRL. Los 𝛽෡𝑗 son MELI: Johan Carl Friedrich
Gauss (1777-1855)

1. Lineales, es decir, su relación funcional con


respecto a Y es lineal.
2. Insesgados, el valor promedio (estimado) del
estimador MCO es igual al verdadero valor
poblacional.
3. Eficientes, por lo que poseen la menor varianza
Andréi Andréyevich
Márkov (1856-1922) entre todos los posibles estimadores.
Endogeneidad y la FPE, América Latina PISA 2012.

El modelo clásico regresión lineal

Problemas econométricos:

La violación de los supuestos del modelo, afecta los coeficientes


estimados y/o sus errores estándar.

Problema No se cumple el supuesto… Consecuencias


Los estimadores no son
Heteroscedasticidad # 4 , ∴ var(ei) = s2i
eficientes.
Coeficientes insesgados
Autocorrelación # 5 , ∴ cov(ei, ej) ≠ 0
pero no eficientes.
Grandes varianzas de los
Multicolineadidad # 8 , ∴ linealidad entre xij y xik
coeficientes estimados.
Coeficientes
Endogeneidad # 10 , ∴ cov(xik , ei,) ≠ 0
inconsistentes y sesgados
Endogeneidad y la FPE, América Latina PISA 2012.

Problema edogeneidad

Qué es ?

Cuando una variable independiente no se encuentra relacionada


con el error del modelo, se dice que xij es exógena. En caso
contrario, xij se define como endógena (Wooldrige, 2010).

Qué la causa ?

1. Los errores de medición.


2. Doble causalidad: xij causa a y , al tiempo que y causa a xij
3. Variables omitidas en el modelo.
Endogeneidad y la FPE, América Latina PISA 2012.

Método de estimación

Bajo este problema, los métodos de Mínimos Cuadrados


Ordinarios y las técnicas multinivel (Modelos Jerárquicos) no son
convenientes, ya que los coeficientes estimados resultantes serán
inconsistentes y sesgados. Se recomienda aplicar el método de
Variables Instrumentales -VI- (Green, 2012).

Variables Instrumentales:

Técnica desarrollada por primera vez por el


economista norteamericano Phillip G.
Wright (18961-1934), en coautoría con su
hijo Sewall Wright (genetista): The Tariff on
Animal and Vegetable Oils (1928).
Sewall Wright
(1889-1998)
Endogeneidad y la FPE, América Latina PISA 2012.

Variables Instrumentales
La idea central de dicho método es la siguiente:

Dado Y = Xb + e , es posible existan k variables contenidas en X,


tales que la cov(X,e) ≠ 0. Supóngase un conjunto de variables l en
Z, donde l > k , la cov(Z,X) ≠ 0 pero con cov(Z,e) = 0. De esta
manera, Z se define como un conjunto de variables
instrumentales para las k variables contenidas en X.
k = 1, x1k ∈ 𝑿
∴ cov(X , ei) ≠ 0
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥1𝑖 + 𝛽2 𝑥2𝑖 … . + 𝛽𝑘 𝑥𝑖𝑘 + 𝜀𝑖

cov(Z , ei) = 0

l = 2, ki1 y ki2 ∈ 𝒁
∴ cov(Z , x1k ) ≠ 0
Endogeneidad y la FPE, América Latina PISA 2012.

Variables Instrumentales (2)


Para obtener los estimadores bajo la cov(X, ei,) ≠ 0. Como la
cov(Z, ei,) = 0 equivale a E(Z e) = 0, y teniendo en cuenta que
𝑌 = 𝑋𝛽 + 𝜀 → 𝜀 = 𝑌 − 𝑋𝛽
entonces:
𝐸 𝑍 𝜀 = 0 → 𝐸 𝑍 𝑌 − 𝑋𝛽 = 𝐸 𝑍𝑌 − 𝑍𝑋𝛽 = 𝐸 𝑍𝑌 − 𝐸 𝑍𝑋 𝛽 = 0

→ 𝐸 𝑍𝑋 𝛽 = 𝐸 𝑍𝑌 → 𝛽 = 𝐸 𝑍𝑋 −1 𝐸 𝑍𝑌

∴ 𝛽መ𝑉𝐼 = 𝑍 ′ 𝑋 −1 𝑍′𝑌 Estimadores de b insesgados y consistentes.

Los coeficientes estimados serán insesgados y consistentes, tanto


si la cov(X, ei,) ≠ 0 como si cov(X, ei,) = 0. Pero si se tiene el
segundo caso, lo adecuado es usar el método de MCO (Wooldrige,
2010).
Endogeneidad y la FPE, América Latina PISA 2012.

Variables Instrumentales (3)


Enfoques:

1. Mínimo Cuadrado en Dos Etapas.


2. Método Generalizado de Momentos.
3. Máxima Verosimilitud Información Limitada.
James Durbin
(1923-2012)
Tests para detección:

a. J. Durbin, estadístico británico (1954).


b. De-Min Wu (1973)
c. J. A. Hausmann, econometrista E.E.U. (1978)
Jerry A. Hausman
Ho: cov(X , ei) = 0. Todas las X son estadísticamente exógenas. (1946 - )

HA: No Ho
Endogeneidad y la FPE, América Latina PISA 2012.

Variables Instrumentales (4)


Tests para instrumentos:

a. J. D. Sargan, econometrista británico (1958).


b. R. L. Basmann (1960).
c. L. P. Hansen, economista E.E.U. (1982).
Lars Peter Hansen
(1952 - )

Ho: cov(X , ei) = 0. Todas las X son estadísticamente


exógenas.
HA: No Ho

John Denis Sargan


(1924 -1996 )
Endogeneidad y la FPE, América Latina PISA 2012.

Variables Instrumentales (5)


Desventajas:

 Los coeficientes, en ocasiones, son más “grandes” a los de


MCO.
 Las varianzas de los coeficientes son mayores a los de MCO.
Aunque dentro de los estimadores VI poseen la menor.
 El R2 en este contexto, no corresponde a la proporción
explicada por el modelo, como en MCO. En algunos casos el
R2 es negativo.
 Los test para la detección deben aplicarse a cada variable
independiente del modelo.
 Los instrumentos empleados, se dejan a “juicio” del
investigador. Hay que contar con un amplio conjunto de
variables en la base de datos.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa:

Tiene las mismas características que una función de producción


estándar. Relaciona, como output, el rendimiento académico
(puntaje) con una serie de características individuales, familiares y
escolares, como inputs.
𝑝 𝑝 𝑝 𝑝
𝑃𝑀𝑖𝑗 = 𝛽0 + σ𝑚 ℎ 𝑤
𝑖=1 𝛽𝑖 𝐶𝐸𝑖 + σ𝑖=𝑚+1 𝛽𝑖 𝐶𝐹𝑖 + σ𝑖=ℎ+1 𝛽𝑖 𝐹𝐸𝑖 + 𝜀𝑖
(1)
Habilidades innatas, capacidades de aprender

𝑝
𝑃𝑀𝑖𝑗 valor medio de los cinco valores plausibles, del estudiante i
en la competencia j, del país p. 𝜀𝑖 error del modelo. Por último, en
los tres sumatorios se incluyen los inputs acorde con lo
desarrollado por las investigaciones en economía de la educación
[vid. Castro, et al. (2014)].
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa (2):
𝑝 𝑝 𝑝 𝑝
𝑃𝑀𝑖𝑗 = 𝛽0 + σ𝑚 ℎ 𝑤
𝑖=1 𝛽𝑖 𝐶𝐸𝑖 + σ𝑖=𝑚+1 𝛽𝑖 𝐶𝐹𝑖 + σ𝑖=ℎ+1 𝛽𝑖 𝐹𝐸𝑖 + 𝜀𝑖
(1)
𝑝
En el modelo (1), 𝐶𝐸𝑖 reúne las características individuales del
estudiante i en el país p. Cada i-ésimo coeficiente, 𝛽𝑖 𝑐𝑜𝑛 𝑖 =
1, … 𝑚, mide el impacto de cada una de ellas sobre el rendimiento
𝑝
medio en cada una de las áreas. 𝐶𝐹𝑖 las características familiares
𝑝
y 𝐹𝐸𝑖 los factores de escuela. Cada coeficiente, 𝛽𝑖 𝑐𝑜𝑛 𝑖 = 𝑚 +
1, … ℎ y 𝛽𝑖 𝑐𝑜𝑛 𝑖 = ℎ + 1, … 𝑤 captura el efecto de las
características familiares y de escuela sobre el rendimiento escolar
respectivamente.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa (3):

cov(norepetidori , ei) ≠ 0

𝑝 𝑝 𝑝 𝑝
𝑃𝑀𝑖𝑗 = 𝛽0 + σ𝑚 ℎ 𝑤
𝑖=1 𝛽𝑖 𝐶𝐸𝑖 + σ𝑖=𝑚+1 𝛽𝑖 𝐶𝐹𝑖 + σ𝑖=ℎ+1 𝛽𝑖 𝐹𝐸𝑖 + 𝜀𝑖
(1)

No repetir curso (norepetidor) asociado con:


Estas variables no
motivación del estudiante (motivacion), los minutos
están correladas con el
promedio duración de las clases, las horas de clases de
error ( ∴ instrumentos
refuerzo que toma por fuera del colegio y si el
de norepetidor).
estudiante hizo preescolar. (prescolar).
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa (4):

Tabla 1: Detección de endogeneidad en la FPE.


Test endogeneidad Argentina Brasil Chile Colombia Costa Rica México Perú Uruguay

Ho: inputs exógenos

MGM C statistic chi2 72,175 82,762 60,005 8,721 27,398 290,462 56,215 9,721
[Lectura] (0,000) (0,000) (0,000) (0,000) (0,000) (0,000) (0,000) (0,002)

MGM C statistic chi2 71,061 5,586 26,886 8,311 7,973 353,245 90,597 11,175
[Matemáticas] (0,000) (0,018) (0,000) (0,004) (0,005) (0,000) (0,000) (0,001)

MGM C statistic chi2 104,694 89,051 40,532 22,027 26,249 294,152 54,181 3,218
[Ciencias] (0,000) (0,000) (0,000) (0,000) (0,000) (0,000) (0,000) (0,073)
Nota: Imputación de los datos missing a través de la metodología hot-deck. p-valor entre paréntesis.
Fuente: Cálculos propios con base en PISA 2012, OCDE.

En las tres competencias y en los ocho países, el p-valor ≤ 10%. Por tanto,
no hay evidencia estadística para aceptar Ho. Hay endogeneidad en la FPE.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa (5):

Tabla 2: Validación instrumentos empleados en la FPE.


Test instrumentos Argentina Brasil Chile Colombia Costa Rica México Perú Uruguay

Ho: inputs exógenos

Hansen's J chi2 3,915 0,357 3,361 1,419 0,993 0,504 1,220 0,022
[Lectura] (0,141) (0,550) (0,186) (0,492) (0,609) (0,478) (0,269) (0,882)
Hansen's J chi2 5,337 3,484 2,000 0,590 7,554 0,708 0,374 0,016
[Matemáticas] (0,069) (0,062) (0,157) (0,745) (0,023) (0,400) (0,541) (0,899)
Hansen's J chi2 2,311 2,291 3,753 1,188 4,312 0,545 1,058 1,667
[Ciencias] (0,317) (0,130) (0,053) (0,552) (0,116) (0,460) (0,304) (0,197)
Variable intrumentalizada: norepitente. Instrumentos incluidos: sexo esfuerzo disciplina libros educamadre educapadre emppadre
publico STRATIO SCMATEDU autonomia SCHSIZE. Instrumentos excluidos: motivacion, minulec, clasesp y prescolar.

Nota: Imputación de los datos missing a través de la metodología hot-deck. p-valor entre paréntesis.
Fuente: Cálculos propios con base en PISA 2012, OCDE.

p-valor ≥ 1%, por tanto, los instrumentos son los adecuados.


Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa (6):

Tabla 3: Condicionantes adquisición competencias. Matemáticas


Var.ind. ↓ Argentina Brasil Chile Colombia Costa Rica México Perú Uruguay
constante 243,70 375,54 294,16 349,90 374,86 229,23 273,57 357,42
Características individuales

(20,223)* (11,971)* (17,557)* (22,527)* (12,773)* (14,124)* (16,109)* (9,347)*


norepitente 221,31 101,05 161,01 121,02 88,22 239,09 193,38 130,63
(32,461)* (21,946)* (24,873)* (31,947)* (15,222)* (16,106)* (23,282)* (17,966)*
sexo -38,68 -27,01 -34,91 -38,63 -30,27 -33,31 -36,06 -23,21
(4,589)* (2,801)* (2,793)* (4,111)* (2,441)* (1,993)* (2,972)* (2,489)*
esfuerzo 10,84 6,12 7,75 6,52 5,37 9,33 3,98 9,45
(3,665)* (2,009)* (2,439)* (2,525)* (1,947)* (1,789)* (3,155) (2,284)*
disciplina -6,95 3,78 2,28 7,53 2,75 6,24 -2,31 6,68
(5,640) (1,983)** (2,936) (3,028)** (2,489) (2,051)* (3,668) (2,839)**
Observaciones 5.632 16.968 5.898 8.059 4.281 29.614 5.442 4.754
motivacion motivacion motivacion motivacion
motivacion motivacion motivacion motivacion
Instrumentos minumat minumat minumat minumat
minumat prescolar minumat minumat
clasmat clasmat clasmat clasmat
Nota: Nota: * sig. 1%, ** sig. 5%, *** sig. 10%. Desviaciones estándar robustas entre paréntesis. Imputación de los
datos missing a través de la metodología hot-deck..
Fuente: Cálculos propios con base en PISA 2012, OCDE.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa (7):

Tabla 3: Condicionantes adquisición competencias. Matemáticas


(continuación)
Var.ind. ↓ Argentina Brasil Chile Colombia Costa Rica México Perú Uruguay
libros 9,70 10,84 34,63 21,61 24,72 16,12 27,43 23,12
Características familiares

(5,078)*** (2,832)* (2,851)* (4,342)* (3,833)* (2,740)* (4,405)* (3,062)*

educamadre 8,06 10,74 11,30 10,09 0,96 -1,17 4,83 1,41

(3,614)** (1,774)* (3,441)* (3,404)* (0,261)* (1,876) (3,511) (0,479)*

educapadre 1,95 6,66 20,49 9,00 0,42 6,69 3,04 -2,13

(3,475) (1,666)* (2,833)* (2,576)* (1,972) (1,814)* (3,711) (2,192)


emppadre 8,91 -0,04 -6,03 0,54 -1,37 0,65 -0,98 5,34

(5,418) (1,754) (3,930) (3,538) (2,797) (2,307) (3,607) (3,145)***


Observaciones 5.632 16.968 5.898 8.059 4.281 29.614 5.442 4.754
motivacion motivacion motivacion motivacion
motivacion motivacion motivacion motivacion
Instrumentos minumat minumat minumat minumat
minumat prescolar minumat minumat
clasmat clasmat clasmat clasmat
Nota: Nota: * sig. 1%, ** sig. 5%, *** sig. 10%. Desviaciones estándar robustas entre paréntesis. Imputación de los
datos missing a través de la metodología hot-deck..
Fuente: Cálculos propios con base en PISA 2012, OCDE.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Función de Producción Educativa (8):

Tabla 3: Condicionantes adquisición competencias. Matemáticas


(continuación)
Var.ind. ↓ Argentina Brasil Chile Colombia Costa Rica México Perú Uruguay
publico -8,66 -51,66 -8,80 -24,03 -28,04 -0,35 -25,88 -30,01
Características escolares

(8,046) (3,956)* (4,092)** (4,557)* (4,200)* (3,257) (5,435)* (6,686)*


STRATIO -0,10 -0,45 -0,76 -0,59 0,17 -0,10 -0,11 -0,64
(0,107) (0,046)* (0,163)* (0,127)* (0,044)* (0,017)* (0,205) (0,170)*
SCMATEDU -7,88 3,61 1,37 3,30 6,64 1,47 9,15 7,13
(2,628)* (0,956)* (1,300) (1,403)** (1,142)* (0,910) (1,229)* (1,287)*
autonomia 22,47 2,70 14,19 -4,29 -1,36 5,55 -6,39 -5,18
(7,158)* (3,432) (4,897)* (3,456) (9,592) (3,227)*** (11,135) (3,778)
SCHSIZE -0,02 0,01 0,01 0,01 0,01 0,00 0,01 0,00
(0,008)** (0,002)* (0,003)* (0,001)* (0,002)* (0,001) (0,003)* (0,003)
Observaciones 5.632 16.968 5.898 8.059 4.281 29.614 5.442 4.754
motivacion motivacion motivacion motivacion
motivacion motivacion motivacion motivacion
Instrumentos minumat minumat minumat minumat
minumat prescolar minumat minumat
clasmat clasmat clasmat clasmat
Nota: Nota: * sig. 1%, ** sig. 5%, *** sig. 10%. Desviaciones estándar robustas entre paréntesis. Imputación de los
datos missing a través de la metodología hot-deck..
Fuente: Cálculos propios con base en PISA 2012, OCDE.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Estimaciones en STATA

El comando para las estimaciones a través de variables


instrumentales es el ivregress.
Sintaxis:
ivregress estimator depvar [varlist1] (varlist2 = varlist_iv) [if] [in] [weight] [,options]

estimator → corresponde al enfoque a emplear: 2sls gmm liml


depvar [varlist1] → listado de var.: dependiente y las exógenas.
(varlist2 = varlist_iv) → var. endógenas e instrumentos.
[if] [in] [weight] → condicionales (si por país) y pesos en la muestra.
[,options] → otras opciones, por ejemplo desviaciones robustas.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Estimaciones en STATA (2)

Para la FPE estimada aquí


ivregress gmm mediamat sexo esfuerzo disciplina muchoslibros
educamadre educapadre emppadre publico STRATIO
SCMATEDU autonomia SCHSIZE (norepitente = motivacion
minumat clasmat) [aw=W_FSTUWT] if NC== 17000,
vce(robust)

Post estimación:

estat endog, forceweights → para detectar el problema.


estat overid, forceweights → para validar instrumentos.
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Estimaciones en STATA (3)
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Estimaciones en STATA (4)

Comando endogeneidad

postestimación
Endogeneidad y la FPE, América Latina PISA 2012.

Aplicación empírica
Estimaciones en STATA (5)

Comando instrumentos

postestimación
Muchas gracias !

Inquietudes, comentarios y/sugerencias:

e-mail: gcastro@javerianacali.edu.co

Santiago de Cali, Julio de 2017

También podría gustarte