Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Material Teoria1 2011-12
Material Teoria1 2011-12
Econometría
Curso 2011-2012. Primera parte
Esquemas de teoría
Profesores:
Jesús Cavero Álvarez
Helena Corrales Herrero
Yolanda González González
Carmen Lorenzo Lago
Mercedes Prieto Alaiz
Pilar Zarzosa Espina
Material Docente de Econometría
Primera parte
Curso 2011-2012
Introducción............................................................................................... 1
Tema 1.- El modelo de regresión lineal clásico I ..................................... 5
Tema 2.- El modelo de regresión lineal clásico II ................................... 17
Tema 3.- Predicción .................................................................................. 21
Tema 4.- Variables ficticias ...................................................................... 25
Tema 5.- Errores de especificación ........................................................... 31
Tema 6.- Multicolinealidad ..................................................................... 41
Anexo ........................................................................................................ 47
Econometría Curso 2011-2012
INTRODUCCIÓN
Concepto de Econometría
1
Econometría Curso 2011-2012
2
Econometría Curso 2011-2012
3er criterio: atendiendo al periodo de tiempo al que estén referidas las variables
• Modelos estáticos: están especificados para un momento de tiempo determinado.
Ejemplo: Ct = α + βRt+ εt
• Modelos dinámicos: en ellos aparece alguna variable retardada. Ejemplo: Ct =
β0 + β1Rt + β2Ct-1 + εt
Para que el modelo econométrico sea operativo necesitamos conocer los valores
numéricos de sus parámetros y para ello hemos de disponer de un conjunto de datos sobre
las variables.
Los datos pueden ser de tres tipos: datos temporales, datos de corte transversal y
datos de panel.
• Datos temporales o series temporales: son observaciones de una variable, para
una unidad económica a lo largo del tiempo. Ejemplos: datos de la Contabilidad
Nacional, indicadores de coyuntura mensuales o trimestrales, ventas de una
empresa a lo largo del tiempo, etc.
• Datos atemporales o de corte transversal: son observaciones de una variable,
para distintas unidades económicas en un momento de tiempo dado. Ejemplo:
Encuesta de Presupuestos Familiares (INE) en el período 90-91, en la que se ha
entrevistado a más de 20.000 familias.
• Datos de panel: son observaciones de una variable para distintas unidades
económicas a lo largo del tiempo, es decir, es la combinación de datos
temporales y de corte transversal.
3
Econometría Curso 2011-2012
4
Econometría Curso 2011-2012
Yi = X i' β + ε i
• Forma matricial: Y = Xβ + ε
Y1 1 X 11 . . X k1 ε1
Y2 1 X 12 . . X k2 ε2
Donde:Y= . , X= . . . . . , ε = .
. . . . . . .
Y 1 X . . X kN ε
N 1N N
Hipótesis Clásicas:
• Linealidad en los parámetros
• ε → N (0, σ 2 I ) o Y → N (Xβ , σ 2 I ) por tanto ε o Y son variables iid
• X no aleatoria
• rg(X) = k+1 < N
e' e = Y ' Y − Y ' Xβˆ − βˆ ' X ' Y + βˆ ' X ' Xβˆ = Y ' Y − 2Y ' Xβˆ + βˆ ' X ' Xβˆ
• Condiciones de mínimo:
∂e' e
1ª Condición : =0
∂βˆ
∂ 2 e' e
2ª Condición : sea definida positiva
∂βˆ ∂βˆ '
• Obtención del estimador MCO:
∂e' e
= −2 X ' Y + 2 X ' Xβˆ = 0 ⇒ X ' Xβˆ = X ' Y Sistema de ecuaciones normales
∂β
ˆ
5
Econometría Curso 2011-2012
∂ 2 e' e
= 2 X ' X matriz definida positiva
∂βˆ ∂βˆ '
• Finitas
- Lineal en Y y en ε : por ser X no aleatoria
- ()
Insesgado: E βˆ = β por ser X no aleatoria y E (ε ) = 0
()
E βˆ = β + ( X ' X ) X ' E (ε )
−1
( )( '
( )) '
∑ βˆβˆ = E βˆ − E ( βˆ ) βˆ − E βˆ = E βˆ − β βˆ − β =( )( )
= E(X ' X ) X 'ε ε ' X (X ' X ) =σ 2 (X ' X )
−1 −1 −1
( )
−1
X ' X
- Asintóticamente normal : N β −β
ˆ a
→ N 0,σ lim N →∞
2
N
- Asintóticamente eficiente : La varianza asintótica alcanza la cota de Cramer-Rao.
6
Econometría Curso 2011-2012
−1
S ˆ ˆ = S 2 (X ' X )
ββ
−1
- Insesgado : E S ˆ ˆ = E S 2 ( X ' X ) = ∑ βˆβˆ
ββ
• Poblacionales: e=Mε
Ya que: e = Y − Yˆ = Y − Xβˆ = MY = Mε
Yˆ = Xβ̂
−1
M = I − X ( X ' X ) X ' matriz no aleatoria, simétrica e idempotente
- E(e)=0
∑ee' = Eee' = E (Mεε ' M ') = σ M ≠ σ I
2 2
- si N→∞ M→I
- E ( X ' e) = 0
- (
e → N 0 ,σ 2 M )
• Muestrales:
- X 'e = 0 ⇒
( )
X ′ Y − Yˆ = X ' Y − X ' Yˆ ⇒ Y = Yˆ si XNx(k+1)
N
∑e = 0 ⇒ e=0 si XNx(k+1)
i =1 i
∑ X ji ei = 0 ∀ j = 1....k ⇒ cov(e, Xj)=0 ⇒ rex j = 0
7
Econometría Curso 2011-2012
(
∑ Yi − Y ) 2
= ∑ Yi 2 − N Y
2
( )(
∑ Yi = Y ' Y = Yˆ + e ' Yˆ + e = Yˆ ' Yˆ + e' e
2
)
2
Restando a ambos lados : N Y
(
∑ Yi − Y )
2
( )
2
= ∑ Yˆi − Yˆ + ∑ ei − e ( )
2
si Y = Yˆ
SCT=SCE+SCR
Coeficientes de determinación R2 y de determinación ajustado
SCR SCE
R2 = 1− = 0 ≤ R 2 ≤1
SCT SCT
2 SCR / N − k − 1
R = 1−
SCT / N − 1
Condiciones de máximo:
1ª condición: Se igualan a cero las primeras derivadas
•
∂ ln L
∂β
=−
1
(− 2 X 'Y + 2 X ' Xβˆ ) = 0 ⇒ X ' Y = X ' Xβ̂ MV
2σˆ 2
MV
MV
8
Econometría Curso 2011-2012
⇒ σˆ MV
2
= e' e
N
ln L β , σ 2 = − N ln (2π ) − N ln σˆ 2 − 1
2 2
(Y − Xβˆ )(' Y − Xβˆ )
2σˆ 2
MV MV MV
MV
ln L β , σ 2 = − N ln (2π ) − N ln
∑ ei2 − N
2 2 N 2
No está acotado y está influido por el número de variables explicativas que introduzcamos
en el modelo.
2) Criterio de Akaike AIC y Criterio de información bayesiano de Schwartz SBIC
−2 2(k + 1)
AIC = ln L +
N N
−2 (k + 1) ln N
SBIC = ln L +
N N
Cuanto menor sean estos estadísticos mejor será la estimación del modelo.
9
Econometría Curso 2011-2012
En el primer modelo, β1 mide en cuánto varía la variable endógena cuando varía X1 en una
unidad, manteniendo constante el resto de las variables. En el segundo modelo, β1* mide en
cuánto varía la variable endógena cuando varía X1 en una unidad
La información que proporciona un regresor, por ejemplo X1, sobre la variable endógena
puede ser parecida a la que tienen el resto de las variables. De hecho, la información de X1
puede ser genuina de la propia variable o compartida con el resto de las variables
explicativas. Cuando estimamos por mínimos cuadrados ordinarios un modelo de regresión
simple el estimador asociado a X1 solamente recoge el efecto de la información propia de
X1, ya que no están incluidos otros regresores. La importancia de la regresión múltiple es
que el estimador por mínimos cuadrados ordinarios asociado a X1 es capaz de medir el
efecto de X1 una vez descontada la información que comparte con el resto de los
regresores.
Existen dos casos especiales en los que el coeficiente estimado por MCO asociado a X1
será el mismo en la regresión simple que en la regresión conjunta.
1) Cuando no exista información compartida (regresores ortogonales)
2) Cuando los coeficientes asociados al resto de los regresores sean cero.
10
Econometría Curso 2011-2012
11
Econometría Curso 2011-2012
βˆ MCO
*
= ( X *' X * ) −1 X *' Y tiene buenas propiedades y no hay ningún problema por lo que
respecta a las propiedades de los estimadores, pero se dejan de cumplir algunas
características que se daban en el modelo con término constante.
e' e
S ˆ ˆ = S2( X *' X * )-1 donde S 2 =
ββ N −k
−1
N 2 N N
N
∑ X 1i ∑ X 1i X 2i L ∑ X 1i X ki ∑ X 1i Yi
β 1
ˆ*
N i =1 i =1 i =1 iN=1
X X L ∑ X 2i X ki X Y βˆ *
N N
βˆ MCO
*
=∑i =1
2i 1i ∑ X 22i
i =1 i =1
∑i =1
2i i =
2
M M M M M M
N N N N βˆ *
∑ X ki X 1i ∑ X ki X 2i L ∑ ki X 2
∑ X ki Yi k
i =1 i =1 i =1 i =1
Particularidades de estos modelos:
1) Los estimadores obtenidos con datos centrados no coinciden con los obtenidos con
datos sin centrar ya que si trabajamos con datos centrados en un modelo sin término
constante obtenemos los mismos estimadores que si trabajásemos con datos centrados en el
modelo con término constante. Lo más correcto en estos modelos es trabajar con datos sin
centrar.
3) Aunque se sigue cumpliendo que los regresores son ortogonales a los residuos X *' e = 0,
ya no se cumple que los errores estén linealmente incorrelacionados porque no se cumple
que ∑ ei = 0 .
4) No se cumple la descomposición de la varianza y por lo tanto el R2 no tiene sentido
porque nunca estaría acotado SCT ≠ SCR+SCE
Sí se sigue cumpliendo Y’Y = Ŷ ’ Ŷ + e’e
12
Econometría Curso 2011-2012
e' e Ŷ ' Ŷ
En este caso lo único que se puede hacer es definir un R*2 como: R*2 = 1 − = que
Y' Y Y' Y
sí estará acotado, pero que en realidad no medirá la variabilidad de Y porque Y’Y no es la
SCT, simplemente nos dará una idea de como ha sido el ajuste. El R2 de un modelo con
término constante y el R*2 del modelo sin término constante no son comparables.
En ocasiones nos interesa cambiar las unidades de una, varias o todas las variables del
modelo para hacer sus valores numéricos comparables con las demás variables o para que
su manejo sea menos engorroso.
Otras veces necesitamos hacer un cambio de origen en los valores de las variables.
Analizaremos, a continuación, los efectos que, sobre la estimación de un modelo, generan
esos cambios.
Cambio de escala
Sea el modelo: Yi = β0 +β1X1i +β2X2i +β3X3i +…..+βkXki +εi con i=1,2,3,....N
Supongamos que hacemos un cambio de escala en todas las variables pasando a tener:
Yi ' = aYi
X 1'i = a1 X 1i
................
X ki' = a k X ki
Ahora el modelo será: Yi' = β 0' + β1' X 1' i + ... + β k' X ki' + ε i
β 0' a1 a ε
Yi = + β1' X 1i + ... + β k' k X ki + i
a a a a
εi
donde cumple las hipótesis clásicas.
a
β 0'
Luego β o = ⇒ β 0' = aβ 0
a
β 1' a1 a
β1 = ⇒ β 1' = β1
a a1
.........................................
β k' a k a
βk = ⇒ β 1' = βk
a ak
Estos son los cambios que experimentan los coeficientes cuando hacemos un cambio de
escala en todas las variables.
Por lo tanto:
13
Econometría Curso 2011-2012
S β2ˆ** = a 2 S β2ˆ
0 0
Cambio de origen
Sea el modelo: Yi = β0 +β1X1i +β2X2i +β3X3i +…..+βKXKi +εi con i=1,2,3,....N
Supongamos que hacemos un cambio de origen en todas las variables pasando a tener:
Yi ' = Yi + a
X 1'i = X 1i + a1
................
X ki' = X ki + a k
Ahora el modelo será: Yi' = β 0' + β1' X 1' i + ... + β k' X ki' + ε i
β 1' = β 1
...................
β k' = β k
β 0 = − a + β 0' + β 1' a1 + ... + β k' a k ⇒ β 0 = − a + β 0' + β 1 a1 + ... + β k a k ⇒
β 0' = β 0 + a − β 1 a1 − ... − β k a k
Luego los cambios de origen en alguna o en todas las variables del modelo sólo afectan al
término independiente.
El único resultado que también cambia es la varianza estimada de β̂ 0 .
14
Econometría Curso 2011-2012
Los parámetros estimados de un modelo lineal son valores absolutos y dependen de las
unidades de medida en las que se expresen las variables del modelo.
Una variable no es más importante que otra por tener un parámetro mayor. Esto ocurre
cuando, siendo ambos parámetros significativos, ambas variables están medidas en las
mismas unidades.
Una solución a este problema es calcular unos coeficientes estandarizados o coeficientes
beta a partir de la normalización de las variables (restarles su media y dividirles por su
desviación típica)
Yi − Y X − X1 X − Xk
= β 1* 1i + ... + β k* ki + ui
SY S X1 S Xk
donde la relación entre los coeficientes beta y los coeficientes estimados originales es:
SXj
βˆ *j = βˆ j .
SY
1
Pulido (2001): Modelos econométricos. Pirámide.
15
Econometría Curso 2011-2012
16
Econometría Curso 2011-2012
Hipótesis a contrastar:
H o : Rβ = r
H 1 : Rβ ≠ r
Rβˆ → (
N Rβ , σ 2 R ( X ' X ) R '
−1
)
A partir de aquí, se demuestra que, si la hipótesis nula es cierta:
e' r e r − e ' e
→ FNH−k −1
S2 H
Donde er = Y − Xβˆr
Ho : β j = 0
H1 : β j ≠ 0
βˆ j
→
Ho
t N − k −1
S βˆ
j
17
Econometría Curso 2011-2012
β1 0
⋅ ⋅
Ho : =
⋅ ⋅
β 0
k
H1 : ≠
SCE R 2 ( N − k − 1)
→
Ho
FNk − k −1 →
Ho
FNk − k −1
S2 k
o bien
(1− R2 k)
Sea la restricción lineal sobre los parámetros: Rβ=r. Intentaremos encontrar el estimador
del vector paramétrico β que satisfaga la restricción. En definitiva, vamos a elegir β̂ r de
forma que minimice
Para obtener dicho estimador restringido habría que formar la función lagrangiana. El
proceso de minimización da como resultado el estimador restringido siguiente:
[ ]
βˆ r = βˆ + ( X ' X ) −1 R ' R ( X ' X ) −1 R '
−1
(r − Rβˆ )
Ejemplo:
Yt = β 0 + β1 X 1t + β 2 X 2 t + ε t
18
Econometría Curso 2011-2012
5,4118
β̂ = 0,4471 ;
- 0,2672
−1
326 − 94.5
[ −1
R ( X ' X ) R ' = ]
0.0235 0.0706
−1
=
0.0706 0.2435 − 94.5 31.5
5.4118
0.5 0 1 0 0.5 0.4471 0.0529
(r − Rβ ) = −
ˆ 0.4471 = − =
0 0 1 2 - 0.2672 0 − 0.0874 0.0874
19
Econometría Curso 2011-2012
5
β̂ r = 0.5
- 0.25
Los residuos restringidos se pueden obtener a partir del modelo original con los
estimadores restingidos o a través del modelo restringido:
Y Yˆ er Y* Yˆ * er
3 3,5=5+0.5*1-0.25*8 -0,5=3-3.5 4,5=3-0.5*1+0.25*8 5 -0,5
2 2,5=5+0.5*2-0.25*14 -0,5=2-2.5 4,5=2-0.5*2+0.25*14 5 -0,5
4 3,5 0,5 5,5 5 0,5
5 4,25 0,75 5,75 5 0,75
5 5,25 -0,25 4,75 5 -0,25
7 6 1 6 5 1
6 5,5 0,5 5,5 5 0,5
8 8,5 -0,5 4,5 5 -0,5
8 8,75 -0,75 4,25 5 -0,75
12 12,25 -0,25 4,75 5 -0,25
Las propiedades del estimador restringido dependen de si la restricción es cierta o no. Así,
el siguiente cuadro enumera las propiedades en ambos casos.
20
Econometría Curso 2011-2012
3.1.- Predicción
2) Conocer lo más exactamente posible los valores que tomarán las variables
explicativas en el período de predicción.
Punto de partida:
( ) ( ) ( ) (
Donde: E ε p = 0 , Var ε p = σ 2 , Cov ε jε p = E ε jε p = 0 ∀ j = 1....N )
Definimos:
Predictor: Yˆp = X ′p β̂ un estimador del valor a predecir.
Error de predicción: f diferencia entre el predictor y lo que queremos predecir.
f es una variable aleatoria con media cero E ( f ) = 0 y varianza: σ 2f = E ( f − E ( f ) )
2
S 2f = S 2 (1 + X 'p ( X ' X ) X p )
−1
21
Econometría Curso 2011-2012
f (
→ N 0 , σ 2f )
S2 χ N2 − k −1
→ N (0,1)
f
→
σf σ2 N − k −1
N (0,1)
como = t N − k −1
χ N2 − k −1
N − k −1
f
tenemos: → t N −k −1
Sf
donde :
f = Yˆp − Y p y S f = S 1 + X 'p ( X ' X )−1 X p
[
Por tanto, el I. C. de Yp vendrá dado por: Yˆp ± tα / 2 ⋅ S f ]
• Test de Hipótesis para la predicción de un valor individual:
H o : Y p = Y po
H1 : Y p ≠ Ypo
Ŷp - Ypo Ho
Si la Ho es cierta:
→ t N − k −1
Sf
22
Econometría Curso 2011-2012
n
∑ fj
j =1
• Error absoluto medio: EAM =
n
1 n fj
• Error absoluto medio del porcentaje de error: EAMP = ∑
n j =1 Y j
• Coeficiente de desigualdad de Theil:
∑ (Yˆ j − Y j ) / n
n 2
j =1
U = 0≤U≤1
n n
∑ Yˆ j / n + ∑ Y j / n
2 2
j =1 j =1
Todos los estadísticos descritos hasta ahora indican una mejor capacidad predictiva
del modelo cuanto más cercanos a cero sean, lo que permite comparar un determinado
modelo con otros alternativos.
1 n ˆ
∑ Y
n j =1 j
−Y =
j
2
(1
Yˆ −Y )
23
2
+ (1
S −S )
23
Yˆ Y
2
+ (
2 1 − rYˆ Y S Yˆ S Y
1442443
)
componente sesgo componente var ianza componente cov arianza
El cociente entre cada uno de los componentes en la suma total se denomina
proporción del sesgo, proporción de la varianza y proporción de la covarianza.
Cada una de estas proporciones varía entre cero y uno, siendo su suma la unidad
como es de esperar. Los dos primeros miden, respectivamente, las diferencias entre la
media y la varianza de la serie predicha ( Y$ ) y las de la serie observada (Y) en el periodo de
predicción. Por tanto, lo deseable es que su valor sea pequeño. La última proporción mide
la parte residual o no sistemática de los errores de predicción, en donde debería recaer la
mayor parte del error total cometido.
23
Econometría Curso 2011-2012
24
Econometría Curso 2011-2012
1.- Introducción
Las variables que hemos introducido como regresores en los temas precedentes son
variables de tipo cuantitativo. Sin embargo, en ocasiones existen factores de tipo cualitativo
que pueden ser relevantes para explicar el comportamiento de la variable endógena.
La inclusión de estos factores en un modelo econométrico se realiza a partir de la
construcción de lo que se conoce como variables ficticias, variables dicotómicas o variables
dummy que toman dos valores arbitrarios, normalmente 1 y 0, que corresponden a las
modalidades del factor, aunque no necesariamente ya que podrán tomar otros valores o más
de dos.
Pueden utilizarse para recoger:
• Efectos temporales:
• Efectos espaciales:
• Efectos de tipo puramente cualitativo.
• Otro tipo de efectos: efectos estacionales, funciones escalonadas, etc
Ejemplo: Queremos explicar el salario de los empleados de varias empresas (Yi) en
función del número de años de experiencia laboral (Xi) y del género (factor cualitativo con
dos modalidades: hombre/mujer).
0 hom bre
Di =
1 mujer
Yi=α1 +βXi+εi
Yi=α2 +βXi+εi
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia:
Yi= α1 +β Xi +δDi +εi
1 Yi = (α + δ ) + βX i + ε i
1123
donde cuando Di = α
2
0 Y = α + βX + ε
i 1 i i
α1+δ = α2 ⇒ δ = α2-α1
25
Econometría Curso 2011-2012
El coeficiente de la variable ficticia δ nos mide el efecto diferencial entre las dos
ordenadas en el origen, es decir, el efecto diferencial del valor esperado de la variable
dependiente por presentar una de las características del factor cualitativo respecto al hecho
de no presentarla.
1 Z i = X i
donde cuando Di =
0 Z i = 0
1 Yi = α + ( 1
β1 + γ ) X i + ε i
23
por tanto cuando Di = β
0 Y = α + β X + ε
2
i 1 i i
β1+γ = β2 ⇒ γ = β2-β1
El coeficiente de la variable ficticia γ nos mide el efecto diferencial entre las
pendientes en los dos grupos, es decir, la diferencia de la influencia de la variable
explicativa sobre la variable endógena por presentar una característica respecto de no
presentarla.
3º.- Que afecte a ambas (ordenada y pendiente)
Si tenemos dos modelos con diferente ordenada en el origen y diferente pendiente:
Yi=α1 +β1Xi+εi
Yi=α2 +β2Xi+εi
las dos ecuaciones se pueden expresar en una sola por medio de una variable ficticia de la
forma:
Yi= α1 +β1 Xi +δDi+ γ X i Di +εi
123
Zi
1 Yi = (α + δ ) + ( β1 + γ ) X i + ε i
1123 123
donde cuando Di = α2 β2
0 Yi = α1 + β1 X i + ε i
26
Econometría Curso 2011-2012
k
Yi =α1 +δDi + ∑ β j X ji +εi
j =1
27
Econometría Curso 2011-2012
29
Econometría Curso 2011-2012
30
Econometría Curso 2011-2012
1.-Formulación de la ecuación
31
Econometría Curso 2011-2012
Hay que tener en cuenta que hay varios tipos de modelos no lineales. Algunos
pueden ser tratados con las técnicas vistas hasta ahora realizando algunas transformaciones
y teniendo en cuenta algunas diferencias2.
2
Ver el apéndice 1 de este tema. Si las variables están todas en logaritmos, los parámetros miden
elasticidades. En general, la elasticidad de Y respecto a X recoge la variación porcentual de Y ante una
∆Y X
variación porcentual de X: E=
∆X Y
3
Basado en Carrascal, U. y otros (2001). Análisis econométrico con Eviews. Ed. RAMA.
32
Econometría Curso 2011-2012
Nota 1: Es necesario que las observaciones de ambas submuestras sean suficientes para
estimar los modelos, es decir, N1>k+1 y N2>k+1. No obstante, el contraste se puede hacer
aunque en una de las dos muestras no haya suficientes grados de libertad, asignando cero a
la SCR correspondiente a esa muestra (Johnston, 1989, pág. 264 y ss.)
Nota 2: Una forma alternativa de llevar a cabo este contraste de Chow es mediante la
incorporación de variables ficticias que recojan el cambio en los coeficientes del modelo.
33
Econometría Curso 2011-2012
1500000 1.1
1000000 1.0
500000 0.9
0 0.8
-500000 0.7
-1000000 0.6
75 80 85 90 95 75 80 85 90 95
Rec ursiv e C(1) Estimates ± 2 S.E. Rec urs iv e C(2) Estimates ± 2 S.E.
12000000 1200
10000000
800
8000000
6000000 400
4000000
0
2000000
0 -400
75 80 85 90 95 75 80 85 90 95
Rec ursiv e C(3) Estimates ± 2 S.E. Rec urs iv e C(4) Estimates ± 2 S.E.
600000
400000
200000
-200000
-400000
70 75 80 85 90 95
34
Econometría Curso 2011-2012
Supongamos ahora, que por error, incluimos en la parte sistemática del modelo una
serie de variables que no son significativas. Es decir:
Modelo correctamente especificado: [1] Y=X1β1+ ε
Modelo estimado (con inclusión): [2] Y=X1β1+ X2β2+ ε
En este caso se estima un modelo donde no se incluye la restricción cierta β2 = 0.
Los estimadores del modelo estimado seguirán siendo ELIO y consistentes y también lo
será S2. El problema, por tanto, no está en las propiedades de los estimadores sino en su
eficiencia comparada con los estimadores del modelo correctamente especificado. Como ya
sabemos, el estimador mínimo cuadrático restringido tiene siempre varianza más pequeña
que el mínimo cuadrático ordinario sin restringir y, por lo tanto, en este caso será más
eficiente. Además, los test de hipótesis son válidos y el predictor es un estimador insesgado
del valor medio.
La detección de error de omisión o de inclusión consiste en aplicar los criterios de selección
del modelo adecuado.
35
Econometría Curso 2011-2012
Asimetría Kurtosis
N N
∑ ei3 / N ∑ ei4 / N
g1 = i =1
3/ 2
g2 = i =1
2
N
N
∑ ei / N ∑ ei / N
2 2
i =1 i =1
36
Econometría Curso 2011-2012
d JB =
N − k −1 2 1
6 4
( )2
g1 + g 2 − 3 → χ 2
2
TABLA RESUMEN
Error de especificación ¿cómo detectarlo?
1. Formulación del modelo
a) Forma funcional Test RESET de Ramsey
b) Forma estructural * Test de Chow
Cambio/permanencia * Estimación recursiva
En general, el test RESET de Ramsey puede
2. Especificación de la matriz de regresores detectar cualquier tipo de error de
especificación en un modelo
a)Omisión de variable relevante *E-views (test Wald de omisión de v.
relevante)
b)Inclusión de variable irrelevante *E-views (test Wald de inclusión de v.
irrelevante)
c)Rango de la matriz X (Multicolinealidad) *Indicios de multicolinealidad (tema 6)
d) X no estocástica
3. Hipótesis sobre las perturbaciones
37
Econometría Curso 2011-2012
38
Econometría Curso 2011-2012
4
La elasticidad de Y respecto a X recoge la variación porcentual de Y ante una variación porcentual de X,
∆Y X
E= .
∆X Y
39
Econometría Curso 2011-2012
40
Econometría Curso 2011-2012
TEMA 6: MULTICOLINEALIDAD
Una cuestión importante que debe analizarse al estudiar los resultados de un modelo
de regresión es el grado de relación lineal existente entre las observaciones de las variables
explicativas, siendo tres las situaciones posibles con las que nos podemos encontrar.
Ortogonalidad: supone la ausencia de relación lineal entre algunos o todos los
regresores incluidos en el modelo, es decir, implica incorrelación entre los regresores.
Multicolinealidad perfecta: se da cuando existe una relación lineal exacta entre
algunos o todos los regresores incluidos en el modelo.
Multicolinealidad imperfecta: consiste en la existencia de una relación lineal fuerte
entre los regresores del modelo.
A continuación vamos a analizar las consecuencias de estas tres situaciones
centrándonos sobre todo en la multicolinealidad imperfecta que es la situación más
frecuente.
Ortogonalidad : Se dice que dos regresores son ortogonales cuando están linealmente
incorrelacionados, es decir, cuando su coeficiente de correlación lineal, o su covarianza es
cero. Así, Xh y Xj son ortogonales si rxh x j = 0 .
Dos grupos de regresores son ortogonales si X 1' X 2 = 0 , lo que significa que cada
regresor del primer bloque está incorrelacionado con cada regresor del segundo bloque.
Particularidades del modelo con regresores ortogonales:
Sea el modelo particionado: Y = X 1 β 1 + X 2 β 2 + ε
• Los EMCO de los parámetros de este modelo coinciden con los que obtendríamos
efectuando la regresión individual de Y sobre cada uno de los bloques:
Los estimadores de los parámetros del modelo particionado en la regresión
Y →
R
X 1 X 2 son:
( )
−1 −1 −1
βˆ1 X 1' X 1 X 1' X 2 X 1'Y X 1' X 1 0 X 1'Y X 1' X 1 X 1'Y
β = = '
ˆ ' = ' =
β2 X 2 X1
ˆ X 2' X 2 X Y 0
2 X 2' X 2 X Y X'X
2 2 2 ( )
−1
X 2' Y
Y
→
R
X1 Y = X 1 β1 + u (
b1 = X 1' X 1 ) −1
X 1'Y
Y
→
R
X2 Y = X 2β2 + v (
b2 = X 2' X 2 ) −1
X 2' Y
Por lo tanto, se obtienen los mismos resultados.
Sin embargo, si los regresores no son ortogonales, no se obtienen los mismos
resultados, sino que en la regresión conjunta, cada uno de los dos estimadores
depende de toda la matriz X, por tanto de X1 y de X2, debido a que X 1' X 2 ≠ 0
41
Econometría Curso 2011-2012
• Las varianzas de los estimadores también coinciden con las calculadas al hacer las
regresiones individuales pero no los estimadores de esas varianzas:
−1 −1
X 1' X 1 0 2 X1X1
'
0 e'e
∑βˆβˆ 0
= σ 2
X 2' X 2
, S βˆβˆ
= S
0
X 2' X 2
siendo S 2
=
N − K −1
Haciendo las regresiones individuales:
∑ b1b1
(
=σ 2 X 1' X 1 )
−1
∑ b2b2
(
=σ 2 X 2' X 2 ) −1
S b1b1 = S1 X X 1
2
( '
1 )
−1
siendo S1
2
=
uˆ ' uˆ
N − K1 − 1
2
(
S b2b2 = S 2 X 2' X 2 )
−1
siendo S2 =
2 vˆ ' vˆ
N − K2 −1
Multicolinealidad Perfecta: Cuando la relación que liga a dos o más variables explicativas
es una relación lineal exacta, es decir, las columnas de la matriz X son linealmente
dependientes. En este caso se deja de cumplir la hipótesis clásica Rg(X) = k+1, de modo
que:
Rg(X) < k+1 ⇒X’X= 0
Y por tanto los estimadores mínimos cuadrados ordinarios no se pueden calcular.
Es, en definitiva un grave problema pero fácilmente detectable, así que si
conocemos la relación lineal entre las variables es muy fácil de corregir, bastará con
eliminar una cualquiera de las variables correlacionadas sin sufrir ninguna disminución en
la capacidad explicativa o predictiva del modelo
La multicolinealidad normalmente, es un problema meramente muestral.
Multicolinealidad Imperfecta o fuerte: cuando la relación entre las variables es muy
fuerte pero no perfecta, es decir, los coeficientes de correlación lineal no son igual a 1 o -1
pero se aproximan bastante. En este caso X’X≠0 por lo tanto no existen razones, a priori,
para no poder estimar el modelo.
Los estimadores serán ELIO siempre que el modelo cumpla las hipótesis clásicas y
coincidirán con los máximo verosímiles, aunque en la práctica esto puede tener poco valor
debido a las consecuencias que este problema genera.
Causas de la multicolinealidad imperfecta:
• Existencia de alguna relación causal entre dos variables explicativas (o más).
• En economía, la mayoría de las variables explicativas están, de alguna manera
correlacionadas. Cuando trabajamos con series temporales, la mayoría de las
variables económicas tienen una tendencia creciente, Granger y Newold
demostraron que basta con introducir una tendencia lineal en dos series temporales
independientes para que su correlación aumente considerablemente, por tanto, la
existencia de esa tendencia puede ser la causa de un problema de multicolinealidad.
42
Econometría Curso 2011-2012
1) Dificultad para interpretar los coeficientes, y por tanto, sus estimaciones. Los
coeficientes de regresión ( β j ) se interpretan como el cambio que se produce en Yi
al variar Xji en una unidad, permaneciendo el resto de variables explicativas
constantes. Cuando existe multicolinealidad imperfecta carece de sentido suponer
que, cuando una variable explicativa se modifica, el resto de las variables
permanecen constantes, al existir altas correlaciones entre ellas. Por este motivo, los
parámetros pierden este significado y, por lo tanto, también sus estimaciones.
2) La multicolinealidad afecta a la precisión de los estimadores ya que sus varianzas
toman valores grandes. Se puede ver, por un lado, a partir del determinante de X’X,
que es relativamente pequeño y, por otro, analizando la varianza de un estimador de
la siguiente manera: Planteamos un modelo particionado en el que el 2º bloque está
formado por un único regresor: Y = X 1 β 1 + X 2 β 2 + ε
σ2
En ese caso: Var βˆ 2 =
(1 − R 2
X 2 • X1 )N S 2
X2
S2
S β2ˆ =
Y su estimador:
2
(1 − R 2
X 2 • X1 )N S 2
X2
Las varianzas de los estimadores pueden ser grandes como consecuencia de:
• Valores grandes del S2
• Fuerte correlación entre X2 y X1 : valores grandes de R X2 2 • X1
43
Econometría Curso 2011-2012
• La simple lógica permite, algunas veces, saber si existe o no una relación causal entre
ellas. Por ejemplo, si dos variables explicativas son la población y el empleo, el
presupuesto nacional y el PNB, etc.
• Grandes varianzas. Indicio poco fiable por sí solo.
• Altos coeficientes de correlación lineal. Si el modelo tiene 2 regresores este coeficiente
es un buen indicio pero si tiene más de dos regresores, los coeficientes de correlación
altos son una condición suficiente para la existencia de multicolinealidad pero no
necesaria, ya que ésta puede existir aunque los coeficientes de correlación sean
comparativamente bajos.
• Coeficientes de correlación múltiple entre los regresores grandes: R X2 j • X1....
Estos coeficientes miden la correlación que existe entre un regresor y todos los demás.
Se puede calcular como coeficiente de determinación en la regresión auxiliar de cada
regresor frente a los otros.
• Estadísticos t pequeños y F grandes
• Factor de inflación de la varianza: FIV
1
Este factor se define como el cociente: FIV j =
1 − R X2 j • X1 .....
tiene la relación entre Xj y las demás variables sobre la varianza de β̂ j . Cuanto mayor sea
este factor, mayor es la varianza del estimador.
El factor de inflación de la varianza se puede interpretar como cociente de dos varianzas del
estimador:
o Su varianza real σ β2ˆ
j
44
Econometría Curso 2011-2012
(σ )
X j • X 1 ... X k Xj 1
= =
(1 − R ) = FIV
j
2
βˆ j
σ 2 2
X j • X 1 ... X k
ortog
N S X2 j
1) Aumentar el tamaño de la muestra. Esta podría ser una solución siempre que la
multicolinealidad fuera un problema muestral.
2) Eliminación de variables: Eliminar aquella o aquellas variables colineales. El
inconveniente de este método es que podríamos caer en graves problemas de errores
de especificación por omisión. Este error sería tanto menor cuanto mayor fuese la
correlación lineal entre la variable omitida y las incluidas y por tanto también será
menor el sesgo de los estimadores.
3) Utilización de información a priori: Consiste en incorporar al modelo algún tipo de
información estableciendo restricciones sobre los parámetros del modelo.
4) Transformación de variables: Si la multicolinealidad se presenta en modelos con una
muestra de series temporales la tendencia aproximadamente común en los
regresores podría ser la principal causa del problema. En este caso una forma de
eliminar esa tendencia es trabajar con la series en primeras diferencias y de esa
forma no solo se eliminaría la tendencia sino que la correlación entre los regresores
disminuiría. También se podría trabajar con ratios.
45
Econometría Curso 2011-2012
46
Econometría Curso 2011-2012
ORDEN de una matriz.- Una matriz con T filas y K columnas se dice que es de orden T por
K, (TxK).
RANGO de una matriz.- Se define como el máximo número de columnas o filas, de X,
linealmente independientes. Corrientemente se dice que es el ORDEN del mayor MENOR
no nulo. Donde los MENORES son los determinantes (nxn) que se puede formar.
PROPIEDADES: Si A es una matriz nxm de rango m<n, entonces A'A es definida positiva y
AA' es semidefinida positiva. (Johnston, p. 182).
Si A es una matriz nxm de rango m<n, entonces A' es de rango m y la matriz resultante de
premultiplicar a A por su transpuesta (A'A) también es de rango m.
MATRIZ CUADRADA.- Es aquella que tiene el mismo número de filas y de columnas.
MATRIZ DIAGONAL.- Aquélla cuyos únicos elementos distintos de cero están en la
diagonal principal.
MATRIZ NO SINGULAR.- Aquélla matriz cuadrada cuyo determinante es distinto de
cero.
MATRIZ IDENTIDAD.- Aquélla cuyos elementos de la diagonal principal son la unidad y
el resto ceros. Se cumple que A·I = I.A = A.
OPERACIONES CON MATRICES
SUMA DE MATRICES.- Para sumar dos matrices deben tener el mismo orden. Se suma
cada elemento de la primera con su correspondiente elemento en la segunda.
PROPIEDADES: Conmutativa: A+B=B+A; Asociativa: A+(B+C)=(A+B)+C
MULTIPLICACIÓN POR UN ESCALAR: Se multiplica el escalar por todos los elementos
de la matriz. Admite la propiedad distributiva: a(A+B)= aA+aB
47
Econometría Curso 2011-2012
48
Econometría Curso 2011-2012
∑ (xi − X )
n n
2
∑ xi2 − nX 2
Varianza muestral: S x2 = i =1
= i =1
n n
∑ (xi − X )
n n
2
∑ xi2 − nX 2
Cuasivarianza muestral: S x2 = i =1 = i =1
n −1 n −1
49
Econometría Curso 2011-2012
X
n
Propiedad: Sean X e Y v.a.i. tal que X → χ n21 e Y → χ n22 , entonces U = 1 → Fn1 ,n2
Y
n2
CONVERGENCIAS Y TEOREMA DEL LÍMITE
Convergencia en probabilidad: Una sucesión {X n }n =1 converge en probabilidad hacia la
∞
variable X, X n c→
. p.
X , si para cualquier δ>0,
Propiedades
1.- X n c→
. p.
X ⇔ X n − X c→
. p.
0
2.- X n c→
. p.
X y g una función continua ⇒ g ( X n ) c→
. p.
g(X )
50
Econometría Curso 2011-2012
[
lim E X n − X
n →∞
2
]= 0
Propiedades
1) Una condición suficiente pero no necesaria para la convergencia en probabilidad es que
se dé la convergencia en media cuadrática. Es decir , si X n m
.c .
→ X ⇒ X n c→
. p.
X.
lim Fn ( x) = F ( x)
n →∞
3) Si X n m
.c .
→ X ⇒ X n c→
. p.
X ⇒ Xn
→
L
X
Ley de los grandes números
Los momentos muestrales de una sucesión de variables aleatorias independientes e
igualmente distribuidas convergen en probabilidad a los correspondientes momentos
poblacionales.
Teorema del límite central
Sea {X n }n =1 una sucesión de v.a.i.i.d. con E(Xi)=µ y Var(Xi)=σ2. Entonces
∞
n n n
∑ X i − E ∑ X i ∑ X i − nµ
i =1 i =1 = i =1
→ N (0,1)
L
n σ n
Var ∑ X i
i =1
σ
o lo que es lo mismo, X n
→
a
N (µ , ).
n
ÁLGEBRA DE LOS LIMITES EN PROBABILIDAD (PLIM)
Sean XT e YT dos sucesiones de variables aleatorias tales que plim XT = c, plim YT = d.
1.- plim (XT + YT) = plim XT + plim YT = c + d.
2.- plim XT.YT = plim XT . plim YT = c .d.
51
Econometría Curso 2011-2012
XT p lim X T c
3.- p lim = = si p lim YT ≠ 0
YT p lim YT d
4.- ( )
p lim X TS = ( p lim X T )S
5.- Si plim (XT - YT ) = 0 y plim XT = c, entonces plim YT = c.
Teorema de Slutsky
Sea XT una sucesión de variables aleatorias tales que plim XT = c, e YT = Ψ (XT) una
función continua en c que no depende de T, entonces plim YT = Ψ (c).
−1
X ´X X ´X
Ejemplo: Si p lim = P, p lim = P −1 siempre que P sea una matriz no singular.
T T
ELEMENTOS BÁSICOS SOBRE CONTRASTES
Hipótesis estadística: Es un enunciado sobre los valores de algunos de los parámetros en la
población hipotética de la cual se toma la muestra.
Hipótesis puntual: es aquella en la que se plantea contrastar un valor específico para un
parámetro.
Hipótesis de intervalo: es aquella en la que se plantea contrastar si el parámetro se
encuentra en un intervalo específico.
Contraste de hipótesis: es la regla que nos permite dilucidar la validez de una hipótesis en
base a la evidencia empírica.
Hipótesis nula: es la hipótesis sometida a análisis y se designa por Ho.
Hipótesis alternativa: es la hipótesis contra la que suele probarse la hipótesis nula y se
designa por H1 o HA.
Al contrastar una hipótesis cabe adoptar dos decisiones: por un lado, podemos rechazarla o
no rechazarla y, por otro, dicha hipótesis puede ser cierta o falsa. Por ello, las
consecuencias de la decisión se pueden esquematizar de la siguiente forma:
Ho cierta Ho falsa
No Rechazar Decisión correcta Error de II tipo
Rechazar Error de I tipo Decisión correcta
Nivel de significación del contraste: Se denota con la letra α (también se denomina tamaño
del contraste) y se define como la probabilidad de rechazar la Ho siendo cierta, lo que
ocurrirá cuando la observación muestral pertenezca a la región crítica.
α= P{error de I tipo}=P{rechazar Ho| si Ho es cierta}
Potencia del contraste: se denota como (1-β), siendo β la probabilidad de cometer el error
de tipo II y se define como la probabilidad de no rechazar la hipótesis nula cuando ésta es
falsa. Así, una vez fijado α, de todas las regiones críticas con el mismo nivel de
significación, elegiremos aquella donde la potencia del contraste sea mayor, es decir que β
sea menor.
β= P{error de II tipo}=P{No rechazar Ho| si Ho es falsa}
52
Econometría Curso 2011-2012
Región crítica: es aquella zona del espacio muestral donde se rechaza Ho. Si la observación
muestral realizada pertenece a ella, entonces se rechaza la Ho.
Región de aceptación: es la complementaria a la región crítica, es decir donde no se rechaza
la Ho.
Valor crítico: es el valor de la distribución obtenido en las correspondientes tablas, fijado
un nivel de significación, que separa la región crítica de la región de aceptación.
La técnica de los contrastes consiste en delimitar estas dos regiones y ver donde cae el valor
muestral obtenido.
P-valor: es el valor de probabilidad y describe el nivel de significación exacto asociado con
un resultado econométrico particular. Por tanto es la probabilidad de rechazar de forma
incorrecta una hipótesis nula que es cierta. Cuanto menor sea el valor p más seguros
estaremos al rechazar la hipótesis nula.
Nivel de confianza (1-α): nos indica la proporción aproximada de veces que el parámetro βi
se encontraría en el intervalo si calculásemos el intervalo con muchas muestras diferentes.
Intervalo de confianza: es un intervalo numérico en el que creemos que se encontraría el
parámetro con un cierto grado (nivel) de confianza.
Intervalo de Probabilidad: es un intervalo aleatorio que se concreta en un intervalo de
confianza cuando disponemos de una realización muestral.
53