Documentos de Académico
Documentos de Profesional
Documentos de Cultura
File PDF
File PDF
César Alonso
[3.]Homocedasticidad condicional:
V (ε |X1 , X2 , . . . , XK ) = σ2
⇒ V (Y |X1 , X2 , . . . , XK ) = σ2
Y = β 0 + β 1 X1 + β 2 X2 + ε
Tenemos que:
E (Y |X1 , X2 ) = β 0 + β 1 X1 + β 2 X2
de manera que
E (Y |X1 , X2 = 0) = β 0 + β 1 X1
E (Y |X1 , X2 = 1) = β 0 + β 2 + β 1 X1
∆E (Y |X1 , X2 , . . . , XK ) = β j ∆Xj
de manera que
∆E (Y |X1 , X2 , . . . , XK )
βj =
∆Xj
β j : Cuando Xj varı́a en una unidad (permaneciendo el resto de las
variables constantes), Y varı́a, en promedio, en β j unidades.
Nótese que: la regresión múltiple Y = E (Y |X1 , X2 , . . . , XK ) + ε
responde a una pregunta diferente que las (teóricas) regresiones
simples Y = E (Y |X1 ) + ε 1 ,..., Y = E (Y |XK ) + ε K
En nuestro ejemplo:
E (Y |X1 , X2 ) = β 0 + β 1 X1 + β 2 X2 = Valor esperado del salario para
unos valores dados de educación y sexo.
β 1 = Incremento en el salario medio asociado a un año adicional de
educación manteniendo el sexo constante (es decir, para individuos del
mismo sexo).
E (Y |X1 ) = γ0 + γ1 X1 = Valor esperado del salario para unos valores
dados de educación.
γ1 = Incremento en el salario medio asociado a un año adicional de
educación, pero sin mantener el sexo constante (es decir, ignorando
que al comparar dos distribuciones con distintos años de educación, las
proporciones de hombres y mujeres pueden ser distintas).
C (X1 , Y )
β1 = (pendiente de L(Y |X1 ))
V (X1 )
C (X2 , Y )
β2 = (pendiente de L(Y |X2 ))
V (X2 )
Nótese que:
γ1 = β 1 solamente si C (X1 , X2 ) = 0 ó si β 2 = 0.
C (X1 , X2 )
es la pendiente de L(X2 |X1 ) :
V (X1 )
L(X2 |X1 ) = δ0 + δ1 X1
Y = β 0 + β 1 X1 + β 2 X2 + · · · + β K XK + ε
min E ( ε2 ),
β 0 ,β 1 ,··· ,β K
donde ε = Y − β 0 − β 1 X1 − β 2 X2 − · · · − β K XK
1 n 2
n i∑
min εi ,
b
β 0 ,β 1 ,··· ,β K =1
∑i b
ε i = 0, ∑i bε i X1i = 0, . . . , ∑i b
ε i XKi = 0
o, de forma equivalente, definiendo xji = Xji − X j , j = 1, . . . , K .
1
n ∑i b
εi = 0 (media muestral de los residuos 0)
1
n ∑i b
ε i x1i = 0
.. (covarianza muestral 0 entre Xj y b
ε)
.
1
∑i b
ε i xKi =0
n
β 0 = E (Y ) − β 1 E (X1 ) − β 2 E (X2 )
V (X2 )C (X1 , Y ) − C (X1 , X2 )C (X2 , Y )
β1 =
V (X1 )V (X2 ) − [C (X1 , X2 )]2
V (X1 )C (X2 , Y ) − C (X1 , X2 )C (X1 , Y )
β2 =
V (X1 )V (X2 ) − [C (X1 , X2 )]2
donde 2
s12 = n1 ∑i X1i − X 1
s1y = n1 ∑i
X1i − X 1 Yi − Y
s12 = n1 ∑i X1i − X 1 X2i − X 2 = s21
2
s22 = n1 ∑i X2i − X 2
s2y = n1 ∑i
X2i − X 1 Yi − Y
Los estimadores βb1 y βb2 de las pendientes miden los efectos parciales
estimados de X1 y X2 , respectivamente, en el valor medio de Y .
Intuitivamente:
Cuanto mayor es Sj2 = n1 ∑i xji2 , mayor es la variabilidad muestral de
Xj , y mayor es la precisión del estimador.
Cuanto mayor es el tamaño muestral n, mayor es la precisión del
estimador (al mejorar el grado de representatividad de la muestra).
Cuanto mayor es Rj2 , menor es la precisión del estimador.
Demostración: Véase Wooldridge.
(Sin pérdida de generalidad, dado que el orden de las variables
explicativas es arbitrario, la prueba es para βb1 ; la prueba para
βb2 , · · · , βbK es análoga).
∑i b
ε2i
σ2 =
e .
n
∑i b
ε i = 0, ∑i b
ε i X1i = 0, . . . , ∑i b
ε i XKi = 0
de manera que sólo hay (n − K − 1) residuos independientes (lo que
se conoce como grados de libertad).
Alternativamente, podemos obtener un estimador insesgado (que para
σ2 ):
n grande es muy similar a e
∑i b
ε2i
σ2 = .
n−K −1
b
1
∑
2
Sj2 = Xji − X j .
n i
∑i ybi2 ∑i b
ε2i
R2 = = 1 − , 0 ≤ R2 ≤ 1
∑i yi2 ∑i yi2
∑i b
ε2i (n − K − 1)
n−1
2 2
R = 1− 1−R = 1− .
∑i yi2 (n − 1)
n−K −1
2
En cualquier caso, para tamaños muestrales grandes R ' R 2 .
Y = β 0 + β 1 X + ε,
donde E (ε|X ) = 0 ⇒ E (Y |X ) = β 0 + β 1 X .
Interpretación de β 1 :
∆E (Y |X )
β1 = ⇒ Si X varı́a 1 unidad, Y varı́a en promedio
∆X
β 1 unidades de Y .
E [(∆Y /Y )|X ] X
= β1
∆X /X E (Y |X )
X
β1 .
Y
En otras ocasiones, se evalúan las elasticidades para los valores medios
de X e Y
E (X )
β1 .
E (Y )
Y = β 0 + β 1 ln X + ε,
donde E (ε|X ) = 0 ⇒ E (Y |X ) = β 0 + β 1 ln X .
Interpretación de β 1 :
∆E (Y |X ) ∆E (Y |X )
β1 = '
∆ ln X ∆X /X
dh (X ) 1
(nótese que si h (X ) = ln X , como h0 (X ) = = , entonces
dX X
dX
diferenciando tenemos que dh (X ) = d ln X ≡ ).
X
César Alonso (UC3M) ECONOMETRIA. Tema 3 43 / 101
Interpretación. Especificaciones más usuales
Modelos semilogarı́tmicos: logaritmo en la variable exógena (cont.)
β 1 es una semielasticidad.
La elasticidad de E (Y |X ) con respecto a X es igual a
β1
,
E (Y |X )
β1
.
Y
∆E (Y |X )
β 1 /100 '
100 × ∆X /X
⇒ Si X varı́a en un 1%, Y varı́a en promedio en β 1 /100 unidades de
Y.
César Alonso (UC3M) ECONOMETRIA. Tema 3 45 / 101
Interpretación. Especificaciones más usuales
Modelos semilogarı́tmicos: logaritmo en la variable exógena (cont.)
Modelo 1 Modelo 2
Y = β∗0 + β∗1 X + ε∗ Y = β 0 + β 1 ln X + ε
∆E (Y |X ) β1 ∆E (Y |X )
β∗1 = '
∆X 100 100 × ∆X /X
ln Y = β 0 + β 1 X + ε,
Y = exp( β 0 + β 1 X + ε)
Interpretación de β 1 :
∆E (ln Y |X ) E [(∆Y /Y ) | X ]
β1 = '
∆X ∆X
E [(100 × ∆Y /Y ) | X ]
β 1 × 100 '
∆X
⇒ Cuando X varı́a en un 1 unidad, Y varı́a en promedio en un
( β 1 × 100) %.
β 1 es una semielasticidad.
La elasticidad de E (Y |X ) con respecto a X es igual a β 1 X
(y depende por tanto de los valores concretos que tome X ).
Esta especificación es de gran utilidad para describir curvas de
crecimiento exponencial.
En particular, supongamos que X = t (tiempo). Entonces,
∆E (ln Y |X )
Y = exp( β 0 + β 1 t + ε) y como β 1 = ,
∆t
β 1 recoge la tasa de crecimiento medio de Y a lo largo del tiempo.
Modelo 1 Modelo 2
Y = β0∗ + β1∗ slX + ε∗ ln Y = β0 + β1 X +ε
∆E (Y |X ) E [(100 × ∆Y /Y 1) | X ]
β∗1 = β 1 ×100 '
∆X ∆X
Si la educ. ↑ 1 unidad, el salario Si la educ. ↑ 1 ud., el consumo
↑ en media en β∗1 euros ↑ en media en ( β 1 ×100) %
ln Y = β 0 + β 1 ln X + ε,
∆E (ln Y |X ) E [(∆Y /Y ) | X ]
β1 = ' ⇒ Cuando X varı́a en un 1%,
∆ ln X ∆X /X
Y varı́a en promedio un
β 1 %.
(β 1 es una elasticidad)
César Alonso (UC3M) ECONOMETRIA. Tema 3 52 / 101
Interpretación de los parámetros del modelo de regresión
lineal
Modelo doble logarı́tmico (cont.)
Y = β0 + β1 X + β2 X 2 + ε
donde E (ε|X ) = 0 ⇒ E (Y |X ) = β 0 + β 1 X + β 2 X 2 .
En este contexto,
∆E (Y |X )
= β 1 + 2β 2 X ,
∆X
es decir: Cuando X varı́a en 1 unidad, Y varı́a en media en
( β 1 + 2β 2 X ) unidades de Y ..
Nótese que β 1 y β 2 no tienen interpretación por separado.
Dependiendo del signo de los efectos marginales serán crecientes
(β 2 > 0) o decrecientes (β 2 < 0).
Existe un valor crı́tico de X en el que el efecto de X sobre E (Y |X )
cambia de signo. Dicho punto es X ∗ = − β 1 /2β 2
Modelo 1 Modelo 2
∗ ∗ ∗ ∗
ln Y = β0 + β 1 X1 + β2 X2 +ε ln Y = β0 + β 1 X1 + β2 X2 + β3 X22 +ε
∆E ((∆Y /Y )|X1 , X2 ) E [(∆Y /Y ) | X1 , X2 ]
β∗2 = ( β 2 +2β3 X2 ) '
∆X 2 ∆X 2
Si la experiencia ↑ 1 año, permaneciendo constante la educación,
el salario-hora ↑ en media en:
( β∗2 ×100) % 100×( β 2 +2β3 X2 ) %
El rendimiento de 1 año adicional de experiencia es:
constante no constante (depende de Experiencia)
Y = β 0 + β 1 X1 + β 2 X2 + β 3 X1 X2 + ε,
donde:
E (ε|X1 , X2 ) = 0 ⇒ E (Y |X1 , X2 ) = β 0 + β 1 X1 + β 2 X2 + β 3 X1 X2 .
ln Y = β 0 + β 1 ln X1 + β 2 ln X2
+ β 3 (ln X1 )2 + β 4 (ln X2 )2 + β 5 (ln X1 ) (ln X2 ) + ε
E [(∆Y /Y ) | X1 , X2 ]
' β 1 + 2β 3 ln X1 + β 5 ln X2 ,
∆X1 /X1
que depende de los logaritmos de los inputs.
La especificación translogarı́tmica se utiliza también para representar
funciones de gasto y funciones de costes.
Realidad
H0 cierta H0 falsa
Conclusión Aceptamos H0 X Error tipo II
del contraste Rechazamos H0 Error tipo I X
σ2
Y ∼ N µ,
n
σ2
En particular, bajo H0 : µ = µ0 , tenemos que Y ∼ N µ0 , .
n
Y − µ0
Podemos definir el estadı́stico Cb = √ . Este estadı́stico se
σ/ n
distribuye bajo H0 como
Y − µ0 √ Y − µ0
Cb = √ = n ∼ N (0, 1)
σ/ n σ
√ Y − µ0
Cb = n ∼ tn−1
σ
b
√
1 n
2
donde bσ= b σ2 = n −
σ2 , siendo b 1 i =1 Yi − Y un estimador
consistente de σ2 .
La distribución de este estadı́stico es una t de Student con n − 1
grados de libertad.
Si n es grande, el resultado del contraste será similar, tanto si
suponemos que σ2 es conocida como si no, porque la distribución t de
Student se aproxima a la normal estándar a medida que n aumenta.
En la práctica:
No conocemos habitualmente la distibución de la(s) variable(s)
consideradas.
Si el tamaño muestral es grande, la aproximación asintótica
proporciona conclusiones similares.
Si sustituimos V βbj por un estimador consistente,
σ2
b
V βbj = , este resultado se mantiene
nSj2 1 − Rj2
βbj − β j
r e· N (0, 1)
Vb βbj
Por tanto, podemos tomar los p-valores que aparecen en las tablas de
resultados de los programas econométricos siempre que n no sea muy
pequeño.
Por supuesto, a partir de estos resultados pueden también construirse
intervalos de confianza aproximados
Ejemplo: Demanda de dinero y actividad económica (Goldberger, p.
107).
Utilizando los datos para EE.UU. del archivo TIM1.GDT, hemos
estimado la siguiente regresión lineal:
donde:
Y = ln (100 × V 4/V 3) = logaritmo de la cantidad real de dinero
(M1)
X1 =ln(V 2) = logaritmo del PIB real
X2 =ln(V 6) = logaritmo del tipo de interés de las Letras del Tesoro
Interpretación:
βb1 : estimación de la elasticidad de la demanda de dinero con respecto
a la producción (manteniendo el tipo de interés constante).
Si el PIB aumenta en un 1% (y el tipo de interés no varı́a) se estima
que la demanda de dinero aumenta en promedio un 0.6%.
βb2 : estimación de la elasticidad de la demanda de dinero con respecto
al tipo de interés (manteniendo la producción constante).
Si el tipo de interés aumenta en un 1% (y el PIB no varı́a) se estima
que la demanda de dinero cae en promedio un 0.2%.
César Alonso (UC3M) ECONOMETRIA. Tema 3 85 / 101
Inferencia en el modelo de regresión lineal: Contraste de
hipótesis
Contrastes sobre el valor de un parámetro
donde
Y = logaritmo de la producción
X1 = logaritmo del trabajo
X2 = logaritmo del capital
Interpretación:
βb1 : estimación de la elasticidad de la producción respecto al trabajo
(manteniendo el capital constante)
Si el trabajo aumenta en un 1% (y el capital no varı́a) se estima que la
producción aumenta en promedio en un 0.63%.
βb2 : estimación de la elasticidad de la producción respecto al capital
(manteniendo el trabajo constante)
Si el capital aumenta en un 1% (y el trabajo no varı́a) se estima que la
producción aumenta en promedio en un 0.45%.
Conceptos previos:
Modelo “no restringido”: es aquel modelo sobre el que se desea
efectuar un contraste de hipótesis (bajo H1 ).
Modelo “restringido”: es aquel modelo en que se ha impuesto la
hipótesis que se desea contrastar (bajo H0 ).
Ejemplo 1: H0 : β 1 = β 2 = 0 vs. H1 : β 1 6= 0 y/o β 2 6= 0.
Y = β 0 + β 1 X1 + β 2 X2 + ε Y = β0 + ε
Ejemplo 2: H0 : β 2 + 2β 1 = 1 vs. H1 : β 2 + 2β 1 6= 1
Y = β 0 + β 1 X1 + β 2 X2 + ε Y ∗ = β0 + β1 X ∗ + ε
donde: Y ∗ = Y − X2
X ∗ = X1 − 2X2
porque β 2 + 2β 1 = 1 ⇒ β 2 = 1 − 2β 1 ⇒
Y = β 0 + β 1 X1 + (1 − 2β 1 )X2 + ε ⇒
(Y − X2 ) = β 0 + β 1 (X1 − 2X2 ) + ε
Definiciones:
Modelo Modelo
no restringido restringido
Coeficientes de
determinación: RS2 RR2
Suma de cuadrados
de los residuos: ∑i b
ε2iS = SRS ∑i b
ε2iR = SRR
SRR − SRS
W0 = n e· χ2q
SRS
o de modo equivalente (siempre que en el modelo restringido la
variable dependiente sea idéntica a la del modelo sin restringir),
RS2 − RR2
W0 = n e· χ2q
1 − RS2
RS2 n−K −1
F = 2
× ∼ FK ,n−K −1
1 − RS K
donde:
Y = ln (100 × V 4/V 3) = logaritmo de la cantidad real de dinero
(M1)
X1 =ln(V 2) = logaritmo del PIB real
X2 =ln(V 6) = logaritmo del tipo de interés de las Letras del Tesoro
Consideramos la hipótesis nula H0 : β 1 = β 2 = 0 (la demanda de
dinero es inelástica a la producción y a los tipos de interés) frente a la
alternativa H1 : β 1 6= 0 y/o β 2 6= 0.
El contraste asintótico es
0.927
W0 = × 38 = 482.55 > χ22 = 5.99
1 − 0.927
La salida de Gretl proporciona el estadı́stico F del contraste de
regresión: F (2, 35) = 223.1866, que está bastante cercano a W 0 /2.
Claramente, se rechaza H0 (el p-valor es prácticamente 0).
César Alonso (UC3M) ECONOMETRIA. Tema 3 101 / 101