Está en la página 1de 61

Regresin simple y mltiple

1. A partir de la siguiente tabla de datos,


Y 4 5 7 12
X 1 4 5 6
Estimar la regresin Yi = +Xi+i
Solucin
Basta calcular,

Suma

Yi
4
5
7
12
28

Xi
1
4
5
6
16

yi
-3
-2
0
5
0

xi
-3
0
1
2
0

xiyi
9
0
0
10
19

xi2
9
0
1
4
14

Para obtener,

xi yi 19
1.357 y 1 Y 2 X 1.572
2
x
i 14

2. La palabra regresin proviene de un estudio de Galton, quien, a finales del


siglo XIX, examin la relacin entre la altura de los hijos y la de sus padres. Un
estudiante decide llevar a cabo un estudio similar para lo que recoge datos de
110 compaeros, estimando la siguiente relacin.
i = 49.78+0.73Xi

R2 = 0.45, EER = 5.08

Donde y representa la altura de los estudiantes y x la media de las alturas de sus


padres
a) Interprete los coeficientes estimados
b) Cul es el significado del estadstico R2?
c) Cul es la prediccin para la altura de un alumno si la altura media de los
padres era 178cm?
1

d) Cmo debe interpretarse el valor de EER?

Solucin
a) Por cada incremento de 1 cm en la altura de los padres, la del estudiante se
incrementar 0.73 cm. En este caso no hay una interpretacin razonable para
el trmino independiente
b) El modelo explica el 45% de la variacin de la altura de los estudiantes
c) El pronstico es i = 49.78+0.73*178 = 179.72
d) El Error Estndar de la Regresin es una medida de la desviacin tpica del
error de regresin i es decir, una medida de la dispersin de las
observaciones en torno a la recta de regresin.
3. El estimador mximo verosmil de la varianza de las perturbaciones aleatorias
del modelo de regresin lineal es ee/n. Compare la calidad de este estimador
con el mnimo cuadrtico ee/nk, en trminos de sesgo, varianza.

Solucin: Sabemos que el estimador MCO, s2, es insesgado. Como el estimador


e'e n k 2
mximo verosmil, s*2

s , ste ser necesariamente sesgado, siendo


n
n

sesgo E (s*2 ) 2

n k e'e
nk 2
k
nk
2
E
2 2
1 2

n
n
n
nk
n

es decir, sesgado a la baja. El tamao del sesgo disminuye con n.

Para calcular la varianza del estimador MCO, recordemos que el estadstico


(n k ) s 2

se distribuye como una 2 con nk g.l. por lo que su media es nk y su

(n k ) s 2
varianza 2(nk). Por tanto var
2(n k ) de donde se deduce fcilmente
2

que var( s 2 )

2 4
.
nk

Por otra parte la varianza del estimador MV ser,

e'e
n k e'e n k
2
2
var
var

var( s ) var( s )
n
n
n

k
n

es decir, la varianza del estimador ML es menor.


2

Ambos son consistentes. En el caso del MCO es claro que su varianza tiende a cero
cuando n. Por otro lado con n el sesgo del estimador MCO es nulo as como
su varianza.

4. Considere el modelo de regresin Yi = 0 +1Xi+i. Sabemos que los


estimadores MCO habituales son insesgados. Sea b1 el estimador obtenido bajo
el supuesto de que el parmetro 0 es nulo.
a) Obtener E(b1) y comprobar que no tiene sesgo cuando 0=0. Hay algn
otro caso en el que dicho estimador sea insesgado?
b) Obtenga la varianza de b1
c) Demostrar que var(b1) var(1), siendo 1 el estimador MCO con constante

Solucin
a) Aplicando el criterio MCO al modelo Yi = 1Xi+i obtenemos,

b1

Y X
X
i

2
i

0 X i 1 X i2 X i i

2
i

X
X

i
2
i

X
X

i i
2
i

Tomando esperanzas vemos que E(b1) = 1 solo cuando 0 = 0 o Xi = 0.

b) La varianza ser,

var(b1 ) E b1 E (b1 )
X i2

X i i
... E
X2
i

X i2 E ( i )2

2
2 2
X i E X i i

2
i

c) Si comparamos esta expresin con la de var(1), es evidente que

2
i

(X

X )2

dado que el denominador de la ltima expresin siempre ser menor, es decir


X i2 ( X i X )2 . La igualdad solo se da cuando la media de X es nula,
en cuyo caso ambos estimadores coinciden.
3

5. Considere la regresin,

Yi 0.2033 0.656 X i ,
(0.0976) (0.1961)

R2 0.397,

SCR 0.0544 SCE 0.0358

donde Y representa la tasa de participacin de las mujeres en la fuerza laboral


(TPFL) en 1972 y X la misma tasa en 1968. Los resultados se obtuvieron a partir
de una muestra de 19 ciudades norteamericanas y entre parntesis figuran los
errores estndar de los estimadores).
a) Interprete los resultados de esta regresin
b) Contraste la hiptesis H0: 1 = 1 contra la alternativa H0: 1 > 1. Especifique
claramente el nivel de significatividad elegido y el valor crtico en tablas
para el mismo.
c) Suponga que en 1968 la TPFL fue de 0.58. Obtenga una prediccin para
E(TPFL en 1972) y construya un intervalo de confianza del 95% para la
misma
d) Cmo probara que los residuos de la regresin estn normalmente
distribuidos?

Sol.
a) Hay una asociacin positiva lo que no es sorprendente si tenemos en cuenta el
hecho de que desde la II Guerra Mundial ha habido un incremento constante de
las mujeres en el mercado laboral.
b) Usando un test t de una cola, t =

.6561
.1961

= 1.7542. Para 17 g.l. el valor

crtico al 95% para un contraste unilateral es 1.74. Para este contraste la zona de
aceptacin estara a la izquierda de 1.74 y la de rechazo a la derecha de ese
valor. Como el valor del estadstico de contraste queda dentro de la regin de
aceptacin, no se puede rechazar la hiptesis nula.
c) La media es 0.2033+0.656*.58 = 0.5838. Para construir el intervalo del 95%,
emplearamos la frmula 0.58382.11*(ee. del pronstico), donde 2.11 es el
valor crtico al 95% para una t17. La desviacin tpica se calculara a partir de,

2
n

( X 0 X )2

xi2

aunque en este caso no tenemos datos suficientes para llevar a cabo ese clculo.
4

d) No es posible contestar a esta cuestin por falta de datos (necesitaramos la


serie de las discrepancias de la regresin para poder hacerlo).

6. Suponga se le contrata para analizar el nmero de veces que los padres


divorciados dejan de pagar la mensualidad que le corresponde al cnyuge
encargado de la custodia de sus hijos. Para ello construye y estima por MCO el
siguiente modelo (errores estndar entre parntesis),

Pi 2.0 0.50M i 25.0Yi 0.80 Ai 3.0 Bi 0.15Ci ,


(0.10) (20.0) (1.0)
(3.0) (0.05)

N 20

donde,
Pi = nmero de meses que deja de pagar en los ltimos cuatro aos i
Mi = nmero de meses que el encargado de pagar la pensin alimenticia estuvo
parado en los ltimos cuatro aos
Yi = porcentaje de renta disponible destinado a la pensin alimenticia
Ai = la edad del cnyuge e encargado de pagar
Bi = creencias religiosas del cnyuge encargado de pagar (en una escala de 1 a 4,
siendo 4 el de creencias religiosas ms fuertes)
Ci = nmero de hijos del matrimonio

Se pide,
a) Indique cul es el signo esperado de los coeficientes de M e Y. Construya un test
para contrastar esa hiptesis. Emplee un nivel de significatividad del 5%.
b) Contraste la hiptesis de que el parmetro de A es estadsticamente
significativo. Emplee un nivel de significatividad del 1%
c) Lleve a cabo el mismo contraste para las variables B y C pero a un nivel de
significatividad del 10%

Solucin
a) Para ambos el signo esperado es positivo (cuantos ms meses desempleado, ms
meses dejar de pagar la pensin, cuanto mayor sea el porcentaje que la pensin
alimenticia representa respecto a su renta disponible, ms meses dejar de
pagar). Por tanto deseamos contrastar la hiptesis H0: =0 contra la alternativa
H1: >0 [o si se prefiere H0: 0 y H1: >0]. Es pues un contraste unilateral.
5

Para 14 g.l. (20-6), el valor crtico en tablas para el 5% es 1.761 y los


estadsticos de contraste,

tM

0.5
25
5 y tY
1.25
0.1
20

Por tanto en el primer caso podemos rechazar la hiptesis nula y aceptar que la
variable afecta positivamente (signo positivo), pero no en el segundo.

b) En este caso se tratara de un contraste a dos colas (bilateral), H0: = 0 y H1:


0, siendo el valor crtico en tablas 2.977. El estadstico de contraste vale tA =
0.8, de manera que no podemos rechazar la hiptesis nula.
c) Anlogamente,

tB

3.0
0.15
1 y tY
3
3.0
0.05

Por tanto la variable religiosidad no es estadsticamente distinta de cero.

7. Suponga que con datos referidos al tamao de la clase (T) y al promedio de las
calificaciones (C), empleamos una muestra de 122 observaciones
correspondientes a alumnos de tercer curso para estimar la siguiente ecuacin,

Ci 520.4 5.82T , R 2 0.08, EER 11.5


(20.4) (2.21)
a) Construya un intervalo de confianza del 95% para el coeficiente de
pendiente 1
b) Calcule aproximadamente el valor p para el contraste bilateral de la hiptesis
nula H0: 1 = 0. En base a este resultado, rechazara la hiptesis al nivel del
5%?Y al 1%?
c) Contraste la hiptesis H0: 1 = -5.6 al nivel del 1%. Emplee un test unilateral
y uno bilateral, especificando en cada caso las hiptesis nula y alternativa y
los valores crticos en tablas.
d) Construya un intervalo de confianza del 99% para 0

Solucin
a) El intervalo se obtiene de 1 t / 2 ee( 1 ) . Buscando en las tablas de la
distribucin t para 120 g.l. (122-2), observamos que el valor crtico al 95%
es, 1.98, de manera que
t ee( ) 5.82 1.98* 2.21 (10.1958, 1.464)
1

/2

b) El estadstico de contraste es para dicha hiptesis es,

t120

5.82 0
2.63
2.21

En las tablas de la distribucin de referencia puede comprobarse que la


probabilidad de encontrar un valor menor que -1.98 es 0.05, que la
probabilidad de encontrar un valor menor que -2.358 es 0.01, que la
probabilidad de encontrar un valor menor que -2.617 es 0.005, etc. Es decir
que en este caso, el valor p < 0.005 y por lo tanto rechazaramos esa
hiptesis tanto al 5% como al 1%.
c) Siguiendo el mismo procedimiento, tendremos,
5.82 (5.6)
t120
0.0995
2.21
Para el test unilateral las hiptesis nula y alternativa sern H0: 1 = 0 y H1: 1 < 0 y el
valor crtico en tablas 2.36. No podemos pues rechazar la hiptesis.
Si empleamos un test bilateral las hiptesis nula y alternativa sern H0: 1 = 0 y H1: 1
0 y el valor crtico en tablas 2.62. No podemos pues rechazar la hiptesis.
d) El intervalo resulta como antes
t ee( ) 520.4 2.62* 20.4 (466.95, 573,85)
0

/2

8. Para estudiar la mortalidad infantil en una muestra de 64 pases


subdesarrollados, se estiman los dos modelos siguientes,

Yi 263.6416 0.0056 X1i 2.2316 X 2i ,


(11.59)
(0.0019) (0.2099)

R 2 0.7077

Yi 168.3067 0.0055 X1i 1.7680 X 2i 12.8686 X 3i ,


(32.89)
(0.0018) (0.2489)
(
)

R 2 0.7474

Siendo Y la tasa de mortalidad infantil, X1 el PIB per cpita, X2 la tasa de alfabetizacin


de las mujeres y X3 y la tasa de fecundidad total.
a) Justifique el signo esperado para X3
b) Compruebe si los cambios en los valores de los coeficientes por la inclusin de
X3 son estadsticamente significativos
c) A su juicio cul de los dos modelos presentados es mejor? Justifique su
respuesta
d) Calcule el error estndar del estimador correspondiente a X3

Solucin
a) A priori cabe esperar una relacin positiva: cuantos ms hijos tenga una mujer,
mayor ser la probabilidad de fallecimientos debidos a falta de atencin,
alimentacin, salud, etc.
b) El correspondiente al PIB per cpita apenas ha variado al contrario que el
coeficiente de la tasa de alfabetizacin que es bastante diferente. Para contrastar
si esta diferencia es estadsticamente significativa, podemos emplear un test tipo
t y contrastar si en la primera ecuacin, el coeficiente de esta variable es
estadsticamente distinto de -1.768, o ver si en la segunda el coeficiente es
significativamente distinto de -2.2316,

t61

2.2316 (1.768)
2.23
0.2099

Al ser mayor (en v.a.) que el valor crtico en tablas al 1%, rechazamos la
hiptesis nula, es decir que la diferencia es significativa.
c) Obtenemos el valor del estadstico F para contrastar si la segunda regresin es
preferible a la primera,
F1,60

(0.7474 0.7077) /1
9.43
(1 0.7474) /(64 4)

Por tanto rechazamos la hiptesis nula de que la tasa de fecundidad sea no


significativa.

d) Para obtenerlo basta recordar la relacin entre los estadsticos t y F,

F1, g t g2

Lo que en este caso significa que el valor del estadstico t para la hiptesis de
que esa variable es nula, vale 9.43 = 3.07 y por lo tanto el ee(b3) =
12.8686/3.07 = 4.19

9. En diciembre de 1969 aparecieron publicadas en una prestigiosa revista de


investigacin, las siguientes dos regresiones, referidas a una muestra de 74
pases con datos de 1964,

ln S / Y 7.3439 0.1596lnY / N 0.0254lnG 1.352ln D1 0.3990ln D2


ln S / N 2.7851 1.1486lnY / N 0.0265lnG 1.3438ln D1 0.3966lnD2

siendo, S/Y el ratio de ahorro del pas, S/N el ahorro per cpita, Y/N la renta per
cpita, G la tasa de crecimiento de la renta per cpita, D1 el porcentaje de
poblacin por debajo de 15 aos y D2 el porcentaje de poblacin por encima de
64 aos.

a) Explique si los signos de los coeficientes son los esperados


b) Examine cuidadosamente los resultados de ambas estimaciones y diga si le
parecen correctos, justificando su respuesta

Solucin

a) Los signos son efectivamente los esperados: el ahorro (tanto si es la propensin


media, como si es el ahorro per cpita) aumentar con la renta per cpita y con
su tasa de crecimiento. Por otra parte la poblacin entre 0-14 y de ms de 64, no
trabaja y por tanto no ahorra, lo que justifica el signo negativo.
b) Dado que,

S SY

, ln S / N ln S / Y ln Y / N
N Y N
de manera que la segunda ecuacin debera ser exactamente igual quela primera
excepto que al coeficiente de ln Y/N habra que sumarle exactamente una
9

unidad. Observando las estimaciones, se comprueba que este requisito, aunque


se verifica aproximadamente para todas las variables, no lo hace para el trmino
independiente que es significativamente diferente en ambas ecuaciones. Los
resultados no pueden ser correctos.

10. Con una muestra de 220 viviendas vendidas en una comunidad, se ha tratado de
modelizar el precio obtenindose,

Pi 119.2 0.485 X 1i 23.4 X 2i 1.7 X 3i 0.02 X 4i


0.090 X 5i 48.8 X 6i ,

R 2 0.72, SCE 41.5

siendo,
P, el precio en miles de , X1, nmero de dormitorios, X2, nmero de baos, X3, el
tamao de la vivienda (en m2), X4, el tamao de la parcela, X5, la antigedad de la
vivienda en aos y X6, es una variable binaria que toma el valor 1 si el estado
general de la casa es malo. SCE es la suma de cuadrados explicada.

a) Suponga que un propietario hace una reforma consistente en convertir parte de


una sala existente en un nuevo cuarto de bao. Cul ser el efecto en el precio
de la casa?
b) Otro propietario aade un nuevo cuarto de bao aumentando el tamao de la
misma en 9 m2. Cul es el efecto sobre el precio?
c) Qu suceder con el precio de una vivienda si su propietario deja que se
deteriore hasta que pueda considerarse en mal estado?
d) Calcule en R2 de la regresin y un estimador de la varianza de las perturbaciones

Solucin
a)
b)
c)
d)

El precio se incrementar en 23400


El incremento ahora ser 23400+15300=38700
El precio se reducir en 48800
Teniendo en cuenta la equivalencia entre el coeficiente de determinacin y el
coeficiente de determinacin corregido (2.3.16), se encuentra inmediatamente
que
R2 = 0.7276. Por lo tanto,

SCE
0.7276 y SCT 57.037, SCR 15.537
SCT
10

Entonces,

SCR
15.537

0.073
n k 1 220 7

11. La misma ecuacin del ejercicio anterior con los errores estndar de los
estimadores entre parntesis, es,
Pi 119.2 0.485 X 1i 23.4 X 2i 1.7 X 3i 0.02 X 4i
(23.2) (2.61)

(8.94)

0.090 X 5i 48.8 X 6i ,
(0.311)

(0.12) (.00048)
R 2 0.72, SCE 41.5

(10.5)

Conteste a las siguientes cuestiones,

a) Es significativo el coeficiente de X1? Escriba las hiptesis nula y alternativa


empleadas, as como el nivel de significacin y el valor crtico en tablas
b) En general las casas con cinco dormitorios se venden por un precio muy superior
a las de dos dormitorios. Es esto compatible con la estimacin del enunciado y
la respuesta dada en a)?
c) El propietario de una vivienda compra un solar adyacente de 500m2. Construya
un intervalo de confianza del 99% para el incremento de valor de la vivienda
d) El estadstico F una vez omitidas las variables X1 y X5, es F = 0.08 Son los
coeficientes de estas variables estadsticamente distintos de cero al 10%? Escriba
la hiptesis nula a contrastar.

Solucin
a) El signo esperado es positivo de manera que las hiptesis nula y alternativa son
respectivamente H0: = 0 y H1: > 0. El test apropiado es un test t, que arroja el
siguiente resultado t220-7 = 0.485/2.61 = 0.186. Una t213 es virtualmente una
normal. Para un nivel del 5% en un contraste unilateral, el valor crtico es 1.64,
de manera que no podemos rechazar la hiptesis nula.
b) El coeficiente de X1 mide el efecto parcial del nmero de dormitorios
manteniendo constante X3, el tamao de la vivienda. Dado que una vivienda con
5 dormitorios es mucho ms grande que una de 2, el resultado en a) no nos dice
gran cosa.
c) El intervalo de confianza del 99% ser 500(0.022.58*0.00048) (9.38, 10.62)

11

d) El valor crtico al 10% de dicha distribucin es F2, = 2.30. Dado que 0.08 <
2.30 no podemos rechazar la hiptesis nula H0= 1 = 5 =0

12. Para estudiar la relacin entre las ventas de helados, Y, y la temperatura de una
determinada ciudad costera, X, se estiman los cuatro modelos siguientes, con
datos diarios del ao 1992 (N=365),
SCR 5324.75

(3)

Yt 105 400 Dt 4.7 X t 8.3Dt X t ,


Yt 250 3.5 X t 9 Dt X t ,
Y 124 557 D 7.3 X ,

(4)

Yt 350 7.7 X t ,

SCR 9819.15

(1)
(2)

SCR 7294.3
SCR 5480.68

D es una variable dummy que toma el valor 1 si el da en cuestin es de los


meses de julio, agosto o septiembre.
a) Interprete los resultados anteriores
b) Elija el modelo que considere ms adecuado

Solucin
a) En los tres primeros modelos estamos suponiendo que el hecho de estar en
verano tiene un efecto adicional al de la temperatura. En (1) la dummy afecta
tanto a la constante como a la pendiente, en 2 solo a la pendiente y en 3 solo
a la constante. Se observa una variacin importante en el coeficiente de X
segn consideremos uno u otro modelo. El modelo (4) hace depender las
venta nicamente de la temperatura
b) La eleccin desde un punto de vista estadstico ha de basarse en el tamao de
la SCR. Aunque en puridad habra que comparar los cuatro modelos, dada la
escasa variacin en cuanto a los grados de libertad, los dos candidatos mejor
situados son el modelo (1) y el (3). Dado que el (3) resulta de imponer en (1)
la restriccin 4 =0, podemos emplear un contraste tipo F,
(5480.68 5324.75) /1
10.54
5324.75 /(365 4)
Este valor es mayor que el crtico en tablas para cualquiera de los niveles de
significatividad habituales. Por lo tanto rechazamos la hiptesis nula y
elegimos el modelo (1).
F1,361

Como solo hay un grado de libertad en el numerador, podemos tambin


obtener el ratio t para b4 como la raz cuadrada de 10.54, es decir 3.25,
12

aproximadamente, lo que conduce a la misma conclusin: la variable DX es


estadsticamente significativa y el modelo (1) mejor que el (3).

13. Una regresin mltiple con dos variables explicativas arroja el siguiente
resultado,
Y 4 0.4 X1 0.9 X 2 ,

530, N 29
R 2 8 / 60, '

siendo

29 0 0

X'X 0 50 10
0 10 80

a) Contraste la hiptesis de que las dos pendientes suman 1


b) Contraste la hiptesis de que la pendiente de X1 es nula

Solucin
a) Las varianzas de los estimadores resultan de,
1

0
0
29 0 0
0.034483

520

2
1
( X'X)
0 50 10 20
0
0.020513 0.002564

29 3

0
0.002564 0.012821
0 10 80

Por lo tanto los errores estndar de los estimadores de pendiente,

1 ) 20*0.020513 0.41026, ee( 1 ) 0.64


var(
2 ) 20*0.012821 0.25642, ee( 1 ) 0.506
var(
) 20*(0.002564) 0.051
cov(
1

El contraste de la hiptesis H0: 1+ 2=1 puede entonces llevarse a cabo a partir


del estadstico,

t293

0.4 0.9 1
0.3

0.399

0.41026

0.25642

2*0.051
var( 1 ) var( 2 ) 2cov( 1 2 )

De manera que la hiptesis no puede ser rechazada.

13

b) Empleando los datos anteriores,

t26

0.4
0.79
0.506

De manera que la hiptesis no puede ser rechazada.

14. Un investigador cree, acertadamente, que la relacin entre dos variables X e Y


viene dada por Y = 1 +2X+u. Dada una muestra de n observaciones de dichas
variables, junto con una tercera Z, que no es determinante de Y, el investigador
estima 2 como,

b2

(Z Z )(Y Y )
(Z Z )( X X )
i

Suponiendo que Z y X son no estocsticas analice si dicho estimador es


insesgado.

Solucin
Sustituyendo Y por su valor,

Z Z Y Y
Z Z X X
Z Z [ X u ] [ X u ]

Z Z X X
Z Z [ X X ] u u Z Z u u

Z Z X X
Z Z X X

b2

donde hemos expresado el estimador como la suma del verdadero parmetro


poblacional ms un trmino de error.
Por lo que se refiere a la insesgadez,

14

Zi Z ui u
E b2 E 2 E

Zi Z X i X

Z Z u u E Z Z u u
i

Z Z X X
Z Z E u u

Z Z X X
i

Z X i X

La esperanza de 2 es obviamente 2 (es una constante) y el denominador de


la esperanza del segundo trmino puede salir fuera del operador esperanza si
asumimos que Z y X son no estocsticas.
En cuanto al numerador, empleamos la propiedad de que la esperanza de
una suma es la suma de las esperanzas, junto con la no aleatoriedad de Z y el
supuesto habitual de que la esperanza del trmino de error es nula.
As llegamos a la conclusin de que el estimador es insesgado.
15. Tras recoger una muestra de 100 observaciones de las variables X e Y, un
investigador propone estimar 1 en la regresin Yi = 0+1Xi+i a partir de la
Y Y
expresin 1* n 1 .
X n X1
a) Compruebe si el estimador es sesgado o insesgado
b) Qu puede decir de la varianza del estimador en relacin con la del
estimador MCO? En concreto, cul de los dos estimadores tendr una
varianza menor?
c) Diga si el estimador * es consistente. Justifique su respuesta.
1

Solucin
a) El estimador es insesgado puesto que,

Yn Y1
( 1 X n n ) (0 1 X n n )
( )
0
1 n 1
X n X1
X n X1
X n X1
Y, teniendo en cuenta los supuestos del modelo, la esperanza de la expresin
anterior es precisamente, 1

15

b) Dado que el estimador pertenece a la misma clase de estimadores que el MCO,


el teorema de Gauss Markov garantiza que la varianza de este estimador ser
mayor que la de MCO.
c) Este estimador no es consistente. Independientemente del tamao muestral, se
obtiene solo a partir dos observaciones (primera y ltima), por lo que aumentar
el tamao de la muestra no tendr aqu el efecto deseado, es decir la
convergencia hacia el verdadero valor del parmetro.

16. Con datos USA del periodo comprendido entre el primer trimestre de 1948 al
segundo de 1978 (estadsticos t entre parntesis), se ha estimado la siguiente
ecuacin,

p
y
h
ln 1.5492 0.7135ln 0.1081ln e 0.0045t ,
k
k
p
(16.33) (21.69)
(6.42)
(15.86)

R 2 0.98

y= produccin real en el sector privado


k= medida del flujo de servicios de capital
h= horas por persona en el sector privado
pe = ndice de precios al productor para el combustible y productos relacionados
p = Deflactor de precios en el sector privado
t = tiempo

a) Apoya la estimacin anterior la hiptesis de que un aumento en el precio


relativo de la energa causa un descenso de la productividad del capital
existente- y de los recursos laborales? Justifique su respuesta
b) Entre 1972 y 1977 el precio relativo de la energa (pe /p) aument un 60%. A
partir de la ecuacin anterior, cul es la prdida de productividad?
c) Tenidos en cuenta los cambios en (h/k) y (pe /p), cul fue la tendencia de la tasa
de crecimiento de la productividad durante el periodo muestral?
d) Cmo debe interpretarse el coeficiente de (h/k), 0.7135?
e) El hecho de que cada coeficiente individual sea significativo, significa que
podemos rechazar la hiptesis de que R2 = 0?Por qu?

Solucin

a) S dado que el signo del coeficiente del precio es negativo y estadsticamente


significativo
16

b) La prdida se cifra en 60*0.1081 = 6.486%


c) La tendencia de la tasa de crecimiento fue de un 0.45%
d) Es una elasticidad: por cada incremento de un punto porcentual en el factor
trabajo, el incremento de la produccin es 0.7135 %
e) Si todos los coeficientes son estadsticamente significativos, es muy poco
probable que no sean globalmente significativos. En este caso,
F3,118

0.98 / 3
1928.37
(1 0.98) /118

17. La siguiente ecuacin trata de explicar el salario de los directores generales en


diferentes sectores productivos,

log( salario
) 4.59 0.257 log(ventas) 0.011roe 0.158 finan
(0.30) (0.032)
(0.004) (0.089)
0.181cons 0.283serv,
(0.085)
(0.099)
N 209, R 2 0.357
roe es el rendimiento de los activos; finan, cons y serv, son variables binarias
para los sectores financiero, de consumo y servicios. El sector del transporte se
ha tomado como categora base.

a) Cmo debe interpretarse el valor del coeficiente de ventas?


b) Calcular la diferencia porcentual aproximada en el salario entre los sectores de
transporte y servicios, manteniendo fijas ventas y roe. Es esta diferencia
significativa al 1%?
c) En general si b1 es el estimador de una variable ficticia donde la endgena est
en logaritmos, la diferencia porcentual exacta entre el valor esperado cuando la
ficticia toma el valor 0 y 1, viene dado por 100[exp(b1)1]. Emplear esta
expresin para calcular la diferencia salarial exacta del supuesto contemplado en
b y comparar los resultados.
d) Cul ser la diferencia porcentual aproximada entre los salarios de los sectores
de consumo y financiero. Escribir una ecuacin que permita contrastar si esta
diferencia es estadsticamente significativa.

17

Solucin
a) Mide directamente la elasticidad, es decir un incremento de un 1% en las ventas,
provocar un incremento de un 0.257% en el salario del director general.
b) La diferencia ser exactamente el valor del coeficiente de la dummy servicios
multiplicada por 100, es decir -28.3%. Es estadsticamente significativa, dado
que
-0.283/0.099 = -2.85.
c) 100[exp(-0.283)-1] =-24.65%, algo mayor que la cifra anterior
d) La diferencia ser 100(0.181-0.158)=2.3%. Para contrastar si la diferencia es
significativa, deberamos estimar una ecuacin en la categora base fuese el
sector financiero (o el de consumo) y ver luego si la dummy del sector de
consumo (financiero), es o no estadsticamente significativa.

18. Para contrastar el efecto, si lo hay, del consumo de marihuana sobre el salario de
los trabajadores, disponemos de datos de salarios, educacin, experiencia y sexo
de una muestra longitudinal. Adems disponemos de la contestacin de cada
trabajador a la pregunta En cuntas ocasiones fumaste marihuana el mes
pasado?
a) Escribir una ecuacin que permita estimar los efectos sobre el salario del
consumo de esta droga
b) Especificar un modelo que permita contrastar si el consumo de marihuana
tiene efectos distintos en hombres y mujeres. Cmo se contrastara que no
hay diferencias entre sexos?
c) Supongamos que se considera preferible medir el consumo clasificando a los
individuos en cuatro grupos: no consumidor, consumidor ocasional (1-5
veces al mes), consumo moderado (6-10 veces) y consumidor habitual.
Proponer un modelo que permita estimar los efectos de la droga sobre el
salario.
d) Usando el mtodo definido en c), explicar cmo contrastar la hiptesis nula
de que el consumo no afecta al salario.
e) Cules son los problemas para obtener inferencia causal con este tipo de
datos?

Solucin:
a) Un modelo adecuado sera,
log(salario) = 0+1uso+2educ+3exper+ 4exper2+ 5mujer+u
de manera que 1001 medir el cambio porcentual en el salario derivado
consumir marihuana una vez ms al mes.
18

b) Emplearamos el modelo,
log(salario) = 0+1uso+2educ+3exper+ 4exper2+ 5mujer+6mujer*uso
La hiptesis nula de que el uso de la droga no presenta diferencias por
gnero sera H0: 6=0
c) Definiendo las dummy apropiadas y tomando como categora base a quienes
no consumen droga,
log(salario) = 0+1uso1+1uso2+1uso3+2educ+3exper+ 4exper2+
5mujer+u
uso1, uso2 y uso3, son dummy para los diferentes grados de consumo.
d) La hiptesis nula es H0: 1=3=3=0. El estadstico de contraste sera una F
con q=3 y n-8 g.l.
e) El trmino de error contendr factores como el historial familiar (que incluye
el historial del uso de droga por parte de los padres) que podran afectar a los
salarios y tambin estar correlacionados con el uso de marihuana. Nos
interesa el efecto del uso de droga por parte de una persona en su salario, de
manera que debemos procurar mantener constantes el resto de los factores.
Deberamos procurar obtener datos del historial familiar para incluirlo en la
ecuacin como una variable adicional.

19. Para tratar de analizar si la pertenencia a un sindicato influye en el salario,


estimamos la siguiente ecuacin,

Wi 11.4 0.30edad 0.0003edad 2 1.01educ 1.22Sind , N 34, R 2 0.14


(0.34) (0.10)

(0.002)

(0.20)

(1.20)

donde w es el salario en euros/hora, edad es la edad en aos del trabajador,


educ, los aos de educacin y sind una dummy que toma el valor 1 si el
trabajador est afiliado a un sindicato.
a) Valorar los resultados de la ecuacin anterior
b) Cmo justificamos la inclusin de la edad al cuadrado? Qu tipo de
relacin hay entre el salario y la edad? No viola la inclusin de edad y
edad2 el supuesto de no multicolinealidad perfecta?
c) Considera que la forma funcional es adecuada? Justifique su respuesta
d) No deberamos ignorar el trmino independiente?

19

e) Basndose en los resultados de la regresin, considera que es beneficioso


para un trabajador estar sindicado? Justifique su respuesta.

Solucin:
a) Todos los coeficientes estimados tienen los signos (direccin) esperados. Los de
edad y nivel de estudios, son estadsticamente significativos, sin embargo el
coeficiente de determinacin corregido, es bajo.
b) Implicara que los salarios crecen con la edad de forma no lineal: el crecimiento
es menor cuanto mayor es el valor de la edad. La relacin parece lineal por
cuanto el coeficiente de edad2 no es significativamente distinto de cero. Edad y
Edad2 no tienen colinealidad perfecta.
c) Dado que los incrementos en los salarios suelen negociarse en trminos
porcentuales, una relacin semilogartmica donde la variable dependiente fuese
log w, sera ms apropiada (as es como suele tratarse este tipo de ecuaciones en
la literatura economtrica)
d) En este contexto suele ser una buena idea ignorar el trmino independiente (a no
ser que estemos seguros de su existencia) incluso si su magnitud es elevada.
e) El coeficiente de la dummy correspondiente es suficiente para afirmar que, en
este caso, no hay evidencia favorable a que la sindicacin redunde en mayores
salarios.

20. Considere la dos regresiones,


y 1 x1 2 x2 3 x3 u ,

y 1 z1 2 z2 3 z3 u

con,

z1 x1 2 x2
z2 x2 4 x3
z3 2 x1 3x2 5 x3
Sea X = [x1 x2 x3] y Z = [z1 z2 z3]
a) Mostrar que las columnas de Z pueden expresarse como combinaciones
lineales de las columnas de X, es decir que Z = XA siendo A una matriz 3x3.
Encontrar los elementos de dicha matriz
b) Dados los elementos de A-1 mostrar que los residuos estimados de las dos
ecuaciones son idnticos.
20

c) Cul es la relacin entre 1 y i para i = 1, 2, 3? Cul es la relacin entre

1 y i para i = 1, 2, 3?
Solucin:
a) Es inmediato comprobar que las ecuaciones que relacionan las columnas de
Z con las columnas de X son,

z1 x1 2 x2
z2 x2 4 x3
z3 2 x1 3x2 5 x3
Y por lo tanto la matriz A que resuelve Z = XA es,

1 0 2
A 2 1 3
0 4 5
Para mostrar que las columnas de X son combinaciones lineales de las columnas
de Z, necesitamos resolver el sistema anterior para expresar cada xi como
funcin de zi, es decir, debemos calcular X = ZA-1. A es una matriz cuadrada no
singular y por tanto invertible, de manera que A-1 existe. Tenemos entonces,

X = ZA z1
1

z2

17 8 2

z3 10 5 1
8 4 1

b) Las matrices de proyeccin P y las matrices productoras de residuos M, son


las mismas en ambos casos, es decir PX=PZ dado que,

PX X(X'X)1 X ' (ZA1 )[(ZA1 )(ZA1 )]1 (ZA1 )' Z(Z'Z)1 Z ' PZ
Por tanto las matrices productoras de residuos MX, MZ han de ser tambin
iguales, con lo que queda probada la afirmacin.
c) Puesto que los residuos de las dos regresiones son iguales, debe cumplirse la
igualdad XA X . Ello implica que A y A 1 de donde se
obtiene,

1 1 23
1 17 1 82 23

21

21. Un investigador tiene datos de corte transversal sobre salarios agregados, W,


beneficios agregados, P, y renta agregada, Y, de una muestra de n pases. Por
definicin Y = W+P. Empleando el anlisis de regresin se estimar las
ecuaciones,

W a1 a2Y
P b b Y
1

a) Mostrar que los resultados de la regresin satisfarn las siguientes


igualdades: a2+b2 = 1 y a1+b1 =0

Solucin:
a)

Y Y W W Y Y P P
Y Y
Y Y
Y Y W P W P Y Y Y Y 1

Y Y
Y Y

a2 b2

a1 b1 (W a2Y ) ( P b2Y )
W P a2Y b2Y
Y Y 0

22. Dadas las expresiones,

T 1u'u

T 1u'u
]
E[u'u
']
E[uu
con u (u1 , u2 ,..., uT ) y u (u1 , u2 ,..., uT )
Explicar el significado de cada una de ellas y su relacin con u2
Solucin:
T 1u'u es la media muestral de los cuadrados de los residuos. Tomando
esperanzas,
22

E[T 1u'u] T 1E (u'u) T 1T u2 u2

es la media muestral de los cuadrados de los residuos.


Anlogamente T 1u'u
Como sabemos,

u2 t2k y dado que la esperanza de una distribucin 2 con t-k g.l. es


u'u

precisamente t-k, tenemos,


] E[ u2 t2k ] u2 E[ u2 t2k ] u2 (T k )
E[u'u

'] es la matriz de covarianzas de los residuos. Dadas las


Finalmente E[uu
hiptesis bsicas del modelo,

'] u2ITT
E[uu

23. Sea el modelo,

y X + u, u N (0, 2I)
y supongamos que dicho modelo se puede expresar como,

y X11 X2 2 u
con la condicin de que X1 y X2 son ortogonales, es decir X1T X2 = 0 .
Demuestre que el estimador MCO se puede expresar como,
1 ( X1T X1 )1 X1T y
( XT X )1 XT y
2

Solucin:

T
( X X) X Y X1 X
1
T
X 2
T

XT X
1T 1
X 2 X1

X1T
X2 T Y
X 2

X1T X 2 X1T
Y
XT2 X 2 XT2

Pero por las condiciones de ortogonalidad X1T X2 XT2 X1 0 y,

23

XT X
1T 1
X 2 X1

X1T X1
X1T X 2 X1T
Y

XT2 X2 XT2
0

( X1T X1 ) 1

0 X1T
Y
XT2 X 2 XT2
X1T
( X1T X1 ) 1 X1T Y 1
0
Y T

1 T
( XT2 X 2 ) 1 XT2
( X 2 X 2 ) X 2 Y 2

24. Sea el modelo yi=1xi+2wi+ui donde por sencillez se ha supuesto que todas las
variables tienen media nula y se ha omitido el trmino independiente.
Supongamos que Xi se distribuye de forma independiente de (Wi, ui) pero que
estas dos ltimas variables pueden estar correlacionadas. Sean y , los
1

estimadores MCO de este modelo. Demuestre que,


a) Tanto si Wi y ui estn correlacionados como si no, 1 converge en
probabilidad a 1
b) Si Wi y ui estn correlacionadas 2 es inconsistente

Solucin:
(a)

1Xi

Escribimos el modelo de regression como, Yi


matricial,
Y

2Wi

ui, o en forma

Donde,
Y1

Y
Y 2,


Yn

X1

X
X 2,


Xn

1 ,

El estimador MCO es,

24

2 .

W1

W
W 2,


Wn

u1

u
U 2,


un

1 XX XW 1 XY

WX WW WY
2
1

XX XW XU
1

2 W X W W W U
1 XX
1 1n
2 n W X

1
n
1
n

XW 1n XU

WW 1n WU

1 n X 2
1 1 n n i 1 i
2 n i 1 Wi X i

1
n

in1 X iWi

1
in1 Wi 2
n

1n in1 X i ui
1 n

Wu
n i 1 i i

Por la ley de los grandes nmeros,


1
n

p
p
in1 X i2
E( X 2 ); 1n in1 Wi 2
E(W 2 );

1
n

p
in1 X iWi
E( XW ) 0

(Porque X y W son independientes y tienen media nula);


p
1
in1 X i ui
E( Xu) 0 (porque X y u son independientes con media cero);
n
p
1
in1 X i ui
E( Xu) 0 . Por tanto,
n
1
1 p 1 E ( X 2 )
0 0


E (W 2 ) E (Wu )
2 0
2
1

E (Wu ) .
2 E (W 2 )

p
(b) De la respuesta a (a) 2
2

E (Wu )
2 si E(Wu) 0.
E (W 2 )

25. a) Dos variables X e Y estn relacionadas segn Yi= 2Xi+ui, donde u es una
perturbacin que satisface los supuestos del modelo de regresin.
i.
ii.

Obtener el estimador MCO para esta ecuacin


Explicar en trminos generales, porqu el procedimiento mnimo
cuadrtico es recomendable si se satisfacen los supuestos habituales

b) Considere ahora la relacin Y i= 1+2Xi+ui siendo X no estocstica y u la


perturbacin sujeta a los supuestos usuales. Para este modelo es conocida la
expresin del estimador MCO que es insesgado, as como la expresin de su
varianza. Dada una muestra de n observaciones un investigador decide estimar

2 segn 2

Yi X i

i.
ii.
25

2
i

, cuya varianza es

u2

2
i

Demostrar que este estimador es en general sesgado


Analizar si es posible determinar el signo del sesgo

iii.

Demostrar que si 1 = 0, el estimador es insesgado Qu puede decirse


en este caso de la eficiencia de respecto al estimador MCO,
2

yx / x
iv.

Demostrar que 2 ser insesgado si X 0 Qu puede decirse en este


caso sobre la eficiencia de respecto al estimador MCO, yx / x 2
2

?
v.

Sean 1 0 y X 0 y supongamos que X vara poco en la muestra. Es


posible que este estimador sea mejor que el MCO?

Solucin:

a) i. Procediendo de la forma habitual, minimizamos


(Y 2 X )2

XY
Obteniendo 2 2
X

ii. Si se cumplen los supuestos habituales proporciona estimadores insesgados,


eficientes y consistentes

b) i. Es fcil ver que,

XY X (1 2 X u) 1 X Xu
b2 2
2
X2
X2
X2
X2
E (b2 )

1 X

XE (u) X
X
X
1

Dado que X es no estocstica.


Por tanto el estimador ser en general sesgado.
ii. El signo del sesgo depende de 1 y de X y no se dispone de esa informacin
iii. Si 1 = 0 del desarrollo anterior se deduce que
26

Xi

E ( 2 ) E 1
2 E (0 2 ) 2
X2

( X X )(Yi Y )
a menos que la media de X sea
2 es ms eficiente que i
( X i X )2
nula, dado que la varianza poblacional de 2 ser
estimador alternativo es

u2

(X

2
i X)

u2

u2

2
i

nX 2

2
i

, mientras que la del

que necesariamente es

mayor, al ser menor el denominador.


vi. Si la media de X es distinta de cero el estimador es sesgado!
vi.

Si X tiene poca variacin muestral


la varianza poblacional de

(X X )

( X X )(Y Y )
(X X )
i

ser pequea y por tanto


ser grande. Por tanto, si

empleamos el criterio del menor error cuadrtico medio, 2 puede ser


preferible si el sesgo es pequeo.

26. Considere el siguiente modelo para explicar la tasa de mortalidad debida a


enfermedades coronarias en un pas hipottico,

Yt 14 10.2Ct 4.5Et 1.1M t


(2.5) (1.2) (0.5)
C = consumo per cpita de cigarrillos
E = consumo per cpita de grasas saturadas
M = consumo per cpita de carne
Los datos corresponden a una muestra anual de 31 observaciones, siendo el
coeficiente de determinacin, 0.678.
a) Explicite las hiptesis nula y alternativa apropiadas para contrastar la
significatividad estadstica de los parmetros individuales.
b) Contraste la significatividad global de la regresin sabiendo que el valor
crtico al 5% es 2.95. Puede decir si es significativa al 10%?
27

c) Construya un intervalo de confianza del 95% para la varianza de las


perturbaciones aleatorias (tome como valores crticos de la distribucin
terica correspondiente 14.57 y 43.19)
d) A su juicio y con los datos proporcionados, es apropiado el modelo?
Justifique su respuesta.
e) Un investigador considera que los efectos de las grasas saturadas y el
consumo de carne son iguales. Escriba la especificacin representativa del
modelo restringido.
f) Suponga que estimado el modelo restringido, se obtiene un valor para el
coeficiente de determinacin de 0.547. Contraste la validez de la restriccin
para un nivel de significatividad del 5% (tome 3 como valor crtico
aproximado).

Solucin
a) Para cada caso H0: = 0 y H1: 0 ( H1: > 0)
b) F3, 27 = 18.95, luego se rechaza H0 y se acepta la significatividad global al
5%. Con mayor razn la regresin ser significativa al 10% (par este nivel de
significatividad el valor crtico ser menor)
c) Debe dejarse en funcin de u2 y quedara aprox. (0.625 u2 ,1.853 u2 )
d) La variable M, aunque significativa, tiene un signo contrario al esperado. En
este sentido (y a falta de valorar otras cuestiones heterocedasticidad) el
modelo no puede considerarse satisfactorio.
e) El modelo sera entonces Yt 0 1Ct 2 ( Et M t ) ut
f) El estadstico F para contrastar esta hiptesis, obtenido a partir de los
coeficientes de determinacin de las regresiones restringida e irrestricta, vale
aproximadamente 10.98, siendo muy superior al valor crtico. En
consecuencia se rechazara la hiptesis nula, es decir que ambos parmetros
sean iguales.

27. Para tratar de explicar la relacin entre el peso de los bebs al nacer (en onzas) y
el consumo de tabaco de las madres, se dispone de una muestra de 1388
observaciones. Con los datos de varianzas, covarianzas y medias dados en la
tabla siguiente,
Peso al nacer
Peso al nacer
Cigarrillos
consumidos
Medias

28

Cigarrillos
consumidos
413.9854
18.31459
35.6473
18.31459
118.6996

2.087176

a) Estime el modelo apropiado que relaciona ambas variables


b) Cul es el peso al nacer pronosticado cuando no se fuma?Y cuando X =20
(se fuma un paquete de cigarrillos diarios? Comentar la diferencia.
c) Implica necesariamente la regresin estimada que existe una relacin causal
entre ambas variables? Justifique su respuesta.
d) Cunto tendra que valer X para que el peso fuese 125 onzas? Comente este
resultado.
e) Suponga que

2
i

561551.3 y (ui ui 1 ) 1083794.01 . Calcule el


2

estadstico de Durbin y Watson y haga una valoracin aproximada de la


hiptesis de no autocorrelacin.
f) Sea la regresin,

u 2 408.56 3.011X 0.057 X 2 ,


(26.88) (9.61)
(0.34)

R 2 0.000119

donde X son los cigarrillos consumidos y u los residuos de la regresin estimada


en a). Valore aproximadamente el supuesto de homocedasticidad, indicando el
estadstico empleado y su distribucin.

Solucin

18.31459
a)
0.5138, 118.6996 (0.5138)*2.087176 119.77
35.6473
b) =119.77-0.5138*0 = 119.77; =119.77-0.5138*20 = 109.494
c) No, correlacin no implica causalidad. Debe haber razones tericas que la
justifiquen.
d) El valor de X tendra que ser negativo, lo que no tiene sentido en este
contexto
e) Se obtiene inmediatamente que DW = 1.93, lo que est suficientemente
prximo a 2 para mantener la no autocorrelacin.
f) El estadtico nR2 se distribuye como una 2 con 2 g.l. Su valor
1388*0.000119 = 0.165, es muy bajo y no permite rechazar la hiptesis nula
(la homocedasticidad).

29

28. Considere un modelo que explique los salarios de los directores generales de las
empresas (Y), en funcin de las ventas anuales (X1), el rendimiento de los pagars
(X2) y el rendimiento de las acciones de la empresa (X3),
log(Y) = 0+1log(X1)+2X2+3X3+u
a) Especificar la hiptesis nula de que, una vez tomada en cuenta a influencia de
las ventas y el rendimiento de los pagars, el rendimiento de las acciones no
influye en el salario de los directivos.
b) Si la estimacin es,
log(Y) = 4.32+0.28log(X1)+0.017X2+0.00024X3+u, n= 209, R2 = 0.283
(0.32) (0.035)
(0.0041) (0.00054)
cul sera el efecto pronosticado sobre el salario de un incremento de 50 puntos
en el rendimiento de las acciones?
c) Contrastar la significatividad individual de X3. Especificar claramente las
hiptesis nula y alternativa.
d) Justifique si incluira esta variable en el modelo final elegido para explicar la
remuneracin de los directores generales.
e) Contraste la significatividad global del modelo. Cul es la hiptesis nula en este
contraste?

Solucin

a) H0: 3 = 0, H1: 3 > 0


b) Se incrementara en un 0.012% aproximadamente, en log Y (lo cual implica un
incremento de aproximadamente un 1.2%) No obstante no se puede rechazar que
ese parmetro sea nulo (ver c), de manera que dicho incremento no producira
ningn efecto.
c) Las hiptesis nula y alternativa han sido especificadas en a). El estadstico de
contraste es t205 = N(0, 1) = 0.44, de manera que no se puede rechazar la
hiptesis nula.
d) NO, dado que claramente es no significativa
e) H0: 1 = 2 = 3 = 0. El estadstico de contraste es F3, 205 = [0.283:3]/[(10.283):205] = 26.97, de manera que se rechazara la hiptesis nula.

30

29. En la tabla siguiente se muestran las varianzas y covarianzas de los logaritmos de las
importaciones, el PIB y el IPC en USA entre 1975 y 2005,

a)

LIMPORT

LPIB

LIMPORT

0.562049

0.429960

LPIB

0.429960

0.332464

LIPC
Medias

0.272408
13.08472

0.211974
8.569723

LIPC
0.27240
8
0.21197
4
0.13712
9
4.785519

La estimacin de las importaciones arroja el siguiente resultado (errores estndar


entre parntesis),

yt 1.41 1.85 x1t 0.87 x2t ,


(0.27) (0.18)

(0.28)

Valore econmicamente los resultados obtenidos.


b)

c)

El coeficiente de determinacin de la regresin anterior es R2 = 0.992.


Sospecha de Multicolinealidad? Justifique su respuesta.
Estime las siguientes regresiones,

i.
ii.
iii.

log(import) = 1+ 2log(PIB) +u
log(import) = 1+ 2log(IPC) +u
log(PIB) = 1+ 2log(IPC) +u

Basndose en los resultados de estas regresiones, qu puede decir sobre la


naturaleza de la Multicolinealidad en los datos?

Solucin

a) Los parmetros son estadsticamente significativos pero el correspondiente a


precios, tiene signo contrario al esperado: si suben los precios lo lgico es que se
compren fuera ms bienes y servicios, es decir que se importe ms y no menos.
b) S, dado que hay un sntoma clsico: elevado coeficiente de determinacin junto
con signos no esperados de los coeficientes.
c) Las estimaciones son,
31

log(import) = 2.002 + 1.293log(PIB), R2 = 0.989321


(0.21) (0.025)
log(import) = 3.578 + 1.986log(IPC), R2 = 0.962795
(0.348) (0.072)
log(PIB) = 1.172 + 1.546log(IPC), R2 = 0.985574
(0.167) (0.035)
La regresin entre PIB e IPC (las variables exgenas en la ecuacin de
importaciones original), muestra un elevado coeficiente de determinacin lo que
indicara elevada correlacin y por tanto, multicolinealidad.

30. Se dispone de los datos de precios, P y cantidades, Q, de naranjas vendidos en la


frutera de 12 supermercados diferentes. Sabemos adems que,
= 70, = 100, = 3550, 2 = 2250

a) Obtenga la estimacin de la funcin de demanda


b) De acuerdo con los resultados obtenidos, qu sucedera si el precio sube un
1%? Es la estimacin anterior una funcin rgida o elstica?
c) La SCR de la regresin anterior es 699. Obtenga un intervalo de confianza del
95% para el estimador del precio (valor crtico aproximado, 2.1).
d) Usando el intervalo de confianza anterior, diga sin necesidad de hacer ms
clculos, si rechazara o no las siguientes hiptesis (justifique su respuesta),
i.
ii.
iii.

H0: 2 = 0,
H0: 2 = 1
H0 : 2 = 1

Solucin

3550
a)
1.578,
2250

32

Q P 100 1.578*70 210.4

Luego la estimacin de la ecuacin de demanda es = 210.4 1.578


b) Para calcular la elasticidad podemos emplear la frmula,
P
1.578*0.7 1.1
Q
Si el precio sube un 1% la cantidad cae un 1.1%: la funcin es elstica.
2
2
SCR

c) Sabemos que ( ) =

y que un estimador de la varianza de las


699

perturbaciones es 2 = nk = 122 = 69.9. Por tanto, la varianza estimada de


es,
( ) =

69.9
2250

= 0.031 . El intervalo vendr dado por,

2.1 ( ) = 1.578 2.10.031 = (1.208, 1.948)


d) Se rechazarn todas las hiptesis que postulen para valores que no estn dentro
del intervalo. En consecuencia, todas las hiptesis resultan rechazadas.

31. Con objeto de investigar el impacto de las indicaciones mdicas contra el consumo
de alcohol, se estima la siguiente ecuacin obtenida a partir de una muestra de 500
individuos (errores estndar entre parntesis),
y 13 11.36 x1 0.2 x2 2.85 x3 14.2 x4 , R 2 0.07
(2.12) (0.31) (2.55) (5.16)
donde y es el nmero de bebidas alcohlicas consumidas en las ltimas dos semanas, x1
es una dummy que toma el valor 1 si el mdico de cabecera ha indicado al individuo
que debe dejar el alcohol, x2 los aos de estudio del individuo, x3 es una dummy que
toma el valor 1 si el individuo es separado o divorciado y x4 es una dummy que toma el
valor 1 si el sujeto est en paro.
a) Valore los resultados de la regresin anterior, indicando si los signos de los
parmetros son los esperados
b) Contraste si las variables anteriores son significativas al 5%
c) Para los contrastes pedidos en b) utilizara un test unilateral o bilateral?
Justifique su respuesta
d) Contraste la significatividad global del modelo al 5%
e) En relacin con el objeto de la investigacin, cul sera la conclusin?
Solucin
a) Los signos son efectivamente adecuados, excepto para x1: si el mdico ha
aconsejado dejar de beber, el individuo bebe ms. El coeficiente de
determinacin corregido es bajo pero suficiente
b) Los valores de los ratios t indican que son significativas x1 y x4
33

c) Parece ms adecuado un test unilateral


d) El valor del coeficiente de determinacin obtenido a partir del coeficiente de
determinacin corregido es aproximadamente 2 = 0.077. El contraste de
significtividad global ser,

1, =

2
1
(1 2 )/()

0.077/4

= 0.9225/495 = 10.33

Se rechaza la hiptesis nula.


e) A juzgar por el signo del coeficiente y su contrastada significatividad, no parece
que dichas indicaciones tengan mucho efecto en los bebedores.

32. Considere el siguiente modelo para explicar la tasa de mortalidad debida a


enfermedades coronarias,

Yt 14 10.2Ct 4.5Et 1.1M t


(2.5) (1.2) (0.5)
Y = Tasa de mortalidad
C = consumo per cpita de cigarrillos
E = consumo per cpita de grasas saturadas
M = consumo per cpita de carne
Los datos corresponden a una muestra anual de 31 observaciones, siendo el
coeficiente de determinacin, 0.678.
g) Explicite las hiptesis nula y alternativa apropiadas para contrastar la
significatividad estadstica de los parmetros individuales.
h) Contraste la significatividad global de la regresin sabiendo que el valor
crtico al 5% es 2.95. Puede decir si es significativa al 10%?
i) A su juicio y con los datos proporcionados, es apropiado el modelo?
Justifique su respuesta.
j) Un investigador considera que los efectos de las grasas saturadas y el
consumo de carne son iguales. Escriba la especificacin representativa del
modelo restringido.
k) Suponga que estimado el modelo restringido, se obtiene un valor para el
coeficiente de determinacin de 0.547. Contraste la validez de la restriccin
para un nivel de significatividad del 5% (tome 3 como valor crtico
aproximado).
Solucin
a) Las hiptesis nula y alternativa seran en este caso H0: i = 0, H1: H1: i > 0
b) El contraste pedido es,
34

R2 / k 1
0.678 / 3

18.38
2
(1 R ) / n k (1 0.678) / 27
Luego la regresin es globalmente significativa al 5%. Con mayor motivo lo
ser al 10% (el valor crtico ser menor).
c) El signo del consumo de carne parece contrario al esperado
d) Yi 1 2Ci 3 Ei 3M i ui 1 2Ci 3 ( Ei M i ) ui
Fk 1,n k

e) En este caso,
2
( RNR
RR2 ) / m (0.678 0.547) /1
F1,27

9.1
2
(1 RNR
) / n k (1 0.678) /(31 4)

Se concluye que la restriccin no es vlida.


33. A partir de una muestra de 25 padres divorciados se ha obtenido la siguiente
estimacin (errores estndar entre parntesis),
Pi 2.0 0.50M i 15.0Yi 0.40 Ai 3.0Bi 0.15Ci , R 2 0.09
(0.10) (9.01) (1.00) (3.0) (0.05)
donde P es el nmero de veces que el padre ha dejado de abonar la pensin mensual
alimenticia en los ltimos cuatro aos, M el nmero de meses que el padre ha
permanecido desempleado en los ltimos cuatro aos, Y la parte de la renta disponible
que debe dedicar a pagar por las ayudas a sus hijos, A la edad en aos, B es una variable
que mide la religiosidad del padre en una escala de 1 a 4, siendo 4 la mxima
religiosidad y C el nmero de hijos.
a) Si el signo esperado de M e Y es positivo, establezca las hiptesis nula y
alternativa apropiadas para contrastar su significatividad al 5%.
b) Puede decirse que las creencias religiosas influyen en el cumplimiento de
los pagos? Justifique su respuesta.
c) De acuerdo con el modelo cuntas veces habr incumplido sus
obligaciones un padre de 30 aos con dos hijos que ha estado siempre
empleado, debe dedicar un 20% de la renta al pago de ayudas y no es
religioso?
d) Sabiendo que la varianza del error de pronstico es 0.64, construya un
intervalo de confianza del 95% para dicha prediccin.
e) Con objeto de contrastar la hiptesis de que la edad y la religiosidad no
influyen, se estima de nuevo la ecuacin de regresin excluyendo estas
variables, obtenindose un coeficiente de determinacin R2 = 0.078. Puede
rechazarse esa hiptesis? Justifique su respuesta.

Solucin
a) Seran H0: i = 0, H1: i > 0
35

b) No porque no se puede rechazar la hiptesis de que el parmetro


correspondiente sea nulo.
c) P = -2+0.5*0+15*0.2+0.4*30+3*1-0.15*2 =15.7, es decir unas 16 veces
d) 15.7 t0.05/20.64 = 15.72.11*0.8

e)

2
( RNR
RR2 ) / m (0.09 0.078) / 2

0.125
2
(1 RNR
) /(n k )
(1 0.09) /19

El estadstico se distribuye como una Fm,n-k de manera que no se puede rechazar


la hiptesis dado que el valor obtenido es menor que el tabulado.

34. La estimacin de la demanda de t de Ceiln en USA obtenida a partir de una


muestra de 22 observaciones, con todas las variables expresadas en logaritmos,
proporcion el siguiente resultado,

qt 2.837 1.481 p1t 1.181 p2t 0.186 p3t 0.257 yt , SCR 0.4277
(2.0) (0.79)
(0.66)
(0.11)
(0.11)
Siendo p1t el precio del t de Ceiln, p2t el precio del t de India, p3t el precio
del caf en Brasil, yt la renta disponible y qt la cantidad demandada. Entre
parntesis figuran los errores estndar.
a) Seale si los signos de los coeficientes son acordes con lo que se deriva de la
teora de la demanda.
b) Contraste la significatividad individual de cada una de las variables (ver
valores crticos en nota final)
c) Sabiendo que (2 , 3 ) = 0.53 contraste la hiptesis 2 = 3 es decir
que los parmetros de los precios del t son iguales pero de signo contrario
(se entiende que 1 es la constante, 2 el parmetro del precio del t de
Ceiln, etc).
d) Con la misma muestra se estima la ecuacin,

qt p1t 0.738 0.199 p3t 0.261yt , SCR 0.6788


Contraste la hiptesis conjunta H0: 2= 1, 3=0 y discuta las implicaciones
econmicas de la misma.

36

Solucin

a) S, son acordes con la teora: el precio del bien tiene signo negativo, el de los
bienes sustitutivos positivo y el de la renta tambin positivo.
b) El cociente entre cada estimador y su error estndar se distribuye como una
t17. Estos valores son respectivamente, -1.87, 1.79, 1.69 y 2.34. Excepto el
cuarto, todos ellos mayores que el valor crtico al 5% para un contraste
unilateral. El caf est en el lmite (valor p = 0.055 no se pude calcular con
los datos del ejercicio).
c) En este caso el estadstico,

b2 b3
1.481 1.181

var(b2 ) var(b3 ) 2cov(b2 , b3 )


0.792 0.662 2*(0.53)
El denominador es negativo por no haber empleado todos los decimales. De
haberlo hecho sera positivo, aunque muy pequeo. El resultado del
estadstico sera un valor elevado con lo que se rechazara la hiptesis.

d) Emplearemos un contraste F de tipo,

F2,17

(0.6788 0.4277) / 2
4.99
0.4277 /17

Comparando con el valor crtico en tablas la hiptesis sera rechazada al 95%


pero no al 99%. La hiptesis implica que la elasticidad respecto al propio
precio es unitaria y que el precio del t de la India no tiene ninguna
influencia.

35. Un fabricante de cable telefnico desea predecir sus ventas a su principal cliente
para lo que estima el siguiente modelo a partir de una muestra anual
correspondiente al periodo 1968-1983 (16 observaciones),

Yt 5918.3 4.784 X 1t 2.397 X 2t 815.529 X 3t 18.918 X 4t 842.791X 5t ,


(2536) (2.56)
(0.85)
(190.2)
(148.59)
(294.75)
SCR 4024058, R 2 0.819,

37

1 9.27,

2 5.35

siendo Y: ventas de cable (millones de pies), X2: PIB (miles de millones de dlares),
X3: construccin de vivienda nueva, X4: paro (%), X5: tipo de inters (%) y X6:
ganancia de lneas para el cliente (%). Entre parntesis se muestran los errores estndar
de los respectivos estimadores; 1 y 2 son respectivamente, el resultado del test de
Breusch Godfrey para la autocorrelacin serial (p=2) y el test de Breusch Pagan
Godfrey para heterocedasticidad,
a) Diga, razonndolo, qu coeficientes tienen los signos esperados
b) Emplee un test unilateral del 5% para contrastar la significatividad individual de
cada uno de los coeficientes anteriores
c) En relacin con los resultados del apartado anterior, qu habra cambiado (en
caso de que as fuera) si hubiese empleado un contraste bilateral?
d) Lleve a cabo un constraste de significatividad global. Especifique con claridad el
nivel de significancia y la hiptesis nula.
e) La tabla siguiente muestra la matriz de varianzas y covarianzas de los
estimadores (se excluye la constante),

X1
X2
X3
X4
X5

X1
6.565897
-1.491489
-246.9097
-313.0653
-253.6421

X2
-1.491489
0.726658
42.95137
100.7123
50.97218

X3
-246.9097
42.95137
36174.56
9764.317
35506.09

X4
-313.0653
100.7123
9764.317
22081.39
23799.44

X5
-253.6421
50.97218
35506.09
23799.44
86876.90

Contraste la hiptesis de los coeficientes de X4 y X6 son iguales.


f) Los valores esperados de las variables explicativas para el ao 1984 son X2=
1550, X3=1100, X4= 9, X5= 16 y X6= 2. Sabiendo que la varianza del error de
prediccin es 512968.22, construya para dicho ao un intervalo de confianza del
95% para la prediccin

Solucin

a) Esperaramos signos positivos para PIB, construccin de vivienda y ganancia


de lneas y negativos para la tasa de paro y el tipo de inters
b) Dividiendo cada uno de los parmetros entre su error estndar,

b
b5
b1
b2
b4
1.91,
2.82, 3 4.29,
0.127,
2.859
ee(b1 )
ee(b2 )
ee(b3 )
ee(b4 )
ee(b5 )
+
+

+
El test unilateral implica que contrastamos la hiptesis nula H1: bi > 0 contra
la alternativa H1: bi > (as es para el PIB, la construccin de vivienda o la
ganancia de lneas) H1: bi < 0 (paro y tipo de inters) es decir, la hiptesis
38

alternativa se construye en funcin de los signos esperados para cada uno de


los coeficientes. El valor crtico que se da en las tablas, corresponde a un
contraste a dos colas (bilateral). Comparando con este dato, vemos que no
seran significativas las variables X4 (tipo de inters) y X5 (ganancia de
lneas), dado que los valores del ratio quedan claramente en la regin de
aceptacin. El PIB no sera significativo al 5% en un contraste bilateral,
pero, al estar muy prximo 1.91 a 2, s lo ser en uno unilateral, puesto que
el valor crtico en este caso, ser bastante menor que 2 (el valor crtico es de
hecho 1.67 aprox.).
c) Ahora las hiptesis nula y alternativa son respectivamente H0: bi = 0 y H1: bi
0. Como se dijo antes, el PIB no sera ahora significativa pero s lo sera la
ganancia de lneas.
d) A partir del coeficiente de determinacin,

R 2 /(k 1)
0.818 / 5

8.98
2
(1 R ) /(n k ) (1 0.818) /(16 6)
De manera que la regresin es globalmente significativa. Las hiptesis nula y
alternativa son ahora,
Fk 1,n k

H0: 1=2 = =5 = 0
H1: No se cumple la hiptesis anterior (basta con que uno de los coeficientes
no sea nulo)
e) Emplearamos el estadstico,
(b4 b6 ) ( 4 6 )
var(b4 b6 )

que se distribuye como una t con n-k g.l. Bajo la hiptesis nula queda,

(b4 b6 )
(b4 b6 )

var(b4 b6 )
var(b4 ) var(b6 ) 2 cov(b4 , b6 )

815.529 842.791
27.262

0.119
36174.56 86876.9 235506.09 228.12

Por lo que no es posible rechazar la hiptesis.


f) Para esos valores el pronstico es y 7247.545 . Dado el valor de la varianza
del error de prediccin, el intervalo del 95% es,
7247.545 2 512968.22 7247.545 1432.44

39

36. Para analizar la influencia del nmero de alumnos por clase sobre la nota media
de los estudiantes, se ha estimado la siguiente regresin (errores estndar entre
parntesis),

Yi 69.89 2.28 X i , R 2 0.0512


(10.36) (0.49)
donde Y es la nota media del alumno y X la proporcin de alumnos por profesor
obtenidas de una muestra de 400 estudiantes de primera enseanza.
a) Indique si la regresin responde a lo esperado y porqu
b) Cul es la nota media esperada para un estudiante de una clase de 22 alumnos?
c) Para contrastar la significatividad estadstica del tamao de la clase, cules son
las hiptesis nula y alternativa ms apropiadas?
d) Lleve a cabo el contraste anterior utilizando los niveles de significacin del 5%
y del 1%
e) Calcule si es posible, el contraste de significatividad global. Qu aadira en
este caso este test al de significatividad individual?

Solucin
a) S, es de esperar que ms alumnos por clase tengan una influencia negativa en el
rendimiento
b) 69.89-2.28*22=19.73
c) H0: 1=0 y H1: 1<0
d) El ratio t arroja un valor de t398=-2.28/0.49 =-4.65. Comparando con los valores
crticos de una normal estndar (n =400), queda claramente en la regin de
rechazo tanto al 5% (-1.64) como al 1% (-2.33). Se rechaza por tanto la hiptesis
nula: el ratio alumnos por profesor tienen una influencia significativa y negativa,
sobre el rendimiento.

R2 / q
0.0512

21.477 y la regresin es claramente


e) F1,398
2
(1 R ) /(n k 1) 0.9488 / 398
significativa. Este test no aade nada en este caso, dado que solo hay una
variable explicativa con lo que el contraste de significatividad global equivale al
contraste de dicha variable, que ya hemos llevado a cabo con el test t.

37. A partir de una muestra de 20 observaciones correspondientes al periodo 19701989, se estima la siguiente ecuacin de salarios (errores estndar entre
parntesis) para un determinado pas,

40

Wt 8.585 0.364 X t 0.004 X t 1 2.56U t , R 2 0.873


(1.130) (0.08)
(0.072)
(0.658)
siendo W los salarios por empleado, X precios del producto y U la tasa de desempleo
a) Interprete los resultados obtenidos
b) Calcule el valor del coeficiente de determinacin ajustado y contraste la
significatividad global del modelo
c) Seale si son previsibles problemas de Multicolinealidad en el modelo anterior
d) Eliminara alguna de las variables incluidas en el modelo? Justifique la
respuesta
e) Cmo podra calcular la elasticidad salarios/paro?

Solucin
a) Los resultados son acordes con lo esperado: los precios del producto influyen
positivamente y la tasa de paro negativamente (ms paro implica ms oferta de
trabajo)
b) Teniendo en cuenta la relacin entre ste y R2, puede obtenerse de,
n 1
19
R 2 1 (1 R2 )
1 0.127 0.85
1 k 1
16
c) S, es bastante probable que haya una elevada correlacin entre Xt y Xt-1.
d) En estos modelos la elasticidad no es constante, dependiendo del valor de la X.
Podra ofrecerse una elasticidad media ponderando el cambio marginal por el
cociente entre las medias de X e Y en lugar de hacerlo con X/Y.

38. Una familia, cuya hija est matriculad en una universidad privada de gran
prestigio, est disgustada con la subida del precio de la matrcula y, para ahorrar
dinero, est considerando la posibilidad de cambiar a otra universidad menos
prestigiosa. Para valorar esta decisin dispone de una muestra aleatoria de 100
universidades con datos correspondientes al ao 2010, con los que estima la
siguiente regresin,
= 7311 + 3985 0.2 + 8406 2376, 2

= 0.72
donde Reput es un ndice que mide el prestigio que vara entre 1(menor
reputacin) y 5; Tamao es el nmero de estudiantes matriculados, y el resto son
variables binarias que indican si la universidad es privada o religiosa y coste es
el precio de la matrcula, cuya media es aproximadamente 49000 dlares.
a) Interprete los resultados. Tienen los coeficientes los signos esperados?
41

b) Es la regresin estadsticamente significativa? Especifique claramente las


hiptesis nula y alternativa para contrastar esta hiptesis.
c) Para ahorrar dinero la familia decide cambiar a una universidad pblica cuya
reputacin es 0.5 puntos inferior y tiene 10000 estudiantes ms. Cul es el
efecto econmico de este cambio? Le parece importante en trminos
relativos?
d) Si se elimina la variable tamao, la estimacin es,
= 5450 + 3539 + 10936 2786,

2 = 0.71

Est justificada esa omisin? Por qu cree que el efecto de asistir a una
universidad privada ha aumentado?
Solucin
a) La reputacin y el ser privada, aumentan el precio de la matrcula. Tamao y ser
religiosa, lo disminuyen. Es un resultado razonable.
b) S, es estadsticamente significativa, dado que,
0.72 / 3
F3,96
92.28
(1 0.72) / 96
Muy superior al valor crtico por lo que se rechaza la hiptesis nula de que los
coeficientes de las variables explicativas son conjuntamente iguales a cero.

c) Supondr un ahorro de 0.5*3985+0.2*10000=3975. S es un ahorro significativo


si tenemos en cuenta el precio medio de las matrculas.
d) El contraste estadstico apropiado es,
F1,96

2
( RNR
RR2 ) /1
0.72 0.71

3.43
2
(1 RNR ) /( N K )
0.28 / 96

39. Para estimar el precio, yi, de la vivienda en un determinado distrito, se estima


una ecuacin en la que y se hace depender de un ndice de contaminacin, x1, y
el nmero de habitaciones de la vivienda, x2. Las dos primeras variables estn
medidas en logaritmos.
a) Seale cules son a priori los signos esperados de los coeficientes. Cmo debe
interpretarse el parmetro correspondiente al ndice de contaminacin?
b) Explique la razn por la que las dos variables explicativas puedan estar
correlacionadas
c) Se han estimado las siguientes ecuaciones a partir de una muestra de 500
observaciones:
42

i. = 11.71 1.0431 ,

2 = 0.256

ii. = 9.23 0.7181 + 0.3062 ,

2 = 0.514

Calcule el valor del estadstico F para contrastar la hiptesis nula H0: 2 = 0


valorando dicha hiptesis.
d) Considerando el apartado b), es la reduccin en el valor de b2 acorde con lo
esperado?

Solucin

a) El signo del coeficiente correspondiente a x1 se espera negativo mientras que el


del coeficiente correspondiente a x2 ser positivo. El coeficiente correspondiente
a x1 debe interpretarse como una elasticidad, al estar medidas en logs tanto y
como x1.
b) Si se asume que en los barrios pobres la contaminacin es mayor y que en los
barrios ricos las casas son ms grandes (mayor nmero de habitaciones), habr
correlacin negativa entre x1 y x2
c) El test sera,
2
( RNR
RR2 ) / m
0.514 0.256
F
0.486/500
3 263.84
2
(1 RNR ) / (n k )

Luego la hiptesis nula debe ser rechazada a cualquier nivel de significatividad


d) S. Dado que la correlacin entre x1 y x2 es negativa (apartado b) y que el signo
de 2 es positivo, el sesgo que se comete al emplear la regresin simple (mal
especificada), ser negativo. Dado que 1 < 0, ello implica que la ecuacin
simple sobreestimar (la magnitud de b1 ser mayor) el efecto de la
contaminacin.
40. La funcin de produccin tipo Cobb Douglas responde a la expresin =

0 1 2 , donde Y es el producto, W el trabajo y K el capital. La


estimacin con datos anuales de la economa espaola, correspondientes al
periodo 1980-2009, es (errores estndar entre parntesis),
yt 0.68 0.46w 0.56k , R 2 0.99
(.087) (.128)
43

donde las minsculas indican datos en logaritmos.


a) Por qu pueden considerarse 0.46 y 0.56 estimadores de 2 y 2?Cmo
interpreta dichos coeficientes?
b) Suponga que quiere contrastar la hiptesis de rendimientos constantes a escala,
es decir H0: 1+2=1. Sabiendo que (2 , 3 ) = 0.004492, contraste la
hiptesis anterior mediante un estadstico t Student. Es ms apropiado un test
unilateral o bilateral para llevar a cabo este contraste?
c) Escriba la ecuacin restringida apropiada para contrastar esta hiptesis mediante
la tcnica de las ecuaciones restringida y no restringida.
d) Con los datos del ejercicio es posible obtener el valor del estadstico F para
contrastar la hiptesis por este mtodo? En caso afirmativo cul sera su valor?
Solucin

a) Porque al tomar logaritmos en la ecuacin original no lineal, sta se transforma


en una ecuacin lineal. Ambos coeficientes son la elasticidad producto-trabajo y
producto capital respectivamente.
b) El test ser,
t

0.46 0.56 1
0.02

0.11
0.0076 0.016 2 * 0.004492 0.18

Y la hiptesis no puede ser rechazada


c) La hiptesis postula que 2 =1-3, por lo que la ecuacin quedara,

yt 1 (1 3 ) wt 3kt
( yt wt ) 1 3 (kt wt )
d) Al implicar una nica restriccin el test t y el F estn relacionados segn t2=F y
por tanto el test F = 0.012 aproximadamente.

41. Para estudiar las diferencias salariales en un determinado pas se obtienen datos
de 7338 trabajadores y se divide el pas en cuatro regiones, Noroeste (NO),
Noreste (NE), Suroeste (SO) y Sureste (SE), estimndose la siguiente regresin
(errores estndar entre parntesis):
i = 4.78 0.038NEi 0.041SOi 0.048SEi
(0.14) (0.018)
(0.010)
(0.012)

44

R2 = 0.52

donde cada una de las variables explicativas es una variable binaria que toma el
valor 1 si el trabajador pertenece a esa regin e Y es el salario expresado en
euros/hora.
a) Cul es el salario medio de correspondiente a la categora base? Qu
regin tiene un salario medio ms elevado? En qu regin es ms reducido
el salario medio?
b) Contraste la hiptesis de significatividad global de la regresin para un nivel
de significancia del 5%.
c) Suponga que excluye la dummy correspondiente a NE e incluye una dummy
para la regin NO. Calcule si es posible el signo y la magnitud de todas las
variables del nuevo modelo.
d) Si la covarianza entre los estimadores bNE y bSO es 0.00007, es
estadsticamente significativa la diferencia de salario entre las regiones
Noreste y Suroeste? Explique claramente si emplea un contraste a una o dos
colas y porqu.

Solucin
a) El salario medio de la categora base es 4.78
El salario medio ms elevado corresponde a la regin NO, 4.78
El ms reducido a la regin SE: 4.78-0.048 = 4.732

R2 / k 1
0.52 / 3

2648.4 , mayor que el valor


2
(1 R ) / n k 0.48 / 7338 4
crtico en tablas para el 5% (2.67, aprox), de manera que se acepta la
significatividad global de la regresin.
c) Obviamente el salario medio resultante ha de ser el mismo para todas las
regiones. Teniendo en cuenta que la nueva categora base es la regin NE cuyo
salario medio es 4.78-0.038=4.742, el resultado ser,
b) F3,7338 F3,

= 4.742+0.038NO0.003SO0.01SE
d) Tenemos que contrastar la hiptesis nula H0: NE = SO, contra la alternativa H1:
NE SO. El contraste es pues bilateral. Empleamos el estadstico,

tn k

45

NE SO

NE SO
var

NE SO
NE var
SO 2cov NE SO
var

0.003
0.0182 0.012 2*0.00007

0.003
0.178
0.000284

Con lo que no podemos rechazar la hiptesis de igualdad de salarios en estas


regiones.

42. Para estudiar la funcin de ahorro se emplean datos del ao 1985


correspondientes a 100 familias. Se estiman los siguientes modelos (errores
estndar entre parntesis):

Renta

(1)
MCO
0.147
(.058)

(2)
MCG
0.161
(.059)

Tamao
Educacin
Edad
Emigrante
Constante
R2
White test

124.84
(655.39)
0.06
5.27

-124.95
(480.86)
.085

(3)
MCO
0.109
(0.071)
67.66
(222.96)
151.82
(117.25)
0.286
(50.52)
(518.39)
(1303.06)
-1605.42
(2380.15)
0.0828
7.44

(4)
MCG
0.105
(0.077)
- 6.87
(168.43)
139.48
(100.54)
21.75
(41.31)
137.28
(844.55)
-1854.42
(2351.80)
0.142

En las columnas (1) y (3) se ha estimado por MCO y en las (2) y (4) por MCG
suponiendo que la varianza de las perturbaciones es var(ui)=2Rentai.
a) A la vista del valor del contraste de White, le parece justificada la
estimacin de la columna (2)? Por qu?
b) Suponga que ha considerado la estimacin de la columna (2) preferible a la
de la columna (1). Podra rechazar la hiptesis de que la propensin
marginal al ahorro es 0.147?
c) En las columnas (3) y (4) se han incluido cuatro variables explicativas
adicionales. Explique razonadamente si pueden considerarse
estadsticamente significativas tanto de forma individual como conjunta.
d) Si tuviera que elegir entre el modelo (3) y el modelo (4), podra hacerlo en
funcin del valor del coeficiente de determinacin? Por qu?
e) Valorando todos los resultados anteriores y cualesquiera otros que puedan
deducirse de los resultados, indique cul de los cuatro modelos es el que
considera ms adecuado.

46

Solucin
a) El contraste de White se emplea para contrastar la hiptesis de
homocedasticidad y se distribuye como una 2 con gl igual al nmero de
regresores de la ecuacin de contraste. En este caso, al ser una regresin simple
la ecuacin (1), la ecuacin de contraste solo tendr dos regresores. El valor
crtico al 5% de una 2 con 2 gl, es 5.99, de manera que no podemos rechazar la
hiptesis de homoscedasticidad y por tanto no est justificado el empleo de
Mnimos Cuadrados Generalizados.
b) La hiptesis nula es H0: = 0.147 y la alternativa H0: 0.147. El estadstico
apropiado para este contraste ser,

0.161 0.147
0.237
0.059
No permite rechazar la hiptesis nula.
c) Ninguna de ellas es estadsticamente significativa individualmente considerada
(test t). Para contrastar la significatividad global de las mismas,

(0.0828 0.06) / 4
0.58,
(1 0.0828) /(100 6)

(0.142 0.085) / 4
1.56
(1 0.142) /(100 6)
De manera que en ninguno de los dos casos son globalmente significativas.

d) No. La variable endgena no es la misma


e) El 1 dado que hemos descartado el 2 (no hay hteroscedasticidad) y las variables
incluidas en el (3) no son significativas ni individual ni globalmente
consideradas, lo que inhabilita tambin el modelo (4)

43. Para estudiar el precio de las viviendas en un determinado pas, se obtiene la


siguiente estimacin a partir de una muestra de 4000 trabajadores (errores
estndar entre parntesis),

Pi 120 0.48 X1i 23.4 X 2i 0.48 X 3i 0.10 X 4i 48.8 X 5i , R 2 .75 SCE 41.5
(24) (2.61)
(8.9)
(0.033) (0.31)
(10.5)
47

donde P son los precios y las variables explicativas son, X1 =el nmero de
dormitorios, X2 =el nmero de cuartos de bao, X3 =el tamao de la vivienda en
m2, X4 =la antigedad en aos y X5 =una dummy que toma el valor 1 si la
vivienda est en un barrio pobre. SCE es la Suma de los Cuadrados Explicada.
a) Comente el resultado relativo al nmero de dormitorios y a la antigedad de
la vivienda
b) El autor del trabajo observa que en el mercado las viviendas de cinco
dormitorios se venden por una cuanta muy superior a las de 2 dormitorios.
Explique si este resultado es compatible con la estimacin obtenida.
c) El coeficiente de determinacin para la regresin que excluye el nmero de
dormitorios y la antigedad, es R2 = 0.73. Exprese la hiptesis nula adecuada
para contrastar si ambas variables con conjuntamente igual a cero. Lleve a
cabo el contraste y diga cul es la conclusin.
.
d) Obtenga, si es posible, un estimador de la varianza de los errores.

Solucin
a) El nmero de dormitorios tiene el signo apropiado ya que ms dormitorios
incrementan el precio; no as la antigedad que tiene un signo contrario al
esperado. No obstante ninguna de las dos variables es estadsticamente
significativa.
b) La magnitud del estimador es pequea y no significativa, lo que podra
entrar en contradiccin con el hecho de que el precio de venta es muy
superior. No obstante hay que tener en cuenta que el valor del estimador,
0.48, mide el efecto parcial del incremento en el nmero de dormitorios
manteniendo constantes el resto de las variables y en concreto el tamao de
la vivienda, por lo que no se puede decir que el resultado sea incompatible

c) La hiptesis nula ser H0: 1 = 4 =0. El resultado del contraste a partir de


los valores del coeficiente de determinacin es,
(0.75 0.73) / 2
F2,3994
159.84
(1 0.75) / 3996

48

Con un valor tan elevado, se rechaza la hiptesis nula a cualquiera de los


niveles de significatividad que habitualmente se emplean.
d) El valor de la SCT puede obtenerse de R2=SCE/SCT y resulta ser 55.33, por
tanto tenemos que SCR =SCT-SCE = 13.83 y,
SCR
13.83
2

0.00346
n k 1 3996

44. Suponga que desea analizar el impacto del consumo de bebidas alcohlicas en
los accidentes de trfico con vctimas mortales, para lo que estima la siguiente
regresin transversal empleando datos de los 48 estados USA (N=48),
Yi 3.36 0.002 X 1i 0.17 X 2 i 0.31X 3i 0.011X 1i X 4 i , R 2 0.499
(0.025)

(0.092)

( 0.24)

(0.0027)

siendo,
Y= nmero de muertos en accidente por milla recorrida en el estado i
X1 = consumo per cpita de cerveza en el estado i
X2 = velocidad media en autopista en el estado i
X3 = dummy que toma el valor 1 si el estado tiene un programa de revisin de los
elementos de seguridad del vehculo
X4 = Altitud media en las reas metropolitanas (se supone que a ms altitud mayor
probabilidad de accidentes porque la altitud influye en el consumo de oxgeno del
cerebro)
a) Comente los resultados de la estimacin y diga si observa algn signo de
problemas.
b) Explique claramente qu es lo que mide la variable de interaccin X1i X4i.
Disee y lleve a cabo un test adecuado para contrastar su significatividad
estadstica
c) Cuando el investigador decide incluir X4i como variable individual (no solo en el
trmino de interaccin), obtiene,
Yi 2.36 0.024 X 1i 0.14 X 2 i 0.24 X 3i 0.35 X 4 i 0.023 X 1i X 4 i , R 2 0.501
( 0.03)

(0.091)

( 0.25)

( 0.33)

(0.012)

Es preferible esta ecuacin o la primera? Justifique su respuesta


d) Cul sera la conclusin de este trabajo en relacin con i) el consumo de cerveza,
b) la altitud a la que se conduce.
49

Solucin
a) Sorprende el hecho de que el consumo de cerveza no sea significativo, lo que
podra deberse a algn problema de omisin de variables, aunque tambin
pudiera ser que el trmino de interaccin hubiera absorbido completamente este
efecto.
b) Esta variable es una medida de si el impacto del consumo de cerveza hace crecer
el nmero de vctimas cuando la altitud aumenta. Su significatividad estadstica
se contrastara de la forma habitual. En este caso el ratio t vale aproximadamente
4.07, por lo que es significativa al 1%.
c) La nueva variable no es estadsticamente significativa y el coeficiente de
determinacin corregido solo mejora marginalmente y esta inclusin tampoco
corrige el problema del consumo, de manera que, a no ser que haya fuertes
razones tericas para incluir la altura como una variable separada, nos
quedaramos que la primera especificacin.
d) Aunque por separado ninguna de ellas parece ejercer un efecto significativo en
el nmero de vctimas, el trmino de interaccin es estadsticamente
significativo y tiene el signo apropiado en las dos estimaciones ensayadas.
Concluiramos que la investigacin aporta evidencia de una influencia conjunta
sobre el nmero de muertos.

45. Con objeto de explicar el salario, que denotamos Y, se estima la siguiente


ecuacin, a partir de una muestra de datos longitudinales,
log() = 0 + 1 + 2 + 3 + 4 +
Las variables explicativas son, aos de educacin del trabajador (educ), aos de
educacin de los padres (padeduc), la experiencia laboral (exper) y la antigedad en la
empresa (antig).
a) Compruebe si se verifica que, en trminos relativos, el rendimiento de un ao
log()
ms de educacin responde a la expresin = 1 + 2 .
b) Qu signo esperara para 2? Justifique su respuesta.

50

c) Empleando una muestra de 722 observaciones, se obtienen los siguientes


resultados (errores estndar entre parntesis),

log(Y ) 5.65 0.047educ 0.00078educ * padeduc


(0.13) (0.01)
(0.00021)
0.019exper 0.010antig ,
(0.004)

(.003)

R 2 0.168

Interprete detalladamente, el valor del coeficiente del trmino de interaccin.


d) Si se aade como variable adicional la educacin de los padres, el resultado de la
estimacin es,

log(Y ) 4.94 0.097educ 0.033 padeduc 0.0016educ * padeduc


(0.38) (0.027)
( ? )
(0.0012)
0.02exper 0.010antig ,
(0.004)

(.003)

R 2 0.173

Obtenga un valor para el contraste de significatividad individual de la nueva


variable y diga si sta es o no significativa.
e) Explique cul sera el procedimiento para contrastar la hiptesis de que el
rendimiento de la educacin no depende de la educacin de los padres y si es
posible, lleve a cabo dicho contraste.

Solucin
a) Derivando se obtiene inmediatamente la expresin anterior
b) Signo positivo. La elevada formacin de los padres se supone que reforzar la
influencia de la educacin en el salario
c) El trmino de interaccin indica que el efecto de la educacin sobre el salario no
depende exclusivamente de la educacin del individuo, sino que resulta
amplificada cuando se combina con un elevado nivel educativo de los
progenitores. En este caso, el efecto de la educacin es mayor para aquellos
individuos cuyos padres tienen mayores niveles de educacin. Por ejemplo, un
ao ms de educacin implica que el salario aumentar en un 4.7% si el nivel
educativo de los padres es nulo, pero si este es distinto de cero, aadir un
crecimiento adicional al salario del individuo.
d) Podemos obtener este contraste comparando los valores de los coeficientes de
determinacin en ambas regresiones,

51

Fq , n k 1

2
( RNR
RR2 ) / q
(0.173 0.168) /1
0.005

4.329
2
(1 RNR ) / n k 1 (1 0.173) / 722 5 1 0.00155

Como este valor es mayor que el crtico en tablas al 5% para una distribucin F1,
716,, rechazaramos la hiptesis nula y concluiramos que la variable es
estadsticamente significativa.
e) Lo ideal sera emplear el modelo del apartado anterior para contrastar la
hiptesis conjunta de que las variables padeduc y educ*padeduc son
conjuntamente iguales a cero. Como no disponemos de datos suficientes para
llevar a cabo este contraste, debemos conformarnos con contrastar la hiptesis
de significatividad individual en el modelo del aparado c). En este caso, dado
que 0.00078/0.00021 = 3.71, rechazaramos la hiptesis nula y la variable es
estadsticamente significativa. Ello unido al resultado obtenido en d (la
significatividad individual de padeduc), indicara que dicha variable es
significativa.

46. La variable Y representa el porcentaje de alumnos que aprueban un examen


estndar de matemticas en los institutos espaoles. Suponga que est interesado en el
efecto del gasto por estudiante en los resultados del examen y considera el siguiente
modelo
Yi = 0 +1log(X1i)+2log(X2i)+3X3i+i, donde X1, X2 y X3
son respectivamente, el gasto por estudiante, la matrcula (n alumnos) y el porcentaje
de alumnos en situacin de pobreza.
a) Suponga que dispone de la variable X4 indicativa del porcentaje de alumnos
que rene los requisitos para poder acogerse al programa de comida gratuita
ofrecida por el centro. Sera esta una buena variable proxy para X3?
Justifique su respuesta

La tabla siguiente muestra las estimaciones del modelo con y sin X4 (errores estndar
entre parntesis),

(1)
(2)
log(X1)
11.13
7.75
(gasto)
(3.30) (3.04)
log(X2)
0.022
1.26
(n alumnos) (0.615) (0.58)
X4
0.324
(0.036)
Constante
69.24 23.14
(26.72 (24.99)
52

N
R2

428
0.0297

428
0.1893

b) Explique por qu el efecto del gasto sobre Y es menor en la columna (2) que
en la columna (1). Son estos efectos estadsticamente superiores a cero?
Explique por qu o por qu no, indicando en su caso el contraste en el que se
basa.
c) Es el porcentaje de aprobados ms bajo en las escuelas con ms alumnado
(manteniendo todo lo dems igual)? Justifique su respuesta
d) Interprete claramente el coeficiente de X4 en la columna (2)
e) Teniendo en cuenta que varios coeficientes son negativos en las
estimaciones anteriores, sera posible que hubiese un porcentaje de
aprobados negativo?

Solucin

a) S, desde luego, dado que se supone que para poder acogerse a ese programa
habr que acreditar unas determinadas condiciones de precariedad
econmica.
b) Con toda probabilidad la omisin de la variable X4 en el modelo (1), est
causando un sesgo en ese coeficiente. S, dado que en ambos casos podemos
rechazar H0: = 0 en favor de la alternativa H1: > 0.
c) A todos los efectos el modelo (2) es preferible al modelo (1) y en este
modelo el coeficiente correspondiente a la matrcula, es negativo y
estadsticamente significativo, de manera que, en efecto, podemos concluir
que la matrcula influye negativamente en los resultados.
d) Si el porcentaje de alumnos en situacin de pobreza aumenta un punto, el
porcentaje de aprobados cae en 0.32 puntos porcentuales.
e) Aunque aparentemente pueda parecer que s, si tomamos en consideracin el
rango de variacin de las variables explicativas (no proporcionado),
observaramos que no es posible tal resultado.

47. Para estudiar los determinantes del peso al nacer de los bebs, se estiman las
siguientes ecuaciones (errores estndar entre parntesis),

53

log(btwght) = 4.66 - 0.0044 cigs + 0.0093 log(faminc) + 0.016 parity


(0.22) (0.0009)

(0.0059)

(0.006)

+ 0.027 male + 0.055 white,


(0.010)

(0.013)

N = 1388, R2 = 0.0472
y,
log(bwght) = 4.65 - 0.0052 cigs + 0.0110 log(faminc) + 0.017 parity
(0.38) (0.0010)

(0.0085)

(0.006)

+ 0.034 male + 0.045 white - 0.0030 motheduc + 0.0032 fatheduc


(0.011)

(0.015)

(0.0030)

(0.0026)

N = 1236, R2 = 0.0493
Siendo,
Btwght = peso al nacer el beb (en onzas)
Cigs = nmero de cigarrillos al da fumados por la madre durante el embarazo
Faminc = renta familiar
Parity = lugar entre los hermanos
Male = dummy sexo (=1 si varn)
White = dummy color (= 1 si blanco)
Motheduc = aos de educacin de la madre
Fatheduc = aos de educacin del padre

a) Interpretar el significado del coeficiente correspondiente a la variable cigs en la


primera ecuacin. En particular, cul es el efecto de fumar 10 cigarrillos ms
por da sobre el peso al nacer?
b) Manteniendo los dems factores constantes y segn los resultados obtenidos,
pesara ms un nio blanco? Cunto ms? Es la diferencia estadsticamente
significativa?
c) Comentar el efecto estimado y la significatividad estadstica de motheduc
d) Con la informacin disponible, por qu es imposible calcular el estadstico F
para contrastar la significatividad conjunta de motheduc y fatheduc? Qu se
necesitara hacer para obtener el estadstico F?

Solucin

54

a) Mide cmo vara el peso al nacer medido en logaritmos, como consecuencia del
nmero de cigarrillos fumados por la madre. Al ser una relacin loglin, cada
cigarrillo adicional hace que el peso del beb disminuya en un100*(0.0044) =
0.44%, aproximadamente. Fumar 10 cigarrillos implica por tanto una prdida de
peso de un 4.4% (aprox.)
b) La variable male es positiva y estadsticamente significativa, por lo que ser
varn implica un mayor peso. Anlogamente la variable white es tambin
positiva y significativa, por lo que ser blanco supone asimismo mayor peso.
Ser varn blanco implica un incremento de peso de 2.7+5.5 = 8.2% en la
primera ecuacin, o 3.4+4.5=7.9% en la segunda
c) El coeficiente presenta un signo contrario al esperado o al menos difcil de
justificar. No obstante, la variable no es estadsticamente significativa, por lo
que no se puede rechazar que su influencia sea nula.
d) Las ecuaciones han sido estimadas a partir de muestras diferentes. Sera
necesario que ambas muestras fuesen iguales para poder llevar a cabo el
estadstico que se pide.

48. Para contrastar el efecto, si lo hay, del consumo de estimulantes sobre el


salario de los trabajadores, disponemos de datos de salarios, educacin,
experiencia y sexo de una muestra longitudinal. Adems disponemos de la
contestacin de cada trabajador a la pregunta En cuntas ocasiones tomaste
estimulantes durante el mes pasado?
a) Escribir una ecuacin que permita estimar los efectos sobre el salario del
consumo de estos productos
b) Especificar un modelo que permita contrastar si su consumo tiene efectos
distintos en hombres y mujeres. Cmo se contrastara que no hay
diferencias entre sexos?
c) Supongamos que se considera preferible medir el consumo clasificando a los
individuos en cuatro grupos: no consumidor, consumidor ocasional (1-5
veces al mes), consumo moderado (6-10 veces) y consumidor habitual.
Proponer un modelo que permita estimar los efectos sobre el salario.
d) Usando el mtodo definido en c), explicar cmo contrastar la hiptesis nula
de que el consumo no afecta al salario.
e) Cules son los problemas para obtener inferencia causal con este tipo de
datos?

Solucin
55

a) Con el resultado de la pregunta se define una dummy cuyo coeficiente ser el


que nos diga si los estimulantes afectan o no a los ingresos salariales. Esta
ltima (ingresos salariales) sera la variable dependiente (puede estar en
logaritmos). El resto de las variables (educacin, experiencia y sexo) seran
incluidas como variables de control en este caso.
b) Basta con definir una dummy de sexo y analizar su significatividad. Si es
significativa, hay diferencias entre sexos y no las habr en caso contrario.
Puede considerarse la posibilidad de incluir un trmino de interaccin entre
el sexo y la variable explicativa de inters
c) Definiramos dummies especficas. La categora base podran ser los no
consumidores. La primera dummy tomara el valor 1 si el consumo es
ocasional y 0 en el resto de los casos, etc., etc.
d) Se limitara a contrastar si son nulas todas las variables relacionadas con el
consumo.
e) Puede haber variables omitidas aparte de la educacin, experiencia y el sexo
y estar correlacionadas con el tratamiento (es decir la variable de inters)?
En este caso el trmino de error contendr esos factores (perfil familiar por
ejemplo ) que pueden afectar al salario y estn correlacionados con el
empleo de estimulantes.

49. Considere la regresin,

Yi 0.2033 0.656 X i ,
(0.0976) (0.1961)

R2 0.397,

SCR 0.0544 SCE 0.0358

donde Y representa la tasa de participacin de las mujeres en la fuerza laboral


(TPFL) en 1972 y X la misma tasa en 1968. Los resultados se obtuvieron a partir
de una muestra de 19 ciudades norteamericanas y entre parntesis figuran los
errores estndar de los estimadores).
a) Interprete los resultados de esta regresin
b) Contraste la hiptesis H0: 1 = 1 contra la alternativa H0: 1 > 1. Especifique
claramente el nivel de significatividad elegido y el valor crtico en tablas
para el mismo.

56

c) Suponga que en 1968 la TPFL fue de 0.58. Obtenga una prediccin para
E(TPFL en 1972) y construya un intervalo de confianza del 95% para la
misma
d) Cmo probara que los residuos de la regresin estn normalmente
distribuidos?

Solucin

a) La tasa de participacin de la mujer en el mercado laboral en 1972 est


positivamente relacionada con la registrada en el ao 1968. Adems esta
variable estadsticamente significativa al 1%, tanto si el test es unilateral
como si es bilateral.
b) El estadstico de contraste es,
0.656 1
t

1.75
0.1961
ee( )
Para un nivel de significatividad del 5%, el valor crtico en tablas es, para un
contraste unilateral, t17, 0.05 = 1.74. Por tanto 1.75 queda en la regin de
aceptacin y no se puede rechazar la hiptesis nula.
c) El pronstico sera = 0.2033+0.58*0.656 = 0.584 y el intervalo,

0.584 ee( 0 )t17, 0.025 0.584 ee( 0 )2.11


pero no hay datos suficientes para calcular el error estndar de la prediccin

S 2 ( K 3)2
d) Emplearamos es estadstico de Jarque Bera, JB n
24
6

50. Para estimar la funcin de exportaciones de una determinada Comunidad


Autnoma espaola (Y) en funcin del tipo de cambio peseta/dlar (X) entre
los aos 1970 y 2001, se estiman las siguientes ecuaciones,

57

Yt 147.1 14.18 X t ,
R 2 0.652
Yt 122.9 24.3Dt 13.01X t ,
R 2 0.724
Y 129.3 10.41X 4.72 D X ,
R 2 0.874
t

Yt 134.6 21.6 Dt 10.89 X t 3.91Dt X t ,

R 2 0.921

Dt es una dummy que toma el valor 1 para todas las observaciones posteriores a
1985,
a) Interpretar los coeficientes de los cuatro modelos
b) Calcular el coeficiente de determinacin ajustado y elegir el mejor modelo
en base a este criterio
c) Contrastar si la incorporacin a la CEE en 1986 tuvo algn efecto sobre la
funcin anterior
d) Si la respuesta anterior es afirmativa, escribir la funcin de exportaciones
antes y despus de la incorporacin a la Comunidad Econmica Europea
Solucin
a) Los modelos expresan la relacin entre las exportaciones (variable
dependiente) y el tipo de cambio (variable independiente). El signo del tipo
de cambio es positivo en los cuatro, conforme a lo esperado.
El modelo bsico es el primero. Los otros tres se limitan a incorporar
distintas combinaciones de la dummy para tratar de analizar si la relacin ha
cambiado en el ao 1985.
b) Empleando la frmula (2.3.16), se obtiene respectivamente 0.64, 0.71, 0.86 y
0.91, de manera que en base a este criterio elegiramos el ltimo modelo
c) Concluiramos que la funcin ha cambiado, si la dummy (sola o
interactuando con el tipo de cambio), es significativa. Para contrastarlo,
podemos emplear contrastes tipo F. Por ejemplo, si comparamos el segundo
modelo con el primero, siendo el primero la ecuacin restringida,
obtendramos,
(0.724 0.652) /1
F1, 29
7.56
(1 0.724) / 29
Es decir, rechazaramos que la dummy fuese nula. Los modelos 3 y 4 tambin
se pueden comparar con el primero (y entre s), siguiendo este procedimiento.

d) Por el procedimiento descrito en c), llegaramos a la conclusin de que el


mejor modelo es el 4. Por tanto la funcin de exportaciones antes (D=0) y
despus de 1985 (D=1) seran,

58

= 134.6+10.89X
= 156.2+14.80X

51. En la tabla siguiente se muestran los datos de consumo y renta


correspondientes a diez regiones espaolas,
Consumo, Y Renta, X = =
xy
x2
y2
4.6
5
-1.9
-2.5 4.75 6.25 3.61
3.6
4
-2.9
-3.5 10.15 12.25 8.41
4.6
6
-1.9
-1.5 2.85 2.25 3.61
6.6
8
0.1
0.5 0.05 0.25 0.01
7.6
8
1.1
0.5 0.55 0.25 1.21
5.6
7
-0.9
-0.5 0.45 0.25 0.81
5.6
6
-0.9
-1.5 1.35 2.25 0.81
8.6
9
2.1
1.5 3.15 2.25 4.41
8.6
10
2.1
2.5 5.25 6.25 4.41
9.6
12
3.1
4.5 13.95 20.25 9.61
Sumas
65
75
0
0 42.5 52.5 36.9
Se pide,
a) La estimacin de la funcin de consumo
b) La media de los valores de consumo ajustados, es decir
c) La suma de los cuadrados total, la suma de los cuadrados explicada y la suma de
los cuadrados residual
d) El coeficiente de determinacin
e) El intervalo de confianza del 95% para la propensin marginal a consumir

Solucin

xy 42.5 0.8095, Y X 6.5 0.8095*7.5 0.4287


a) 1
0
1
x2 52.5
b) Dado que E(b0+b1X)=0+1X, ha de coincidir con la media del consumo
65
observado, es decir = = 6.5
10

c) Estas sumas son,

59

SCT yt2 36.9


SCE y 2 ( 1 xt ) 2 12 xt2 0.80952 *52.5 34.4027
SCR SCT SCE 36.9 34.4027 2.4973

d) R2 1

SCR
2.4973
1
0.9324
SCT
36.9

e) El contraste de significatividad global ser,

F1,8

R2 / k
0.9324

110.34
2
(1 R ) /(n k 1) (1 0.9324) / 8

Por tanto el contraste de significatividad individual,


1
t8
110.34 10.504
ee( )
1

De donde,

ee(1 )

0.8095
0.077
10.504

y el intervalo,
0.8095 2.306*0.077 (0.6312, 0.9875)

Otra va,

2
2.4973/ 8
1 ) 2
var(
0.005946, ee( 1 ) 0.005946 0.077 ,
x
52.5
t
etc, etc.

52. Considere la siguiente ecuacin de salarios,

3.75 5.44educ 2.62Mujer 0.29edad 0.69 NO 0.60 NE 0.27 SO


Sal
(1.06) (0.21)
(0.20)
(0.04)
(0.30) (0.28)
(0.26)
N 4000,

R 2 0.194, SCE 6.21

La variable dependiente es el salario hora en euros del ao 1998 y las


independientes, una dummy que toma el valor 0 si el trabajador tiene solo estudios
primarios y 1 si ha terminado el bachillerato (educ), una dummy sexo (1 si mujer),
60

los aos de edad del trabajador (edad), y dummies que expresan el lugar de
residencia, noroeste (NO), noreste (NE), suroeste (SO) y sureste (SE).
a) Suponiendo que la jornada laboral es de 7 horas, durante 5 das a la semana,
Cul sera la diferencia en el salario mensual (4 semanas) de un trabajador(a)
con el ttulo de bachiller respecto a quienes no lo tienen?
b) Explique si hay evidencias de diferencias salariales significativas en funcin del
lugar de residencia.
c) El coeficiente de determinacin de la regresin restringida para contrastar la
hiptesis de que los efectos regionales son nulos, es 0.190. Diga si es posible
rechazar dicha hiptesis en un contraste del 5%.
El correspondiente estadstico de contraste arroja el siguiente resultado,
d) Elvira y Vega de 28 aos de edad, tienen ambas el ttulo de bachiller pero
mientras la primera vive en la regin NO, Vega vive en la regin NE. Cul ser
la diferencia de salario esperada? Cmo podra construir un intervalo de
confianza del 95% para dicha diferencia?

Solucin

a) Sera 7*5*4*5.44=761.6 euros superior


b) S las hay puesto que las variables NO y NE son estadsticamente significativas.
Quienes vivan en estos lugares, ganarn ms que los que residan en las regiones
SO y SE (que tendrn salarios iguales, dado que SO no es estadsticamente
distinta de cero).
c) El correspondiente estadstico de contraste arroja el siguiente resultado,
F3,3993

(0.194 0.19) / 3
(1 0.194) / 4000 7

6.60

De manera que se rechazara la hiptesis nula y las variables son conjuntamente


significativas (observando las tablas se deduce que el valor crtico al 5% estara
entre 2.68 y 2.60, por lo que el estadstico emprico es muy superior).
d) La primera tendra un salario 0.09 euros/hora mayor (0.69-0.60).
Haciendo una nueva regresin donde la dummy excluida recogida en el
intercepto fuese NO o NE

61

También podría gustarte