Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ejercicios - Soluciones Estadistica II
Ejercicios - Soluciones Estadistica II
Suma
Yi
4
5
7
12
28
Xi
1
4
5
6
16
yi
-3
-2
0
5
0
xi
-3
0
1
2
0
xiyi
9
0
0
10
19
xi2
9
0
1
4
14
Para obtener,
xi yi 19
1.357 y 1 Y 2 X 1.572
2
x
i 14
Solucin
a) Por cada incremento de 1 cm en la altura de los padres, la del estudiante se
incrementar 0.73 cm. En este caso no hay una interpretacin razonable para
el trmino independiente
b) El modelo explica el 45% de la variacin de la altura de los estudiantes
c) El pronstico es i = 49.78+0.73*178 = 179.72
d) El Error Estndar de la Regresin es una medida de la desviacin tpica del
error de regresin i es decir, una medida de la dispersin de las
observaciones en torno a la recta de regresin.
3. El estimador mximo verosmil de la varianza de las perturbaciones aleatorias
del modelo de regresin lineal es ee/n. Compare la calidad de este estimador
con el mnimo cuadrtico ee/nk, en trminos de sesgo, varianza.
sesgo E (s*2 ) 2
n k e'e
nk 2
k
nk
2
E
2 2
1 2
n
n
n
nk
n
(n k ) s 2
varianza 2(nk). Por tanto var
2(n k ) de donde se deduce fcilmente
2
que var( s 2 )
2 4
.
nk
e'e
n k e'e n k
2
2
var
var
var( s ) var( s )
n
n
n
k
n
Ambos son consistentes. En el caso del MCO es claro que su varianza tiende a cero
cuando n. Por otro lado con n el sesgo del estimador MCO es nulo as como
su varianza.
Solucin
a) Aplicando el criterio MCO al modelo Yi = 1Xi+i obtenemos,
b1
Y X
X
i
2
i
0 X i 1 X i2 X i i
2
i
X
X
i
2
i
X
X
i i
2
i
b) La varianza ser,
var(b1 ) E b1 E (b1 )
X i2
X i i
... E
X2
i
X i2 E ( i )2
2
2 2
X i E X i i
2
i
2
i
(X
X )2
5. Considere la regresin,
Yi 0.2033 0.656 X i ,
(0.0976) (0.1961)
R2 0.397,
Sol.
a) Hay una asociacin positiva lo que no es sorprendente si tenemos en cuenta el
hecho de que desde la II Guerra Mundial ha habido un incremento constante de
las mujeres en el mercado laboral.
b) Usando un test t de una cola, t =
.6561
.1961
crtico al 95% para un contraste unilateral es 1.74. Para este contraste la zona de
aceptacin estara a la izquierda de 1.74 y la de rechazo a la derecha de ese
valor. Como el valor del estadstico de contraste queda dentro de la regin de
aceptacin, no se puede rechazar la hiptesis nula.
c) La media es 0.2033+0.656*.58 = 0.5838. Para construir el intervalo del 95%,
emplearamos la frmula 0.58382.11*(ee. del pronstico), donde 2.11 es el
valor crtico al 95% para una t17. La desviacin tpica se calculara a partir de,
2
n
( X 0 X )2
xi2
aunque en este caso no tenemos datos suficientes para llevar a cabo ese clculo.
4
N 20
donde,
Pi = nmero de meses que deja de pagar en los ltimos cuatro aos i
Mi = nmero de meses que el encargado de pagar la pensin alimenticia estuvo
parado en los ltimos cuatro aos
Yi = porcentaje de renta disponible destinado a la pensin alimenticia
Ai = la edad del cnyuge e encargado de pagar
Bi = creencias religiosas del cnyuge encargado de pagar (en una escala de 1 a 4,
siendo 4 el de creencias religiosas ms fuertes)
Ci = nmero de hijos del matrimonio
Se pide,
a) Indique cul es el signo esperado de los coeficientes de M e Y. Construya un test
para contrastar esa hiptesis. Emplee un nivel de significatividad del 5%.
b) Contraste la hiptesis de que el parmetro de A es estadsticamente
significativo. Emplee un nivel de significatividad del 1%
c) Lleve a cabo el mismo contraste para las variables B y C pero a un nivel de
significatividad del 10%
Solucin
a) Para ambos el signo esperado es positivo (cuantos ms meses desempleado, ms
meses dejar de pagar la pensin, cuanto mayor sea el porcentaje que la pensin
alimenticia representa respecto a su renta disponible, ms meses dejar de
pagar). Por tanto deseamos contrastar la hiptesis H0: =0 contra la alternativa
H1: >0 [o si se prefiere H0: 0 y H1: >0]. Es pues un contraste unilateral.
5
tM
0.5
25
5 y tY
1.25
0.1
20
Por tanto en el primer caso podemos rechazar la hiptesis nula y aceptar que la
variable afecta positivamente (signo positivo), pero no en el segundo.
tB
3.0
0.15
1 y tY
3
3.0
0.05
7. Suponga que con datos referidos al tamao de la clase (T) y al promedio de las
calificaciones (C), empleamos una muestra de 122 observaciones
correspondientes a alumnos de tercer curso para estimar la siguiente ecuacin,
Solucin
a) El intervalo se obtiene de 1 t / 2 ee( 1 ) . Buscando en las tablas de la
distribucin t para 120 g.l. (122-2), observamos que el valor crtico al 95%
es, 1.98, de manera que
t ee( ) 5.82 1.98* 2.21 (10.1958, 1.464)
1
/2
t120
5.82 0
2.63
2.21
/2
R 2 0.7077
R 2 0.7474
Solucin
a) A priori cabe esperar una relacin positiva: cuantos ms hijos tenga una mujer,
mayor ser la probabilidad de fallecimientos debidos a falta de atencin,
alimentacin, salud, etc.
b) El correspondiente al PIB per cpita apenas ha variado al contrario que el
coeficiente de la tasa de alfabetizacin que es bastante diferente. Para contrastar
si esta diferencia es estadsticamente significativa, podemos emplear un test tipo
t y contrastar si en la primera ecuacin, el coeficiente de esta variable es
estadsticamente distinto de -1.768, o ver si en la segunda el coeficiente es
significativamente distinto de -2.2316,
t61
2.2316 (1.768)
2.23
0.2099
Al ser mayor (en v.a.) que el valor crtico en tablas al 1%, rechazamos la
hiptesis nula, es decir que la diferencia es significativa.
c) Obtenemos el valor del estadstico F para contrastar si la segunda regresin es
preferible a la primera,
F1,60
(0.7474 0.7077) /1
9.43
(1 0.7474) /(64 4)
F1, g t g2
Lo que en este caso significa que el valor del estadstico t para la hiptesis de
que esa variable es nula, vale 9.43 = 3.07 y por lo tanto el ee(b3) =
12.8686/3.07 = 4.19
siendo, S/Y el ratio de ahorro del pas, S/N el ahorro per cpita, Y/N la renta per
cpita, G la tasa de crecimiento de la renta per cpita, D1 el porcentaje de
poblacin por debajo de 15 aos y D2 el porcentaje de poblacin por encima de
64 aos.
Solucin
S SY
, ln S / N ln S / Y ln Y / N
N Y N
de manera que la segunda ecuacin debera ser exactamente igual quela primera
excepto que al coeficiente de ln Y/N habra que sumarle exactamente una
9
10. Con una muestra de 220 viviendas vendidas en una comunidad, se ha tratado de
modelizar el precio obtenindose,
siendo,
P, el precio en miles de , X1, nmero de dormitorios, X2, nmero de baos, X3, el
tamao de la vivienda (en m2), X4, el tamao de la parcela, X5, la antigedad de la
vivienda en aos y X6, es una variable binaria que toma el valor 1 si el estado
general de la casa es malo. SCE es la suma de cuadrados explicada.
Solucin
a)
b)
c)
d)
SCE
0.7276 y SCT 57.037, SCR 15.537
SCT
10
Entonces,
SCR
15.537
0.073
n k 1 220 7
11. La misma ecuacin del ejercicio anterior con los errores estndar de los
estimadores entre parntesis, es,
Pi 119.2 0.485 X 1i 23.4 X 2i 1.7 X 3i 0.02 X 4i
(23.2) (2.61)
(8.94)
0.090 X 5i 48.8 X 6i ,
(0.311)
(0.12) (.00048)
R 2 0.72, SCE 41.5
(10.5)
Solucin
a) El signo esperado es positivo de manera que las hiptesis nula y alternativa son
respectivamente H0: = 0 y H1: > 0. El test apropiado es un test t, que arroja el
siguiente resultado t220-7 = 0.485/2.61 = 0.186. Una t213 es virtualmente una
normal. Para un nivel del 5% en un contraste unilateral, el valor crtico es 1.64,
de manera que no podemos rechazar la hiptesis nula.
b) El coeficiente de X1 mide el efecto parcial del nmero de dormitorios
manteniendo constante X3, el tamao de la vivienda. Dado que una vivienda con
5 dormitorios es mucho ms grande que una de 2, el resultado en a) no nos dice
gran cosa.
c) El intervalo de confianza del 99% ser 500(0.022.58*0.00048) (9.38, 10.62)
11
d) El valor crtico al 10% de dicha distribucin es F2, = 2.30. Dado que 0.08 <
2.30 no podemos rechazar la hiptesis nula H0= 1 = 5 =0
12. Para estudiar la relacin entre las ventas de helados, Y, y la temperatura de una
determinada ciudad costera, X, se estiman los cuatro modelos siguientes, con
datos diarios del ao 1992 (N=365),
SCR 5324.75
(3)
(4)
Yt 350 7.7 X t ,
SCR 9819.15
(1)
(2)
SCR 7294.3
SCR 5480.68
Solucin
a) En los tres primeros modelos estamos suponiendo que el hecho de estar en
verano tiene un efecto adicional al de la temperatura. En (1) la dummy afecta
tanto a la constante como a la pendiente, en 2 solo a la pendiente y en 3 solo
a la constante. Se observa una variacin importante en el coeficiente de X
segn consideremos uno u otro modelo. El modelo (4) hace depender las
venta nicamente de la temperatura
b) La eleccin desde un punto de vista estadstico ha de basarse en el tamao de
la SCR. Aunque en puridad habra que comparar los cuatro modelos, dada la
escasa variacin en cuanto a los grados de libertad, los dos candidatos mejor
situados son el modelo (1) y el (3). Dado que el (3) resulta de imponer en (1)
la restriccin 4 =0, podemos emplear un contraste tipo F,
(5480.68 5324.75) /1
10.54
5324.75 /(365 4)
Este valor es mayor que el crtico en tablas para cualquiera de los niveles de
significatividad habituales. Por lo tanto rechazamos la hiptesis nula y
elegimos el modelo (1).
F1,361
13. Una regresin mltiple con dos variables explicativas arroja el siguiente
resultado,
Y 4 0.4 X1 0.9 X 2 ,
530, N 29
R 2 8 / 60, '
siendo
29 0 0
X'X 0 50 10
0 10 80
Solucin
a) Las varianzas de los estimadores resultan de,
1
0
0
29 0 0
0.034483
520
2
1
( X'X)
0 50 10 20
0
0.020513 0.002564
29 3
0
0.002564 0.012821
0 10 80
t293
0.4 0.9 1
0.3
0.399
0.41026
0.25642
2*0.051
var( 1 ) var( 2 ) 2cov( 1 2 )
13
t26
0.4
0.79
0.506
b2
(Z Z )(Y Y )
(Z Z )( X X )
i
Solucin
Sustituyendo Y por su valor,
Z Z Y Y
Z Z X X
Z Z [ X u ] [ X u ]
Z Z X X
Z Z [ X X ] u u Z Z u u
Z Z X X
Z Z X X
b2
14
Zi Z ui u
E b2 E 2 E
Zi Z X i X
Z Z u u E Z Z u u
i
Z Z X X
Z Z E u u
Z Z X X
i
Z X i X
Solucin
a) El estimador es insesgado puesto que,
Yn Y1
( 1 X n n ) (0 1 X n n )
( )
0
1 n 1
X n X1
X n X1
X n X1
Y, teniendo en cuenta los supuestos del modelo, la esperanza de la expresin
anterior es precisamente, 1
15
16. Con datos USA del periodo comprendido entre el primer trimestre de 1948 al
segundo de 1978 (estadsticos t entre parntesis), se ha estimado la siguiente
ecuacin,
p
y
h
ln 1.5492 0.7135ln 0.1081ln e 0.0045t ,
k
k
p
(16.33) (21.69)
(6.42)
(15.86)
R 2 0.98
Solucin
0.98 / 3
1928.37
(1 0.98) /118
log( salario
) 4.59 0.257 log(ventas) 0.011roe 0.158 finan
(0.30) (0.032)
(0.004) (0.089)
0.181cons 0.283serv,
(0.085)
(0.099)
N 209, R 2 0.357
roe es el rendimiento de los activos; finan, cons y serv, son variables binarias
para los sectores financiero, de consumo y servicios. El sector del transporte se
ha tomado como categora base.
17
Solucin
a) Mide directamente la elasticidad, es decir un incremento de un 1% en las ventas,
provocar un incremento de un 0.257% en el salario del director general.
b) La diferencia ser exactamente el valor del coeficiente de la dummy servicios
multiplicada por 100, es decir -28.3%. Es estadsticamente significativa, dado
que
-0.283/0.099 = -2.85.
c) 100[exp(-0.283)-1] =-24.65%, algo mayor que la cifra anterior
d) La diferencia ser 100(0.181-0.158)=2.3%. Para contrastar si la diferencia es
significativa, deberamos estimar una ecuacin en la categora base fuese el
sector financiero (o el de consumo) y ver luego si la dummy del sector de
consumo (financiero), es o no estadsticamente significativa.
18. Para contrastar el efecto, si lo hay, del consumo de marihuana sobre el salario de
los trabajadores, disponemos de datos de salarios, educacin, experiencia y sexo
de una muestra longitudinal. Adems disponemos de la contestacin de cada
trabajador a la pregunta En cuntas ocasiones fumaste marihuana el mes
pasado?
a) Escribir una ecuacin que permita estimar los efectos sobre el salario del
consumo de esta droga
b) Especificar un modelo que permita contrastar si el consumo de marihuana
tiene efectos distintos en hombres y mujeres. Cmo se contrastara que no
hay diferencias entre sexos?
c) Supongamos que se considera preferible medir el consumo clasificando a los
individuos en cuatro grupos: no consumidor, consumidor ocasional (1-5
veces al mes), consumo moderado (6-10 veces) y consumidor habitual.
Proponer un modelo que permita estimar los efectos de la droga sobre el
salario.
d) Usando el mtodo definido en c), explicar cmo contrastar la hiptesis nula
de que el consumo no afecta al salario.
e) Cules son los problemas para obtener inferencia causal con este tipo de
datos?
Solucin:
a) Un modelo adecuado sera,
log(salario) = 0+1uso+2educ+3exper+ 4exper2+ 5mujer+u
de manera que 1001 medir el cambio porcentual en el salario derivado
consumir marihuana una vez ms al mes.
18
b) Emplearamos el modelo,
log(salario) = 0+1uso+2educ+3exper+ 4exper2+ 5mujer+6mujer*uso
La hiptesis nula de que el uso de la droga no presenta diferencias por
gnero sera H0: 6=0
c) Definiendo las dummy apropiadas y tomando como categora base a quienes
no consumen droga,
log(salario) = 0+1uso1+1uso2+1uso3+2educ+3exper+ 4exper2+
5mujer+u
uso1, uso2 y uso3, son dummy para los diferentes grados de consumo.
d) La hiptesis nula es H0: 1=3=3=0. El estadstico de contraste sera una F
con q=3 y n-8 g.l.
e) El trmino de error contendr factores como el historial familiar (que incluye
el historial del uso de droga por parte de los padres) que podran afectar a los
salarios y tambin estar correlacionados con el uso de marihuana. Nos
interesa el efecto del uso de droga por parte de una persona en su salario, de
manera que debemos procurar mantener constantes el resto de los factores.
Deberamos procurar obtener datos del historial familiar para incluirlo en la
ecuacin como una variable adicional.
(0.002)
(0.20)
(1.20)
19
Solucin:
a) Todos los coeficientes estimados tienen los signos (direccin) esperados. Los de
edad y nivel de estudios, son estadsticamente significativos, sin embargo el
coeficiente de determinacin corregido, es bajo.
b) Implicara que los salarios crecen con la edad de forma no lineal: el crecimiento
es menor cuanto mayor es el valor de la edad. La relacin parece lineal por
cuanto el coeficiente de edad2 no es significativamente distinto de cero. Edad y
Edad2 no tienen colinealidad perfecta.
c) Dado que los incrementos en los salarios suelen negociarse en trminos
porcentuales, una relacin semilogartmica donde la variable dependiente fuese
log w, sera ms apropiada (as es como suele tratarse este tipo de ecuaciones en
la literatura economtrica)
d) En este contexto suele ser una buena idea ignorar el trmino independiente (a no
ser que estemos seguros de su existencia) incluso si su magnitud es elevada.
e) El coeficiente de la dummy correspondiente es suficiente para afirmar que, en
este caso, no hay evidencia favorable a que la sindicacin redunde en mayores
salarios.
y 1 z1 2 z2 3 z3 u
con,
z1 x1 2 x2
z2 x2 4 x3
z3 2 x1 3x2 5 x3
Sea X = [x1 x2 x3] y Z = [z1 z2 z3]
a) Mostrar que las columnas de Z pueden expresarse como combinaciones
lineales de las columnas de X, es decir que Z = XA siendo A una matriz 3x3.
Encontrar los elementos de dicha matriz
b) Dados los elementos de A-1 mostrar que los residuos estimados de las dos
ecuaciones son idnticos.
20
1 y i para i = 1, 2, 3?
Solucin:
a) Es inmediato comprobar que las ecuaciones que relacionan las columnas de
Z con las columnas de X son,
z1 x1 2 x2
z2 x2 4 x3
z3 2 x1 3x2 5 x3
Y por lo tanto la matriz A que resuelve Z = XA es,
1 0 2
A 2 1 3
0 4 5
Para mostrar que las columnas de X son combinaciones lineales de las columnas
de Z, necesitamos resolver el sistema anterior para expresar cada xi como
funcin de zi, es decir, debemos calcular X = ZA-1. A es una matriz cuadrada no
singular y por tanto invertible, de manera que A-1 existe. Tenemos entonces,
X = ZA z1
1
z2
17 8 2
z3 10 5 1
8 4 1
PX X(X'X)1 X ' (ZA1 )[(ZA1 )(ZA1 )]1 (ZA1 )' Z(Z'Z)1 Z ' PZ
Por tanto las matrices productoras de residuos MX, MZ han de ser tambin
iguales, con lo que queda probada la afirmacin.
c) Puesto que los residuos de las dos regresiones son iguales, debe cumplirse la
igualdad XA X . Ello implica que A y A 1 de donde se
obtiene,
1 1 23
1 17 1 82 23
21
W a1 a2Y
P b b Y
1
Solucin:
a)
Y Y W W Y Y P P
Y Y
Y Y
Y Y W P W P Y Y Y Y 1
Y Y
Y Y
a2 b2
a1 b1 (W a2Y ) ( P b2Y )
W P a2Y b2Y
Y Y 0
T 1u'u
T 1u'u
]
E[u'u
']
E[uu
con u (u1 , u2 ,..., uT ) y u (u1 , u2 ,..., uT )
Explicar el significado de cada una de ellas y su relacin con u2
Solucin:
T 1u'u es la media muestral de los cuadrados de los residuos. Tomando
esperanzas,
22
'] u2ITT
E[uu
y X + u, u N (0, 2I)
y supongamos que dicho modelo se puede expresar como,
y X11 X2 2 u
con la condicin de que X1 y X2 son ortogonales, es decir X1T X2 = 0 .
Demuestre que el estimador MCO se puede expresar como,
1 ( X1T X1 )1 X1T y
( XT X )1 XT y
2
Solucin:
T
( X X) X Y X1 X
1
T
X 2
T
XT X
1T 1
X 2 X1
X1T
X2 T Y
X 2
X1T X 2 X1T
Y
XT2 X 2 XT2
23
XT X
1T 1
X 2 X1
X1T X1
X1T X 2 X1T
Y
XT2 X2 XT2
0
( X1T X1 ) 1
0 X1T
Y
XT2 X 2 XT2
X1T
( X1T X1 ) 1 X1T Y 1
0
Y T
1 T
( XT2 X 2 ) 1 XT2
( X 2 X 2 ) X 2 Y 2
24. Sea el modelo yi=1xi+2wi+ui donde por sencillez se ha supuesto que todas las
variables tienen media nula y se ha omitido el trmino independiente.
Supongamos que Xi se distribuye de forma independiente de (Wi, ui) pero que
estas dos ltimas variables pueden estar correlacionadas. Sean y , los
1
Solucin:
(a)
1Xi
2Wi
ui, o en forma
Donde,
Y1
Y
Y 2,
Yn
X1
X
X 2,
Xn
1 ,
24
2 .
W1
W
W 2,
Wn
u1
u
U 2,
un
1 XX XW 1 XY
WX WW WY
2
1
XX XW XU
1
2 W X W W W U
1 XX
1 1n
2 n W X
1
n
1
n
XW 1n XU
WW 1n WU
1 n X 2
1 1 n n i 1 i
2 n i 1 Wi X i
1
n
in1 X iWi
1
in1 Wi 2
n
1n in1 X i ui
1 n
Wu
n i 1 i i
p
p
in1 X i2
E( X 2 ); 1n in1 Wi 2
E(W 2 );
1
n
p
in1 X iWi
E( XW ) 0
E (W 2 ) E (Wu )
2 0
2
1
E (Wu ) .
2 E (W 2 )
p
(b) De la respuesta a (a) 2
2
E (Wu )
2 si E(Wu) 0.
E (W 2 )
25. a) Dos variables X e Y estn relacionadas segn Yi= 2Xi+ui, donde u es una
perturbacin que satisface los supuestos del modelo de regresin.
i.
ii.
2 segn 2
Yi X i
i.
ii.
25
2
i
, cuya varianza es
u2
2
i
iii.
yx / x
iv.
?
v.
Solucin:
XY
Obteniendo 2 2
X
XY X (1 2 X u) 1 X Xu
b2 2
2
X2
X2
X2
X2
E (b2 )
1 X
XE (u) X
X
X
1
Xi
E ( 2 ) E 1
2 E (0 2 ) 2
X2
( X X )(Yi Y )
a menos que la media de X sea
2 es ms eficiente que i
( X i X )2
nula, dado que la varianza poblacional de 2 ser
estimador alternativo es
u2
(X
2
i X)
u2
u2
2
i
nX 2
2
i
que necesariamente es
(X X )
( X X )(Y Y )
(X X )
i
Solucin
a) Para cada caso H0: = 0 y H1: 0 ( H1: > 0)
b) F3, 27 = 18.95, luego se rechaza H0 y se acepta la significatividad global al
5%. Con mayor razn la regresin ser significativa al 10% (par este nivel de
significatividad el valor crtico ser menor)
c) Debe dejarse en funcin de u2 y quedara aprox. (0.625 u2 ,1.853 u2 )
d) La variable M, aunque significativa, tiene un signo contrario al esperado. En
este sentido (y a falta de valorar otras cuestiones heterocedasticidad) el
modelo no puede considerarse satisfactorio.
e) El modelo sera entonces Yt 0 1Ct 2 ( Et M t ) ut
f) El estadstico F para contrastar esta hiptesis, obtenido a partir de los
coeficientes de determinacin de las regresiones restringida e irrestricta, vale
aproximadamente 10.98, siendo muy superior al valor crtico. En
consecuencia se rechazara la hiptesis nula, es decir que ambos parmetros
sean iguales.
27. Para tratar de explicar la relacin entre el peso de los bebs al nacer (en onzas) y
el consumo de tabaco de las madres, se dispone de una muestra de 1388
observaciones. Con los datos de varianzas, covarianzas y medias dados en la
tabla siguiente,
Peso al nacer
Peso al nacer
Cigarrillos
consumidos
Medias
28
Cigarrillos
consumidos
413.9854
18.31459
35.6473
18.31459
118.6996
2.087176
2
i
R 2 0.000119
Solucin
18.31459
a)
0.5138, 118.6996 (0.5138)*2.087176 119.77
35.6473
b) =119.77-0.5138*0 = 119.77; =119.77-0.5138*20 = 109.494
c) No, correlacin no implica causalidad. Debe haber razones tericas que la
justifiquen.
d) El valor de X tendra que ser negativo, lo que no tiene sentido en este
contexto
e) Se obtiene inmediatamente que DW = 1.93, lo que est suficientemente
prximo a 2 para mantener la no autocorrelacin.
f) El estadtico nR2 se distribuye como una 2 con 2 g.l. Su valor
1388*0.000119 = 0.165, es muy bajo y no permite rechazar la hiptesis nula
(la homocedasticidad).
29
28. Considere un modelo que explique los salarios de los directores generales de las
empresas (Y), en funcin de las ventas anuales (X1), el rendimiento de los pagars
(X2) y el rendimiento de las acciones de la empresa (X3),
log(Y) = 0+1log(X1)+2X2+3X3+u
a) Especificar la hiptesis nula de que, una vez tomada en cuenta a influencia de
las ventas y el rendimiento de los pagars, el rendimiento de las acciones no
influye en el salario de los directivos.
b) Si la estimacin es,
log(Y) = 4.32+0.28log(X1)+0.017X2+0.00024X3+u, n= 209, R2 = 0.283
(0.32) (0.035)
(0.0041) (0.00054)
cul sera el efecto pronosticado sobre el salario de un incremento de 50 puntos
en el rendimiento de las acciones?
c) Contrastar la significatividad individual de X3. Especificar claramente las
hiptesis nula y alternativa.
d) Justifique si incluira esta variable en el modelo final elegido para explicar la
remuneracin de los directores generales.
e) Contraste la significatividad global del modelo. Cul es la hiptesis nula en este
contraste?
Solucin
30
29. En la tabla siguiente se muestran las varianzas y covarianzas de los logaritmos de las
importaciones, el PIB y el IPC en USA entre 1975 y 2005,
a)
LIMPORT
LPIB
LIMPORT
0.562049
0.429960
LPIB
0.429960
0.332464
LIPC
Medias
0.272408
13.08472
0.211974
8.569723
LIPC
0.27240
8
0.21197
4
0.13712
9
4.785519
(0.28)
c)
i.
ii.
iii.
log(import) = 1+ 2log(PIB) +u
log(import) = 1+ 2log(IPC) +u
log(PIB) = 1+ 2log(IPC) +u
Solucin
H0: 2 = 0,
H0: 2 = 1
H0 : 2 = 1
Solucin
3550
a)
1.578,
2250
32
c) Sabemos que ( ) =
69.9
2250
31. Con objeto de investigar el impacto de las indicaciones mdicas contra el consumo
de alcohol, se estima la siguiente ecuacin obtenida a partir de una muestra de 500
individuos (errores estndar entre parntesis),
y 13 11.36 x1 0.2 x2 2.85 x3 14.2 x4 , R 2 0.07
(2.12) (0.31) (2.55) (5.16)
donde y es el nmero de bebidas alcohlicas consumidas en las ltimas dos semanas, x1
es una dummy que toma el valor 1 si el mdico de cabecera ha indicado al individuo
que debe dejar el alcohol, x2 los aos de estudio del individuo, x3 es una dummy que
toma el valor 1 si el individuo es separado o divorciado y x4 es una dummy que toma el
valor 1 si el sujeto est en paro.
a) Valore los resultados de la regresin anterior, indicando si los signos de los
parmetros son los esperados
b) Contraste si las variables anteriores son significativas al 5%
c) Para los contrastes pedidos en b) utilizara un test unilateral o bilateral?
Justifique su respuesta
d) Contraste la significatividad global del modelo al 5%
e) En relacin con el objeto de la investigacin, cul sera la conclusin?
Solucin
a) Los signos son efectivamente adecuados, excepto para x1: si el mdico ha
aconsejado dejar de beber, el individuo bebe ms. El coeficiente de
determinacin corregido es bajo pero suficiente
b) Los valores de los ratios t indican que son significativas x1 y x4
33
1, =
2
1
(1 2 )/()
0.077/4
= 0.9225/495 = 10.33
R2 / k 1
0.678 / 3
18.38
2
(1 R ) / n k (1 0.678) / 27
Luego la regresin es globalmente significativa al 5%. Con mayor motivo lo
ser al 10% (el valor crtico ser menor).
c) El signo del consumo de carne parece contrario al esperado
d) Yi 1 2Ci 3 Ei 3M i ui 1 2Ci 3 ( Ei M i ) ui
Fk 1,n k
e) En este caso,
2
( RNR
RR2 ) / m (0.678 0.547) /1
F1,27
9.1
2
(1 RNR
) / n k (1 0.678) /(31 4)
Solucin
a) Seran H0: i = 0, H1: i > 0
35
e)
2
( RNR
RR2 ) / m (0.09 0.078) / 2
0.125
2
(1 RNR
) /(n k )
(1 0.09) /19
qt 2.837 1.481 p1t 1.181 p2t 0.186 p3t 0.257 yt , SCR 0.4277
(2.0) (0.79)
(0.66)
(0.11)
(0.11)
Siendo p1t el precio del t de Ceiln, p2t el precio del t de India, p3t el precio
del caf en Brasil, yt la renta disponible y qt la cantidad demandada. Entre
parntesis figuran los errores estndar.
a) Seale si los signos de los coeficientes son acordes con lo que se deriva de la
teora de la demanda.
b) Contraste la significatividad individual de cada una de las variables (ver
valores crticos en nota final)
c) Sabiendo que (2 , 3 ) = 0.53 contraste la hiptesis 2 = 3 es decir
que los parmetros de los precios del t son iguales pero de signo contrario
(se entiende que 1 es la constante, 2 el parmetro del precio del t de
Ceiln, etc).
d) Con la misma muestra se estima la ecuacin,
36
Solucin
a) S, son acordes con la teora: el precio del bien tiene signo negativo, el de los
bienes sustitutivos positivo y el de la renta tambin positivo.
b) El cociente entre cada estimador y su error estndar se distribuye como una
t17. Estos valores son respectivamente, -1.87, 1.79, 1.69 y 2.34. Excepto el
cuarto, todos ellos mayores que el valor crtico al 5% para un contraste
unilateral. El caf est en el lmite (valor p = 0.055 no se pude calcular con
los datos del ejercicio).
c) En este caso el estadstico,
b2 b3
1.481 1.181
F2,17
(0.6788 0.4277) / 2
4.99
0.4277 /17
35. Un fabricante de cable telefnico desea predecir sus ventas a su principal cliente
para lo que estima el siguiente modelo a partir de una muestra anual
correspondiente al periodo 1968-1983 (16 observaciones),
37
1 9.27,
2 5.35
siendo Y: ventas de cable (millones de pies), X2: PIB (miles de millones de dlares),
X3: construccin de vivienda nueva, X4: paro (%), X5: tipo de inters (%) y X6:
ganancia de lneas para el cliente (%). Entre parntesis se muestran los errores estndar
de los respectivos estimadores; 1 y 2 son respectivamente, el resultado del test de
Breusch Godfrey para la autocorrelacin serial (p=2) y el test de Breusch Pagan
Godfrey para heterocedasticidad,
a) Diga, razonndolo, qu coeficientes tienen los signos esperados
b) Emplee un test unilateral del 5% para contrastar la significatividad individual de
cada uno de los coeficientes anteriores
c) En relacin con los resultados del apartado anterior, qu habra cambiado (en
caso de que as fuera) si hubiese empleado un contraste bilateral?
d) Lleve a cabo un constraste de significatividad global. Especifique con claridad el
nivel de significancia y la hiptesis nula.
e) La tabla siguiente muestra la matriz de varianzas y covarianzas de los
estimadores (se excluye la constante),
X1
X2
X3
X4
X5
X1
6.565897
-1.491489
-246.9097
-313.0653
-253.6421
X2
-1.491489
0.726658
42.95137
100.7123
50.97218
X3
-246.9097
42.95137
36174.56
9764.317
35506.09
X4
-313.0653
100.7123
9764.317
22081.39
23799.44
X5
-253.6421
50.97218
35506.09
23799.44
86876.90
Solucin
b
b5
b1
b2
b4
1.91,
2.82, 3 4.29,
0.127,
2.859
ee(b1 )
ee(b2 )
ee(b3 )
ee(b4 )
ee(b5 )
+
+
+
El test unilateral implica que contrastamos la hiptesis nula H1: bi > 0 contra
la alternativa H1: bi > (as es para el PIB, la construccin de vivienda o la
ganancia de lneas) H1: bi < 0 (paro y tipo de inters) es decir, la hiptesis
38
R 2 /(k 1)
0.818 / 5
8.98
2
(1 R ) /(n k ) (1 0.818) /(16 6)
De manera que la regresin es globalmente significativa. Las hiptesis nula y
alternativa son ahora,
Fk 1,n k
H0: 1=2 = =5 = 0
H1: No se cumple la hiptesis anterior (basta con que uno de los coeficientes
no sea nulo)
e) Emplearamos el estadstico,
(b4 b6 ) ( 4 6 )
var(b4 b6 )
que se distribuye como una t con n-k g.l. Bajo la hiptesis nula queda,
(b4 b6 )
(b4 b6 )
var(b4 b6 )
var(b4 ) var(b6 ) 2 cov(b4 , b6 )
815.529 842.791
27.262
0.119
36174.56 86876.9 235506.09 228.12
39
36. Para analizar la influencia del nmero de alumnos por clase sobre la nota media
de los estudiantes, se ha estimado la siguiente regresin (errores estndar entre
parntesis),
Solucin
a) S, es de esperar que ms alumnos por clase tengan una influencia negativa en el
rendimiento
b) 69.89-2.28*22=19.73
c) H0: 1=0 y H1: 1<0
d) El ratio t arroja un valor de t398=-2.28/0.49 =-4.65. Comparando con los valores
crticos de una normal estndar (n =400), queda claramente en la regin de
rechazo tanto al 5% (-1.64) como al 1% (-2.33). Se rechaza por tanto la hiptesis
nula: el ratio alumnos por profesor tienen una influencia significativa y negativa,
sobre el rendimiento.
R2 / q
0.0512
37. A partir de una muestra de 20 observaciones correspondientes al periodo 19701989, se estima la siguiente ecuacin de salarios (errores estndar entre
parntesis) para un determinado pas,
40
Solucin
a) Los resultados son acordes con lo esperado: los precios del producto influyen
positivamente y la tasa de paro negativamente (ms paro implica ms oferta de
trabajo)
b) Teniendo en cuenta la relacin entre ste y R2, puede obtenerse de,
n 1
19
R 2 1 (1 R2 )
1 0.127 0.85
1 k 1
16
c) S, es bastante probable que haya una elevada correlacin entre Xt y Xt-1.
d) En estos modelos la elasticidad no es constante, dependiendo del valor de la X.
Podra ofrecerse una elasticidad media ponderando el cambio marginal por el
cociente entre las medias de X e Y en lugar de hacerlo con X/Y.
38. Una familia, cuya hija est matriculad en una universidad privada de gran
prestigio, est disgustada con la subida del precio de la matrcula y, para ahorrar
dinero, est considerando la posibilidad de cambiar a otra universidad menos
prestigiosa. Para valorar esta decisin dispone de una muestra aleatoria de 100
universidades con datos correspondientes al ao 2010, con los que estima la
siguiente regresin,
= 7311 + 3985 0.2 + 8406 2376, 2
= 0.72
donde Reput es un ndice que mide el prestigio que vara entre 1(menor
reputacin) y 5; Tamao es el nmero de estudiantes matriculados, y el resto son
variables binarias que indican si la universidad es privada o religiosa y coste es
el precio de la matrcula, cuya media es aproximadamente 49000 dlares.
a) Interprete los resultados. Tienen los coeficientes los signos esperados?
41
2 = 0.71
Est justificada esa omisin? Por qu cree que el efecto de asistir a una
universidad privada ha aumentado?
Solucin
a) La reputacin y el ser privada, aumentan el precio de la matrcula. Tamao y ser
religiosa, lo disminuyen. Es un resultado razonable.
b) S, es estadsticamente significativa, dado que,
0.72 / 3
F3,96
92.28
(1 0.72) / 96
Muy superior al valor crtico por lo que se rechaza la hiptesis nula de que los
coeficientes de las variables explicativas son conjuntamente iguales a cero.
2
( RNR
RR2 ) /1
0.72 0.71
3.43
2
(1 RNR ) /( N K )
0.28 / 96
i. = 11.71 1.0431 ,
2 = 0.256
2 = 0.514
Solucin
0.46 0.56 1
0.02
0.11
0.0076 0.016 2 * 0.004492 0.18
yt 1 (1 3 ) wt 3kt
( yt wt ) 1 3 (kt wt )
d) Al implicar una nica restriccin el test t y el F estn relacionados segn t2=F y
por tanto el test F = 0.012 aproximadamente.
41. Para estudiar las diferencias salariales en un determinado pas se obtienen datos
de 7338 trabajadores y se divide el pas en cuatro regiones, Noroeste (NO),
Noreste (NE), Suroeste (SO) y Sureste (SE), estimndose la siguiente regresin
(errores estndar entre parntesis):
i = 4.78 0.038NEi 0.041SOi 0.048SEi
(0.14) (0.018)
(0.010)
(0.012)
44
R2 = 0.52
donde cada una de las variables explicativas es una variable binaria que toma el
valor 1 si el trabajador pertenece a esa regin e Y es el salario expresado en
euros/hora.
a) Cul es el salario medio de correspondiente a la categora base? Qu
regin tiene un salario medio ms elevado? En qu regin es ms reducido
el salario medio?
b) Contraste la hiptesis de significatividad global de la regresin para un nivel
de significancia del 5%.
c) Suponga que excluye la dummy correspondiente a NE e incluye una dummy
para la regin NO. Calcule si es posible el signo y la magnitud de todas las
variables del nuevo modelo.
d) Si la covarianza entre los estimadores bNE y bSO es 0.00007, es
estadsticamente significativa la diferencia de salario entre las regiones
Noreste y Suroeste? Explique claramente si emplea un contraste a una o dos
colas y porqu.
Solucin
a) El salario medio de la categora base es 4.78
El salario medio ms elevado corresponde a la regin NO, 4.78
El ms reducido a la regin SE: 4.78-0.048 = 4.732
R2 / k 1
0.52 / 3
= 4.742+0.038NO0.003SO0.01SE
d) Tenemos que contrastar la hiptesis nula H0: NE = SO, contra la alternativa H1:
NE SO. El contraste es pues bilateral. Empleamos el estadstico,
tn k
45
NE SO
NE SO
var
NE SO
NE var
SO 2cov NE SO
var
0.003
0.0182 0.012 2*0.00007
0.003
0.178
0.000284
Renta
(1)
MCO
0.147
(.058)
(2)
MCG
0.161
(.059)
Tamao
Educacin
Edad
Emigrante
Constante
R2
White test
124.84
(655.39)
0.06
5.27
-124.95
(480.86)
.085
(3)
MCO
0.109
(0.071)
67.66
(222.96)
151.82
(117.25)
0.286
(50.52)
(518.39)
(1303.06)
-1605.42
(2380.15)
0.0828
7.44
(4)
MCG
0.105
(0.077)
- 6.87
(168.43)
139.48
(100.54)
21.75
(41.31)
137.28
(844.55)
-1854.42
(2351.80)
0.142
En las columnas (1) y (3) se ha estimado por MCO y en las (2) y (4) por MCG
suponiendo que la varianza de las perturbaciones es var(ui)=2Rentai.
a) A la vista del valor del contraste de White, le parece justificada la
estimacin de la columna (2)? Por qu?
b) Suponga que ha considerado la estimacin de la columna (2) preferible a la
de la columna (1). Podra rechazar la hiptesis de que la propensin
marginal al ahorro es 0.147?
c) En las columnas (3) y (4) se han incluido cuatro variables explicativas
adicionales. Explique razonadamente si pueden considerarse
estadsticamente significativas tanto de forma individual como conjunta.
d) Si tuviera que elegir entre el modelo (3) y el modelo (4), podra hacerlo en
funcin del valor del coeficiente de determinacin? Por qu?
e) Valorando todos los resultados anteriores y cualesquiera otros que puedan
deducirse de los resultados, indique cul de los cuatro modelos es el que
considera ms adecuado.
46
Solucin
a) El contraste de White se emplea para contrastar la hiptesis de
homocedasticidad y se distribuye como una 2 con gl igual al nmero de
regresores de la ecuacin de contraste. En este caso, al ser una regresin simple
la ecuacin (1), la ecuacin de contraste solo tendr dos regresores. El valor
crtico al 5% de una 2 con 2 gl, es 5.99, de manera que no podemos rechazar la
hiptesis de homoscedasticidad y por tanto no est justificado el empleo de
Mnimos Cuadrados Generalizados.
b) La hiptesis nula es H0: = 0.147 y la alternativa H0: 0.147. El estadstico
apropiado para este contraste ser,
0.161 0.147
0.237
0.059
No permite rechazar la hiptesis nula.
c) Ninguna de ellas es estadsticamente significativa individualmente considerada
(test t). Para contrastar la significatividad global de las mismas,
(0.0828 0.06) / 4
0.58,
(1 0.0828) /(100 6)
(0.142 0.085) / 4
1.56
(1 0.142) /(100 6)
De manera que en ninguno de los dos casos son globalmente significativas.
Pi 120 0.48 X1i 23.4 X 2i 0.48 X 3i 0.10 X 4i 48.8 X 5i , R 2 .75 SCE 41.5
(24) (2.61)
(8.9)
(0.033) (0.31)
(10.5)
47
donde P son los precios y las variables explicativas son, X1 =el nmero de
dormitorios, X2 =el nmero de cuartos de bao, X3 =el tamao de la vivienda en
m2, X4 =la antigedad en aos y X5 =una dummy que toma el valor 1 si la
vivienda est en un barrio pobre. SCE es la Suma de los Cuadrados Explicada.
a) Comente el resultado relativo al nmero de dormitorios y a la antigedad de
la vivienda
b) El autor del trabajo observa que en el mercado las viviendas de cinco
dormitorios se venden por una cuanta muy superior a las de 2 dormitorios.
Explique si este resultado es compatible con la estimacin obtenida.
c) El coeficiente de determinacin para la regresin que excluye el nmero de
dormitorios y la antigedad, es R2 = 0.73. Exprese la hiptesis nula adecuada
para contrastar si ambas variables con conjuntamente igual a cero. Lleve a
cabo el contraste y diga cul es la conclusin.
.
d) Obtenga, si es posible, un estimador de la varianza de los errores.
Solucin
a) El nmero de dormitorios tiene el signo apropiado ya que ms dormitorios
incrementan el precio; no as la antigedad que tiene un signo contrario al
esperado. No obstante ninguna de las dos variables es estadsticamente
significativa.
b) La magnitud del estimador es pequea y no significativa, lo que podra
entrar en contradiccin con el hecho de que el precio de venta es muy
superior. No obstante hay que tener en cuenta que el valor del estimador,
0.48, mide el efecto parcial del incremento en el nmero de dormitorios
manteniendo constantes el resto de las variables y en concreto el tamao de
la vivienda, por lo que no se puede decir que el resultado sea incompatible
48
0.00346
n k 1 3996
44. Suponga que desea analizar el impacto del consumo de bebidas alcohlicas en
los accidentes de trfico con vctimas mortales, para lo que estima la siguiente
regresin transversal empleando datos de los 48 estados USA (N=48),
Yi 3.36 0.002 X 1i 0.17 X 2 i 0.31X 3i 0.011X 1i X 4 i , R 2 0.499
(0.025)
(0.092)
( 0.24)
(0.0027)
siendo,
Y= nmero de muertos en accidente por milla recorrida en el estado i
X1 = consumo per cpita de cerveza en el estado i
X2 = velocidad media en autopista en el estado i
X3 = dummy que toma el valor 1 si el estado tiene un programa de revisin de los
elementos de seguridad del vehculo
X4 = Altitud media en las reas metropolitanas (se supone que a ms altitud mayor
probabilidad de accidentes porque la altitud influye en el consumo de oxgeno del
cerebro)
a) Comente los resultados de la estimacin y diga si observa algn signo de
problemas.
b) Explique claramente qu es lo que mide la variable de interaccin X1i X4i.
Disee y lleve a cabo un test adecuado para contrastar su significatividad
estadstica
c) Cuando el investigador decide incluir X4i como variable individual (no solo en el
trmino de interaccin), obtiene,
Yi 2.36 0.024 X 1i 0.14 X 2 i 0.24 X 3i 0.35 X 4 i 0.023 X 1i X 4 i , R 2 0.501
( 0.03)
(0.091)
( 0.25)
( 0.33)
(0.012)
Solucin
a) Sorprende el hecho de que el consumo de cerveza no sea significativo, lo que
podra deberse a algn problema de omisin de variables, aunque tambin
pudiera ser que el trmino de interaccin hubiera absorbido completamente este
efecto.
b) Esta variable es una medida de si el impacto del consumo de cerveza hace crecer
el nmero de vctimas cuando la altitud aumenta. Su significatividad estadstica
se contrastara de la forma habitual. En este caso el ratio t vale aproximadamente
4.07, por lo que es significativa al 1%.
c) La nueva variable no es estadsticamente significativa y el coeficiente de
determinacin corregido solo mejora marginalmente y esta inclusin tampoco
corrige el problema del consumo, de manera que, a no ser que haya fuertes
razones tericas para incluir la altura como una variable separada, nos
quedaramos que la primera especificacin.
d) Aunque por separado ninguna de ellas parece ejercer un efecto significativo en
el nmero de vctimas, el trmino de interaccin es estadsticamente
significativo y tiene el signo apropiado en las dos estimaciones ensayadas.
Concluiramos que la investigacin aporta evidencia de una influencia conjunta
sobre el nmero de muertos.
50
(.003)
R 2 0.168
(.003)
R 2 0.173
Solucin
a) Derivando se obtiene inmediatamente la expresin anterior
b) Signo positivo. La elevada formacin de los padres se supone que reforzar la
influencia de la educacin en el salario
c) El trmino de interaccin indica que el efecto de la educacin sobre el salario no
depende exclusivamente de la educacin del individuo, sino que resulta
amplificada cuando se combina con un elevado nivel educativo de los
progenitores. En este caso, el efecto de la educacin es mayor para aquellos
individuos cuyos padres tienen mayores niveles de educacin. Por ejemplo, un
ao ms de educacin implica que el salario aumentar en un 4.7% si el nivel
educativo de los padres es nulo, pero si este es distinto de cero, aadir un
crecimiento adicional al salario del individuo.
d) Podemos obtener este contraste comparando los valores de los coeficientes de
determinacin en ambas regresiones,
51
Fq , n k 1
2
( RNR
RR2 ) / q
(0.173 0.168) /1
0.005
4.329
2
(1 RNR ) / n k 1 (1 0.173) / 722 5 1 0.00155
Como este valor es mayor que el crtico en tablas al 5% para una distribucin F1,
716,, rechazaramos la hiptesis nula y concluiramos que la variable es
estadsticamente significativa.
e) Lo ideal sera emplear el modelo del apartado anterior para contrastar la
hiptesis conjunta de que las variables padeduc y educ*padeduc son
conjuntamente iguales a cero. Como no disponemos de datos suficientes para
llevar a cabo este contraste, debemos conformarnos con contrastar la hiptesis
de significatividad individual en el modelo del aparado c). En este caso, dado
que 0.00078/0.00021 = 3.71, rechazaramos la hiptesis nula y la variable es
estadsticamente significativa. Ello unido al resultado obtenido en d (la
significatividad individual de padeduc), indicara que dicha variable es
significativa.
La tabla siguiente muestra las estimaciones del modelo con y sin X4 (errores estndar
entre parntesis),
(1)
(2)
log(X1)
11.13
7.75
(gasto)
(3.30) (3.04)
log(X2)
0.022
1.26
(n alumnos) (0.615) (0.58)
X4
0.324
(0.036)
Constante
69.24 23.14
(26.72 (24.99)
52
N
R2
428
0.0297
428
0.1893
b) Explique por qu el efecto del gasto sobre Y es menor en la columna (2) que
en la columna (1). Son estos efectos estadsticamente superiores a cero?
Explique por qu o por qu no, indicando en su caso el contraste en el que se
basa.
c) Es el porcentaje de aprobados ms bajo en las escuelas con ms alumnado
(manteniendo todo lo dems igual)? Justifique su respuesta
d) Interprete claramente el coeficiente de X4 en la columna (2)
e) Teniendo en cuenta que varios coeficientes son negativos en las
estimaciones anteriores, sera posible que hubiese un porcentaje de
aprobados negativo?
Solucin
a) S, desde luego, dado que se supone que para poder acogerse a ese programa
habr que acreditar unas determinadas condiciones de precariedad
econmica.
b) Con toda probabilidad la omisin de la variable X4 en el modelo (1), est
causando un sesgo en ese coeficiente. S, dado que en ambos casos podemos
rechazar H0: = 0 en favor de la alternativa H1: > 0.
c) A todos los efectos el modelo (2) es preferible al modelo (1) y en este
modelo el coeficiente correspondiente a la matrcula, es negativo y
estadsticamente significativo, de manera que, en efecto, podemos concluir
que la matrcula influye negativamente en los resultados.
d) Si el porcentaje de alumnos en situacin de pobreza aumenta un punto, el
porcentaje de aprobados cae en 0.32 puntos porcentuales.
e) Aunque aparentemente pueda parecer que s, si tomamos en consideracin el
rango de variacin de las variables explicativas (no proporcionado),
observaramos que no es posible tal resultado.
47. Para estudiar los determinantes del peso al nacer de los bebs, se estiman las
siguientes ecuaciones (errores estndar entre parntesis),
53
(0.0059)
(0.006)
(0.013)
N = 1388, R2 = 0.0472
y,
log(bwght) = 4.65 - 0.0052 cigs + 0.0110 log(faminc) + 0.017 parity
(0.38) (0.0010)
(0.0085)
(0.006)
(0.015)
(0.0030)
(0.0026)
N = 1236, R2 = 0.0493
Siendo,
Btwght = peso al nacer el beb (en onzas)
Cigs = nmero de cigarrillos al da fumados por la madre durante el embarazo
Faminc = renta familiar
Parity = lugar entre los hermanos
Male = dummy sexo (=1 si varn)
White = dummy color (= 1 si blanco)
Motheduc = aos de educacin de la madre
Fatheduc = aos de educacin del padre
Solucin
54
a) Mide cmo vara el peso al nacer medido en logaritmos, como consecuencia del
nmero de cigarrillos fumados por la madre. Al ser una relacin loglin, cada
cigarrillo adicional hace que el peso del beb disminuya en un100*(0.0044) =
0.44%, aproximadamente. Fumar 10 cigarrillos implica por tanto una prdida de
peso de un 4.4% (aprox.)
b) La variable male es positiva y estadsticamente significativa, por lo que ser
varn implica un mayor peso. Anlogamente la variable white es tambin
positiva y significativa, por lo que ser blanco supone asimismo mayor peso.
Ser varn blanco implica un incremento de peso de 2.7+5.5 = 8.2% en la
primera ecuacin, o 3.4+4.5=7.9% en la segunda
c) El coeficiente presenta un signo contrario al esperado o al menos difcil de
justificar. No obstante, la variable no es estadsticamente significativa, por lo
que no se puede rechazar que su influencia sea nula.
d) Las ecuaciones han sido estimadas a partir de muestras diferentes. Sera
necesario que ambas muestras fuesen iguales para poder llevar a cabo el
estadstico que se pide.
Solucin
55
Yi 0.2033 0.656 X i ,
(0.0976) (0.1961)
R2 0.397,
56
c) Suponga que en 1968 la TPFL fue de 0.58. Obtenga una prediccin para
E(TPFL en 1972) y construya un intervalo de confianza del 95% para la
misma
d) Cmo probara que los residuos de la regresin estn normalmente
distribuidos?
Solucin
1.75
0.1961
ee( )
Para un nivel de significatividad del 5%, el valor crtico en tablas es, para un
contraste unilateral, t17, 0.05 = 1.74. Por tanto 1.75 queda en la regin de
aceptacin y no se puede rechazar la hiptesis nula.
c) El pronstico sera = 0.2033+0.58*0.656 = 0.584 y el intervalo,
S 2 ( K 3)2
d) Emplearamos es estadstico de Jarque Bera, JB n
24
6
57
Yt 147.1 14.18 X t ,
R 2 0.652
Yt 122.9 24.3Dt 13.01X t ,
R 2 0.724
Y 129.3 10.41X 4.72 D X ,
R 2 0.874
t
R 2 0.921
Dt es una dummy que toma el valor 1 para todas las observaciones posteriores a
1985,
a) Interpretar los coeficientes de los cuatro modelos
b) Calcular el coeficiente de determinacin ajustado y elegir el mejor modelo
en base a este criterio
c) Contrastar si la incorporacin a la CEE en 1986 tuvo algn efecto sobre la
funcin anterior
d) Si la respuesta anterior es afirmativa, escribir la funcin de exportaciones
antes y despus de la incorporacin a la Comunidad Econmica Europea
Solucin
a) Los modelos expresan la relacin entre las exportaciones (variable
dependiente) y el tipo de cambio (variable independiente). El signo del tipo
de cambio es positivo en los cuatro, conforme a lo esperado.
El modelo bsico es el primero. Los otros tres se limitan a incorporar
distintas combinaciones de la dummy para tratar de analizar si la relacin ha
cambiado en el ao 1985.
b) Empleando la frmula (2.3.16), se obtiene respectivamente 0.64, 0.71, 0.86 y
0.91, de manera que en base a este criterio elegiramos el ltimo modelo
c) Concluiramos que la funcin ha cambiado, si la dummy (sola o
interactuando con el tipo de cambio), es significativa. Para contrastarlo,
podemos emplear contrastes tipo F. Por ejemplo, si comparamos el segundo
modelo con el primero, siendo el primero la ecuacin restringida,
obtendramos,
(0.724 0.652) /1
F1, 29
7.56
(1 0.724) / 29
Es decir, rechazaramos que la dummy fuese nula. Los modelos 3 y 4 tambin
se pueden comparar con el primero (y entre s), siguiendo este procedimiento.
58
= 134.6+10.89X
= 156.2+14.80X
Solucin
59
d) R2 1
SCR
2.4973
1
0.9324
SCT
36.9
F1,8
R2 / k
0.9324
110.34
2
(1 R ) /(n k 1) (1 0.9324) / 8
De donde,
ee(1 )
0.8095
0.077
10.504
y el intervalo,
0.8095 2.306*0.077 (0.6312, 0.9875)
Otra va,
2
2.4973/ 8
1 ) 2
var(
0.005946, ee( 1 ) 0.005946 0.077 ,
x
52.5
t
etc, etc.
los aos de edad del trabajador (edad), y dummies que expresan el lugar de
residencia, noroeste (NO), noreste (NE), suroeste (SO) y sureste (SE).
a) Suponiendo que la jornada laboral es de 7 horas, durante 5 das a la semana,
Cul sera la diferencia en el salario mensual (4 semanas) de un trabajador(a)
con el ttulo de bachiller respecto a quienes no lo tienen?
b) Explique si hay evidencias de diferencias salariales significativas en funcin del
lugar de residencia.
c) El coeficiente de determinacin de la regresin restringida para contrastar la
hiptesis de que los efectos regionales son nulos, es 0.190. Diga si es posible
rechazar dicha hiptesis en un contraste del 5%.
El correspondiente estadstico de contraste arroja el siguiente resultado,
d) Elvira y Vega de 28 aos de edad, tienen ambas el ttulo de bachiller pero
mientras la primera vive en la regin NO, Vega vive en la regin NE. Cul ser
la diferencia de salario esperada? Cmo podra construir un intervalo de
confianza del 95% para dicha diferencia?
Solucin
(0.194 0.19) / 3
(1 0.194) / 4000 7
6.60
61