Está en la página 1de 9

Soluciones a los problemas

2.1 ( i) Los ingresos, la edad y los antecedentes familiares (como el número de hermanos) son sólo algunas posibilidades. Parece que cada uno de
ellos podría ser correlacionado con años de educación. (Ingresos y la educación son probablemente correlacionados positivamente, la edad y la
educación pueden ser correlacionados negativamente porque las mujeres en cohortes más recientes tienen, en promedio, más educación,;. Y
número de hermanos y la educación son probablemente una correlación negativa)

(Ii) No, si los factores que figuran en la parte (i) se correlacionan con educ. Debido a que nos gustaría mantener estos factores fijos,
que son parte del término de error. Pero si u se correlaciona con educ entonces E ( u | educ) 0, y así falla SLR.4.

2.2 En la ecuación y = 0 + 1 X + u, sumar y restar 0 Del lado derecho de obtener y = ( 0 +


0) + 1 X + (U 0). Llamar al nuevo error e = u 0, por lo que E ( e) = 0. La nueva intersección es 0 + 0,
pero la pendiente es todavía 1.

norte

2.3 ( Yo dejo y i = GPA yo, X i = ACTO yo, y n = 8. A continuación, x = 25,875, y = 3,2125, ( Xyo - x) (y yo - y) =
yo 1

norte

5,8125, y ( Xyo - X ) 2 = 56.875. De la ecuación (2.9), se obtiene la pendiente como 1 =


yo 1

5,8125 / 56.875 ≈ . 1022, redondeado a cuatro lugares decimales. A partir de (2.17), =y-
0

X ≈ 3,2125 - (0,1022) 25,875 ≈ . 5681. Por lo tanto, podemos escribir


1

= 0,5681 + 0,1022 ACT GPA


n = 8.

La intersección no tiene una interpretación útil porque ACTO No está cerca de cero para la población de interés. Si ACTO

es de 5 puntos superior, GPA aumenta en 0,1022 (5) = 0,511.

(Ii) Los valores ajustados y los residuos - redondeadas a cuatro decimales - se dan junto con el número de
observación yo y GPA en la siguiente tabla:

i GPA GPA û

1 2,8 2.7143 . 0857

2 3,4 3.0209 . 3791

3 3.0 3,2253 -.2253


4 3.5 3.3275 . 1725

5 3.6 3.5319 . 0681

6 3.0 3,1231 -.1231


7 2,7 3,1231 -.4231
8 3,7 3.6341 . 0659

Puede comprobar que los residuos, como se informa en la tabla, suma a 0,0002, que es bastante cercano a cero dado el error
inherente redondeo.

6
(Iii) Cuando ACT = 20, GPA = 0,5681 + 0,1022 (20) ≈ 2.61.

norte
2
(Iv) La suma de los residuos al cuadrado, ˆ iies aproximadamente 0,4347 (redondeado a cuatro decimales),
u,
1

norte

y la suma total de cuadrados, ( yyo - y) 2, es aproximadamente 1.0288. Entonces el R- al cuadrado de la


yo 1

regresión es

R 2 = 1 - SSR / SST ≈ 1 - (0.4347 / 1.0288) ≈ . 577.

Por lo tanto, sobre 57,7% de la variación en GPA se explica por ACTO en esta pequeña muestra de estudiantes.

2.4 ( Yo cuando CIGS = 0, el peso al nacer es predicho 119.77 onzas. Cuando CIGS = 20, bwght = 109,49.
Esto se trata de una caída de 8,6%.

(Ii) No necesariamente. Hay muchos otros factores que pueden afectar el peso al nacer, en particular la salud general de la madre y la
calidad de la atención prenatal. Estos podrían ser correlacionados con el consumo de cigarrillos durante el parto. También, algo así como el
consumo de cafeína puede afectar el peso al nacer, y también podría estar correlacionado con el consumo de cigarrillos.

(Iii) Si queremos un predicho bwght de 125, entonces cigs = ( 125 - 119.77) / (-.524) -10.18, o alrededor de≈-10 cigarrillos! Esto no
tiene sentido, por supuesto, y se muestra lo que sucede cuando estamos tratando de predecir algo tan complicado como el peso al
nacer con una sola variable explicativa. El mayor peso al nacer predice necesariamente es 119,77. Sin embargo, casi 700 de los
nacimientos en la muestra tenía un peso al nacer superior a 119,77.

(Iv) 1.176 fuera de 1.388 mujeres no fumaron durante el embarazo, o alrededor de 84,7%. Debido a que estamos utilizando únicamente CIGS
para explicar el peso al nacer, sólo uno hemos predicho en el peso al nacer CIGS = 0. El peso de nacimiento predicho es necesariamente más o
menos en el medio de los pesos de nacimiento observados en
CIGS = 0, y así estaremos bajo predecir altas tasas de natalidad.

2.5 ( i) La intersección implica que cuando inc = 0, contras se prevé que sea negativo $ 124.84. Esto, por supuesto, no puede ser
verdad, y refleja el hecho de que el consumo de esta función podría ser un pobre predictor del consumo a niveles muy bajos
ingresos. Por otro lado, sobre una base anual, $ 124.84 no está tan lejos de cero.

(Ii) Sólo tiene que conectar 30.000 en la ecuación: contras = -124,84 + 0,853 (30,000) = 25,465.16 dólares.

(Iii) El MPC y el APC se muestran en el siguiente gráfico. A pesar de que la intersección es negativo, la APC más pequeño
de la muestra es positiva. El gráfico comienza en un nivel de ingreso anual de $ 1.000 (en dólares de 1970).

7
.9

MPC
APC MPC

. 853

APC

. 728

.7

1000 10000 20000 30000


Cía

2.6 ( i) Sí. Si viven más cerca de un incinerador reduce los precios de la vivienda, siendo entonces más lejos aumenta precios de la
vivienda.

(Ii) Si la ciudad decidió ubicar la incineradora en una zona alejada de los barrios más caros, entonces log ( dist) se
correlaciona positivamente con la calidad de la vivienda. Esto violaría SLR.4, y la estimación OLS es sesgada.

(Iii) Tamaño de la casa, número de cuartos de baño, tamaño del lote, la edad de la casa, y la calidad de la vecindad (incluyendo la
calidad de la escuela), son sólo algunos de los factores. Como se mencionó en la parte (ii), se trata sin duda podría correlacionarse con dist
[ y log ( dist)].

2.7 ( i) Cuando se condiciona en Cía en el cálculo de una expectativa, Cía se convierte en una constante. Asi que

MI( u | inc) = MI( inc e | inc) = inc MI( e | inc) = inc 0 porque E ( e | inc) = MI( e) = 0.

(Ii) Una vez más, cuando nos condición sobre Cía en el cálculo de una variación, Cía se convierte en una constante. Asi que

var ( u | inc) = var ( inc e | inc) = (inc) 2 var ( e | inc) = 2 mi Cía porque Var ( e | inc) = 2 e.

(Iii) Las familias de bajos ingresos no tienen mucha discreción sobre el gasto; Por lo general, una familia de bajos ingresos debe
gastar en alimentos, ropa, vivienda y otras necesidades. las personas de mayores ingresos tienen más discreción, y algunos podrían
elegir más el consumo, mientras que otros más ahorro. Esto sugiere discreción más amplia variabilidad en el ahorro de las familias de
ingresos más altos.

8
2.8 ( i) De la ecuación (2.66),

norte norte

%= xy /ii Xii
2
.
1 yo

1 1

enchufar y i = 0 + 1 X yo + u yo da

norte norte

%=
1
Xyo( 0 1
xu yo yo
) / X ii
2
.
yo 1 1

Después de álgebra estándar, el numerador se puede escribir como

norte norte norte


2
0
X yo 1
X Xu.
yo yo
yo

yo 1 yo 1 yo 1

Poner esto sobre el denominador muestra podemos escribir 1 % como

norte norte norte norte

% =0 Xii / Xii + 1 +
2
Xu ii/
2
X ii .
1 yo

1 1 1 1

Condicionada a la X yo, tenemos

norte norte

MI( 1 %) = 0 Xii /
2
Xii + 1
1 1

porque E ( u i) = 0 para todo yo. Por lo tanto, el sesgo en 1 % está dada por el primer término en esta ecuación.

norte

Este sesgo es obviamente cero cuando 0 = 0. También es cero cuando x ii= 0, que es el mismo que
1

x = 0. En el último caso, la regresión a través del origen es idéntica a la regresión con una intercepción. (Ii) De la última
expresión de % en la parte (i) que tenemos, condicionada a la X yo,
1

2 2
norte norte norte norte

var ( 1 %) = 2
Xii var xuyo =ii Xii
2 2
X yo Var ()u yo
1 1 1 yo 1

2
norte norte norte
2 2 2
= x ii= 2 /
2
Xii X ii .
1 1 1

9
norte norte norte

(Iii) A partir de (2.57), Var ( 1 ) = 2/ ( xxii )


2
. Desde la pista, X ii
2
( xx,
2
y entonces
)
ii
1 1 1

norte norte

var ( 1 %) var ( 1 ). Una forma más directa de ver esto es para escribir 2 2
xxii = ) XNX, w()
2
( ii
HICH
1 1

norte X a no ser que x = 0.


2
es menos que yo

yo 1

(Iv) Para un tamaño de muestra dado, el sesgo en 1 % aumenta a medida X aumentos (que sostiene la suma de la

2
Xyofijo). Pero como X aumenta, la varianza de aumenta con respecto a Var ( 1 %). El sesgo en 1 %
1

También es pequeña cuando 0 es pequeño. Por lo tanto, si preferimos %o en un error cuadrático medio
1 1

norte
2
base depende de los tamaños de 0, X , y n ( Además del tamaño de Xii ).
1

2.9 ( i) Se sigue la pista, señalando que 1 cy = 1 CY ( el promedio de la muestra de CY


1 yo
es do1 veces el

promedio de la muestra de y yo) y 2 cx = 2 cx. Cuando hacemos una regresión do 1 y yo en do 2 X yo ( incluyendo una intercepción) que

utilizar la ecuación (2.19) para obtener la pendiente:

norte norte

( cxcxcycy
2 yo 2
)( 1 yo 1
) ccxxyy
12
( yo )( yo
)
% yo 1 yo 1
1 norte norte
2 2
( cxcx ) CXX )
2

2 yo 2 2
( yo
yo 1 yo 1

norte

( xxyyc
yo
)( yo
)
do1
1 yo 1 .
norte 1
do2 2 do2
( xxii )
1

A partir de (2.17), obtenemos la intercepción como 0


% = ( do 1 y) - 1 % ( do 2 x) = (c 1 y) - [( do 1 / do 2) 1 ] ( do 2 x) =

do 1 ( y - 1 x) = C 1 0 ) Porque el punto de intersección de la regresión y yo en x yo es ( y - 1 X ).

(Ii) Utilizamos el mismo enfoque de la parte (i), junto con el hecho de que ( cy)
1
= c1+ y y

( cx)
2
= C 2 + X . Por lo tanto, ( CY
1
)(
yo
cy)
1
= (c 1 + y yo) - ( do 1 + y) = y yo - y y ( do 2 + X yo) -

( cx)
2
= x yo - X . Asi que do 1 y do 2 enteramente caer fuera de la fórmula de la pendiente de la regresión de ( do 1 + y yo)

en ( do 2 + X yo), y 1 % =1 . La intersección es % =1 ( CY - 1) % ( cx) = (c 1 + y) - 1 ( do 2 +


0 2

x) = ( y ˆ X ) + c 1 - do 2 1 = 0 + do 1 - do 2 1 , Que es lo que queríamos demostrar.


1

(Iii) Simplemente podemos aplicar la parte (ii) porque IniciarCY )


sesión(
1 yo
log ()do1log () y yo . En otras palabras,

reemplazar do 1 con log ( do 1), y yo con log ( y yo), y establecer do 2 = 0.

10
(Iv) Una vez más, podemos aplicar la parte (ii) con do 1 = 0 y sustitución do 2 con log ( do 2) y X yo con log ( X yo).

Si 垐 y 1 son la intersección original y pendiente, entonces 1 % ˆ1 y 0 % 垐 Iniciar sesión(


do ) .
0 0 2 1

2.10 ( i) Esta derivación se realiza esencialmente en la ecuación (2.52), una vez (1 / SST)X se pone en el interior

T Xyo). Entonces, justo definir


la suma (que es válida porque SS no depende de
wd yo yo
/ SST X
.

(Ii) Debido Cov ( 垐, u ) E [( )],u mostramos que este último es cero. Pero, de la parte (i),
1 1 1

[( E )]u= E
norte
Wu u
norte
MI(Porque
wuu ) . el u yo son parejas no correlacionado
1 1
yo 1 yo yo yo 1 yo yo

0, ih). Por lo tanto,


2
uuyo /) Unidas / n ( porque E ( uuih )
2
(Que son independientes), MI( )E( Naciones
yo

norte norte norte


2
wuu ) /)norte
( /)norte
2
MI(
yo yo
w yo( w yo 0.
yo 1 yo 1 yo 1

(Iii) La fórmula para el intercepto OLS es 0 垐y X y, enchufando y xu


0 1

da 0 垐( xu ) X u ( ) X.
0 1 1 0 1 1

(Iv) Debido 1 y u no están correlacionados,

var ( 垐) Var ()u Var () X


2 2
/ norte (
2
/ SST)X X
2 2
/ norte
22
X / SST ,
0 1 X

que es lo que queríamos demostrar.

(V) Uso de la pista y la sustitución da ( var) [SST / 2


nx
2
] / SST
0 X X

norte norte
2
/ SST. X
2 1 2 2 2 2 1
norte X yo X X / SST X
norte X yo
yo 1 yo 1

2.11 ( i) quisiéramos asignar aleatoriamente el número de horas en el curso de preparación para que
horas es independiente de otros factores que afectan al rendimiento en el SAT. Entonces, tendríamos recopilar información sobre
SAT para cada estudiante en el experimento, produciendo un conjunto de datos

{( horas
yo
, SAT ): yo
yo
1, ...,}norte, dónde norte es el número de estudiantes que podemos permitirse el lujo de tener en el estudio.
A partir de la ecuación (2.7), debemos tratar de obtener la mayor variación en horas yo
como es factible.

(Ii) Estas son tres factores: la capacidad innata, el ingreso familiar y la salud general en el día del examen. Si pensamos que los
estudiantes con mayor inteligencia nativa piensan que no necesitan prepararse para el SAT, a continuación, la capacidad y la horas será una
correlación negativa. El ingreso familiar probablemente se correlaciona positivamente con horas, porque las familias de ingresos más altos
pueden permitirse más fácilmente cursos de preparación. Exclusión de problemas de salud crónicos, la salud en el día del examen debe ser
más o menos correlacionada con las horas pasadas en un curso de preparación.

(Iii) Si los cursos de preparación son eficaces, 1 debe ser positiva: otros factores iguales, un aumento de la horas debe
aumentar Sab.

(Iv) La intersección, 0, tiene una interpretación útil en este ejemplo: porque E ( u) = 0, 0 es el


SAT puntuación media para los estudiantes en la población con hora = 0.

11
SOLUCIONES A ordenador, que C2.1 ( i) El promedio parlotear es de aproximadamente 87,36 y el promedio mrate

es aproximadamente 0.732.

(Ii) La ecuación estimada es

Prate = 83.05 + 5.86 mrate n = 1534,

R 2 = . 075.

(Iii) La intersección implica que, incluso si mrate = 0, la tasa de participación prevista es 83.05
por ciento. El coeficiente de mrate implica que un aumento de un dólar en la tasa de partido - un aumento bastante grande - se estima que
aumentará parlotear por 5,86 puntos porcentuales. Esto supone, por supuesto, que este cambio parlotear es posible (si, por ejemplo, parlotear
ya está en el 98, esta interpretación no tiene sentido).

(Iv) Si conectamos mrate = 3,5 en la ecuación obtenemos ˆ =


parlotear 83,05 + 5,86 (3,5) = 103,59.
Esto es imposible, ya que podemos tener como máximo una tasa de participación del 100 por ciento. Esto ilustra que, especialmente cuando
están delimitadas variables dependientes, un modelo de regresión simple puede dar predicciones extrañas para valores extremos de la variable
independiente. (En la muestra de 1.534 empresas, sólo el 34 tener mrate 3.5.)

(V) mrate explica aproximadamente el 7,5% de la variación en parlotear. Esto no es mucho, y sugiere que muchos otros factores
influyen en las tasas de participación 401 (k).

C2.2 ( i) salario promedio es de alrededor de 865.864, lo que significa $ 865 864, porque salario es en miles de dólares. Promedio ceoten es
aproximadamente 7,95.

(Ii) Hay cinco directores generales con ceoten = 0. La tenencia más larga es de 37 años. (Iii) La ecuación

estimada es

sesión( n)==177,
Iniciar salario 6,51 R 2 = . 013.ceoten
+ 0,0097

 
 
Obtenemos la aproximación cambio porcentual en salario dado ceoten = 1 multiplicando el coeficiente de ceoten por 100, 100
(0,0097) = 0,97%. Por lo tanto, un año más como director general se prevé que aumente el salario en casi un 1%.

C2.3 ( i) La ecuación estimada es

= 3,586.4 - 0,151 totwrk sueño


n = 706, R 2 = . 103.

La intersección implica que la cantidad estimada de sueño por semana para alguien que no trabaja es 3,586.4 minutos, o
alrededor de 59,77 horas. Esto viene a alrededor de 8,5 horas por noche.

12
(Ii) Si alguien trabaja dos horas más por semana a continuación, totwrk = 120 (porque totwrk se mide en minutos),

y así dormir = -.151 (120) = -18.12 minutos. Esto es sólo unos pocos minutos

una noche. Si alguien fuera a trabajar una hora más en cada uno de los cinco días hábiles, dormir =
- . 151 (300) = -45.3 minutos, o alrededor de cinco minutos por noche.

C2.4 ( i) el salario promedio es de $ 957.95 y el CI promedio es de 101.28. La desviación estándar de la muestra de IQ es de


aproximadamente 15.05, que es bastante cerca del valor de la población de 15 años.

(Ii) Esto exige un modelo de nivel de nivel:

= 116,99 + 8,30 IQ
salario n = 935, R 2 = . 096.

Un aumento de la IQ de 15 aumentos previstos salario mensual de 8,30 (15) = $ 124,50 (en dólares de 1980). IQ puntuación ni
siquiera explicar el 10% de la variación en salario.

(Iii) Esto exige un modelo de nivel de registro:

Iniciar =sesión( ) 5,89 + 0,0088 IQ n = 935,


salariales

R 2 = . 099.

Si CI = 15 entonces sesión( )
Iniciar salario = 0,0088 (15) = 0,132, que es el (aproximado) proporcional
cambiar en el salario predicho. Por consiguiente, el incremento porcentual es de aproximadamente 13,2.

C2.5 ( i) El modelo de elasticidad constante es un modelo log-log:

Iniciar sesión( rd) = 0 + 1 Iniciar sesión( ventas) + u,

dónde 1 es la elasticidad de rd con respecto a ventas.

(Ii) La ecuación estimada es

Iniciar rd n) == 32,
sesión( R 2+= 1,076
-4,105 . 910. log ( ventas)

La elasticidad estimada de rd con respecto a ventas es 1,076, que es justo por encima de uno. Un aumento de uno por ciento en ventas se
estima que aumentará rd en alrededor de 1,08%.

C2.6 ( i) Parece plausible que otro dólar de gasto tiene un efecto mayor para las escuelas de bajo gasto que para las escuelas de alto
gasto. En las escuelas de bajo gasto, más dinero puede ir a la compra de más libros, computadoras, y para la contratación de los
profesores mejor calificados. En los altos niveles de gasto, queremos gastar poco, o ningún efecto porque las escuelas de alto gasto ya
tienen maestros de alta calidad, buenas instalaciones, un montón de libros, y así sucesivamente.

(Ii) Si tomamos cambios, como de costumbre, obtenemos

13
mates 10 1
Iniciargastar
sesión( ) (≈ 1
/ 100) (% gastar ) ,

al igual que en la segunda fila de la Tabla 2.3. Así que si % gastar 10, mates 10 1
/ 10.

(Iii) Los resultados de regresión son

mates 10 69.34 11,16 log ( gastar )


2
norte 408, R . 0297

(Iv) Si gastar aumenta en un 10 por ciento, mates 10 aumenta en aproximadamente 1,1 puntos porcentuales.
Esto no es un efecto enorme, pero no es trivial para las escuelas de bajo gasto, donde un aumento del 10 por ciento en el gasto
podría ser una cantidad bastante pequeña dólar.

(V) En este conjunto de datos, el mayor valor de math10 es 66,7, que no es especialmente cerca de 100. De hecho, los mayores
valores ajustados es de sólo 30,2.

14

También podría gustarte