EJERCICIOS
CAPITULO 1 LA NATURALEZA DE LA ECONOMETRIA Y LOS DATOS ECONÓMICOS
1.1 Suponga que se le pide que realice un estudio para determinar si grupos de clase pequeños
contribuyen a un mejor desempeño de los estudiantes de cuarto grado.
i) Si pudiera realizar cualquier experimento que deseara, ¿qué haría? Explique con claridad.
R= Seleccionaría al tamaño del grupo como la variable independiente, otorgándole diferentes
valores en cada observación, donde los parámetros serían β 1, = calificaciones del primer parcial, β2
=calificaciones del segundo parcial, β3= calificación tercer parcial. De tal suerte que observaría los
cambios en los parámetros cuando se disminuye una unidad en el número de estudiantes.
Dejando en ц los términos de error o perturbación como asistencia, horas de estudio,
infraestructura escolar, condiciones de llegada a la escuela, situaciones familiares.
ii) Siendo más realistas, suponga que puede obtener datos observacionales de varios miles
de estudiantes de cuarto grado de un determinado estado. Puede conocer el tamaño de
sus grupos y las calificaciones estandarizadas obtenidas en el examen final. ¿Por qué
puede esperarse una correlación negativa entre el tamaño de los grupos y las
puntuaciones en el examen final?
R= Porque la hipótesis es que a mayor cantidad de alumnos en el salón de clases el rendimiento
sea menor o negativo.
iii) Una correlación negativa, ¿indicaría necesariamente que tamaños de grupo menores
causan un mejor desempeño?
R= No necesariamente, ya que se deben considerar también las variables de error o perturbación
que pueden alterar el rendimiento de los alumnos.
1.2 Para justificar los programas de capacitación laboral se ha dicho que éstos mejoran la
productividad de los trabajadores. Suponga que se le pide que evalúe si una mayor capacitación
para el trabajo hace que los trabajadores sean más productivos. Pero, en lugar de que se le
proporcionen datos sobre trabajadores individuales, se le facilitan datos de fábricas en Ohio. De
cada firma se le proporcionan horas de capacitación laboral por trabajador (capacitación) y la
cantidad de artículos no defectuosos producidos por hora por cada trabajador (producción).
i) Establezca cuidadosamente el experimento ceteris paribus subyacente a esta pregunta.
R= se plante la pregunta: ¿en cuanto disminuirá la cantidad de artículos no defectuosos
producidos por hora por trabajador en la medida en la que se le aumenta una hora de
capacitación laboral a cada trabajador en Ohio, mientras todas las demás condicionantes
permanecen constantes?
iii) ¿Parece razonable que la decisión de una empresa de capacitar a sus trabajadores sea
independiente de las características de estos? ¿Cuáles son algunas de esas características
medibles y no medibles de los trabajadores?
R= No, no parece del todo razonable
Algunas de las características son: sus habilidades, experiencia en el puesto, horas de
trabajo, horas de descanso, tiempo de movilidad desde su casa hasta el trabajo.
iii) Nombre un factor, que no sea una característica de los trabajadores, que influya en la
productividad de los trabajadores.
R= tiempo de movilidad desde su casa hasta el trabajo
iv) Si encontrara una correlación positiva entre producción y capacitación, ¿habría
establecido de manera convincente que la capacitación para el trabajo hace que los
trabajadores sean más productivos? Explique.
R= No necesariamente, ya que existen otros factores cualitativos (stress, situaciones
familiares, alimentación insuficiente, etc.), así como cuantitativas (tiempo de movilidad de
su casa al trabajo, horas de descanso, horas de trabajo) que influyen en el desempeño del
trabajador.
1.3 Suponga que en su universidad se le pide que encuentre una relación entre horas semanales
de estudio (estudio) y horas semanales de trabajo (trabajo). ¿Tendría sentido considerar que en
este problema se trata de inferir si estudio “causa” trabajo o trabajo “causa” estudio? Explique.
R= No tiene ningún sentido de causalidad la relación entre estas dos variables ya que no todos
los alumnos necesariamente trabajan y, además, existen otras actividades entre las cuales ellos
pueden elegir como e deporte o el ocio.
CAPITULO 2.- EL MODELO DE REGRESIÓN SIMPLE
2.1 Sea niños la cantidad de hijos que ha tenido una mujer, y educ los años de educación que tiene
esa mujer. Un modelo sencillo para relacionar fertilidad con años de educación es
Niños = β0 + β1educ + u,
donde u es el error no observado.
i) ¿Qué tipo de factores son los contenidos en u? ¿Es posible que estos factores estén
correlacionados con el nivel de educación?
R= los factores contenidos en u, son aquellos que causan error o perturbación a los parámetros,
siempre y cuando estén relacionados con la variable (educación). En este ejemplo en particular
pueden ser ingreso, necesidad de trabajar o no, edad, si vive en zona rural o urbana, estado civil y
cuantas personas conforman su núcleo familiar. Por lo que si es posible que estén relacionados
con su nivel de educación.
ii) ¿Es posible que con un análisis de regresión simple se halle el efecto ceteris paribus de
educación sobre fertilidad? Explique.
R= si es posible ya que debido al efecto ceteris paribus, se van a considerar
únicamente los comportamientos de las variables educación y fertilidad, mientras que
todo lo demás permanezca en el mismo estado, por lo que no serán consideradas. La
correlación que se obtenga será negativa porque se parte de la hipótesis de que a
mayor nivel de educación las mujeres tendrán menor número de hijos.
2.2 En el modelo de regresión lineal simple y = β0 + β1x + u, suponga que E(u) ≠ 0. Sea ∞0 = E(u),
muestre que siempre es posible reescribir el modelo con la misma pendiente y, pero con otro
intercepto y otro error, de manera que el nuevo error tenga valor esperado cero.
R= Primero hay que considerar que: ∞0 = E(u) y que E(u) = u, por lo que ∞0 = u
Si al nuevo término de error lo denominamos E(e), entonces E(e) = u - ∞0, y entonces la nueva
fórmula quedaría: y = ∞0 + β0 + β1x + E(e)
El intercepto cambia a ∞0 + β0
La pendiente sigue siendo β1
Y el término de error E(e) = 0
2.3 En la tabla siguiente se presentan las puntuaciones obtenidas en el examen de ingreso a la
universidad en Estados Unidos, ACT (American College Test), y en el GPA (promedio escolar)
por ocho estudiantes universitarios. El GPA está medido en una escala de cuatro puntos y se ha
redondeado a un dígito después del punto decimal.
i) Estime la relación entre GPA y ACT empleando MCO; es decir, obtenga las estimaciones para la
pendiente y para el intercepto en la ecuación
R= Modelo gpa = β0 + β1 act + u
Se trasladan los datos a Stata y se hace la regresión del modelo
Se obtiene un valor para la constante o intercepto de β0 = 0.5681; y de la pendiente de β1 = 0.102
Comente la dirección de la relación ¿tiene, en este caso, el intercepto una interpretación útil?
R= No, considero que el intercepto no tiene una interpretación útil debido a que si
consideramos que tanto la constante como la pendiente el valor de β0 = 0 y el de β1 ≠ 0, asumimos
que ante una calificación de 0 en el examen, el promedio con el que habría egresado de la escuela
sería de 0.5681 lo que es ilógico.
Explique, ¿qué tanto más alto será el GPA predicho si ACT aumenta cinco puntos?
R= se debe multiplicar la pendiente β1 * 5 = 0.51. Es decir que un incremento de 5 puntos en
la constante provocará 0.51 puntos en el promedio de los estudiantes.
ii) Calcule los valores ajustados y los residuales para cada observación y verifique que los
residuales (aproximadamente) sumen cero.
GPA
Estudiante GPA RESIDUALES
Calculada
1 2.8 2.71429 0.0857
2 3.4 3.020884 0.3791
3 3 3.22528 -0.2253
4 3.5 3.327478 0.1725
5 3.6 3.531874 0.0681
6 3 3.123082 -0.1231
7 2.7 3.123082 -0.4231
8 3.7 3.634072 0.0659
Σ 0.000
iii) ¿Cuál es el valor que se predice para el GPA si ACT 20?
R: GPA = 0.5681 + (0.102 * 20)
GPA = 0.5681 + 2.04
GPA = 2.6081
iv) ¿Qué tanto de la variación en el GPA de estos ocho estudiantes es explicada por el ACT?
Explique.
R= De acuerdo con el valor de la R2, que nos indica que tanto el modelo se ajusta a la variable,
tenemos que
R2 = 0.5774
Es decir, que nos representa que solo el 57.54% de la calificación del examen de admisión de un
alumno explica su promedio escolar.
2.4 La base de datos [Link] contiene cifras sobre los hijos nacidos de mujeres en Estados
Unidos. Las dos variables de interés son la variable independiente, peso en onzas del niño al nacer
(Bwght) y la variable explicativa, cantidad promedio diaria de cigarros consumidos por la madre
durante el embarazo (cigs). La siguiente ecuación de regresión simple se estimó con datos de
n=1,388 nacimientos:
Bwght = 119.77 - 0.514 cigs
i) ¿Cuál es el peso al nacer que se predice si cigs = 0? ¿Y cuándo cigs = 20 (un paquete
por día)? Analice la diferencia.
R= El peso promedio del bebé al nacer cuando la madre no ha fumado ningún cigarro
será de 119.77 onzas.
Cuando la madre fumó 20 cigarros diario, el peso del bebé será de -10.17 onzas
ii) ¿Capta esta ecuación de regresión simple una relación causal entre el peso del niño al
nacer y el hábito de fumar de la madre? Explique.
R= Si existe una relación causal entre el hecho de fumar cigarros y el peso del bebé,
que tiene como consecuencia un peso negativo o menor que el bebé de la madre que
no fumó
iii) Para que el peso al nacer predicho sea de 125 onzas, ¿cuál tiene que ser el valor de
cigs? Explique.
R= 125 = 119.77 – 0.514 cigs
Al despejar, tenemos que: 125 – 119.77 = -0.514 cgs
Cigs = - 5.23 = -10.17
0.514
iv) La proporción de mujeres en la muestra que no fumaron durante el embarazo es
aproximadamente 0.85. ¿Ayuda esto a entender sus hallazgos del inciso iii)?
R= Esta cifra no tiene sentido, una persona no puede fumar menos diez cigarros, por tanto, se
concluye que en este modelo no hay una relación que pronostique el número de cigarros que
debe fumar una mujer durante su embarazo para que su hijo pese 125 onzas.
2.5 En la función lineal de consumo
ons= β^0 + ^
c^ β 1 inc ,
La propensión marginal a consumir estimada (PMgC) del ingreso no es más que la pendiente, ^β 1,
c^ons ^
β
mientras que la propensión media a consumir (PMeC) es = 0 +^
β . Usando las
inc inc 1
observaciones sobre ingreso anual y consumo de 100 familias (ambos medidos en dólares), se
obtiene la ecuación siguiente:
c^
ons=−124.84 +0.853 inc
2
n=100 , R =0.692
i) Interprete el intercepto en esta ecuación y analice su signo y su magnitud.
R= La intercepción implica que cuando inc = 0, se predice que cons será negativo 124.84. Esto, por
supuesto, es falso, por lo que esta función de consumo podría ser un mal predictor de consumo a
niveles de ingresos muy bajos. Por otro lado, $124.84 no esta tan lejos de cero.
ii) ¿Cuál es el consumo que se predice si el ingreso familiar es de $30, 000?
ons=−124.84 +.853 ( 30,000 )=25,465.16 dólares
R= c^
iii) Con inc en el eje x, trace una gráfica la PMgC estimada y de la PMeC estimada.
2.6 Usando los datos de Kiel y McClain (1995) sobre las casas vendidas en 1988 en Andover,
Massachusetts, en la ecuación siguiente se relaciona el precio de las casas (price) con la distancia a
un incinerador de basura construido recientemente (dist):
i) Interprete el coeficiente de log (dist). ¿Es el signo de esta estimación el que se esperaba?
R= Aunque acá se puede señalar la salvedad de que no se sabe la medida de la distancia (si es en
metros, kilómetros, yardas, etcétera), el signo positivo nos revela que cuando más lejos del
incinerador éste una casa, más elevado será su valor. Esta conclusión tiene sentido, una casa va a
tener un mayor valor siempre que este alejada de sitios contaminantes como incineradores,
fabricas, ríos contaminados, etcétera.
ii) ¿Considera que la regresión simple proporciona un estimador insesgado de la elasticidad ceteris
paribus de price (precio) respecto a dist? (Reflexione en la decisión de la ciudad sobre dónde
colocar el incinerador.)
R= Esta regresión puede presentar un problema de NO insesgadez, ¿Por qué razón? Recordar que
la insesgadez se obtiene cuando 𝐸(𝑢⃓𝑥)=0, es decir, cuando la variable independiente y el término
de error no se encuentren correlacionadas. Pero en este caso nuestra variable independiente, que
es el incinerador podría estar correlacionada con el término de error. Esto porque un incinerador
usualmente se construye alejado de las ciudades más desarrolladas. Por tanto el precio de una
casa podría estar correlacionado con el nivel de desarrollo de una ciudad y NO TANTO con la
distancia de la casa respecto a un incinerador de basura.
iii) ¿Qué otros factores relacionados con una casa afectan su precio? ¿Pueden estos factores estar
correlacionados con la distancia al incinerador?
R= La respuesta de este inciso es parecida a la anterior, los factores que afectan al precio de una
casa es el nivel de desarrollo de la ciudad donde se encuentra la casa, pero además hay otros
factores como si la casa tiene cochera, el tamaño de la casa, si la casa es cercana a un centro
comercial, etcétera. Y además podemos responder que SI puede haber correlación entre estas
variables y la distancia de un incinerador de basura. Por ejemplo en el caso de un centro
comercial, es lógico que este se va a construir lo más alejando posible de un incinerador de
basura.
2.7 Considere la función de ahorro
sav=β 0 + β 1 inc+u , u= √ inc∗e
2
Donde e es una variable aleatoria con E(e) = 0 y Var(e) = σ e .Suponga que es independiente de inc.
i) Muestre que E(u|inc)=0, de manera que el supuesto clave de mediacondicional cero
(supuesto RLS.4) se satisface. [Sugerencia: Si e es independiente de inc, entonces E (e|
inc) = E (e).]
R= Cuando condicionamos inc en el cálculo de una variación, √ incse convierte en una constante.
Entonces: E ( u|inc ) =E ¿ porque E ( e|inc )=E ( e )=0.
2
ii) Muestre que Var(u|inc) = σ e inc , de manera que se viola el supuesto RLS.5 de
homocedasticidad. En particular la varianza de sav (ahorro) aumenta con inc.
[Sugerencia: Var ( e|inc )=Var ( e ) , si inc y e son independientes.]
R= Otra vez, cuando condicionamos inc en el cálculo de una variación, √ incse convierte en una
Var ( u|inc )=Var ( √ inc∗e|inc )=( √ inc ) Var ( e|inc )=σ 2e inc
2
constante. Entonces: porque
Var= ( e|inc )=σ 2e .
iii) Proporcione un análisis para sostener el supuesto de que la varianza de los ahorros
aumenta con el ingreso familiar.
R= Las familias con bajos ingresos no tienen mucha discreción sobre el gasto; por lo general, una
familia de bajos ingresos debe gastar en alimentos, ropa, vivienda y otras necesidades. Las
personas con ingresos más altos tienen más discreción, y algunos podrían elegir más consumo
mientras que otros ahorran más. Esta discreción sugiere una mayor variabilidad en el ahorro entre
las familias de mayores ingresos.
2.8 Considere el modelo estándar regresión simple y=β 0 + β 1 x +u bajo los supuestos RLS.1 a
RLS.5 de Gauss-Markov. Los estimadores usuales de MCO ^β 0 y ^β 1 son insesgados para sus
~
respectivos parámetros poblacionales. Sea β 1 el estimador de β 1 obtenido suponiendo que el
intercepto es cero (vea la sección 2.6).
~ ~
i) Determine E ( β 1 )en términos de x i β 0 y β 1 . Verifique que β 1es insesgado respecto a β 1 cuando
~
el ntercepto poblacional ( β 0 ) es cero. ¿Hay otros casos en los que β 1 sea insesgado?
n n
~ i=1
∑ (C2 X i−C 2 X)(C 1 Y i−C1 Y ) ∑ C 1 C 2 ( X i− X )(Y i−¿ y )
R= β 1= n
= i=1 n
¿
∑ (C2 X i−C2 X ) 2
∑C 2
2 ( X i −X )
2
i=1 i=1
C1 n
∗∑ ( X −X ) ( Y i−Y )
C 2 i=1 i C
¿ = 1 ^β 1 .
n
C2
∑ ( X i− X )2
i =1
~ ~
β 0 =( C1 Y )− β1 ( C2 X ) =(C ¿¿ 1Y )−¿ ¿
¿ C 1 ( Y − ^β 1 X ) =C 1 β^ 0
~
ii) Determine la varianza de β 1. (Sugerencia: La varianza no depende de β 0.)
R= Partiendo de: ( C 1+ Y )=C 1+ Y y ( C 2+ X ) =C2 + X
Por lo tanto:
( C 1+ Y i )−(C¿¿ 1+Y ¿)=(C1 +Y )=Y i−Y ¿ ¿
( C 2+ X i )−( C2 + X ) =X i −X Entonces C 1y C 2 desciende para la regresión de (C 1+Y i)en
~
( C 2+ X i ) , y β 1= β^ 1 .
El intercepto es
~ ~
β 0 =( C1 +Y ) − β 1 ( C 2 + X ) =( C1 +Y ) − ^β 1 ( C 2 + X ) =( Y − ^β1 X ) + C1−C 2 β^ 1= β^ 0 +C 1−C 2 ^β 1.
~
iii) Muestre que Var ( β 1 ) ≤Var ( β^ 1 ). [Sugerencia: En cualquier muestra de datos,
n n
∑ X ≥ ∑ ( X i− X)2, donde la desigualdad es estricta a menos que X =0. ¿
2
i
i=1 i=1
R= Se aplica lo del punto anterior porque log ( C 1 Y i ) =log ( C 1) + log ( Y i ) .En otras palabras,
C 1 con log ( C 1 ) ,Y i con log ( Y i ) y C2=0.
iv) Analice el efecto de sustitución que existe entre sesgo y varianza al elegir entre
^β 1 y β 1 .
R= Nuevamente utilizamos lo del punto ii con C 1=0 y C 2 con log ( C 2 ) y X i con log ( X i ) . Si ^β 0 y ^β 1
~ ~
son el intercepto original, entonces β 1= β^ 1 y β 0= ^β0 −log ( C 2 ) ^β 1.
2.9 Sean ^β 0 y ^β 1el intercepto y la pendiente en la regresión de y i sobre xi, usando n observaciones.
~ ~
Sean c1 y c2 constantes, con c2 ≠ 0. Sean β 0 y β 1 el intercepto y la pendiente de la regresión de c 1yi
~ ~
sobre c2xi. Muestre que β 1 (c1/c2) ^β 0y β 0 = c1 ^β 0 , verificando con esto lo que se afirma en la
~
sección 2.4 sobre las unidades de medición. [Sugerencia: Para obtener β 1, sustituya las versiones
~
escaladas de x y de y en la ecuación (2.19).] Después, use la ecuación (2.17) para β 0 , usando la x y
la y escaladas y la pendiente correcta.]