Está en la página 1de 11

Econometría I

Tema 4: Modelo de regresión múltiple: inferencia

Ejercicios

1. (Í) Considera el siguiente modelo que relaciona el crecimiento en la ocupación de un


país (employment) con el crecimiento de su PIB (gdp).

employmenti = β0 + β1 gdpi + ui

(a) Estima este modelo con los datos incluidos en el fichero employment.xls. Incluye
el output de Gretl. Presenta los errores estándar, la SRC y la recta ajustada,
incluyendo el coeficiente de determinación.
(b) ¿Es el regresor gdp estadísticamente significativo con un nivel de significación
del 5%? Para hacer el contraste utiliza el estadístico t. Para aplicar la regla de
decisión utiliza la comparación del valor − t con el valor crítico.
(c) Dada la respuesta al apartado anterior, sabrias decir si gdp és estadísticamente
significativo con un nivel de significación del 1%? ¿Y al 10%? Justifica.
(d) Utilizando las tablas correspondientes, encuentra el valor-p asociado al contraste
del apartado 1b. Comprueba que coincide con el proporcionado por el output de
Gretl.
(e) Haz un gráfico donde se vea exactamente el valor−p. Aségurate de poner nombres
a los ejes.
(f) Repite el contraste del apartado 1b, pero esta vez aplica la regla de decisión que
compara el valor − p con el nivel de significación.
(g) Explica cómo ha asignado Gretl el número de ∗’s a asignar al lado del valor − p.
(h) ¿Qué supuesto necesitamos hacer sobre el mecanismo que ha generado la muestra
para poder justificar el uso del estadístico t en toda esta pregunta.

2. (Í) Considera el modelo que estimamos en el Tema 3 que relaciona el peso de un recién
nacido (bwgth) con el consumo de tabaco de la madre durante el embarazo (cigs) y la
renta familiar (f aminc):

bwghti = β0 + β1 cigsi + β2 f aminci + ui

Este modelo se estimo con una muestra de 1388 observaciones incluidas en el fichero
bwght.xls

(a) Estima de nuevo este modelo por M CO. Incluye el output de la estimación.
Presenta el modelo ajustado de 4 formas diferentes incluyendo, alternativamente,
debajo de los coeficientes estimados: (i) los errores estándar, (ii) los valores t,
(iii) los valores p y finalmente (iv) la notación de asteriscos: ( ), (∗), (∗∗) or
(∗ ∗ ∗).

1
(b) ¿Es cigs estadísticamentw significativa al 5%? Responde utilizando el valor − t.
(c) ¿Es cigs estadísticamente significativa al 5%? Responde utilizando el valor − p.
(d) Buscando en las tablas correspondientes, encuentra el valor-p asociado al contraste
H0 : β1 = 0 vs H1 : β1 6= 0. Comprueba que coincide con el proporcionado por
el output de Gretl. Incluye un dibujo donde se pueda representar claramente el
valor-p que has encontrado. Etiqueta bien los ejes.
(e) Dado el valor − p que has encontrado en el apartado anterior, ¿es cigs estadísti-
camente significativa al nivel α = 1%?

3. (0) De los datos de 46 estados de los Estados Unidos para el 1992, Baltagi(1998)
obtuvo los siguientes resultados de estimar un modelo por M CO (errores estándar
entre paréntesis):

d i =4.30 − 1.34 lnPi + 0.17 lnRi


lnC R2 = 0.27
(0.91) (0.30) (0.20)

donde C = consumo de tabaco en número de paquetes al año, P = precio del paquete


de tabaco y R = renta real disponible.

(a) ¿Cuál es la estimación obtenida de la elasticidad de la demanda de tabaco respecto


al precio? ¿Clasificarías el tabaco, como un producto de demanda elástica o
inelástica?
(b) Constrasta si la demanda del consumo de tabaco es perfectamente inelástica re-
specto al precio.
(c) ¿Cuál es la estimación de la elasticidad-renta del tabaco?
(d) Constrasta si la demanda de tabaco tiene una elasticitat unitaria respecto la renta.
(e) Encuentra un intervalo de confianza del 95% para β1 .
(f) Utilizando el intervalo de confianza de la pregunta anterior, ¿rechazarías o no la
hipótesis nula H0 : β1 = 0.6 versus H1 : β1 6= 0.6 utilizando un nivel α = 0.05?
Justifica.
(g) Contrasta H0 : β1 = 0.6 versus H1 : β1 6= 0.6, haciendo el contraste correspon-
diente, es decir, sin utilizar el intervalo de confianza. Comprueba que la respuesta
coincide con la dada en el apartado anterior.
(h) Encuentra un intervalo de confianza del 95% para β2 . Dado este intervalo, ¿cómo
clasificarías el tabaco, como un bien normal o inferior?

4. (0) Tenemos una muestra de 80 observaciones para estimar el siguiente modelo:

M odelo(1) yi = β0 + β1 xi1 + β2 xi2 + β3 xi3 + ui

(a) Si queremos utilizar el método de substitución, para estimar los parámetros del
M odelo(1) por M CR bajo la restricción β1 = 0, ¿cuál sería la expresión del
modelo restringido en este caso? Se cuidadoso con la notación.

2
(b) Explica como utilizarías el modelo restringido para encontrar la estimación por
M CR de los parámetros del modelo M odelo(1) bajo la restricción especificada.

5. ( 0) Repite la pregunta 4 pero considerando la restricción β1 = β2 .

6. (0) Demuestra que el estadístico F , a utilizar para contrastar q restricciones dentro de


un modelo de regresión lineal con K + 1 regresores se puede reescribir de la siguiente
forma:
(SRCR − SRC)/q (R2 − RR2
)/q
F = =
SRC/(n − (K + 1)) (1 − R2 )/(n − (K + 1))
donde SRC Es la suma de loa cuadrados de los residuos del modelo inicial que estamos
contrastando, R2 es el coeficiente de determinación asociado a la estimación de este
modelo, SRCR es la suma de los cuadrados de los residuos del modelo restringido y
2
RR el coeficiente de determinación asociado a la estimación del modelo restringido.

7. ( 0) Demuestra que el test de significación global sobre un modelo de regresión lineal


con K + 1 regresores se puede reescribir de la seguiente forma:
(SRCR − SRC)/q R2 /(K − 1)
F = =
SRC/(n − (K + 1)) (1 − R2 )/(n − (K + 1))
donde SRC es la suma de los cuadrados de los residuos del modelo inicial que estamos
contrastando, SRCR es la suma de cuadrados de los residuos del modelo restringido, q
es el número de restricciones que estamos contrastando y R2 el coeficiente de determi-
nación asociado a la estimación del modelo inicial.

8. (Í) (Wooldridge) Se propone el siguiente modelo para estudiar si los gastos en campaña
electoral afectan a los resultados.
M odelo(1) votAi = β0 + β1 expendAi + β2 expendBi + β3 prtystrAi + ui
donde votA es el porcentage de votos dado el candidato A, expendA y expendB són
los gastos de la campaña del candidato A y el competidor candidato B, en miles de
dólares y prtysrtA es un medida de la fuerza del partido del candidato A (medida
por el porcentaje de votos que fueron para el partido del candidato A en las últimas
elecciones presidenciales).

(a) Según el M odelo(1), ¿cuál sería el efecto marginal de un gasto de 1000 dólares más
por parte del candidato A sobre sus votos esperados? Argumenta la respuesta.
(b) Estima el model utilizando los datos incluidos en el fichero vote1.xls, correspondi-
entes a los 173 distritos de los Estados Unidos. Presenta los resultados de forma
habitual. ¿Han salido los signos de los coeficientes estimados como esperabas?
Comenta de forma rigurosa.
(c) Según los datos, ¿afectan los gastos hechos por un candidato a sus resultados?
¿Y los gastos hechos por un contrincante? Haz el contraste correspondiente para
responder rigurosamente a estas preguntas. Utiliza un nivel de significación del
5%.

3
(d) Encuentra el intervalo de confianza para β1 utilizando un nivel de confianza del
95%.
(e) Dada la respuesta al apartado anterior, ¿rechazarías o no H0 : β1 = 4 vs H1 :
β1 6= 4 al 5%? Razona.
(f) Especifica la hipótesis nula que nos permetiría contrastar que un aumento de los
gastos del candidato A en 1000 dólares se contrarrestan con 1000 dólares de gastos
del candidato B. Es decir, si los gastos en campañaa del candidato A aumentan en
1000 dólares y los gastos del candidato B también, entonces en media, los votos
obtenidos por el candidato A no variarían.
(g) Lleva a cabo el test de 8f utilizando la opción de Gretl para contrastar restricciones
lineales para calcular el valor − F . ¿Qué conclusión extraes? Justifica.
(h) Calcula el valor − F asociado al contraste 8f utilizando la siguiente expresión del
estadístico F :
(SRCR − SRC)/q
F =
(SRC)/(n − (K + 1))
Comprueba que coincide con el dado por Gretl en el apartado anterior.
(i) Considera un segundo modelo propuesto para analizar los mismos datos:

M odelo(2) votAi = β0 +β1 expendAi +β2 expendBi +β3 prtystrAi +β4 (expendAi ·expendBi )+ui

Según el M odelo(2), en este caso, ¿cuál sería el efecto marginal de un gasto de


1000 dólares más por parte del candidato A sobre sus votos?
(j) Estima el M odelo(2). Contrasta si el efecto marginal de un gasto de 1000 dólares
más por parte del candidato A sobre sus votos depende de los gastos hechos por
el candidato B.

9. ( Í ) Considera el siguiente modelo:


educi = β0 + β1 sibsi + β2 meduci + β3 f educi + ui

donde educi =años de educación de una persona i, sibsi =número de hermanos de


la persona i, meduci =número de años de educación de la madre de la persona i, i
f educi =número de años de educación del padre.

(a) Queremos constratar H0 : β2 = β3 versus H1 : β2 6= β3 . Explica en palabras que


estaríamos contrastando.
(b) Queremos hacer el contraste incluido en el apartado 9a utilizando la expresión del
estadístico F que compara la estimación del model restringido con el modelo no
restringido.
(SRCR − SRC)/q
F =
(SRC)/(n − (K + 1))
¿Cuál sería la expresión del modelo restringido que habríamos de estimar en este
caso para calcular SRCR ?
(c) Utilizando los datos incluidos en el fichero educacio.xls, estima el modelo re-
stringido que has especificado en el apartado anterior. Comenta los resultados.

4
(d) Encuentra el valor − F asociado al contraste 9a utilizando la expresión incluida
en el apartado 9b para calcular este valor. Dado el valor que has encontrado,
¿rechazarías H0 o no con un nivel α = 0.05? Justifica.
(e) Verifica que el valor − F que has encontrado en el apartado anterior, se puede
calcular también utilizando la expresión:
(R2 − RR2
)/q
2
(1 − R )/(n − (K + 1))
(f) Verifica los resultados de la estimación obtenida en el apartado anterior utilizando
el comando Contrastes/Restricciones lineales . . . disponible en Gretl dentro del
menu asociado al output de estimar el modelo original por M CO.
(g) Encuentra el intervalo de confianza para β1 al 95%. ¿Qué podrías decir sobre la
relación entre el número de hermanos y los años de educación de una persona?
(h) Haz el contraste de significación global del 5%. Para calcular el valor − F utiliza
la opción de Gretl Contrastes/Restricciones lineals...¿Qué conclusión has sacado?
(i) Repite el test de significación global de este modelo utilizando las 2 expresiones
siguientes para calcular el valor − F y comprueba que utilices la expresión que
utilices, el valor − F es el mismo:

(SRCR − SRC)/q R2 /(K − 1)


(i) F = (ii) F =
(SRC)/(n − (K + 1)) (1 − R2 )/(n − (K + 1))

10. (Í) Un econometra propone el siguiente modelo para contrastar si hay discriminación
salarial, por género, en un determinado mercado laboral:
M odelo(1) ln Si = β0 + β1 di + ui
donde S representa los salarios brutos mensuales en euros y di es una variable que
toma el valor 1 si la persona i es hombre y 0 si es mujer.

(a) Estima el M odelo(1) con los datos incluidos en el fichero salaris2D.xls. ¿Cuál
estimación darías sobre la diferencia salarial esperada entre un hombre y una
mujer? Se específico.
(b) ¿Qué dificultades ves en poder interpretar la estimación anterior como una me-
dida del grado de discriminación salarial por género en este mercado? Es decir,
para poder interpretar la estimación de β1 en términos causales. Argumenta rig-
urosamente.
(c) Para mejorar el análisis sobre la posible presencia de discriminación en est mer-
cado, el econometra propone estimar este segundo modelo:
M odelo(2) ln Si = β0 + β1 di + β2 exi + β3 (exi · di ) + ui
donde ex son los añoss de experiencia. Dada la expresión de la recta de regresión
poblacional de lnS en función de ex para una mujer, derivada del M odelo(2). Da
la expresión de la recta de regresión poblacional de lnS en función de ex para un
hombre, derivada del M odelo(2).

5
(d) El econometra propone hacer el siguiente contraste:
H0 : β1 = β3 = 0 vs. H1 : no H0
¿Qué estaría contrastando? Explica con palabras.
(e) ¿Rechazaría el econometra esta hipótesis con un nivel de significación del 5%?
¿Y del 1%? Haz el contraste correspondiente. ¿Qué conclusión sacarías sobre la
presencia de discriminación en este mercado?
(f) Repite el mismo tipo de contraste de discriminación salarial con los mismos datos
pero aplicando el test de Chow. Para hacerlo plantea el modelo adecuado y la
hipótesis nula correspondiente. Calcula el valor − F . El resultado ha de ser
idéntico al obtenido en el apartado 10e.
(g) Repite el mismo tipo de contraste de discriminación con los mismos datos pero
utilizando ahora dos variables fictícias. Para hacerlo define las dos variables,
plantea el modelo adecuado y la hipótesis nula y alternativa. Calcula de nuevo el
valor − F . El resultado ha de ser idéntico al obtenido en el apartado 10e.
(h) ¿Qué supuesto necesitamos hacer sobre el mecanismo que ha generado la muestra
para poder justificar el úso de del estadístico F en toda esta pregunta. ¿Crees
que se cumplen?

11. (Í) Se quiere estudiar los efectos de una campaña de desprestigio que ha sufrido
una empresa de material de construcción por parte de una competidora. Para hacer el
estudio, disponemos del fichero campaign.xls donde hau la evolución de las ventas de la
empresa potencialmente perjudicada de enero de 1993 a marzo de 1999. La campañaa
de desprestigio se llevo a cabo en el julio de 1996. Destacaremos dos períodos, período
1 antes de la campañaa (enero 1993 - junio 1996) y el período 2 (julio 1996 - marzo
1999).

(a) Con la ayuda de Gretl (comando restringir muestra) calcula la media de las ventas
de cada período (Q̄período 1 y Q̄período 2 ). ¿Qué podemos deducir sobre el efecto de
la campañaa de desprestigio de la comparación de estas dos medias?
Para analizar el comportamiento de las ventas de la empresa perjudicada disponemos
de información de estas ventas (Q), el precio de venta (P ) y el índice de volu-
men de construcción de la zona de actuación de la empresa, (C). Planteamos el
seguiente modelo:
M odelo(1) : lnQt = β0 + β1 lnPt + β2 lnCt + ut t : Enero1993,..,Marzo1999
(b) Interpreta los parámetros. ¿Qué signpo esperas que tengan?
(c) Estima el model por M CO. Incluye el output.
(d) ¿Nos permite el M odelo(1) analizar si la campañaa de desprestigio ha afectado a
las ventas de esta empresa?
Ahora introducimos una variable fictícia para analizar el posible impacto de la
campañaa de desprestigio. Definimos la variable fictícia D:
(
0 si t = Enero93,..,Junio96
Dt =
1 si t = Julio96,..,Marzo99

6
Planteamos el seguiente modelo:

M odelo(2) : lnQt = β0 +β1 lnPt +β2 lnCt +β3 Dt +β4 (Dt ·lnPt )+β5 (Dt ·lnCt )+ut

(e) Estima el M odelo(2) por MCO.


(f) Según el M odelo(2), ¿cuál es la estimación de la elasticidad precio antes de la
campaña de desprestigio? ¿Y despiés? ¿Y la elasticidad respecto el volumen de
construcción antes? ¿Y después? ¿Y la media de lnQ independientemente de lnP
y lnC antes? ¿Y después?
(g) Escribe la H0 y H1 que permita contrastar si la campaña ha tenido efecto o no.
Haz el contraste utilizando la seguiente expresión del estadístico F :
(SRCR − SRC)/q
F =
SRC/(n − (K + 1))
¿Qué conclusiones puedes sacar?
(h) Ahora queremos repetir el análisis del posible impacto de la campaña de despres-
tigio utilizando el test de Chow. Planteamos el M odelo(3):

lnQt = β0 + β1 lnPt + β2 lnCt + ut t = Enero93, .., Junio96


lnQt = β0? + β1? lnPt + β2? lnCt + ut t = Julio96, .., M arzo99

Estima este modelo. ¿Cuál es la estimación de la elasticidad precio antes de la


campaña de desprestigio? ¿Y después? ¿Y la elasticidad respecto el volumen de
construcción antes? ¿Y después? ¿Y la media de lnQ independientemente de lnP
y lnC antes? ¿Y después?
(i) Contrasta el posible efecto de la campaña de desprestigio haciendo servir el
M odelo(3). Escribe la H0 y H1 y calcula de nuevo el valor − F . ¿Qué con-
clusiones puedes sacar?

12. (Í ) Queremos utilizar una simulación para ilustrar como la presencia de colinealidad
puede afectar a la estimación y inferencia de los parámetos de un modelo de regresión.
En un guión de comandos de Gretl escribe los seguientes comandos:

nulldata 20
set seed 12345
genr x1=uniform(0,50)
genr x2=x1+normal(0,1)
genr x3=uniform(0,50)
genr u=normal(0,4)
genr y=2+0.5*x1+0.5*x2+1*x3+u

(a) Escribe el mecanismo generador de datos, mgd, asociado a este guión.

7
(b) Ejecuta el guión. Llama a esta muestra, muestra1. Selecciona las variables x1,
x2 y x3 y con la ayuda de Gretl encuentra la matriz de coeficientes de correlación
simple. ¿Son los valores de esta matriz como esperabas? Comenta.
(c) Com la muestra1 generada estima el modelo:
yi = β0 + β1 xi1 + β2 xi2 + β3 xi3 + ui .
Encuentra los intervalos de confianza para cada parámetro con un nivel de confi-
anza del 95%. Haz un test de significación para cada regresor.
(d) ¿Crees que la estimación ha quedado afectada por la presencia de colinealidad?
Para contestar analita los valores de los coeficientes estimados, los intervalos de
confianza y la significación de los diferentes regresores.
(e) Estimando las regresiones auxiliares adecuadas, calcula F IV1 , F IV2 y F IV3 aso-
ciada a la estimación anterior. ¿Tienen el valor que esperabas?

13. (Í) Queremos valorar empíricamente la posible relación entre la tasa de mortalidad
asociada a problemas cardiacos de una sociedad con indicadores de estilo de vida de una
sociedad. Para hacer este análisis disponemos de datos para los Estados Unidos desde
1947 hasta 1980, incluidos en el fichero mortalitat.xls. Dados los datos, se propone
estimar el modelo de regresión lineal siguiente:
deathratet = β0 + β1 calct + β2 cigt + β3 edf att +
+β4 meatt + β5 spiritst + β6 beert + β7 winet + ut
donde:
deathrate = tasa mortalidad por problemas cardiacos, (expresada en número de per-
sonas por cada 100.000 habitantes)
calc = consumo diario de calcio per cápita (en gramos)
cig = consumo diario de tabaco per cápita (en libras)
edf at = consumo diario de grasas per cápita (en libras)
meat = consumo diario de carne per cápita (en libras)
spirits = consumo diario de alcohol destiado per cápita (en galones)
beer = consumo diario de cerveza per cápita (en galones)
wine = consumo diario de vino per cápita (en galones)

(a) Con la ayuda de Gretl estima la regresiób especificada por MCO. Incluye el out-
put. Presenta la recta ajustada incluyendo las estimaciones de los parámetros,
desviaciones estándar estimadas entre paréntesis y la bondad de ajuste.
(b) Dados loss resultados de la estimación, ¿crees que hay indicios para sospechar la
presencia de colinealidad en la muestra? ¿Sí? ¿No? Argumenta.
(c) Calcula, haciendo la regresión adecuado, el indicador V IF7 . ¿Qué información te
da este indicador? Dado el valor de este indicador, ¿cómo crees que puede haber
quedado afectada la estimación del parámetro β7 ? Comenta.
(d) Con la ayuda de Gretl, completa el análisis de la presencia de colinealidad en
la muestra. ¿Qué indicadores has hecho servir? En vista de estos indicadores,
comenta como puede haber quedado afectada la estimación de los parámetros.
Argumenta.

8
14. (Í) Ray Fair (2002)1 propuso el siguiente modelo que relacionaba el percentaje de
voto obtenido por el partido en la Casa Blanca a las elecciones presidenciales, V , con
las variables económicas y variables políticas.
Vt = β0 + β1 GROW T Ht + β2 IN F LAT IONt + β3 GOODN EW St +
+β4 RU N N IN Gt + β5 DU RAT IONt + β6 P ART Yt + β7 W ARt + ut
donde:
GROWTH: tasa crecimiento (media 3 primeros trimestres año elecciones, %),
INFLATION = tasa inflación (media últimos 15 trimestres antes de las elecciones, %),
GOODNEWS = número trimestres con buen crecimiento económico (superior al 3.2%)
de los últimos 15 trimestres,
RUNNING = {1 si presidente actual se vuelve a presentar, 0 si no},
DURATION ={ 0 si partido en la Casa Blanca lleva sólo 1 legislatura, 1 si 2 , ....etc}
PARTY = {1 si presidente actual es demócrata, -1 si presidente actual es republicano},
WAR = {1 si elecciones 1920, 1944 o 1948, 0 si cualquier otra}.

(a) Estima por M CO la regresión propuesta por Fair utilizando los datos del fichero
elections.xls. Este fichero incluye datos de las elecciones en los Estados Unidos
de 1916 a 2000. Presenta aquí la recta ajustada indicando: estimaciones de los
parámetros, valors − t y el coeficiente de determinación. Incluye el output de
Gretl.
(b) ¿Ha salido el signo de la estimación de β1 como esperabas? ¿Y de β2 ? ¿Y de β3 ?
Comenta brevemente y interpreta cada una de estas estimaciones.
(c) Constrasta si el porcentaje de voto que recibe el partido en el gobierno esta rela-
cionado con la situación de económica precedente a las elecciones. Es decir, con-
trasta si las variables económicas són conjuntamente significativas para explicar V.
La respuesta ha de inclouir: hipótesis nula y alternativa, el estadístico de contrast
a utilizar y la su distribución, cómo has calculado el valor del estadístico y la regla
de decisión aplicada. Incluye cualquier output de Gretl que hayas necesitado.

15. El fichero de datos keeling_whorf _co2.gdt contiene observaciones mensuales de la


concentración de dióxido de carbono co2 en Mauna Loa, Hawaii entre 1965-2003. (Para
más información: http://en.wikipedia.org/wiki/Keeling_Curve.)

(a) Haz un plot de la serie co2 respecto el tiempo. Comenta.


(b) Crea una variable de tendencia temporal bajo el nombre trend y estima, por
M CO, el siguiente modelo:

M odelo(1) co2t = β0 + β1 trendt + ut .


Interpreta los resultados.
(c) Haz un gráfico de los residuos M CO versus el tiempo. Comenta. ¿Hay esta-
cionalidad? Da una explicación de porqué podemos observar estacionalidad en
esta serie.
1
Ray Fair(2002), Predicting Presidential elections and other things, Standford Bussiness Books

9
(d) Utilizando la opción correspondiente en Gretl, crea una variable fictícia para cada
mes. Es decir, genera las variables dt1 ,....,dt12 donde:

1 si j = 1
dtj =
0 si j 6= 1

Con la misma muestra estima por M CO el siguiente modelo:


12
X
M odelo(2) co2t = αj dtj + β1 trendt + ut .
j=1

Interpreta los resultados. ¿Han servido las variables fictícias para controlar la
estacionalidad?
(e) Haz un gráfico de los residuos M CO resultantes de estimar el M odelo(2) versus
el tiempo. Comenta. Ves evidencia de algún problema econométrico adicional?

16. El fichero de datos ees2006.gdt contiene datos de la Encuesta de Estructura Salarial


que la Fundación SEPI realiza entre las indústrias manufactureras. El fichero contiene
información de 5000 personas sobre su salario mensual en euros (SALAMES), años
de escolarización (ESCOLA), añoss de experiencia (EXP ER) y génereo (M U JER),
entre otros.

(a) Encuentra los estadísticos de estadística descriptiva de las variables incluidas.


(b) Estima el siguiente modelo con la muestra dada:

M odelo(1) ln(SALAM ESi ) = β0 + β1 ESCOLAi + β2 EXP ERi + ui

(c) ¿Crees que la presencia de colinealidad puede haber afectado a la estimación?


¿Qué estadístico has utilizado para constestar?
(d) Considera añadir como regresor la variable EDAD en el M odelo(1). Explica qué
pasa cuando queremos estimar el M odelo(1) añadiendo este regresor. ¿Has podido
estimar β3 ? ¿Qué puedes decir de var(β̂3 )? Se riguroso. ¿Qué conclusión sacas
sobre las persones que tenemos en esta muestra?
(e) Escribe un modelo que te permita contrastar si el efecto marginal de la experiencia
laboral en los salarios depende de los años de experiencia. Llama este modelo,
M odelo(2). Estima este segundo modelo i contrasta si el efecto marginal de la
experiencia laboral en los salarios depende de los años de experiencia. Explica en
palabras lo que has encontrado.
(f) En términos de bondad de ajuste, ¿qué modelo escogerías, el M odelo(1) o el
M odelo(2)?
(g) Da una estimación del efecto marginal de la experiencia sobre los salarios para
una persona que tiene 1 año de experiencia versus una que tiene 20 años de
experiencia.

10
17. Considera la misma muestra que en el ejercicio anterior, ees2006.gdt. Estamos intere-
sados en contrastar la existencia de discriminación por género utilizando esta muestra.

(a) Estima el salario promedio de un hombre. Estima el salario promedio de una


mujer. ¿Qué te permite decir esta diferencia? Explica qué ventaja ofrece el
modelo de regresión en este contexto.
(b) Modifica el M odelo(1) de la pregunta anterior de forma que te permita analizar
la existencia de discriminación en este mercado. Llama este modelo, M odelo(3).
Estima este modelo.
(c) Haz el(los) contraste(s) que creas oportuno, sobre los parámetros del M odelo(3),
con tal de analizar la posible presencia de discriminación per género. Explica ex-
actamente el tipo de dicriminación que estas contrastando. Discute los resultados.
¿Qué conclusión has obtenido?

11