Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PARTE 1.
1. Se realizó una regresión múltiple tomando como variable dependiente a Ln(wage). En
la siguiente tabla se pueden observar los comandos utilizados y los coeficientes generados
(Coef.) junto con los respectivos errores estándar. En la Esquina superior derecha se observa el
valor de R2 (R-squared).
r(198);
. gen ln_wage=ln(wage)
. reg ln_wage polytech college highgrad pexper exper swage educ male
.
Figura 1.1.
( )
̂ →
( )
luego, ( ) garantiza que la expresión anterior esté bien definida y esto
último es una consecuencia directa de la colinealidad no-perfecta.
d) El error esperado es 0, para cualquier valor en las covariables. Este supuesto tiene
una implicación importante que ya se mencionó en c), ya que esto asegura que la
covarianza entre los errores y las covariables es nula, es decir, no están
correlacionadas.
3. Para evaluar la significancia conjunta de las co-variables, haremos uso del comando
test.
( 1) - educ + male = 0
( 2) - swage + male = 0
( 3) - exper + male = 0
( 4) - highgrad + male = 0
( 5) - college + male = 0
( 6) - polytech + male = 0
( 7) - pexper + male = 0
( 8) male = 0
F( 8, 394) = 245.52
Prob > F = 0.0000
Para evaluar dicha significancia es se debe observa la columna P>|t| de la tabla que
nos indica el p-valor del siguiente test para cada covariable i:
̂
√ (̂)
- Para este test el criterio de rechazo utilizado será que el intervalo de confianza no
contenga a 0.
- Se observa que sólo para polytech el intervalo contiene a 0, luego no se puede
rechazar la hipótesis nula para el coeficiente y se concluye que Cpolytech no es
significativo para un nivel del significancia del 5% (es igual a 0). En todos los demás
casos los coeficientes resultan estadísticamente significativos.
IN3401-1 Estadística para la Economía y la Gestión
Profesor Marcelo Olivares - P. Auxiliar a cargo: Angélica Córdova
Realizado por Juan Guillermo Obando Rojel
- Parece lógico que el salario aumente cuando el trabajador completa los estudios
de College. Lo mismo con los años de experiencia (exper), los años de educación
(educ), o el salario de partida. Incluso que ‘male’ tenga asociado un coeficiente
positivo es algo esperable y bastante común en países como el nuestro.
- Sin embargo, para el caso de la covariable pexper (años de experiencia previa) se
esperaría una correlación positiva con el salario. Esto último podría sugerir que dos
o más covariables están correlacionada, exper y pexper por ejemplo.
- En el caso de Highgrad se entiende que el coeficiente sea negativo, pues en
relación al promedio de los trabajadores quienes sólo completan los estudios
secundarios tienden a ganar menos. Esto último tiene sentido además por la
forma de nuestro set de datos, donde en general un individuo sólo posee el valor 1
en Highgrad, en College o en Polytech excluyentemente.
6. Ahora deseamos estimar el salario esperado para una persona con 12 años de
educación, con 4 años de experiencia y 2 años en su trabajo actual. El resto de los valores de las
covariables se asumen iguales al promedio. Haciendo uso del comando sum para cada variable
independiente se obtienen los valores promedio. Luego, haciendo uso del comando predict se
obtienen los siguientes valores:
Luego haciendo uso del método delta, construiremos un intervalo de confianza al 95%.
En este caso ( ), entonces:
IN3401-1 Estadística para la Economía y la Gestión
Profesor Marcelo Olivares - P. Auxiliar a cargo: Angélica Córdova
Realizado por Juan Guillermo Obando Rojel
( ) ( )
√ ( ( ) ( )) → ( ( ) )
Luego:
√ ( ) → ( )
Notemos que en este caso se ha usado 1.96 por ser un método asintótico.
. pwcorr male educ exper pexper swage highgrad college polytech, star(0.05)
male 1.0000
educ 0.4948* 1.0000
exper -0.0572 -0.0430 1.0000
pexper 0.1264* -0.0674 0.0413 1.0000
swage 0.5234* 0.6994* -0.0993* 0.1275* 1.0000
highgrad -0.4917* -0.5228* 0.0048 -0.0325 -0.4596* 1.0000
college 0.0863 0.3008* 0.0268 -0.0453 0.2546* -0.3077* 1.0000
polytech 0.3062* 0.2664* 0.0278 -0.0239 -0.1039* -0.5096* -0.2239*
polytech
polytech 1.0000
. vif
8.
8.1 En esta parte se desea evaluar si es más conveniente una regresión sobre el Logaritmo
natural de wage, en vez de sobre la variable monto (wage). Al realizar los gráficos
cuantil-cuantil sobre los residuos, se observa que la variable cuyos residuos se
aproximan más a un comportamiento Normal es Ln_monto. Luego se justifica la
utilización de la misma, porque lo anterior sugiere la obtención de mejores
estimaciones al cumplirse éste supuesto estudiado.
1
.5
Residuals
0
-.5
-.5 0 .5
Inverse Normal
60000
40000
Residuals
20000
0
-20000
8.2 Para esta parte, se propone el siguiente modelo de regresión, donde se ha añadido el
coeficiente asociado a una nueva variable . Esta nueva variable parece
convincente en el sentido que intenta capturar el efecto ponderador de los años de experiencia
sobre los salarios esperados.
( )
8.3 Para verificar que el modelo irrestricto sea más conveniente que el anidado (realice
mejores predicciones), se hace uso de un Test de Fisher en el que se desea testear la siguiente
hipótesis:
SSR es la suma de los cuadrados residuales para los casos irrestrictos (U) y
restringidos (R). El estadístico del test es el siguiente:
IN3401-1 Estadística para la Economía y la Gestión
Profesor Marcelo Olivares - P. Auxiliar a cargo: Angélica Córdova
Realizado por Juan Guillermo Obando Rojel
( )
( ) ( )
( )
( ) ( )
( )
Como el valor del estadístico es mayor que el valor del mismo para un 95%
de confiabilidad 0,739783051, se tiene que el p-valor es menor que 0.005, luego se rechaza la hipótesis
y se concluye que agregar la covariable mejora las predicciones en el modelo. Además,
2
en las tablas se observa que R ajustado es mayor cuando se incorpora esta covariable (0.838 vs 0.829).
Se concluye que el modelo mejora.
. generate swpex = swage*pexper
. reg ln_wage male educ swage exper pexper highgrad college polytech swpex
9. Para evaluar la homocedasticidad gráficamente, se hizo uso del comando scatter en STATA
para cada covariable. Se sabe que una manera de verificar la Homocedasticidad es observando que los
residuos sean más o menos los mismos para cada valor de la variable independiente. Esto se traduce
gráficamente en lo siguiente: tenemos Homocedasticidad si, al observar los gráficos de los residuos,
encontramos que, para cada valor de la variable dependiente, el ancho del clúster de puntos es el
mismo.
1
.5
.5
Residuals
Residuals
0
0
-.5
-.5
10000 20000 30000 40000 50000 60000 5 10 15 20
starting wage years on current job
1
1
.5
.5
Residuals
Residuals
0
0
-.5
-.5
0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1
=1 if high school graduate =1 if male
1
1
.5
.5
Residuals
Residuals
0
0
-.5
-.5
5 10 15 20
0 10 20 30 40 highest grade completed
previous experience
1
1
.5
.5
Residuals
Residuals
0
0
-.5
-.5
0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1
=1 if a polytech =1 if college graduate
Entonces, al observar los gráficos vemos que no hay crecimientos o decrecimientos considerables en
los residuos que sugieran problemas de heterocedasticidad.
Comprobemos también haciendo el Test de White. Este test tiene las siguientes hipótesis:
. imtest, white
chi2(34) = 43.50
Prob > chi2 = 0.1275
Source chi2 df p
Como el p-valor del test es mayor que 0.005 (0.1275), entonces NO se verifica la
heterocedasticidad, es decir, no se puede rechazar la hipótesis de Homocedasticidad para un 95% de
confiabilidad. Esto último es importante para lograr una estimación mejor en MCO y para evitar
errores significativos en el cálculo del estimador de la matriz de varianzas y covarianzas de los
estimadores de mínimos cuadrados.
IN3401-1 Estadística para la Economía y la Gestión
Profesor Marcelo Olivares - P. Auxiliar a cargo: Angélica Córdova
Realizado por Juan Guillermo Obando Rojel
PARTE 2.
1. En esta parte de la tarea, se pide estudiar de qué manera la educación afecta los
salarios. Para ello se utilizó se quitó la variable polytech por no ser significativa al nivel
evaluado en la PARTE 1. Se utilizó LN (wage) como variable dependiente y se aplicaron
transformaciones a algunas variables. Las justificaciones para estas decisiones son las
siguientes:
( ) ( )