Está en la página 1de 11

Miguel Moscote- Kevin Farinango

Econometría I
Facultad de Economía
Universidad Externado de Colombia

1) Emplee los datos de ENCV-2014.dta para:


a. Crear una variable que tenga el salario en miles de pesos por hora (recuadro de código
y resultados), para ello emplee las preguntas
Antes de descuentos ¿cuánto ganó… el mes pasado en este empleo? (incluya propinas y comisiones y excluya
horas extras, viáticos y pagos en especie)
¿Cuántas horas a la semana trabaja normalmente… en ese trabajo?

clear
cd "C:\Users\HP\OneDrive\Documentos\migue\6 semester\Econometria"
use ENCV-2014.dta

sum p8624
sum p171
gen salario_miles = p8624 //Salario mensual

replace salario_miles = p171 if p8624==.

replace salario_miles= salario_miles/1000 //salario mensual en miles

sum salario_miles
replace p415 = p415*4 //horas de trabajo mensuales

sum p415
gen salario_horas_miles = salario_miles/p415 //salario en miles de
pesos por hora

sum salario_horas_miles

b. Crear una variable solamente para cada persona que recibe un salario en a, que indique
si el empleado (asalariado) es formal (recuadro de código y resultados), para ello emplee
la variable
¿Está… cotizando actualmente a un fondo de pensiones?
Si está pensionado o cotizando el empleado es formal.
gen formal = 0 if salario_horas_miles!=. //informal

replace formal = 1 if p6920 == 1 & salario_horas_miles!=.


//contribuye

replace formal = 1 if p6920 == 3 & salario_horas_miles!=.

//es pensionado

tab formal

c. Crear una variable solamente para cada persona que recibe un salario en a, que indique
si el empleado (asalariado) es calificado (recuadro de código y resultados), para ello
emplee las variables
¿En qué nivel está matriculado… ?
¿Cuál es el nivel educativo más alto alcanzado por… y el último año o grado aprobado en este nivel?
Si está estudiando posgrado o si no está estudiando y alcanzó técnico, tecnólogo
universitario, o posgrado (con o sin título) el empleado es calificado

tab p8587
tab p1088

gen calificado = 0 if salario_horas_miles!=.


//no calificado

replace calificado = 1 if p8587 > 5 & p8587!=. &

salario_horas_miles!=. //nivel mas alto

replace calificado = 1 if p1088==8 & salario_horas_miles!=.


// posgrado

tab calificado

d. Emplee el comando summarize y verifique que las 13.222 observaciones de


empleados tienen las 3 variables creadas (recuadro de código y resultados).

summarize salario_horas_miles formal calificado


2) Con base en las variables sugeridas en el numeral 1
a. Estime el siguiente modelo (recuadro de código y resultados)
log ( salario )= β0 + β 1 mujer + β 2 formal++ β3 edad + β 4 calificado+u

gen lsalario=log(salario_horas_miles)
rename p6040 edad
recode p6020 (2=1) (1=0), gen(mujer)

reg lsalario mujer formal edad calificado

log ( salario )=0.591+(−0.687) mujer +(0.55) formal+(0.005)edad +(0.56)calificado

b. Interprete β 2y β 4 y comente sobre su significancia estadística y práctica.


Respuesta:
β 2 nos indica que si la persona es un empleado formal (o sea que cotiza o esta
pensionado) esto alterara en 0.55 el total del log(salario), mientras que el β 4 nos indica que
si el empleado es calificado (o sea que Si está estudiando posgrado o si no está
estudiando y alcanzó técnico, tecnólogo universitario, o posgrado) entonces esto alterara
en 0.56 el log(salario)

Para β 2 y para β 4 los parámetros son estadísticamente significativos ya que son menores
al valorde significancia que es de 0.05

Se desea testear si el efecto marginal de la edad sobre el salario en miles de pesos por
hora depende del género de la persona,
c. Plantee la ecuación que incluye el estimador para testear este efecto

log ( salario )= β0 + β 1 mujer + β 2 edad +u

d. Estime el modelo en c empleando “factor variables” (recuadro de código y resultados)


reg lsalario i.mujer##c.edad

e. Emplee el comando margins para ver el efecto marginal de incrementar la edad para
una mujer con 35 años (recuadro de código y resultados), interprete

margins , dydx(mujer) at(edad==35)

El efecto marginal de incrementar la edad para una mujer con 35 años, seria de un aumento de
0.0355 por cada año que se agregue

3) Con base en las variables sugeridas en el numeral 1

a. Estime el siguiente modelo, emplee “factor variables” (recuadro de código y resultados)


salario=β0 + β 1 mujer + β 2 formal+ β3 calificado+ ∑ β z region z+ u
Z
Donde Z es el conjunto de regiones en el país de la variable región en la ENCV2014.

tab region, gen(region)


rename p8624 salario
reg salario mujer formal calificado i.region

b. Interprete cada β z ¿cuál es la región base?


 En este caso la región base es atlántico,
 En relación con la región atlántica en la región oriental el salario es 47621,81 mas
alto
 En relación con la región atlántica en la región central el salario es 7864,66 más
alto
 En relación con la región atlántica en la región pacifica el salario es 4858,49 más
bajo
 En relación con la región atlántica en Bogotá el salario es 269.636,9 más alto
 En relación con la región atlántica en Antioquia el salario es 2548.24 más bajo
 En relación con la región atlántica en Valle del cauca el salario es 4415.52 más alto
 En relación con la región atlántica en San Andrés el salario es 58391,6 más alto
 En relación con la región atlántica en la Orinoquia y amazonia el salario es
185023,8 más alto

c. ¿Cuál región tiene el mayor efecto positivo sobre el salario en miles pesos por hora?
La región que tiene el mayor efecto positivo sobre el salario es Bogota ya que su salario
por hora es 269.636,9
Suponga un escenario contrafactual en que todas las observaciones ahora pertenecen a la
región más productiva encontrada en c.
d. Calcule la masa de salarios (en miles de millones de pesos) que el modelo predice en el
escenario base y en el contrafactual. Recuerde, la masa de salarios equivale a la suma de
salarios mensuales de todos los trabajadores, por ello debe usar el factor de expansión.
(recuadro de código y resultados)
gen nsalario = (salario/(p415*4))/1000
sum nsalario [iw=fex_c]
display (r(mean)*10170325)/10000000000

e. Comente el numeral d
respuesta:
podemos decir que la masa de salarios en un escenario en que todas las observaciones
ahora pertenecen a la región más productiva seria de 0.0015

4) Emplee los datos de gpa1.dta para:


a. Estimar el modelo en la ecuación 3.15 [Determinantes del promedio en la universidad]
del libro de Wooldridge por medio de MCO (recuadro de código y resultados)
clear
cd "C:\Users\HP\OneDrive\Documentos\migue\6 semester\Econometria"

use gpa1.dta

reg colGPA hsGPA ACT


colGPA =1.28+ ( 0.453 ) hsGPA + ( 0.009 ) ACT

b. Estimar el mismo modelo en el numeral a, pero empleando una regresión cuantilica


sobre la mediana (p50), y sobre p25 y p75. (recuadro de código y resultados)
 Mediana (p50)
qreg colGPA hsGPA ACT , q(50)
predict GPA50,xb

colGPA =1.33+(0.421)hsGPA +( 0.010) ACT

 P25
qreg colGPA hsGPA ACT, q(25)
predict GPA25,xb

colGPA =1.697+(0.297)hsGPA+(0.004) ACT

 P75
qreg colGPA hsGPA ACT, q(75)
predict GPA75, xb
colGPA =0.999+(0.688)hsGPA +(−0.002) ACT

c. Interprete y compare los coeficientes en cada caso, recuerde que la descripción de


variables está en el libro de Wooldridge
Respuesta:
Si comparamos la regresión que hicimos en el punto 4.A podemos ver que existen
cambios en los coeficientes, si comparamos con el cuantil 0.25, podemos ver que si se
incrementa un punto adicional en la puntuación de la variable hsGPA generará un
promedio de 0.29 a la puntuación, y en ACT, se producirá un cambio a 0.004

En el caso de la mediana se puede ver que un incremento de 1 punto en hsGPA afectara


0.421 a colGPA, y de resto para la mediana no van a haber grandes cambios

En el cuantil del 0.75, podemos ver que un incremento de 1 punto adicional a la puntuación
de hsGPA va a hacer que se incremente en promedio 0.68 el ponderado de colGPA, y
además en ACT se afectaría en -0.002 el col GPA

d. Cree una sola grafica del tipo kernel density para ver: la distribución del GPA
observada, la que predice el modelo en el numeral a y las que predice el modelo en el
numeral b (recuadro de código y resultados)
twoway (kdensity colGPA) (kdensity GPA50) (kdensity GPA25)
(kdensity GPA75)

e. Comente sus hallazgos

La línea amarilla es la regresión con el cuantil de mayores puntuaciones (0.75)


por lo que es la que tiene mayor efecto en la ponderación de notas del colGPA ,
también podemos ver la línea la morada (0,50) en este caso la densidad es
parecida y asimétrica. Y la línea amarilla (0.25) representa el cuantil con menor
afectación en el ponderado.

5) Emplee los datos de ceosal para:


a. Estimar el modelo (recuadro de código y resultados)
log ⁡(salario )=β 0+ β1 ceoten+u
La variable salario es el sueldo anual, en miles de dólares de los CEO, y ceoten son los
años de antigüedad como CEO de la empresa.
use "C:\Users\Asus\Downloads\ceosal2 (1).dta"
reg lsalary ceoten

log ( salary ) =6.505+(0.00972) ceoten

b. Interprete β 1 y comente sobre su significancia estadística y práctica

β 1 indica que el sueldo anual (en miles de dólares) del individuo incrementara en promedio un
0.972% al generarse un incremento en un año de antigüedad como CEO de la empresa.
El parámetro no es estadísticamente significativo ya que es mayor al valor de significancia que
es de 0.05

.
Teniendo en cuenta el problema de retransformación abordado en clase, suponga que se
desea emplear la ecuación en a para encontrar la predicción del salario en dólares por
hora.
c. Encuentre el valor ajustado del salario en miles de dólares por hora del modelo en a,
compárelo con el salario en miles de dólares observado (recuadro de código y resultados)

predict lsalarye, xb
summarize lsalarye lsalary
Se puede observar con base en los resultados obtenidos que los valores ajustados de
log(salario)que vendría siendo (y gorro) coinciden con el promedio muestral de la variable del
salario (y normal) , teniendo en cuenta que la suma y el promedio de los residuales debe ser
igual a cero, se afirma que el promedio muestral debe ser igual al promedio de la variable

También podría gustarte