Está en la página 1de 21

Taller 2 Introducción a la econometría

Juan David Campos Mora


Mariana Contreras Cubides
Mariana Gabriela Lozano Sánchez
Valentina Sánchez Vivas
María Fernanda Téllez Valenzuela
Julián Leandro Valbuena Gonzales

Universidad Sergio Arboleda


Escuela de Economía
Economía

Bogotá D.C.

2021
1.(1 punto) Estime un modelo en el cual la variable dependiente sea el salario (INGLABO en
pesos) y como variables independientes: los años de educación (ESC), experiencia en el trabajo en
meses (P6426) convertida a años, experiencia en años al cuadrado, género (P6020, recodifique
esta variable con 0 y 1), una interacción entre el género recodificado y los años de educación estuvo
contagiado con COVID (P3147S1), el estrato (P4030S1A1, únicamente del 1 al 6, no interprete
este estimador). Para las variables independientes pruebe varias especificaciones (lineales o
logarítmicas, considerando que las cualitativas ni las cuadráticas van en logaritmos). Muestre todas
las especificaciones en una sola tabla .Muestre una segunda tabla con todos los criterios de
selección para escoger el mejor modelo.

Fuente; R studio

Modelo 1 = Modelo Lineal


Modelo 2 = Modelo Lin-Log-Log
Modelo 3= Modelo Lin-Log-Lin
Modelo 4= Modelo Lin-Lin-Log
CRITERIOS MODELO MODELO MODELO MODELO SELECCIÓN
1 2 3 4
P-value global ⬇ 1% 1% 1% 1% Cualquiera

R2 ⬆ 10,02% 9,54% 10,07% 9,474% Modelo 3

Varianza del 1.5969e+16 1.6571e+16 1.6363e+16 1.6171e+16 Modelo 1


modelo ⬇

P-value ESC 1% 0.280615 1% 0.307306 Modelo 1


Modelo 3
P-value Exp_año 5% 1% 1% 5% Modelo 2
Modelo 3
P-value Exp_año2 0.076623 0.483680 0.54823 0.067309 Ninguna

P-value genero 0.590668 5% 0.58414 5% Modelo 2


Modelo 4
P-value int 0.067191 0.1% 0.07604 0.1% Modelo 2
Modelo 4
P-value covid 0.749886 0.738202 0.78936 0.691952 Ninguna

P-value Estrato 0.1% 0.1% 0.1% 0.1% Cualquiera

AIC ⬇ 41367.57 39961.21 40243.78 41085.6 Modelo 2

BIC ⬇ 41413.77 40007.09 40289.73 41131.74 Modelo 2

Fuente; Elaboración propia.


En el P-valor, los valores que no se encuentran en porcentaje significan que no tienen significancia
estadística dentro del modelo analizado.

De acuerdo con los criterios comparados el mejor modelo es el Modelo 2.


2. (2 puntos) Considerando el enunciado del punto anterior y solo para el mejor modelo:

Fuente; R studio

 Especificación lineal;

 Especificación matricial;
n-7-1=1201
n=1209
𝕪𝟏𝟎𝟐𝟗𝒙𝟏 = 𝕩𝟏𝟐𝟎𝟗𝒙𝟖 + 𝜷𝟖𝒙𝟏 𝕦𝟏𝟐𝟎𝟗𝒙𝟏
 Interpretación estimadores (y/o los efectos marginales)

ESC (Años de escolaridad)

𝝏𝑰𝑵𝑮𝑳𝑨𝑩𝑶
=325276.9+158824.5*género
𝝏𝑬𝑺𝑪

Se presentan dos escenarios para el género donde:


género: 1 es mujer
0 es hombre

Escenario 1

𝝏𝑰𝑵𝑮𝑳𝑨𝑩𝑶
= =325276.9+158824.5*female(1)
𝝏𝑬𝑺𝑪
Al aumentar un año la escolaridad, las mujeres ganan 484.101,4 pesos por hora en la ciudad de
Medellín

Escenario 2

𝝏𝑰𝑵𝑮𝑳𝑨𝑩𝑶
= =325276.9+158824.5*male(0)
𝝏𝑬𝑺𝑪

El salario promedio de los hombres es de 325.276.9 pesos por hora en la ciudad de Medellín al
aumentar un año la escolaridad.

Exp_año(Experiencia en años)

̅̅̅̅̅̅̅̅̅̅̅̅̅̅ = 6.22709
𝑬𝒙𝒑_𝒂ñ𝒐𝒔

𝝏𝑰𝑵𝑮𝑳𝑨𝑩𝑶
==217924.1-2*301.1*Exp_años
𝝏𝑬𝒙𝒑_𝒂ñ𝒐𝒔

𝝏𝑰𝑵𝑮𝑳𝑨𝑩𝑶
=214174,1464
𝝏𝑬𝒙𝒑_𝒂ñ𝒐𝒔

Si la experiencia en años de la persona aumenta en 1 año, el salario aumentará 214.174,1464 pesos


en la ciudad de Medellín. (Ceteris paribus)

Exp_año2 (Experiencia en años al cuadrado)


El efecto marginal de esta variable sobre el salario ya se halló, ya que esta es una variable que
aparece dos veces en el modelo.
Género

̅̅̅̅̅̅= 10.2578
𝑬𝑺𝑪

𝝏𝑰𝑵𝑮𝑳𝑨𝑩𝑶
= -1192526.0 +158824.5*ESC
𝝏𝒈𝒆𝒏𝒆𝒓𝒐

𝝏𝑰𝑵𝑮𝑳𝑨𝑩𝑶
= =4366.63,9561
𝝏𝒈𝒆𝒏𝒆𝒓𝒐

Las mujeres ganan en promedio 436.663,9561 pesos más que los hombres cuando hombres y
mujeres tienen 10.26 años de educación.

Interacción entre género y educación (Int)


El efecto marginal sobre el salario ya se analizó anteriormente en la variable género y en este caso
asumimos derivar con respecto al género en la interacción por tanto el resultado será igual.

Covid
En este caso vemos que la variable covid no es una variable relevante para explicar el salario por
tanto, no se interpreta el efecto marginal.

 Interpretación los p-values individuales;


ESC (Años de escolaridad);
Los años de educación no son una variable relevante para explicar el salario.
Exp_año(Experiencia en años);
La experiencia en el trabajo es una variable relevante para explicar el salario con un nivel de
significancia del 1%
Exp_año2(Experiencia en años al cuadrado);
La experiencia en años al cuadrado no es una variable relevante para explicar el salario.
Género;
El género es una variable relevante para explicar el salario con un nivel de significancia del 5%
Int(Interacción entre género y ESC);
La interacción entre género y los años de educación es una variable relevante para explicar el
salario con un nivel de significancia del 0.1%
Covid;
El covid no es una variable relevante para explicar el salario.
Estrato;
El estrato es una variable relevante para explicar el salario con un nivel de significancia del 0.1%
 Interpretación p-value global;
El salario depende globalmente de las variables independientes (estrato, género, experiencia en
años y de la interacción entre género y años de escolaridad con un nivel ) con una significancia del
1%.

 Interpretación R- Squared

En este modelo el coeficiente de determinación es 0,0954, lo que nos muestra que todas las
variables independientes explican la variación del salario en un 9,54%

 Identifique si existen rendimientos marginales decrecientes en los años de experiencia


e interpretarlos en términos económicos

En este modelo evidenciamos que la variable lineal (Exp_año) tiene un p-valor que nos da un nivel
de significancia del 1% mientras que por otro lado la variable no lineal (Exp_año2) su p-valor nos
muestra que no tiene significancia ya que nos da un valor de (0.483680) es decir, nos da un nivel
de significancia de más del 10%. En esta situación no podemos evidenciar si existen rendimientos
decrecientes ya que la variable no lineal es no significativa.
3. (1 punto) Calcule, compare e interprete la tasa de retorno de la educación entre el bachillerato,
el grado de técnico o tecnólogo, el nivel universitario y el postgrado (con la variable P6220),
considerando el p-value para validar la tasa y con todas las variables independientes del punto 1
(siempre y cuando sean significativas, sino son significativas elimínelas de esta especificación).
La especificación del modelo considera solo a la variable dependiente en logaritmos. Es decir,
debe estimar 4 modelos econométricos. Escriba la especificación genérica para la variable
dependiente observada (regresión log lin). Al final y a manera de resumen elabore una tabla para
mostrar las tasas de retorno en los 4 casos (según el modelo). Adicionalmente, en la misma tabla
agregue dos columnas con la frecuencia absoluta y relativa de las categorías de la variable P6220
con el factor de expansión. Coloque las interpretaciones de las tasas de retorno para cada escenario.

Nivel Tasa de retorno p-value Frecuencia Frecuencia


Académico Absoluta Relativa
Bachiller 0.51352% Supera el 10% 812 32.056850 %
Técnico / 13.1405% 0.01% 389 15.357284 %
tecnológico
Universitario 3.63769% Supera el 10% 216 8.527438 %
Posgrado 2.30868% Supera el 10% 94 3.711015 %
Fuente; Elaboración propia.

 Análisis tasa de retorno


Bachiller : El grado de educación de un Bachiller no es una variable relevante para explicar el
salario en la ciudad de Medellín ya que el p- value nos muestra un nivel de significancia superior
al 10%.
Técnico y tecnológico : Los años de escolaridad de una persona que hace un técnico o tecnólogo
hace que se incremente el salario en un 13, 1405% en la ciudad de Medellín, esto evidenciado en
la tasa de retorno y por otra parte el p-value nos muestra un nivel de significancia del 0.01%, es
decir, la escolaridad de una persona que hace un técnico o tecnólogo es una variable relevante para
explicar el salario.
Universitario : Los años de escolaridad de una persona que tiene un título universitario no es una
variable relevante para explicar el salario en la ciudad de Medellín ya que el p-value nos muestra
un nivel de significancia superior al 10%.
Posgrado: Los años de escolaridad de una persona que tiene un posgrado no es una variable
relevante para explicar el salario en la ciudad de Medellín ya que el p-value nos muestra un nivel
de significancia superior al 10%.

En nuestra sociedad la educación es vista frecuentemente como una herramienta para mejorar la
calidad de vida de las personas, se tiene la concepción que a una mayor cantidad de estudios
formales la vinculación al mundo laboral se facilitará y adicionalmente es de esperar que los
ingresos percibidos sean mayores en comparación a los que se conseguirían con un nivel de
escolaridad inferior. Sin embargo, la evidencia en el estudio presentado anteriormente contradice
la afirmación, ya que el técnico es la variable relevante que nos explica el salario con un nivel de
significancia del 1%. Esto podría ser explicado, ya que los costos por un nivel superior en la
educación han aumentado y los incentivos en las personas de lograr una educación superior son
menores. No obstante, “La localización es un factor que puede ser clave para obtener una tasa de
retorno alta, al igual que su capital humano'' (Tarazona, E. Remolina D, 2017 ).Concluyendo que
para Medellín su tasa de retorno es alta.

4.(1 punto) Grafique la distribución del ingreso laboral (sin logaritmos) de la ciudad asignada en
los 4 casos del punto 3, compárelas y haga interpretaciones económicas. En la misma gráfica
coloque las 4 distribuciones, interpretando en términos de su curtosis y varianza. Adicionalmente,
coloque estadísticas descriptivas para los percentiles, cuartiles o deciles, correspondientes a cada
caso del ingreso laboral.

Fuente; R studio
Color Nivel educación Curtosis Varianza
Bachillerato Grande 1.762332e+12
Técnico Grande 767886.4
Profesional\universitario Pequeña 7.489106e+13
Posgrado Pequeña 3.067184e+13
Fuente; Elaboración propia.
Coeficiente de Gini entre los ingresos de la población de Medellín
GINI 0.4983999
Fuente; Elaboración propia.
Como se puede evidenciar en la gráfica, en el caso de los bachilleres y con base en su curtosis que
resulta ser bastante grande lo que resulta ser una curtosis de tipo Leptocúrtica, es posible interpretar
que Existe una gran concentración de los valores en torno a su media, con un salario no superior a
los 4 millones de pesos, además de presentar la mayor varianza entre los 4 grupos de niveles
educativos graficados con un 1.762332e+12. En el caso de los técnicos, la curtosis que presenta
también es bastante alta, presentando una varianza de 767886.4, con un salario menor a los 4
millones, pero como se puede observar algunas personas con este nivel educativo ganan más que
la media de técnicos estudiada. En el caso de los profesionales presenta una curtosis relativamente
pequeña. Lo cual resulta ser una distribución normal con respecto a su media, es decir que gran
cantidad de personas con este nivel educativo de encuentran en ese rango de salario, con una
varianza de 7.489106e+13. Finalmente en el caso de las personas que realizan un posgrado, con
base en sus curtosis podemos determinar que es Platicúrtica es decir que existe una baja
concentración de los valores en torno a su media, con una parte significativa por encima de los 5
millones de pesos con una varianza del 3.067184e+13.
En general se puede evidenciar que gran cantidad de la población de la ciudad de Medellín
terminaron sus estudios de bachiller, pero no optaron o no tuvieron la posibilidad de acceder una
educación superior de manera tal que la media del salario es relativamente baja, como se pude
evidenciar son pocas las personas con un posgrado que pueden acceder a un mayor salario, y como
claramente se puede observar son aquellas personas con un posgrado quienes pueden acceder a
una mayor remuneración salarial. En la ciudad de Medellín son más las personas con un bajo nivel
educativo y por ende un bajo nivel salarial.
De la gráfica expuesta anteriormente, se evidencia que la mayor parte de la población (una mayor
concentración), que tiene un grado de educación de bachiller y técnico, reciben aproximadamente
un ingreso laboral mínimo (salario mínimo); también se ve, que son muy pocos los que con este
grado de educación reciben un salario mayor al rango mínimo (entre 1 millón y 2 millones).A su
vez, se muestra que la mayoría de gente alcanza sus estudios hasta un nivel técnico ya que en el
nivel de pregrado y posgrado vemos menos concentración de personas (densidad) que al igual
reciben un salario mayor al mínimo, pero manteniendo una tendencia estable. Para los ingresos
de los habitantes de Medellín se encuentra un coeficiente de Gini de 0.4983999, por lo que se
deduce que en la ciudad los ingresos son en su mayoría iguales sin embargo, al analizar por niveles
de estudio se evidencio que la población con un grado de educación superior presenta cierta
desigual en la distribución de salarios.
 Estadísticas descriptivas
Percentiles Bachillerato
Percentil 0% 25% 50% 75% 100%
Valor 0 800000 916000 1230000 20000000
Fuente; Elaboración propia.
Coeficiente Gini Bachillerato
GINI 0.3647418
Fuente; Elaboración propia.
El nivel de ingreso laboral mínimo del 25% de las personas con mayor salario que tienen un grado
de educación de bachiller es de $1.230.000 pesos. Por otra parte, el 50% tienen un menor ingreso
laboral a $916000 pesos. Asimismo, se encuentra un coeficiente de Gini de 0.3647418 que está
mayormente próximo a 0, por lo que se deduce que ante este nivel de educación hay cierta igualdad
salarial.
Percentiles Técnico
Percentil 0% 25% 50% 75% 100%
Valor 0 877803 1200000 1600000 5300000
Fuente; Elaboración propia.
Coeficiente Gini Técnico
GINI 0.2858798
Fuente; Elaboración propia.
El nivel de ingreso laboral máximo del 25% de las personas con menor salario que tienen un grado
de educación de técnico o tecnólogo es de $877.803 pesos. Por otra parte, el 50% tienen un mayor
ingreso laboral de $1.200.000 pesos. Asimismo, se encuentra un coeficiente de Gini de 0.2858798
que está mayormente próximo a 0, por lo que se deduce que ante este nivel de educación hay
igualdad salarial.
Percentiles Profesionales/universitarios
Percentil 0% 25% 50% 75% 100%
Valor 0 1200000 2000000 3195000 10000000
Fuente; Elaboración propia.
Coeficiente Gini Profesionales/universitarios
GINI 0.5543853
Fuente; Elaboración propia.
El nivel de ingreso laboral mínimo del 25% de las personas con mayor salario que tienen un título
universitario es de $3.195.000 pesos. Por otra parte, el 50% tienen un menor ingreso laboral de
$2.000.000 pesos. Asimismo, se encuentra un coeficiente de Gini de 0.5543853 que está
mayormente próximo a 1, por lo que se deduce que ante este nivel de educación hay cierta
desigualdad salarial.
Percentiles posgrado
Percentil 0% 25% 50% 75% 100%
Valor 0 2725000 4000000 6075000 44000000
Fuente; Elaboración propia.
Coeficiente Gini Posgrado
GINI 0.4022738
Fuente; Elaboración propia.
El nivel de ingreso laboral mínimo del 25% de las personas con mayor salario que tienen un
posgrado es de $6.075.000 pesos. Por otra parte, el 50% tienen un menor ingreso laboral de
$4.000.000 pesos. Asimismo, se encuentra un coeficiente de Gini de 0.4022738 que está
mayormente próximo a 1, por lo que se deduce que ante este nivel de educación hay cierta
desigualdad salarial.
#Taller 2 Introducción a la econometría
#Grupo 2
#Ciudad: Medellin

library(dplyr)
library(gmodels)
library(reldist)
library(psych)

setwd("C:/Users/campo/Desktop/Medellin")

Vivienda=read.csv("Área - Vivienda y Hogares.csv",sep=";",dec=",")


Carac_generales=read.csv("Área - Características generales (Personas).csv",sep =
";",dec=",")
F_trabajo=read.csv("Área - Fuerza de trabajo.csv",sep=";" ,dec=",")
Ocupados=read.csv("Área - Ocupados.csv",sep=";" ,dec=",")
Desocupados=read.csv("Área - Desocupados.csv",sep=";",dec="," )
Inactivos=read.csv("Área - Inactivos.csv",sep=";" ,dec=",")
O_Ingresos=read.csv("Área - Otros ingresos.csv",sep=";" ,dec=",")
aoa=read.csv("Área - Otras actividades y ayudas en la semana.csv",sep=";" ,dec=",")

colnames(Vivienda)[1]="DIRECTORIO"
colnames(Carac_generales)[1]="DIRECTORIO"
colnames(F_trabajo)[1]="DIRECTORIO"
colnames(Ocupados)[1]="DIRECTORIO"
colnames(Desocupados)[1]="DIRECTORIO"
colnames(Inactivos)[1]="DIRECTORIO"
colnames(O_Ingresos)[1]="DIRECTORIO"
colnames(aoa)[1]="DIRECTORIO"
colnames(Vivienda)[1]

dim(Vivienda)
dim(Carac_generales)
Base2021=merge(Vivienda,Carac_generales,by=c("DIRECTORIO","SECUENCIA_P"),all
= TRUE)
Base2021=merge(Base2021,F_trabajo,by=c("DIRECTORIO","SECUENCIA_P","ORDEN
"),all = TRUE)
Base2021$factor=as.numeric(gsub(",",".",Base2021$fex_c_2011))
Base2021=select(Base2021,-HOGAR.x,-REGIS.x,-AREA.x,-MES.x,-DPTO.x,-
fex_c_2011.x,
-HOGAR.y,-REGIS.y,-AREA.y,-MES.y,-DPTO.y,-fex_c_2011.y)
Base2021=merge(Base2021,Ocupados,by=c("DIRECTORIO","SECUENCIA_P","ORDE
N"),all = TRUE)
Base2021=select(Base2021,-HOGAR.x,-REGIS.x,-AREA.x,-MES.x,-DPTO.x,-
fex_c_2011.x,
-HOGAR.y,-REGIS.y,-AREA.y,-MES.y,-DPTO.y,-fex_c_2011.y)
Base2021=merge(Base2021,Desocupados,by=c("DIRECTORIO","SECUENCIA_P","OR
DEN"),all = TRUE)
Base2021=merge(Base2021,Inactivos,by=c("DIRECTORIO","SECUENCIA_P","ORDEN
"),all = TRUE)
Base2021=merge(Base2021,O_Ingresos,by=c("DIRECTORIO","SECUENCIA_P","ORDE
N"),all = TRUE)
Base2021=select(Base2021,-HOGAR.x,-REGIS.x,-AREA.x,-MES.x,-DPTO.x,-
fex_c_2011.x,
-HOGAR.y,-REGIS.y,-AREA.y,-MES.y,-DPTO.y,-fex_c_2011.y)
Base2021=merge(Base2021,aoa,by=c("DIRECTORIO","SECUENCIA_P","ORDEN"),all
= TRUE)
dim(Base2021)

write.csv(Base2021,"Base2021.csv")
Medellin = filter(Base2021,AREA.x==05)

Medellin$factor=round(Medellin$factor)
Medellin$factor

#Ejercicio 1

#Ajustes en variables
#Conversión de mes a años
Medellin$Exp_año= (Medellin$P6426)/12

#Experencia en años al cuadrado


Medellin$Exp_año2=Medellin$Exp_año*Medellin$Exp_año

#Recodificar género
Medellin$genero=ifelse(Medellin$P6020==1,1,0)
attach(Medellin)
table(genero)
table(genero,P6020)

#Interacción entre el género y ESC


Medellin$Int=Medellin$genero*Medellin$ESC
glimpse(Medellin)

#COVID recodificación
Medellin$covid = ifelse(is.na(Medellin$P3147S1),0,1)
table(Medellin$covid)
#Estratos filtro
Medellin$Estrato=Medellin$P4030S1A1
filter(Medellin, Estrato >=1 )
filter(Medellin, Estrato <=7 )

#Especificaciones Lineales
--------------------------
#Modelo Lineal
Modelo1=lm(INGLABO~ESC+Exp_año+Exp_año2+genero+Int+covid+Estrato,weights=f
actor)
summary(Modelo1)
mean(ESC) #10.2578
mean(Exp_año, na.rm = T)

#Tabla ANOVA para el Modelo 1


anova(Modelo1)

# Criterios de informacion para el Modelo 1


AIC(Modelo1) # Akaike
BIC(Modelo1) # Bayesiano
------------------------------------------
#Modelo lin - log
#Logaritmos
lESC = log(ESC)
lExp_año =log(Exp_año)
Modelo2=lm(INGLABO~lESC[lESC!=NA|lESC!=-
Inf]+lExp_año[lExp_año!=NA|lExp_año!=-
Inf]+Exp_año2+genero+Int+covid+Estrato,weights=factor)
summary(Modelo2)

#Tabla ANOVA para el Modelo 2


anova(Modelo2)

# Criterios de informacion para el Modelo 2


AIC(Modelo2) # Akaike
BIC(Modelo2) # Bayesiano
---------------------------------------
#Modelo lin - log con Exp_año
Modelo3=lm(INGLABO~ESC+lExp_año[lExp_año!=NA|lExp_año!=-
Inf]+Exp_año2+genero+Int+covid+Estrato,weights=factor)
summary(Modelo3)

#Tabla ANOVA para el Modelo 3


anova(Modelo3)
# Criterios de informacion para el Modelo 3
AIC(Modelo3) # Akaike
BIC(Modelo3) # Bayesiano
-------------------------------------
#Modelo lin - log con ESC
Modelo4=lm(INGLABO~lESC[lESC!=NA|lESC!=-
Inf]+Exp_año+Exp_año2+genero+Int+covid+Estrato,weights=factor)
summary(Modelo4)

#Tabla ANOVA para el Modelo 4


anova(Modelo4)
# Criterios de informacion para el Modelo 4
AIC(Modelo4) # Akaike
BIC(Modelo4) # Bayesiano

library(stargazer)
stargazer(Modelo1,
Modelo2,
Modelo3,
Modelo4,type="text",out="modelos.doc")

library(stargazer)
stargazer(Modelo2,type="text",out="Mejor_modelos.doc")

#Ejercicio 3

Medellin$P6220[is.na(Medellin$P6220)] = 0
bachillerato = Medellin %>%
filter(P6220 == 2)

bachillerato$l_INGLABO = log(bachillerato$INGLABO)

bachillerato$l_INGLABO[is.infinite(bachillerato$l_INGLABO)] <- NA

attach(bachillerato)
TasaR_ba=lm(l_INGLABO~ESC+Exp_año+Exp_año2+P4030S1A1,bachillerato,weights
= factor)
summary(TasaR_ba)
detach(bachillerato)

tecnico <- Medellin %>%


filter( P6220 == 3)
tecnico$l_INGLABO = log(tecnico$INGLABO)
tecnico$l_INGLABO[is.infinite(tecnico$l_INGLABO)] <- NA
TasaR_tec=lm(l_INGLABO~ESC+Exp_año+Exp_año2+P4030S1A1,tecnico,weights =
factor)
summary(TasaR_tec)

profesional <- Medellin %>%


filter(P6220 == 4)
profesional$l_INGLABO = log(profesional$INGLABO)
profesional$l_INGLABO[is.infinite(profesional$l_INGLABO)] <- NA
TasaR_pro=lm(l_INGLABO~ESC+Exp_año+Exp_año2+P4030S1A1,profesional,weights
= factor)
summary(TasaR_pro)

postgrado <- Medellin %>%


filter(P6220 == 5)
postgrado$l_INGLABO = log(postgrado$INGLABO)
postgrado$l_INGLABO[is.infinite(postgrado$l_INGLABO)] <- NA
TasaR_post=lm(l_INGLABO~ESC+Exp_año+Exp_año2+P4030S1A1,postgrado,weights
= factor)
summary(TasaR_post)
#2 Bachiller
#3 Tecnico o tecnológico
#4 universitario
#5 Posgrado

#Frecuencias Relativas y absolutas


CrossTable(Medellin$P6220)

#Ejercicio 4
plot(dx, lwd = 2, col = "red",
main = "Distribución del ingreso laboral", xlab = "")
set.seed(1)
dtecnico <- density((tecnico$INGLABO[!is.na(tecnico$INGLABO)]))
lines(dtecnico, col = "blue", lwd = 2)
set.seed(1)
dprofesional <- density((profesional$INGLABO[!is.na(profesional$INGLABO)]))
lines(dprofesional, col = "green", lwd = 2)
set.seed(1)
dposgrado <- density((postgrado$INGLABO[!is.na(postgrado$INGLABO)]))
lines(dposgrado, col = "purple", lwd = 2)

#Varianza Bachillerato
var((bachillerato$INGLABO[!is.na(bachillerato$INGLABO)]))
#Varianza Tecnico
var((tecnico$INGLABO[!is.na(tecnico$INGLABO)]))

#Varianza profesionales
var((profesional$INGLABO[!is.na(profesional$INGLABO)]))

#Varianza pregrado
var((postgrado$INGLABO[!is.na(postgrado$INGLABO)]))

#Estadísticas descriptivas (Percentiles)


quantile((bachillerato$INGLABO[!is.na(bachillerato$INGLABO)]))
quantile((tecnico$INGLABO[!is.na(tecnico$INGLABO)]))
quantile((profesional$INGLABO[!is.na(profesional$INGLABO)]))
quantile((postgrado$INGLABO[!is.na(postgrado$INGLABO)]))

#Indice Gini Bachillerato


gini((bachillerato$INGLABO[!is.na(bachillerato$INGLABO)]))
#Indice Gini Tecnico
gini((tecnico$INGLABO[!is.na(tecnico$INGLABO)]))
#Indice Gini Profesionales
gini((profesional$INGLABO[!is.na(profesional$INGLABO)]))
#Indice Posgrago
gini((postgrado$INGLABO[!is.na(postgrado$INGLABO)]))
#Indice de Gini entre los ingresos de la población
gini((Medellin$INGLABO[!is.na(Medellin$INGLABO)]))

También podría gustarte