Está en la página 1de 61

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERÚ

Facultad de Economía

STATA (Base de datos ELMPS)

HUANCAYO – PERÚ
2020
Línea de investigación:
Tecnologías y Sistemas de Información
CATEDRÁTICO:
Mg. Juan Carlos Pérez Ticse
INDICE:
Investigadores:
MODELO DEL CAPITAL HUMANO............................................................................4
 ARROYO SOLANO, Jhandery
1. Fundamento teórico................................................................................................4
 CCANTO NUÑUVERO, Carolai
2. Especificación del modelo matemático del consumo.............................................4
 GUTIERREZ
3. Especificación DAMIÁN,
del modelo Estefany
econométrico...............................................................4
 OCHOA
4. Estimación TAIPE, Ruth
de Coeficientes:...................................................................................5
SEMESTRE:
5. Análisis Estadístico:...............................................................................................6
5.1. SÉPTIMO
Análisis de significancia individual(t)............................................................7
N° Grupo:
5.2. Análisis de significancia global (F, R2)...........................................................7
CORRECCIÓN
3 DEL MODELO......................................................................................9
1. Multicolinealidad.......................................................................................................9
1.1 Identificación problemas de multicolinealidad...............................................9
1.2 Regresión de Variables:................................................................................12
2. Heterocedasticidad:..............................................................................................13
2.1 Identificando problemas de Heterocedasticidad:...............................................13
2.2. Regresión de Variables:................................................................................17
ESTADISTICAS UNIVARIADAS................................................................................21
1. Comando SUM:....................................................................................................22
2. Comando MEANS:..............................................................................................22
3. Diagrama Tallo-hoja.............................................................................................23
4. Grafico de la Caja (boxplots)...............................................................................24
5. Normalidad:..........................................................................................................26
EVALUACIÓN DE LA NORMALIDAD......................................................................28
1. Métodos Gráficos:................................................................................................28
1.1 VARIABLE 1: Actividad Económica del primer trabajo..................................28
1.2 VARIABLE N°2: Sector institucional del trabajo.............................................33
2 Métodos Numéricos:............................................................................................38
2.1 Skewness.......................................................................................................39
2.2 Shapiro-Wilk.................................................................................................40
2.3 Shapiro Francia.............................................................................................41
ANALISIS DE GRAFICOS............................................................................................43
1. Gráfico de Barras:.................................................................................................43
2. Histograma...........................................................................................................46
3. Gráfico de Caja (Boxplots)......................................................................................48
HUANCAYO – PERÚ
2020
4. Gráfico de Dispersión..............................................................................................50
5. Gráficos de Torta....................................................................................................56
MODELO DEL CAPITAL HUMANO

1. Fundamento teórico
El primer economista clásico que implementó el concepto capital humano fue
Adam Smith (1776), quien en su obra pionera “La riqueza de las naciones”,
propuso una similitud entre los hombres y las máquinas productoras. Más tarde,
otros autores consideraron el concepto implementado por Smith, entre ellos Mill
y Bentham, hasta la contribución de Marshall. La concepción del capital
humano, a pesar de ser considerada por autores como Petty, Cantillon, Marshall,
Fisher y Von Thuner, nunca fue desarrollada en el marco de una estructura
teórica sólida, al menos hasta la mitad del siglo XX, gracias a las obras pioneras
de Mincer (1958), Schultz (1960) y Becker (1964). Dichas obras aportaron una
teoría económica sobre el capital humano que se basaba principalmente en los
años de escolaridad y en la experiencia profesional, variables que explican las
funciones de ingreso individuales (Dirección General para la Cooperación al
Desarrollo, 2008). La teoría del capital humano de Mincer, nos da a entender de
qué variables depende el salario de una persona, pueden ser mencionarse las
capacidades adquiridas como consecuencia de la inversión en capital
humano(educación formal, experiencia laboral), capacidades debidas a
habilidades innatas(inteligencia), tipo de empleo, base de contrato, género y
otras. En la ecuación tradicional de Mincer son estimados de los coeficientes de
un modelo semilogaritmico.
2. Especificación del modelo matemático del consumo
Modelo económico:

Y =f ( Nivel Educativo , Años de experiencia )

Modelo matemático:
log ( Ingreso ) =β 0+ β1 ( Nivel educativo ) + β 2 ( Años de educacion ) +e
0< β 0 <1

3. Especificación del modelo econométrico


La forma matemática específica, carece de validez sino identifica o valora
cuantitativamente los coeficientes en ese sentido la econometría al pretender
explicar la realidad debe plantear un modelo económico que refleje la realidad
en su real dimensión.
El modelo econométrico debe reflejar la realidad, debe especificar la interacción
de las demás variables no consideradas den el modelo matemático a través de la
incorporación de una variable que englobe a todas las demás variables abstraídas
del proceso de modelación, en este caso se denomina termino de perturbación o
de error (e).
Modelo Econométrico

log ( Ingreso ) =β 0+ β1 Nivel educativo+ β 2 Años de experiencia +ϵ

e: Es una variable aleatoria o estocástica que contiene la magnitud de la


influencia en la variable dependiente de parte de todas aquellas variables no
consideradas deterministamente en el modelo matemático.

4. Estimación de Coeficientes:

Se procede a la estimación de los parámetros de la función consumo a través del


método de mínimos cuadrados ordinarios, haciendo uso de la técnica estadística
de un análisis de regresión se obtuvo los siguientes valores de β 0 , β 1 , β 2 , … .
El comando que se utilizo fue:

reg lfrph sexo edad exper qrf edu8c10 edu6c6 aeduc slpt1 set1 elt1 ae1t1d ft sit
ai1t ts1 tel1 t1cc t1ss ai2t te2 ts2 tel2 t2cc t2ss ai3t te3 ts3 tel3 t3cc t3ss

log ( Ingreso ) =β 0+ β1 Nivel educativo+ β 2 Años de experiencia +ϵ


Figura N°1: Estimación de coeficientes

Source SS df MS Number of obs = 3,110


F(30, 3079) = 31.92
Model 440.67678 30 14.689226 Prob > F = 0.0000
Residual 1416.83464 3,079 .46016065 R-squared = 0.2372
Adj R-squared = 0.2298
Total 1857.51142 3,109 .597462664 Root MSE = .67835

lfrph Coef. Std. Err. t P>|t| [95% Conf. Interval]

sexo -.2151283 .0565155 -3.81 0.000 -.3259401 -.1043165


edad .0246538 .0081445 3.03 0.002 .0086845 .0406231
exper -.0001098 .0000969 -1.13 0.257 -.0002999 .0000803
qrf .08663 .0109883 7.88 0.000 .0650849 .1081751
edu8c10 -.0530727 .0260787 -2.04 0.042 -.1042062 -.0019393
edu6c6 .1063817 .035202 3.02 0.003 .0373599 .1754034
aeduc .0151048 .0091314 1.65 0.098 -.0027994 .033009
slpt1 -.7334936 .134509 -5.45 0.000 -.9972301 -.469757
set1 -.0990853 .0380983 -2.60 0.009 -.1737859 -.0243847
elt1 .0234306 .0253106 0.93 0.355 -.0261967 .0730579
ae1t1d -.0190721 .0029116 -6.55 0.000 -.0247809 -.0133633
ft .2302413 .0629847 3.66 0.000 .106745 .3537375
sit -.151935 .0383323 -3.96 0.000 -.2270944 -.0767756
ai1t .0041759 .0024085 1.73 0.083 -.0005466 .0088984
ts1 -.0087746 .0248649 -0.35 0.724 -.0575281 .0399789
tel1 -.035961 .0130837 -2.75 0.006 -.0616147 -.0103073
t1cc -.063629 .0566407 -1.12 0.261 -.1746865 .0474284
t1ss -.1187868 .0606783 -1.96 0.050 -.2377609 .0001873
ai2t .0064073 .0026695 2.40 0.016 .001173 .0116415
te2 -.0097904 .0157687 -0.62 0.535 -.0407086 .0211278
ts2 -.0489355 .0216278 -2.26 0.024 -.0913418 -.0065291
tel2 .0275168 .0144702 1.90 0.057 -.0008555 .0558891
t2cc -.0506556 .0395811 -1.28 0.201 -.1282637 .0269524
t2ss -.0691985 .0452562 -1.53 0.126 -.1579339 .019537
ai3t -.0106514 .0021768 -4.89 0.000 -.0149194 -.0063833
te3 -.0653233 .0365972 -1.78 0.074 -.1370808 .0064341
ts3 -.0143364 .0251297 -0.57 0.568 -.063609 .0349362
tel3 -.00588 .021331 -0.28 0.783 -.0477044 .0359444
t3cc -.0275966 .0488437 -0.56 0.572 -.1233661 .0681728
t3ss -.0922941 .0466095 -1.98 0.048 -.183683 -.0009053
_cons 3.870271 .5734022 6.75 0.000 2.745981 4.994561

Fuente: Elaboración propia.

Como vemos en la siguiente regresión, nos da un R2 de 0.2372, es decir las variables


explican a la variable dependiente en un 23%.También podría indicarnos que nuestro
modelo es eficiente en un 23.72%.

5. Análisis Estadístico:

5.1. Análisis de significancia individual(t)


H 0 : β j=0
H1: β j≠ 0

En este primer nivel de análisis estadístico debemos analizar la significancia


estadística individual del coeficiente o parámetro estimado, debemos
asegurarnos que el valor estimado tenga propiedades estadísticas favorables y
apropiadas, que no sean ineficientes y sobre todo que tengan algún valor
estadístico diferente de cero.
En este primer análisis se puede observar que el coeficiente independiente es
significativo (prob<0.05), esto también se cumple en el caso del coeficiente de la
variación del ingreso (prob<0.05).
Pero esto no se cumple en las variables de experiencia(exper), años de
educación(aeduc), la estabilidad laboral del primer trabajo(elt1), empleo del
segundo trabajo(te2) entre otras ya que la (prob>0.05), esto nos muestra que nos
es muy significativo para el modelo.

5.2. Análisis de significancia global (F, R2)

 F-Statistic:
H 0 : β j=0
β k =0
β m=0

El F- estadístico corrobora el resultado anterior, en el cual los regresores son


significativos para explicar la variable endógena.

En nuestro caso es un valor de 31.92 y que su probabilidad es 0.000000 menor a 0.05,


nos indica que las variables si expliquen en forma global a las variables.

 R-Cuadrado (R2): Se le conoce como bondad de ajuste.


2 SCR SCE
R =1− = =0.2372
SCT SCT

Nos indica que el 23.7% de las variaciones de las variables como experiencia (exper),
quintiles de riqueza (qrf), años de educación (aeduc), entre otras explican las
variaciones del logaritmo del salario.

También podría indicarnos que nuestro modelo es eficiente en un 23.72%.

CORRECCIÓN DEL MODELO

En el anterior modelo, este último tenía ciertas fallas debido a que diversas variables
como experiencia (exper), años de educación (aeduc), la estabilidad laboral del primer
trabajo (elt1), empleo del segundo trabajo (te2) entre otras no eran muy significativas en
nuestro modelo, en otras palabras, las variables no explicaban al logaritmo del salario.
Para lo cual se realiza test de multicolinealidad y heterocedasticidad.

1. Multicolinealidad

Cuando dos variables explicativas están altamente relacionadas, podemos hablar de


multicolinealidad. Esto tiene implicaciones en la estabilidad de los coeficientes de
regresión. También proporciona valores "inflados" para errores estándar. Para detectar
la multicolinealidad usaremos dos test de multicolinealidad.

1.1 Identificación problemas de multicolinealidad

1.1.1 TEST MATRIZ DE CORRELACIONES:


 El método para comprobar el grado de asociación entre las variables las probabilidades
de relación deben ser menores a 0.05 para que no exista el problema de
multicolinealidad.
Figura N° 2: Análisis de multicolinealidad en la matriz de correlaciones
Se puede ver que existe una correlación alta, Para mejorar nuestro modelo eliminamos
las variables independientes:
Edad por que se relaciona con años de experiencia (exper)
logro educativo (8 categorías mayores de 10 años) (edu8c10) logro educativo
(6 categorías mayores de 6 años) (edu6c6) por que se relacionan con los años de
educación (aeduc)
sector institucional del trabajo (sit) por que se relaciona con las actividades del
primer trabajo (ae1t1d) y la formalidad del primer trabajo (ft).
años de inicio del primer trabajo (ai1t), años de inicio del segundo trabajo (ai2t)
y años de inicio del tercer trabajo (ait3t), porque se relacionan con la variable
experiencia.

1.1.2 TEST FACTOR DE INFLACION DE VARIANZA (VIF):


Aquella variable cuyo VIF sea mayor a 10 presenta multicolinealidad.

Figura N°3: Análisis de multicolinealidad corregido.

Variable VIF 1/VIF

ts3 4.26 0.234501


set1 4.24 0.235887
t3cc 3.81 0.262218
t1ss 3.81 0.262278
t1cc 3.71 0.269815
t3ss 3.63 0.275452
ft 3.60 0.277969
Interpretación:
tel3 3.39 0.295108 En base a teoría se explica que, si los
elt1 3.27 0.305504 valores son mayores que 10, existe
t2ss 2.43 0.412252 multicolinealidad, pero a través de
ts1 2.31 0.432552
t2cc 2.29 0.436164
nuestros valores se observa un VIF
ts2 2.00 0.501024 menores a 10.
tel2 1.77 0.564838
tel1 1.73 0.578501
aeduc 1.73 0.579578
ae1t1d 1.71 0.584152
qrf 1.59 0.628427
exper 1.33 0.749898
te3 1.22 0.820233
te2 1.19 0.842537
sexo 1.16 0.862400
slpt1 1.13 0.881819

Mean VIF 2.49

.
Fuente: Elaboración Propia.

1.2 Regresión de Variables:

Teniendo en cuenta el mejor modelo sobre salario real por hora de todos los trabajos.

lfrph = f(sexo exper qrf aeduc slpt1 set1 elt1 ae1t1d ft ts1 tel1 t1cc t1ss te2 ts2 tel2 t2cc
t2ss te3 ts3 tel3 t3cc t3ss)

Figura N° 4: Regresión del Modelo

Fuente: Elaboración propia

Se observa en la figura que presenta un R^2 del 22,22%, siendo significativo la


variables independientes .Asimismo un F estadístico significativo,
2. Heterocedasticidad:

2.1 Identificando problemas de Heterocedasticidad:

La heterocedasticidad es un problema que está relacionado con la varianza del error y se


presenta cuando la varianza de las perturbaciones no son constante a lo largo de las
observaciones. Este problema es mas frecuente en los datos de corte transversal.

Para identificar este problema se siguen los siguientes pasos:

Primero. Para poder identificar el problema. Se realiza la grafica de residuos para


observar como es la distribucion de estos. (se usa el comando rvfplot).

Figura N° 5: Grafica de Residuos

GRAFICA DE RESIDUOS
4
2
Residuals
0-2
-4

-1 0 1 2 3
Fitted values

Fuente: Elaboracion propia

 Interpretación:

El grafico representa la distribucion de los errores de las observaciones, se puede


apreciar que la mayoria de las observaciones estan cocentradas entre si, es decir
no estan tan dispersas, sin embargo hay todavia muchas de ellas que se alejan
del punto de concentración, eso nos demuestra que podria haber un problema de
heterocedasticidad, ya que la varianza de estos errores no estarian siendo
homocedasticas. Las causas de este problema podria ser que se estarian
omitiendo variables en el modelo, una formal estructural incorrecta, variables
explicativas con distribucion asimetrica o amplio recorrido (los valores del
regresor esten asociados a una mayor dispersion en el termino del error de la
regresion).

Segundo. Se aplica el Test de Breush-Pagan, la idea de este test es de comprobar si se


puede encontrar un conjunto de variables Z que sirvan para explicar la evolcion de la
varianza de las perturbaciones aleatorias. (se utiliza el comando estat hettest, normal).

2.1.1 TEST DE BREUSH-PAGAN


Figura N°6: Test de Breusch Pagan

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity


Ho: Constant variance
Variables: fitted values of lfrph

chi2(1) = 29.20
Prob > chi2 = 0.0000

.
Fuente: elaboracion propia

Donde:
H 0=Varianza constante (homocedásticas)

H 1=Varianza no constante (heterocedasticas)

Se rechaza la hipótesis nula puesto que la probabilidad es menor al 5%, en ese sentido

determinamos que si existe problemas de heteroscedasticidad.

Tercero. Se aplica el Test de White, la idea de este test es determinar si las variables

explicativas del modelo sirven para determinar la evolución del error al cuadrado. Por
ello, se eliminan las variables tel3 ts1 ts3 t3cc te2 t1cc elt1 t2ss ai1t aeduc edu8c10,

puesto que no son significativas para el modelo, ya que su probabilidad es mayor a 0.05.

Como se observa en la siguiente regresión:

Figura N° 7: Test de White


Source SS df MS Number of obs = 3,110
F(30, 3079) = 31.92
Model 440.67678 30 14.689226 Prob > F = 0.0000
Residual 1416.83464 3,079 .46016065 R-squared = 0.2372
Adj R-squared = 0.2298
Total 1857.51142 3,109 .597462664 Root MSE = .67835

lfrph Coef. Std. Err. t P>|t| [95% Conf. Interval]

sexo -.2151283 .0565155 -3.81 0.000 -.3259401 -.1043165


edad .0246538 .0081445 3.03 0.002 .0086845 .0406231
exper -.0001098 .0000969 -1.13 0.257 -.0002999 .0000803
qrf .08663 .0109883 7.88 0.000 .0650849 .1081751
edu8c10 -.0530727 .0260787 -2.04 0.042 -.1042062 -.0019393
edu6c6 .1063817 .035202 3.02 0.003 .0373599 .1754034
aeduc .0151048 .0091314 1.65 0.098 -.0027994 .033009
slpt1 -.7334936 .134509 -5.45 0.000 -.9972301 -.469757
set1 -.0990853 .0380983 -2.60 0.009 -.1737859 -.0243847
elt1 .0234306 .0253106 0.93 0.355 -.0261967 .0730579
ae1t1d -.0190721 .0029116 -6.55 0.000 -.0247809 -.0133633
ft .2302413 .0629847 3.66 0.000 .106745 .3537375
sit -.151935 .0383323 -3.96 0.000 -.2270944 -.0767756
ai1t .0041759 .0024085 1.73 0.083 -.0005466 .0088984
ts1 -.0087746 .0248649 -0.35 0.724 -.0575281 .0399789
tel1 -.035961 .0130837 -2.75 0.006 -.0616147 -.0103073
t1cc -.063629 .0566407 -1.12 0.261 -.1746865 .0474284
t1ss -.1187868 .0606783 -1.96 0.050 -.2377609 .0001873
ai2t .0064073 .0026695 2.40 0.016 .001173 .0116415
te2 -.0097904 .0157687 -0.62 0.535 -.0407086 .0211278
ts2 -.0489355 .0216278 -2.26 0.024 -.0913418 -.0065291
tel2 .0275168 .0144702 1.90 0.057 -.0008555 .0558891
t2cc -.0506556 .0395811 -1.28 0.201 -.1282637 .0269524
t2ss -.0691985 .0452562 -1.53 0.126 -.1579339 .019537
ai3t -.0106514 .0021768 -4.89 0.000 -.0149194 -.0063833
te3 -.0653233 .0365972 -1.78 0.074 -.1370808 .0064341
ts3 -.0143364 .0251297 -0.57 0.568 -.063609 .0349362
tel3 -.00588 .021331 -0.28 0.783 -.0477044 .0359444
t3cc -.0275966 .0488437 -0.56 0.572 -.1233661 .0681728
t3ss -.0922941 .0466095 -1.98 0.048 -.183683 -.0009053
_cons 3.870271 .5734022 6.75 0.000 2.745981 4.994561

Fuente: Elaboración propia

Después de eliminar las variables que no son significativas para el modelo se regresiona

el nuevo modelo con variables significativas. (Se usa el comando reg de la siguiente
forma: reg lfrph sexo edad exper qrf edu6c6 slpt1 set1 ae1t1d ft sit tel1 t1ss ai2t ts2

tel2 t2cc ai3t te3 t3ss).

Figura N° 8: Regresión del nuevo modelo.


Source SS df MS Number of obs = 3,110
F(19, 3090) = 49.66
Model 434.486281 19 22.867699 Prob > F = 0.0000
Residual 1423.02514 3,090 .460525936 R-squared = 0.2339
Adj R-squared = 0.2292
Total 1857.51142 3,109 .597462664 Root MSE = .67862

lfrph Coef. Std. Err. t P>|t| [95% Conf. Interval]

sexo -.2089265 .0559941 -3.73 0.000 -.318716 -.0991371


edad .0258272 .0080392 3.21 0.001 .0100645 .0415899
exper -.0001328 .0000958 -1.39 0.166 -.0003207 .0000551
qrf .0894774 .0108991 8.21 0.000 .0681073 .1108476
edu6c6 .079643 .0101225 7.87 0.000 .0597954 .0994905
slpt1 -.8042734 .1030876 -7.80 0.000 -1.006401 -.6021462
set1 -.1228318 .0279019 -4.40 0.000 -.1775399 -.0681237
ae1t1d -.0185905 .0028686 -6.48 0.000 -.024215 -.012966
ft .2510259 .058014 4.33 0.000 .1372761 .3647757
sit -.1726526 .0275939 -6.26 0.000 -.2267568 -.1185483
tel1 -.0371461 .0127357 -2.92 0.004 -.0621175 -.0121748
t1ss -.1929213 .041067 -4.70 0.000 -.2734428 -.1123998
ai2t .0089738 .0020304 4.42 0.000 .0049927 .0129548
ts2 -.061327 .019743 -3.11 0.002 -.1000377 -.0226162
tel2 .0300597 .0138654 2.17 0.030 .0028735 .0572459
t2cc -.0804545 .0345958 -2.33 0.020 -.1482877 -.0126214
ai3t -.0090375 .0020323 -4.45 0.000 -.0130224 -.0050527
te3 -.0694438 .035273 -1.97 0.049 -.1386046 -.000283
t3ss -.1233781 .0375526 -3.29 0.001 -.1970087 -.0497475
_cons 4.016748 .4300611 9.34 0.000 3.173514 4.859983

Fuente: Elaboración propia

Se puede observar que el indicador R-cuadrado tiene una probabilidad de 0.2339, es


decir no es tan alto y se debe al problema de heterocedasticidad que tiene el modelo.
Por otro lado el indicador de significancia global F-Statistic=49.66, es decir es más alta
que en la regresión anterior, por lo que representa que las variables en su conjunto si
estarían explicando el modelo.

Finalmente se aplica el Test de White (se usa el comando imtest,white).


2.2.2 TEST DE WHITE

Figura N° 9: Test de White


White's test for Ho: homoskedasticity
against Ha: unrestricted heteroskedasticity

chi2(200) = 267.93
Prob > chi2 = 0.0009

Cameron & Trivedi's decomposition of IM-test

Source chi2 df p

Heteroskedasticity 267.93 200 0.0009


Skewness 43.22 19 0.0012
Kurtosis 39.94 1 0.0000

Total 351.08 220 0.0000

Fuente: Elaboracion propia

Donde:
H 0=Existe homocedasticidad

H 1=No existe homocedasticidad ,(existe heterocedasticidad )

Se rechaza la hipótesis nula puesto que las probabilidad es menos al 5%, en ese sentido

determinamos que si existe problemas de heteroscedasticidad.

2.2. Regresión de Variables:

Cuarto. Se corrige el problema de heterocedasticidad con las varianzas robustas.


Entonces se vuelve a regresionar. (Se usa el comando reg robust; de la siguiente
manera: reg lfrph sexo edad exper qrf edu6c6 slpt1 set1 ae1t1d ft sit tel1 t1ss ai2t
ts2 tel2 t2cc ai3t te3 t3ss, robust).
Figura N° 10:Correccion del problema de Heterocedasticidad

Linear regression Number of obs = 3,110


F(19, 3090) = 60.38
Prob > F = 0.0000
R-squared = 0.2339
Root MSE = .67862

Robust
lfrph Coef. Std. Err. t P>|t| [95% Conf. Interval]

sexo -.2089265 .0594837 -3.51 0.000 -.3255581 -.092295


edad .0258272 .0082218 3.14 0.002 .0097064 .041948
exper -.0001328 .0001019 -1.30 0.193 -.0003327 .0000671
qrf .0894774 .0105111 8.51 0.000 .0688679 .110087
edu6c6 .079643 .0105957 7.52 0.000 .0588677 .1004182
slpt1 -.8042734 .0911856 -8.82 0.000 -.9830639 -.6254829
set1 -.1228318 .0273298 -4.49 0.000 -.1764183 -.0692453
ae1t1d -.0185905 .0029816 -6.24 0.000 -.0244366 -.0127444
ft .2510259 .0573167 4.38 0.000 .1386432 .3634087
sit -.1726526 .025416 -6.79 0.000 -.2224864 -.1228187
tel1 -.0371461 .012421 -2.99 0.003 -.0615004 -.0127918
t1ss -.1929213 .0453216 -4.26 0.000 -.2817848 -.1040578
ai2t .0089738 .0022675 3.96 0.000 .0045279 .0134196
ts2 -.061327 .022294 -2.75 0.006 -.1050395 -.0176144
tel2 .0300597 .0137149 2.19 0.028 .0031684 .056951
t2cc -.0804545 .0375118 -2.14 0.032 -.1540052 -.0069039
ai3t -.0090375 .0022697 -3.98 0.000 -.0134877 -.0045873
te3 -.0694438 .0333881 -2.08 0.038 -.1349089 -.0039788
t3ss -.1233781 .0398139 -3.10 0.002 -.2014426 -.0453136
_cons 4.016748 .3739904 10.74 0.000 3.283453 4.750043

Fuente: Elaboración propia

Se llega a la conclusión de que la variable Empleo del tercer trabajo, lo cual generaba

problemas de heteroscedasticidad ha sido corregida, puesto que ahora la prob=0.038,

esto quiere decir que la variable Empleo del tercer trabajo es significativo para el

modelo econométrico, y además ya no genera heteroscedasticidad para nuestro modelo.

Por otro lado en el indicador de significancia global, se observa que el F-

Estadístico=60.38, es decir los coeficientes de las variables explicativas en cojunto son

significativas para el modelo.


Finalmente se realiza la regresion robusta de las variables, esto genera una versión
robusta de la variable dependiente sobre las independientes. (Se usa el comando: rreg
lfrph sexo edad exper qrf edu6c6 slpt1 set1 ae1t1d ft sit tel1 t1ss ai2t ts2 tel2 t2cc
ai3t te3 t3ss).

Figura N° 11:
Huber iteration 1: maximum difference in weights = .82193228
Huber iteration 2: maximum difference in weights = .09867496
Huber iteration 3: maximum difference in weights = .01891849
Biweight iteration 4: maximum difference in weights = .29284346
Biweight iteration 5: maximum difference in weights = .03265407
Biweight iteration 6: maximum difference in weights = .00989652

Robust regression Number of obs = 3,109


F( 19, 3089) = 62.57
Prob > F = 0.0000

lfrph Coef. Std. Err. t P>|t| [95% Conf. Interval]

sexo -.1911787 .047074 -4.06 0.000 -.2834783 -.0988792


edad .0214709 .0068234 3.15 0.002 .0080921 .0348498
exper -.000125 .0000805 -1.55 0.121 -.0002829 .0000329
qrf .0937185 .0091631 10.23 0.000 .075752 .1116849
edu6c6 .0870278 .0087989 9.89 0.000 .0697756 .10428
slpt1 -.8407226 .0866497 -9.70 0.000 -1.010619 -.6708257
set1 -.1520893 .0234516 -6.49 0.000 -.1980715 -.106107
ae1t1d -.0167671 .0024169 -6.94 0.000 -.0215059 -.0120282
ft .2078915 .0487793 4.26 0.000 .1122484 .3035347
sit -.1854946 .0232237 -7.99 0.000 -.2310301 -.1399591
tel1 -.0228223 .0107123 -2.13 0.033 -.0438263 -.0018184
t1ss -.1820167 .0345261 -5.27 0.000 -.2497132 -.1143202
ai2t .0039311 .0019184 2.05 0.041 .0001696 .0076927
ts2 -.0526392 .016594 -3.17 0.002 -.0851755 -.0201029
tel2 .0245228 .011654 2.10 0.035 .0016724 .0473732
t2cc -.0809067 .0294993 -2.74 0.006 -.1387469 -.0230665
ai3t -.0080065 .0018672 -4.29 0.000 -.0116676 -.0043453
te3 -.0392291 .0296478 -1.32 0.186 -.0973604 .0189022
t3ss -.1047774 .0315627 -3.32 0.001 -.1666634 -.0428915
_cons 12.16369 3.32382 3.66 0.000 5.646565 18.68081

Fuente: Elaboracion propia


.

Se observa que con esta regresión robusta de variables se ajustó los valores del p-value

de las variables que aparentemente no son significativas para el modelo. La

probabilidad de la variable experiencia ahora es de 0.121, es decir los errores de esta

variable se ajustó, por lo que bajo. También se observa que el indicador de significancia
global F-Estadístico=62.57, es decir los coeficientes de las variables explicativas en

conjunto son aún más significativas para el modelo.


ESTADISTICAS UNIVARIADAS

Las estadísticas univariadas incluyen la media, mediana y diferentes percentiles, moda,


los valores máximos y mínimos, así como las medias de dispersión (rango, deviación
estándar), comúnmente utilizadas en estadística para resumir información.
La base de datos que emplearemos es la de ELMPS y se puede acceder a la misma a la
misma a través del comando use.

. use "E:\VII Semestre\Tecnologias\Editor de datos-ELMPS.dta"


(demographic)

. describe

Contains data from E:\VII Semestre\Tecnologias\Editor de datos-ELMPS.dta


obs: 137,951 demographic
vars: 66 15 May 2020 23:21
size: 26,348,641

storage display value


variable name type format label variable label

ronda int %9.0g ronda de encuesta


id str11 %11s identificacion de la persona
idhog str9 %9s identificacion del hogar
icodhh byte %9.0g codigo de identificacion del hogar
ihp str9 %9s identificacion unica del hogar por primera vez
iip str11 %11s identificacion unica de la primera observacion
irp byte %28.0g Lattr_98_06_12
inclusion en rondas de paneles
ih12 str9 %9s identificacion del hogar en el 2012
ih06 str8 %9s identificacion del hogar en el 2006
ih98 str8 %9s identificacion del hogar en 1998
id12 str11 %11s identificacion individual en el 2012
id06 str10 %10s Individual ID in 2006
id98 str10 %10s identificacion individual en 1998
np12 byte %9.0g numero de personas en el 2012
np06 byte %9.0g numero de personas en el 2006
np98 byte %9.0g Person No. in 1998
ino12 byte %9.0g observacion individual en el 2012
ino06 byte %9.0g observacion individual en el 2006
ino98 byte %9.0g Individual observed in 1998 round
ih_06_12 str8 %9s en el 2006 de los hogares del panel en el 2012
ih_98_06 str8 %9s en 1998 de los hogares del panel en el 2006
fe float %9.0g factor de expansion
sexo byte %9.0g gender 1 femenino;0 masculino
edad int %9.0g edad
qrf byte %9.0g quintiles de riqueza familiar
edu8c10 byte %31.0g educ2 logro educativo(8 categorias mayores de 10 años)
edu6c6 byte %25.0g lvlofedu logro educativo(6 categoris mayores de 6 años)
aeduc byte %9.0g años de educacion
codph byte %9.0g codigo del padre si esta en el hogar
codmh byte %9.0g codigo del madre si esta en el hogar
trab1 int %9.0g año del primer trabajo
de1s byte %9.0g desempleados durante una semana
em1s byte %9.0g empleado con referencia a la primera semana
mo1s byte %9.0g mano de obra en la primera semana
moe1s byte %9.0g mano de obra extra en la primera semana
slpt1 byte %32.0g empsts situacion laboral del primer trabajo
set1 byte %20.0g sector sector economico del primer trabajo
elt1 byte %15.0g nstabilit
estabilidad laboral del primer trabajo
ae1t1d byte %73.0g ecac1d actividad economica del primer trabajo
ft byte %11.0g Formal formalidad del primer trabajo
sit byte %32.0g Lcrinstsec
sector institucional del trabajo
frph float %9.0g salario real por hora de todos los trabajos
ai1t int %8.0g año de inicio del primer trabajo
te1 byte %41.0g Lmempst empleo del primer trabajo
ts1 byte %43.0g sector sector del primer trabajo
tel1 byte %12.0g stab estabilidad laboral del primer trabajo
t1cc byte %9.0g LABB contrato compatible del primer trabajo
t1ss byte %8.0g LABL seguridad social del primer trabajo
ai2t int %8.0g año de inicio del segundo trabajo
te2 byte %41.0g Lmempst empleo del segundo trabajo
ts2 byte %43.0g sector sector del segundo trabajo
tel2 byte %12.0g stab estabilidad laboral del segundo trabajo
t2cc byte %9.0g LABB contrato compatible del segundo trabajo
t2ss byte %8.0g LABL seguridad social del segundo trabajo
ai3t int %8.0g año de inicio del tercer trabajo
te3 byte %41.0g Lmempst empleo del tercer trabajo
ts3 byte %43.0g sector sector del tercer trabajo
tel3 byte %12.0g stab estabilidad laboral del tercer trabajo
t3cc byte %9.0g LABB contrato compatible del tercer trabajo
t3ss byte %8.0g LABL seguridad social del tercer trabajo
pp_98_06 float %9.0g peso del panel para paneles de 1998 al 2006
pp_98_06_12 float %9.0g peso del panel para paneles de 1998 al 2012
pp_06_12 float %9.0g peso del panel para paneles de 2006 al 2012
Female str1 %9s 1 femenino;0 masculino
lfrph float %9.0g logaritmo del salrio real
exper int %9.0g experiencia

Sorted by:

.
Figura N° 12: Utilización de los comandos use y describe
1. Comando SUM:

Las estadísticas que se obtienen con la instrucción sum son de gran utilidad, ya que nos
ayudan a visualizar valores maximos y minimos, asi como los puntes de corte para los
percentiles más utilizados.
Figura N° 13: Utilizando el comando (sum frph, detail)

. sum frph

Variable Obs Mean Std. Dev. Min Max

frph 27,358 6.018589 12.24494 .0434572 807.6923

. sum frph, detail

salario real por hora de todos los trabajos

Percentiles Smallest
1% .63877 .0434572
5% 1.318681 .0482858
10% 1.807289 .0663338 Obs 27,358
25% 2.808853 .0869145 Sum of Wgt. 27,358

50% 4.273504 Mean 6.018589


Largest Std. Dev. 12.24494
75% 6.47908 523.5053
90% 10 578.7101 Variance 149.9385
95% 13.50185 715.6093 Skewness 30.30018
99% 35.71429 807.6923 Kurtosis 1506.246

Fuente: Elaboración propia.


La Skewness y Kurtosis proporcionan información sobre la simetría de la distribución
(para skewness el valor esperado es 20 y para la kurtosis el valor esperado es 1506). Por
otro lado están los percentiles que indican la posición de diferentes valores en relación
al resto de las observaciones y se obtienen ordenando de mayor a menor.
2. Comando MEANS:

Otra manera de representar los datos es mediante el cálculo de medias armónica y


geométrica.
Figura N° 14: Media aritmética, media geométrica y media armónica (means)
. means frph

Variable Type Obs Mean [95% Conf. Interval]

frph Arithmetic 27,358 6.018589 5.873485 6.163694


Geometric 27,358 4.268906 4.23126 4.306887
Harmonic 27,358 3.164794 3.114217 3.217042

.
Fuente: Elaboración propia.
Existen otros estimadores del centro de la distribución que se basan en la exclusión de
cierta proporción de valores extremos. Estos estimadores se conocen como trimmed
means o también conocidas por medias recortadas. La manera de estimar las medianas
recortadas se puede entender como comparar la manera de estimar la media y la
mediana.
Figura N° 15: Sum con restricciones

. sum frph

Variable Obs Mean Std. Dev. Min Max

frph 27,358 6.018589 12.24494 .0434572 807.6923

. sum frph if frph>0 & frph<900

Variable Obs Mean Std. Dev. Min Max

frph 27,358 6.018589 12.24494 .0434572 807.6923

. sum frph if frph>20 & frph<100

Variable Obs Mean Std. Dev. Min Max

frph 610 37.72607 19.32114 20.00983 98.9011

. sum frph if frph>150 & frph<500

Variable Obs Mean Std. Dev. Min Max

frph 15 227.63 76.9787 150.8111 436.9927

Fuente: Elaboración propia.


3. Diagrama Tallo-hoja

En su estructura más simple, se trata de una serie de números. La presentación del tipo
tallo-hoja permite explorar la estructura de los datos, mediante este grafico se puede
evaluar:
 Si la estructura es simétrica.
 La dispersión
 Situación especial de algún valor
 Concentración de datos
 Patrones de dispersión y errores de digito
Para construir este grafico es muy simple y consiste en una presentación de los datos
ordenados de mayor a menor.
Figura N° 16: Diagrama de tallo-hoja (stem)
. stem frph

Stem-and-leaf plot for frph (salario real por hora de todos los trabajos)

frph rounded to integers

0* 00000000000000000000000000000000000000000000000000000000000 ... (14586)


0. 555555555555555555555555555555555555555555555555555555555555 ... (9692)
1* 000000000000000000000000000000000000000000000000000000000000 ... (1918)
1. 5555555555555555555555555555555555555555555555555555555555555 ... (479)
2* 0000000000000000000000000000000000000000011111111111111111111 ... (219)
2. 55555555555555555555555555555666666666666666677777777777777777 ... (95)
3* 00000000000000000001111111111112222222222222233333333333333333 ... (74)
3. 5555555555555555556666666666677777778888888888888888889999
4* 00000111112222222333333333344444
4. 55555566666666677777888888899999
5* 000111122222333334444
5. 55566777788888889999
6* 00011222
6. 578888889999999
7* 000122344
7. 555666777777888999
8* 00123
8. 55566688899
9* 23344
9. 556678888999
10* 0234
10. 568
11* 01112
11. 555558
12* 12
12. 6
13* 44
13. 57
14* 0344
14. 5
15* 14
15.
16* 4
16.
17*
17.
18* 0
18. 5
19*
19.
20* 2
20. 78
21*
21. 7
22* 2
22.
23* 11
23.
24*

Fuente: Elaboración propia.


24.
25*
25.
Donde por ejemplo
26*
26.
0*| 00000000…0
27* 1 corresponde al valor minimo(14586)
27.
16*|4 corresponde una observación con valor de 16,4
28*
28.
29*
29.
30*
30.
31*
31.
32*
4. Grafico de la Caja (boxplots)

Este tipo de grafico es una representación simple de la información, que indica:


 La localización del centro de datos
 La dispersión
 La simetría
 La extensión de los extremos(colas de distribución)
 La existencia de valores aberrantes
El grafico de la caja es un buen instrumento para realizar comparaciones entre
diferentes categorías. La ventaja del diagrama de caja, basado en los rangos
intercuartiles, es que es resistente al impacto de valores extremos
Ejemplo:
graph box frph
Figura N° 17: Diagrama de la caja de frph
800
salario real por hora de todos los trabajos
200 400
0 600

Fuente:
1. Male 2. Female
Elaboración
800

propia.
salario real por hora de todos los trabajos

graph box frph


if frph>100,
600

by(sexo)
Figura N° 18:
400

Diagrama de la
caja con
restricción
200
0

Graphs by 1 femenino;0 masculino


Fuente: Elaboración propia.
Es de utilidad poder tener el grafico de caja para comparar la distribución de los valores
observados(en este ultimo caso se graficaron los valores observados en salario real por
hora de todos los trabajos por sexo).
5. Normalidad:
Existen diversos metodos para evaluar la normalidad ; probablemente el mas utilizado
es el grafico de la variable original, en relacion a su transformación como una variable
normalizada. De este grafico se puede obtener información sobre la falta de normalidad.
.qnorm frph
Figura N° 19: Grafico de Normalidad de la variable frph
800
salario real por hora de todos los trabajos
200 400
0 600

-40 -20 0 20 40 60
Inverse Normal

.symplot frph
Figura N° 19: Grafico de Normalidad de la variable frph

800 600 salario real por hora de todos los trabajos


Distance above median
200 400
0

0 1 2 3 4
Distance below median

Para realizar este grafico debemos calcular la diferencia entre la mediana y el valor
observado. Como valores esperados podemos graficar el valor observado vs. El mismo
valor observado. Si la distribución es simétrica todos los valores deben quedar por
debajo del valor esperado.
EVALUACIÓN DE LA NORMALIDAD

1. Métodos Gráficos:
Analizamos la normalidad de dos variables: Actividad económica del primer trabajo
(ae1t1d) y Sector institucional del trabajo (sit).

1.1 VARIABLE 1: Actividad Económica del primer trabajo


1.1. 1 Diagrama de tallo-hoja
Figura N° 20: Análisis de la variable Actividad económica del primer trabajo.

Variable Obs Mean Std. Dev. Min Max

ae1t1d 48,234 5.540925 5.866527 0 20

Fuente: Elaboración propia

Interpretación:
Se observa que el promedio de la variable actividad económica del primer trabajo es
5.5; de ello se interpreta que el 7.02% y el 11.97% de todas las observaciones tiene una
actividad económica de construcción y comercio mayorista respectivamente. De todas
las observaciones se muestra que los encuestados pueden tener una actividad económica
de la agricultura, silvicultura y pesca hasta actividades de extraterritorial que sería el
máximo. La desviación estándar es de 5.866 es decir casi en relación con la media por
lo que si puede representar los valores típicos de este conjunto de observaciones.

Figura N°21: Método de tallo y hojas de la variable actividad económica del primer
trabajo
0* 000000000000000000000000000000000000000000000000000000000000 ... (17059)
0* 11111111111111111111111111111111111111111111111111111111111111 ... (102)
0* 2222222222222222222222222222222222222222222222222222222222222 ... (5767)
0* 33333333333333333333333333333333333333333333333333333333333333 ... (316)
0* 44444444444444444444444444444444444444444444444444444444444444 ... (262)
0* 5555555555555555555555555555555555555555555555555555555555555 ... (3386)
0* 6666666666666666666666666666666666666666666666666666666666666 ... (5776)
0* 7777777777777777777777777777777777777777777777777777777777777 ... (2472)
0* 8888888888888888888888888888888888888888888888888888888888888 ... (1034)
0* 99999999999999999999999999999999999999999999999999999999999999 ... (436)
1* 00000000000000000000000000000000000000000000000000000000000000 ... (434)
1* 111111111111111111111111
1* 22222222222222222222222222222222222222222222222222222222222222 ... (459)
1* 33333333333333333333333333333333333333333333333333333333333333 ... (146)
1* 4444444444444444444444444444444444444444444444444444444444444 ... (3628)
1* 5555555555555555555555555555555555555555555555555555555555555 ... (4165)
1* 6666666666666666666666666666666666666666666666666666666666666 ... (1253)
1* 77777777777777777777777777777777777777777777777777777777777777 ... (228)
1* 8888888888888888888888888888888888888888888888888888888888888 ... (1115)
1* 99999999999999999999999999999999999999999999999999999999999999 ... (168)
2* 0000
Fuente: Elaboración propia

Interpretación:
Analizando el grafico del Método de tallo y hojas de la variable actividad económica del
primer trabajo se observa a simple vista que esta variable no tiene una distribución
normal dado que una distribución normal debería comenzar con pocas distribuciones e
ir aumentando y posteriormente disminuir. En consecuencia se concluye que la variable
sector institucional del trabajo no tiene una distribución normal.
Figura N° 22: Método de tallo y hojas de la variable actividad económica del primer
trabajo en dos poblaciones: Masculino y femenino
-> sexo = 1. Male

Stem-and-leaf plot for ae1t1d (actividad economica del primer trabajo)

0* 0000000000000000000000000000000000000000000000000000000000000 ... (7528)


0* 11111111111111111111111111111111111111111111111111111111111111 ... (100)
0* 2222222222222222222222222222222222222222222222222222222222222 ... (4880)
0* 33333333333333333333333333333333333333333333333333333333333333 ... (292)
0* 44444444444444444444444444444444444444444444444444444444444444 ... (232)
0* 5555555555555555555555555555555555555555555555555555555555555 ... (3347)
0* 6666666666666666666666666666666666666666666666666666666666666 ... (4674)
0* 7777777777777777777777777777777777777777777777777777777777777 ... (2402)
0* 88888888888888888888888888888888888888888888888888888888888888 ... (959)
0* 99999999999999999999999999999999999999999999999999999999999999 ... (359)
1* 00000000000000000000000000000000000000000000000000000000000000 ... (311)
1* 1111111111111111111111
1* 22222222222222222222222222222222222222222222222222222222222222 ... (364)
1* 33333333333333333333333333333333333333333333333333333333333333 ... (129)
1* 4444444444444444444444444444444444444444444444444444444444444 ... (2700)
1* 5555555555555555555555555555555555555555555555555555555555555 ... (2100)
1* 66666666666666666666666666666666666666666666666666666666666666 ... (587)
1* 77777777777777777777777777777777777777777777777777777777777777 ... (191)
1* 8888888888888888888888888888888888888888888888888888888888888 ... (1060)
1* 9999999999999999999999999999999999999999999999999999999999999999999
2* 0000

-> sexo = 2. Female

Stem-and-leaf plot for ae1t1d (actividad economica del primer trabajo)

0* 0000000000000000000000000000000000000000000000000000000000000 ... (9531)


0* 11
0* 22222222222222222222222222222222222222222222222222222222222222 ... (887)
0* 333333333333333333333333
0* 444444444444444444444444444444
0* 555555555555555555555555555555555555555
0* 6666666666666666666666666666666666666666666666666666666666666 ... (1102)
0* 7777777777777777777777777777777777777777777777777777777777777777777777
0* 888888888888888888888888888888888888888888888888888888888888888 ... (75)
0* 999999999999999999999999999999999999999999999999999999999999999 ... (77)
1* 00000000000000000000000000000000000000000000000000000000000000 ... (123)
1* 11
1* 222222222222222222222222222222222222222222222222222222222222222 ... (95)
1* 33333333333333333
1* 44444444444444444444444444444444444444444444444444444444444444 ... (928)
1* 5555555555555555555555555555555555555555555555555555555555555 ... (2065)
1* 66666666666666666666666666666666666666666666666666666666666666 ... (666)
1* 7777777777777777777777777777777777777
1* 8888888888888888888888888888888888888888888888888888888
1* 99999999999999999999999999999999999999999999999999999999999999 ... (101)

Fuente: Elaboración propia


Interpretación:
Se analiza la normalidad de la variable actividad económica del primer trabajo en dos
poblaciones, masculino y femenino. Primero se observa la distribución de la variable
actividad económica del primer trabajo pero solo de los varones e inmediatamente se
concluye que la distribución de esta variable en dicha población no es normal, debido a
que se observa una distribución asimétrica de las observaciones. Segundo se observa la
distribución de la misma variable pero, esta vez en la población de solo mujeres y
también se llega a la misma conclusión, es decir, la distribución de la variable sector
institucional del trabajo con respecto a las mujeres no tiene un distribución normal.

1.1.2 Histograma
Figura N° 23: Histograma de la variable actividad económica

HISTOGRAMA
(Actividad Economica)
.8
.6
Density
.4
.2
0

0 5 10 15 20
Actividad economica del primer trabajo

Fuente: Elaboración propia

Interpretación:

Se analiza la normalidad de la actividad económica del primer trabajo en un gráfico de


histograma. Se observa que la distribución de esta variable a simple vista no tiene una
distribución normal puesto que, las barras no se encuentran simétricamente y además la
línea amarilla que debería seguir una distribución normal y ser simétrica no se asemeja
en nada a la línea de una distribución normal.
Figura N° 24: Histograma de la variable actividad económica en dos poblaciones

HISTOGRAMA
(Actividad Economica: Masculino, Femenino)
MASCULINO FEMENINO
1.5
1
Density
.5
0

0 5 10 15 20 0 5 10 15 20
actividad economica del primer trabajo
Density
normal ae1t1d

Fuente: Elaboración propia

Interpretación:

Se analiza la normalidad de la variable actividad económica del primer trabajo en dos


poblaciones, masculino y femenino; en un histograma. Primero se observa la
distribución de la variable actividad económica del primer trabajo con respecto a los
varones nos muestra una distribución asimétrica de esta variable, además la línea negra
que debería seguir una distribución normal no se asemeja en nada a dicha distribución
por lo que no es simétrica. En consecuencia se concluye que la variable actividad
económica del primer trabajo en la población de varones no tiene una distribución
normal. Segundo se observa la distribución de la misma variable pero, esta vez en la
población de mujeres y también se llega a la misma conclusión, es decir, la distribución
de la variable actividad económica del primer trabajo con respecto a las mujeres no
tiene un distribución normal.
1.1.3 Densidad de Kernel
Figura N° 25: Estimación de la densidad de Kernel

ESTIMACION DE LA DENSIDAD KERNEL


.2
.15
Densidad
.1
.05
0

0 5 10 15 20
Actividad economica del primer trabajo

Kernel density estimate


kernel = epanechnikov, bandwidth = 0.6109 Normal density

Fuente: elaboración propia

Interpretación:
Se analiza la estimación de la densidad de la variable actividad económica del primer
trabajo. La línea roja representa una densidad que debería ser una distribución normal.
Por otro lado la línea azul nos representa la densidad de nuestra variable (actividad
económica del primer trabajo) puesto que se observa que ambas líneas no se asemejan
en nada. Se concluye que esta variable no tiene una distribución normal.

1.2 VARIABLE N°2: Sector institucional del trabajo

Figura N° 26: Análisis de la variable sector institucional del trabajo


. sum sit

Variable Obs Mean Std. Dev. Min Max

sit 38,959 6.201186 2.77315 1 10

Fuente: Elaboración propia

Interpretación:
Se observa que el promedio de la variable sector institucional del trabajo es 6.2, de ello
se interpreta que el 10.31% de todas las observaciones recibe un salario irregular y que
las otras categorías de la variable sector institucional del trabajo también se encuentran
por ese rango. De todas las observaciones se muestra que los encuestados pueden
encontrarse en el sector institucional de autónomo hasta gobierno que sería el máximo.
La desviación estándar es de 2.77 es decir se aleja del valor de la media por lo que se
concluye que no puede representar los valores típicos de este conjunto de
observaciones.

1.2.1 Diagrama de Tallo-hoja

Figura N° 27: Método de tallo y hojas de la variable sector institucional del trabajo
Stem-and-leaf plot for sit (sector institucional del trabajo)

0* 11111111111111111111111111111111111111111111111111111111111111 ... (584)


0* 2222222222222222222222222222222222222222222222222222222222222 ... (2691)
0* 3333333333333333333333333333333333333333333333333333333333333 ... (4006)
0* 4444444444444444444444444444444444444444444444444444444444444 ... (8408)
0* 55555555555555555555555555555555555555555555555555555555555555 ... (816)
0* 6666666666666666666666666666666666666666666666666666666666666 ... (4015)
0* 7777777777777777777777777777777777777777777777777777777777777 ... (5014)
0* 8888888888888888888888888888888888888888888888888888888888888 ... (3000)
0* 9999999999999999999999999999999999999999999999999999999999999 ... (1542)
1* 0000000000000000000000000000000000000000000000000000000000000 ... (8883)

Fuente: Elaboración propia

Interpretación:

Analizando el grafico del Método de tallo y hojas de la variable sector institucional del
trabajo se observa a simple vista que esta variable no tiene una distribución normal dado
que una distribución normal debería comenzar con pocas distribuciones e ir aumentando
y posteriormente disminuir. Se concluye que la variable sector institucional del trabajo
no tiene una distribución normal.
Figura N° 28: Método de tallo y hojas de la variable sector institucional del trabajo
en dos poblaciones masculino y femenino
Stem-and-leaf plot for sit (sector institucional del trabajo)

0* 11111111111111111111111111111111111111111111111111111111111111 ... (393)


0* 2222222222222222222222222222222222222222222222222222222222222 ... (2151)
0* 3333333333333333333333333333333333333333333333333333333333333 ... (3774)
0* 4444444444444444444444444444444444444444444444444444444444444 ... (1434)
0* 55555555555555555555555555555555555555555555555555555555555555 ... (470)
0* 6666666666666666666666666666666666666666666666666666666666666 ... (3869)
0* 7777777777777777777777777777777777777777777777777777777777777 ... (4464)
0* 8888888888888888888888888888888888888888888888888888888888888 ... (2614)
0* 9999999999999999999999999999999999999999999999999999999999999 ... (1366)
1* 0000000000000000000000000000000000000000000000000000000000000 ... (5747)

-> sexo = 2. Female

Stem-and-leaf plot for sit (sector institucional del trabajo)

0* 11111111111111111111111111111111111111111111111111111111111111 ... (191)


0* 22222222222222222222222222222222222222222222222222222222222222 ... (540)
0* 33333333333333333333333333333333333333333333333333333333333333 ... (232)
0* 4444444444444444444444444444444444444444444444444444444444444 ... (6974)
0* 55555555555555555555555555555555555555555555555555555555555555 ... (346)
0* 66666666666666666666666666666666666666666666666666666666666666 ... (146)
0* 77777777777777777777777777777777777777777777777777777777777777 ... (550)
0* 88888888888888888888888888888888888888888888888888888888888888 ... (386)
0* 99999999999999999999999999999999999999999999999999999999999999 ... (176)
1* 0000000000000000000000000000000000000000000000000000000000000 ... (3136)

Fuente: Elaboración propia

Interpretación:
Se analiza la normalidad de la variable sector institucional del trabajo en dos
poblaciones, masculino y femenino. Primero se observa la distribución de la variable
sector institucional del trabajo pero solo de los varones e inmediatamente se concluye
que la distribución de esta variable en dicha población no es normal. Segundo se
observa la distribución de la misma variable pero, esta vez en la población de solo
mujeres y también se llega a la misma conclusión, es decir, la distribución de la variable
sector institucional del trabajo con respecto a las mujeres no tiene un distribución
normal.
1.2.2 Histograma

Figura N° 29: Histograma de la variable sector institucional del trabajo

HISTOGRAMA
(Sector Institucional del Trabajo)
1.5
1
Densidad
.5
0

0 2 4 6 8 10
Sector institucional del trabajo

Fuente: Elaboración propia

Interpretación:

Se analiza la normalidad de la variable sector institucional del trabajo en un gráfico


de histograma. Se observa que la distribución de la variable sector institucional del
trabajo a simple vista no tiene una distribución normal puesto que, las barras no se
encuentran simétricamente y además la línea roja que debería seguir una
distribución normal no se asemeja en nada a una distribución normal simétrica.
Figura N° 30: Histograma de la variable sector institucional del trabajo en dos
poblaciones

HISTOGRAMA
(Sector institucional del trabajo:Masculino, Femenino)
MASCULINO FEMENINO
3
Densidad
2
1
0

0 5 10 0 5 10
Sector institucional del trabajo

Density
normal sit

Fuente: Elaboración propia

Interpretación:
Se analiza la normalidad de la variable sector institucional del trabajo en dos
poblaciones, masculino y femenino; en un histograma. Primero se observa la
distribución de la variable sector institucional del trabajo con respecto a los varones nos
muestra una distribución asimétrica de esta variable, además la línea roja que debería
seguir una distribución normal no se asemeja en nada a dicha distribución. Por lo que se
concluye que la variable sector institucional del trabajo de la población de varones no
tiene una distribución normal. Segundo se observa la distribución de la misma variable
pero, esta vez en la población de mujeres y también se llega a la misma conclusión, es
decir, la distribución de la variable sector institucional del trabajo con respecto a las
mujeres no tiene un distribución normal.
1.2.3 Densidad de Kernel

Figura N° 31: Estimación de la densidad de Kernel

ESTIMACION DE LA DENSIDAD DE KERNEL


.25
.2
Densidad
.15
.1
.05
0

0 2 4 6 8 10
Sector institucional del trabajo

Kernel density estimate


kernel = epanechnikov, bandwidth = 0.3014
Normal density

Fuente: Elaboración propia

Interpretación:

Se analiza la estimación de la densidad de la variable sector institucional del


trabajo. La línea roja representa una densidad que tiende a la normalidad pero no es
perfecta. Por otro lado la línea azul nos representa la densidad de nuestra variable
(sector institucional del trabajo) por lo que se observa que ambas líneas no se
asemejan en nada y por último se concluye que esta variable no tiene una
distribución normal.

2 Métodos Numéricos:

La normalidad de la variable es cuando la probabilidad son mayores o igual a 0.05


siendo significativo para el modelo.
Se analizará las hipótesis, teniendo en cuenta su hipótesis nula lo siguiente:
Ho : La variable se distribuye normalmente
Ha: La variable no se distribuye normalmente
Ya que se observa que la probabilidad es mayor a 0.05, entonces estaríamos
aceptando el Ho por lo cual podríamos decir que los residuos se distribuyen
normalmente.

2.1 Skewness
La normalidad de la variable es cuando la probabilidad son mayores o igual a 0.05, para
un tamaño muestral pequeño

Figura N° 32: Skewness/Kurtosis

Skewness/Kurtosis tests for Normality


joint
Variable Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2

lfrph 27,358 0.0000 0.0000 . .


sexo 137,951 0.8690 . . .
edad 137,949 0.0000 0.0000 . .
exper 137,949 0.0000 0.0000 . .
qrf 110,323 0.6331 0.0000 . .
edu8c10 111,191 0.0000 0.0000 . .
edu6c6 92,100 0.0000 0.0000 . .
aeduc 93,010 0.0000 0.0000 . .
slpt1 48,388 0.0000 0.0000 . .
set1 48,382 0.0000 0.0921 . .
elt1 48,386 0.0000 0.0000 . .
ae1t1d 48,234 0.0000 0.0000 . .
ft 32,766 0.0000 . . .
sit 38,959 0.0004 0.0000 . .
ai1t 30,785 0.0000 0.0000 . .
te1 30,785 0.0000 0.0000 . .
ts1 30,785 0.0000 0.0000 . .
tel1 30,785 0.0000 0.0000 . .
t1cc 30,785 0.0000 0.0000 . .
t1ss 30,785 0.0000 0.0000 . .
ai2t 16,330 0.0000 0.0000 . .
te2 16,330 0.0000 0.0000 . .
ts2 16,329 0.0000 0.0000 . .
tel2 16,328 0.0000 0.0000 . .
t2cc 16,328 0.0000 . . .
t2ss 16,328 0.0000 . . .
ai3t 5,346 0.0000 0.0000 . .
te3 5,346 0.0000 0.0000 . .
ts3 5,346 0.0000 0.6908 . 0.0000
tel3 5,346 0.0000 0.0000 . .
t3cc 5,345 0.0000 . . .
t3ss 5,345 0.0000 . . .

.
Fuente: Elaboración propia
2.2 Shapiro-Wilk

La normalidad de la variable es cuando la probabilidad son mayores o igual a 0.05


Shapiro-Wilk W test for normal data.

Figura N° 33: Shapiro-Wilk W test

Shapiro-Wilk W test for normal data

Variable Obs W V z Prob>z

lfrph 27,358 0.97343 306.626 15.700 0.00000


sexo 137,951 1.00000 0.028 -10.061 1.00000
edad 137,949 0.94589 2054.018 21.458 0.00000
exper 137,949 0.76812 8801.987 25.552 0.00000
qrf 110,323 0.99488 167.229 14.365 0.00000
edu8c10 111,191 0.97470 831.102 18.865 0.00000
edu6c6 92,100 0.99266 211.669 14.991 0.00000
aeduc 93,010 0.97414 751.261 18.540 0.00000
slpt1 48,388 0.98450 279.501 15.614 0.00000
set1 48,382 0.96318 663.617 18.011 0.00000
elt1 48,386 0.94323 1023.434 19.212 0.00000
ae1t1d 48,234 0.94029 1073.765 19.344 0.00000
ft 32,766 0.99999 0.113 -6.008 1.00000
sit 38,959 0.97161 433.351 16.764 0.00000
ai1t 30,785 0.04527 1.2e+04 25.841 0.00000
te1 30,785 0.98064 245.609 15.128 0.00000
ts1 30,785 0.96141 489.446 17.023 0.00000
tel1 30,785 0.95026 630.881 17.721 0.00000
t1cc 30,785 0.99993 0.826 -0.524 0.69988
t1ss 30,785 0.99992 0.988 -0.033 0.51304
ai2t 16,330 0.03058 7325.336 24.122 0.00000
te2 16,330 0.96748 245.723 14.920 0.00000
ts2 16,329 0.96348 275.941 15.234 0.00000
tel2 16,328 0.93248 510.144 16.900 0.00000
t2cc 16,328 0.99995 0.353 -2.825 0.99763
t2ss 16,328 0.99995 0.358 -2.785 0.99732
ai3t 5,346 0.02047 2816.827 20.885 0.00000
te3 5,346 0.97527 71.107 11.212 0.00000
ts3 5,346 0.96817 91.540 11.876 0.00000
tel3 5,346 0.92235 223.303 14.221 0.00000
t3cc 5,345 0.99995 0.151 -4.973 1.00000
t3ss 5,345 0.99997 0.100 -6.053 1.00000
Fuente: Elaboración propia.

Nota: La aproximación normal a la distribución de muestreo de W ' es válido para 4 <=


n <= 2000.

2.3 Shapiro Francia

La normalidad de la variable es cuando la probabilidad son mayores a 0.05


Shapiro-Francia W' test for normal data.

Figura N° 34: Shapiro-Francia


Shapiro-Francia W' test for normal data

Variable Obs W' V' z Prob>z

lfrph 27,358 0.97334 384.473 16.693 0.00001


sexo 137,951 1.00000 0.000 -56.557 1.00000
edad 137,949 0.94601 3658.957 25.294 0.00001
exper 137,949 0.76823 1.6e+04 29.786 0.00001
qrf 110,323 0.99488 279.635 17.143 0.00001
edu8c10 111,191 0.97472 1392.177 22.038 0.00001
edu6c6 92,100 0.99267 336.678 17.523 0.00001
aeduc 93,010 0.97431 1191.909 21.342 0.00001
slpt1 48,388 0.98453 383.836 17.257 0.00001
set1 48,382 0.96344 907.175 19.752 0.00001
elt1 48,386 0.94344 1403.626 21.018 0.00001
ae1t1d 48,234 0.94082 1464.209 21.137 0.00001
ft 32,766 1.00000 0.000 -56.556 1.00000
sit 38,959 0.97159 573.334 18.188 0.00001
ai1t 30,785 0.04496 1.5e+04 27.233 0.00001
te1 30,785 0.98158 297.164 16.082 0.00001
ts1 30,785 0.96182 615.881 18.140 0.00001
tel1 30,785 0.95036 800.741 18.881 0.00001
t1cc 30,785 1.00000 -0.000 . 0.00001
t1ss 30,785 1.00000 0.000 -54.772 1.00000
ai2t 16,330 0.03018 8582.153 24.637 0.00001
te2 16,330 0.96948 270.043 15.229 0.00001
ts2 16,329 0.96418 316.959 15.664 0.00001
tel2 16,328 0.93281 594.515 17.375 0.00001
t2cc 16,328 1.00000 0.000 -60.585 1.00000
t2ss 16,328 1.00000 0.000 -58.281 1.00000
ai3t 5,346 0.01976 3047.115 20.403 0.00001
te3 5,346 0.98217 55.437 10.212 0.00001
ts3 5,346 0.97004 93.139 11.532 0.00001
tel3 5,346 0.92360 237.504 13.913 0.00001
t3cc 5,345 1.00000 0.000 -57.846 1.00000
t3ss 5,345 1.00000 -0.000 . 0.00001

Note: The normal approximation to the sampling distribution of W'


is valid for 10<=n<=5000 under the log transformation.

Fuente: Elaboración propia.

Nota: La aproximación normal a la distribución de muestreo de W ' es válido para 10 <=


n <= 5000 bajo la transformación de registro.

Cuando las variables tienen probabilidades mayores al 5 %, podemos decir que están
distribuidos normalmente.
Se puede ver que existen variables que están distribuidos normalmente y son las
siguientes:
sexo
(ft) la formalidad del primer trabajo
(t1cc) Contrato compatible del primer trabajo
(t1ss) Seguridad social del primer trabajo
(t2cc) Contrato compatible del segundo trabajo
(t2ss) Seguridad social del segundo trabajo
(t3cc) Contrato compatible del tercer trabajo
(t3ss) Seguridad social del tercer trabajo

ANALISIS DE GRAFICOS

1. Gráfico de Barras:
Grafico N°1:Distribución del contrato compatible del primer trabajo por sexo.

Distribucion de Edad
50 40
Media de Edad
20 30
10
0

Hombre Mujer Hombre Mujer


Si No
Base generada por los alumnos
1=Hombre 2=Mujer

Fuente: Elaboración propia.


En el grafico N°1 analizamos la media de la edad, el sexo, y la distribución del contrato
compatible del primer trabajo (t1cc), interpretamos que la mayor parte de la población
que tuvo un contrato compatible en el primer trabajo son mayormente hombres, por otro
la población que no tuvo un contrato compatible del primer trabajo es representado
mayormente por las mujeres.

Grafico N°2: Distribución del Contrato compatible del segundo trabajo por sexo.
Distribucion de Edad

50 40
Media de Edad
20 30
10
0

Hombre Mujer Hombre Mujer


Si No
Base generada por los alumnos
1=Hombre 2=Mujer

Fuente: Elaboración propia.


En el grafico N°2 analizamos la media de la edad, el sexo, y la distribución del contrato
compatible del segundo trabajo (t2cc), interpretamos que la mayor parte de la población
que tuvo un contrato compatible en el primer trabajo son mayormente hombres, por otro
lado, la población que no tuvo un contrato compatible del segundo trabajo es
representado mayormente por los hombres.

Grafico N°3: Distribución del contrato compatible del tercer trabajo por sexo.

Distribucion de Edad
50 40
Media de Edad
20 30
10
0

Hombre Mujer Hombre Mujer


Si No
Base generada por los alumnos
1=Hombre 2=Mujer

Fuente: Elaboración propia.


En el grafico N°3 analizamos la media de la edad, el sexo, y la distribución del contrato
compatible del tercer trabajo (t3cc), interpretamos que la mayor parte de la población
que tuvo un contrato compatible en el tercer trabajo son mayormente mujeres, por otro
lado, la población que no tuvo un contrato compatible del tercer trabajo es representado
equitativamente.
Grafico N°4: Distribución del Logro educativo (6 categorías, 6 años)

Logro Educativo(6 categorias, 6 años): Relación entre sexo y contrato compatible del primer trabajo
Formalidad del primer trabajo
0. Informal 1. Formal
60
40
Media de la Edad
20
0

te s te te te er te s te te te er te s te te te er te s te te te er
ra rite ia ia ia gh ra rite ia ia ia gh ra rite ia ia ia gh ra rite ia ia ia gh
il te W ed ed ed Hi
l il te W ed ed ed Hi
l il te W ed ed ed Hi
l il te W ed ed ed Hi
l
I & m m m & I & m m m & I & m m m & I & m m m &
1. ads nter nter ter sity 1. ads nter nter ter sity 1. ads nter nter ter sity 1. ads nter nter ter sity
e I .I In er e I .I In er e I .I In er e I .I In r
R n 4 e
v n iv R n 4 e
v n iv R n 4 e
v n iv R n 4 ve nive
2. tha bo . U 2. tha bo . U 2. tha bo . U 2. tha bo . U
s s A 6 s s A 6 s s A 6 s s A 6
Le 5. Le 5. Le 5. Le 5.
3. 3. 3. 3.

1. yes 2. no 1. yes 2. no

1. Male 2. Female
Fuente: Elaboración propia

En el grafico N°4 separamos a las personas por logro educativo (6 categorías, 6 años),
sexo, la formalidad del primer trabajo, el contrato compatible con el primer trabajo.
Sabiendo que el logro educativo tiene 6 categorías (1: Analfabeto, 2: Leer y escribir, 3:
Menos que el intermedio, 4: Intermedio, 5: Por encima del intermedio, 6: Universidad y
superior)
2.
lit
er
at
e
w Media de la Edad
i
3. t h o
e l ut 1.
em an illi
0 20 40 60
5. e
6. G 4. nt dip at
y ter

y superior).
7. Vo en mi ary lome
po ca era dd sc a
st tio l h le ho
-s na ig sc ol
8. e c o l h h s h oo
2. un nd igh ch l
lit iv ar s oo
er er y ch l
at si in o

1. yes
e ty st ol
w & itu
ith ab te
3. o
u
e l t 1. o

2. Histograma
em an illi ve
5. e
6. G 4. nt dip at
y ter
7. Vo en mi ary lome
po ca era dd sc a

Fuente: Elaboración propia


0. Informal

st tio l h le ho
-s na ig sc o
8. eco l h h s ho l
un nd igh ch ol
iv ar s oo
er y ch l

2. no
si in o
2. ty st ol
lit & itu
er ab te

1. Male
at ov
e e
w
ith

Grafico N°6: Años de educación por sexo


3. ou 1
el t . i
em an lli
5 y te
6. . G 4. ent dip rat
V e
7. o n mi ary lome
po ca era dd sc a
st tio l h le s ho
-s na ig c o
8. eco l h h s hool
Formalidad del primer trabajo

2. un nd igh ch l
lit iv ar s oo
er er y ch l
at si in o
1. yes

e ty st ol
w & itu
ith ab te
3. o
e l ut 1. o
2. Female

em an illi ve
5.
6. G 4. t ip at en
y ter
d
7. Vo en mi ary lome
po ca era dd sc a
1. Formal

st tio l h le ho
-s na ig sc ol
8. eco l h h s hoo
un nd igh ch l
iv ar s oo
er y ch l
Grafico N°5: Distribución del Logro educativo (8 categorías, 10 años)

2. no

si in o
ty st ol
& itu
ab te
ov
e

ningún diploma, 3: Escuela primaria, 4: Escuela Intermedia, 5:Escuela secundaria


sexo, la formalidad del primer trabajo, el contrato compatible con el primer trabajo.
Sabiendo que el logro educativo tiene 8 categorías (1: Analfabeto, 2: Alfabetizada sin
En el grafico N°5 separamos a las personas por logro educativo (8 categorias, 10 años),
Logro Educativo(8 categorias, 10 años): Relación entre sexo y contrato compatible del primer trabajo

general, 6:Instituto de formación profesional, 7:Instituto post-secundaria, 8: Universidad


Años de educación por Sexo
Sexo
1. Male 2. Female
.4
Densidad
.2
0

0 10 20 30 0 10 20 30
Años de Educación
Fuente:Elaboracion propia

En el grafico N°6 analizamos un histograma de años de educación por sexo, según el


sistema educativo americano las personas que acabaron el bachillerato son las que
cuentan con años de educación de 12 años, en el grafico vemos que existe mayormente
una población que acabo el bachillerato, además las personas que acabaron la
universidad son mayormente hombres.

Grafico N° 7: Salario real por hora (frph<10) por sexo


Salario real por Sexo
Sexo
1. Male 2. Female
6
4
Porcentaje
2
0

0 5 10 0 5 10
Salario real por hora
Fuente:Elaboracion propia

En el grafico N°7 nos muestra la relación entre el salario real por hora menores a 10
unidades monetarias, Un 5% de los hombres gana un salario real de 5 u.m. mientras un
4.3% de las mujeres recibe un salario menor a los 5 u.m.

Grafico N° 8: Salario real por hora (frph<25) por sexo

Salario real por Sexo


Sexo En el grafico N°8
1. Male 2. Female nos muestra la
20

relación entre el
salario real por
hora menores a
15

25 unidades
Porcentaje

monetarias, Un
10

20% de los
hombres gana un
salario real menor
5

a 10 u.m,
mientras un 16%
0

0 20 40 60 0 20 40 60
Salario real por hora de las mujeres
Fuente:Elaboracion propia recibe un salario
menor a los 10
u.m.

Grafico N° 9: Salario real por hora(frph>100) por sexo


Salario real por Sexo
Sexo
1. Male 2. Female
80
60
Porcentaje
40
20
0

0 200 400 600 800 0 200 400 600 800


Salario real por hora
Fuente:Elaboracion propia

En el grafico N°9 nos muestra la relación entre el salario real por hora mayores a 100
unidades monetarias, Un 70% de los hombres gana un salario real igual a 200 u.m,
mientras un 69% de las mujeres recibe un salario real igual a 200 u.m.

3. Gráfico de Caja (Boxplots)

Los diagramas de caja, también conocidos como de caja y bigotes son gráficos que
muestra la distribución de una variable usando cuartiles, de modo que de manera visual
salario real por hora de todos los trabajos

podemos inferir algunas cosas sobre su dispersión, ubicación y simetría. Permite


explorar el comportamiento de los datos así como el histograma, los resultados
muestran que las variables pueden tener valores atípicos potenciales. Teniendo en
cuenta los puntos sobre la línea superior del cuadro.
800

600

400

200

Grafico N° 10: Salario real por hora de todos los trabajos


0

Fuente: Elaboración propia


La variable del salario real del trabajador es la que tiene mayor variabilidad y esta
sobreestimado por ello esta variable presenta datos atípicos (numéricamente distante).

15,000

10,000

5,000
exper

45
Grafico N° 11: Años de experiencia del trabajador

Años de experiencia del trabajador

Fuente: Elaboración propia

La variable experiencia muestra menos atípicos con respecto a los salarios

Grafico N° 11: Salario real comparado con la seguridad y formalidad del primer
-2
6

lfrph2

trabajo

Salario real comparado con la seguridad y formalidad del primer rabajo

1. yes 2. no 1. yes 2. no
0. Informal 1. Formal

Fuente: Elaboración propia


Los gráficos muestran la seguridad de los trabajadores en el primer trabajo respecto a la
formalidad. Los trabajadores informales no cuentan con seguro social , como también
en el sector formal es beneficiado con el seguro pero muestra valores atípicos.

4. Gráfico de Dispersión

Se analizara el grafico de dispersion de 3 variables, actividad economica del primer


trabajo, sector institucional del trabajo y estabilidad laboral del primer trabajo.

 Atividad economica del primer trabajo

Figura N° 12: Gráfico de dispersion de la variable actividad economica.

GRÁFICO DE DISPERSIÓN
(Actividad Económica y edad)
150
100
Edad
50
0

0 5 10 15 20
Actividad Económica

Fuente: Elaboración propia

Interpretación:
Se realizó el grafico presentado para verificar si existe alguna correlación entre la
variable Actividad económica del primer trabajo y edad. Por lo que se llegó a la
conclusión de que ambas variables no tienen ningún tipo de correlación, puesto que la
variable edad se incrementa o asciende de acuerdo a cada categoría de la variable
actividad económica del primer trabajo, además los datos de ambas variables tienen
algunos valores atípicos. Cada categoría de la variable actividad económica del primer
trabajo (agricultura, silvicultura, pesca, minas y canteras, fabricación, electricidad,
construcción, comercio, transporte, etc.) no está en relación con la variable edad.
Grafico N° 13: Gráfico de dispersión con la línea de ajustes

GRÁFICO DE DISPERSIÓN
(Actividad Económica y edad)
150
100
Edad
50
0

0 5 10 15 20
Actividad Económica

edad Fitted values

Fuente: Elaboración propia

Interpretación:
En el grafico se observa una línea recta que representa de mejor manera los puntos en
este diagrama de dispersión de la variable actividad económica del primer trabajo y
edad. Esta línea muestra los patrones de los datos de ambas variables, pero no nos
muestra ninguna tendencia, lo que nos muestra es una línea horizontal, es decir no es
esta indicando de que verdaderamente no existe ninguna relación entre la variable
actividad económica del primer trabajo y edad.
 Estabilidad laboral del primer trabajo.

Grafico N° 14: Grafico de dispersión de la variable estabilidad laboral del primer


trabajo.

GRÁFICO DE DISPERSION
(Estabilidad laboral del primer trabajo y Edad)
150
100
Edad
50
0

1 2 3 4
Estabilidad laboral del primer trabajo

Fuente: Elaboración propia

Se realizó el grafico presentado para verificar si existe alguna correlación entre la


variable estabilidad laboral del primer trabajo y edad. Por lo que se llegó a la conclusión
de que ambas variables no tienen ningún tipo de correlación, puesto que la variable edad
se incrementa o asciende (los puntos no manifiestan ninguna tendencia) de acuerdo a
cada categoría de la variable estabilidad laboral del primer trabajo. Los datos de cada
categoría de esta variable no se encuentran tan dispersos a excepción de la cuarta
categoría (casual) que contiene un número mínimo de personas que tienen trabajos
casuales y a la vez una edad máxima, este grupo seria el que estaría sesgando la
información, es decir no tiene ninguna relación con los otros datos.
Grafico N°15: Grafico de dispersión con la línea de ajustes

GRÁFICO DE DISPERSION
(Estabilidad laboral del primer trabajo y Edad)
150
100
Edad
50
0

1 2 3 4
Estabilidad laboral del primer trabajo

edad Fitted values

Fuente: Elaboración propia

Interpretación:
En el grafico se observa una línea ligeramente recta que representa de mejor manera los
puntos en este diagrama de dispersión de la variable estabilidad laboral del primer
trabajo y edad. Esta línea muestra los patrones de los datos de ambas variables, pero
solo nos muestra una ligera tendencia de izquierda a derecha, no es muy notoria, pero si
se observa con detenimiento de aprecia dicha diminución por lo que se concluiría de que
existe una correlación negativa, pero esta es muy débil, es decir ambas variables casi no
están relacionadas.
 Variable sector institucional del trabajo.
Grafico N°16: Grafico de dispersión de la variable sector institucional y edad

GRÁFICO DE DISPERSION
(Sector institucional y edad)
150
100
Edad
50
0

0 2 4 6 8 10
Sector Institucional

Fuente: Elaboración propia

Interpretación:

Se realizó el grafico presentado para verificar si existe alguna correlación entre la


variable sector institucional del trabajo y edad. Por lo que se llegó a la conclusión de
que ambas variables no tienen ningún tipo de correlación, puesto que la variable edad se
incrementa o asciende (los puntos no manifiestan ninguna tendencia) de acuerdo a cada
categoría de la variable sector institucional del trabajo. Los datos de cada categoría de
esta variable no muestran mucha dispersión a excepción de dos categorías (Familia no
remunerada y gobiernos) que contiene un número mínimo de personas que se
encuentran en este sector pero fuera de la edad que la mayoría de personas se
encuentran en las otras categorías.
Grafico N° 17: Grafico de dispersión con la línea de ajuste

GRÁFICO DE DISPERSION
(Sector institucional y edad)
150
100
Edad
50
0

0 2 4 6 8 10
Sector Institucional

edad Fitted values

Fuente: Elaboración propia

Interpretación:

En el grafico se observa una línea recta que representa de mejor manera los puntos en
este diagrama de dispersión de la variable sector institucional del trabajo y edad. Esta
línea muestra los patrones de los datos de ambas variables, es decir se observa una línea
horizontal recta, por lo que se concluiría de que no existe ninguna correlación entre
estas dos variables analizadas, es decir la variable sector institucional del trabajo no
causa ninguna relación en la variable edad.
5. Gráficos de Torta

La gráfica de pastel se usa para representar variables cualitativas o categóricas, de


preferencia nominales.

Gráfico N°18: Formalidad del primer trabajo por género

Fuente: Elaboración propia.

En la base de datos la formalidad del primer trabajo de un total de 137 951 trabajadores
en el sector informal un 17,17% son mujeres y 82,83% son masculinos por otro lado el

sector formal un 24,75% son mujeres y 75,25% son masculinos . El Perú es el segundo
país con menor brecha laboral entre hombres y mujeres en la región de Latino América,
de acuerdo al Índice de Mejores Trabajos, informe emitido por el Banco Interamericano
de Desarrollo (BID). Para las mujeres con empleos informales se encontraron
asociaciones positivas y contundentes sí estuvieron previamente casadas, si tuvieron
responsabilidades familiares, si su empleo fue a tiempo parcial o si realizaron largas
jornadas de trabajo remunerado.
Gráfico N°19: Nivel socioeconómico de las familias por género

El grafico nos muestra los quintiles de la riqueza familiar por género en el quintil 1 las
personas vulnerables o pobres extremos son el 50,45% mujeres y el 49,55% varones
donde los más pobres reciben una proporción muy pequeña del ingreso. Para el caso
quintil 5 las personas más adineradas son las mujeres un 50,33% y con respecto a los
varones un 49,67%.

Gráfico N°20: Estabilidad laboral y formalidad del primer trabajo


Las personas que tienen empleo permanente la gran mayoría pertenecen al sector
formal en un 48,3 % , por otro lado vemos el trabajo estacionario que pertenecen
en el sector formal un 28,97% y en el sector informal un 71,03% ,estas personas
están desempleados, con trabajos inestables y vulnerables se han convertido en
características estructurales de muchas sociedades en los últimos años.Debido a
la disminución de la participación del estado la reducción del Estado y la
consecuente disminución de empleos públicos así como los estándares laborales
más flexibles y la pérdida de poder de los sindicatos han contribuido al aumento
de la informalidad laboral.

6. Gráficos de doble entrada:


Grafico N° 21: Salario y Años de educación (Distribución por Sexo) con frph<500

Graficos de doble entrada: Salario real y Años de Educación


Distribución por sexo
1. Male 2. Female
Salario real por hora de todos los trabajos
400
300
200
100
0

0 10 20 30 0 10 20 30
Años de educación
1= Hombre, 2= Mujer

En este grafico nos muestra la distribución entre el salario real y años de educación y
que esta a su vez lo divide en el sexo de la persona, además el salrio real es menor a 500
u.m., interpretamos que en la dispersión existe un dato o una persona que es hombre y
que gana un salario real por hora superior a 400 u.m. con 12 a 13 años de educación
mientras que en el caso de las mujeres el salario máximo es aproximadamente de 230 a
250 u.m con 15 a 16 años de educacion aprox..

Grafico N° 22: Salario y Años de educación (Distribución por Sexo) con frph<1000

Graficos de doble entrada: Salario real y Años de Educación


Distribución por sexo
Salario real por hora de todos los trabajos

1. Male 2. Female
800
600
400
200
0

0 10 20 30 0 10 20 30
Años de educación
salario real por hora de todos los trabajos Fitted values
1= Hombre, 2= Mujer

En este grafico nos muestra la distribución entre el salario real y años de educación y
que esta a su vez lo divide en el sexo de la persona, además el salario real es menor a
1000 u.m., interpretamos que en la dispersión existe un dato o una persona que es
hombre y que gana un salario real por hora de 800 u.m. con 15 a 19 años de educación
mientras que en el caso de las mujeres el salario máximo es aproximadamente de 230 a
600 u.m con 15 a 16 años de educación aprox. Además observamos la tendencia de la
dispersión, que es positiva.
Grafico N° 23: Salario y Años de educación (Distribución por Sexo) con frph<100 &
frph>5

Graficos de doble entrada: Salario real y Años de Educación


Distribución por sexo
Salario real por hora de todos los trabajos

1. Male 2. Female
100
50
0

0 10 20 30 0 10 20 30
Años de educación
salario real por hora de todos los trabajos Fitted values
1= Hombre, 2= Mujer

En este grafico nos muestra la distribución entre el salario real y años de educación y
que esta a su vez lo divide en el sexo de la persona, además el valor del salario real se
encuentra entre 5 y 100 u.m., interpretamos que en la dispersión existen hombres que
ganan un salario real mayores a 50 u.m con 12 a15 años de educación mientras que en el
caso de las mujeres nos muestran mayores datos con un salario menor al 50 u.m. con 15
a 19 años de educación aprox. Además observamos la tendencia de la dispersión, que es
positiva.
Grafico N° 24: Salario real y edad(Distribucion por formalidad del primer trabajo)
con frph<100 & frph>50

Graficos de doble entrada: Salario real y Edad


Distribución por formalidad del primer trabajo
En
Salario real por hora de todos los trabajos

0. Informal 1. Formal
100
50

20 40 60 80 20 40 60 80
Años de educación
salario real por hora de todos los trabajos Fitted values
0= Informal, 1= Formal

este grafico nos muestra la distribución entre el salario real y la edad de la persona y que
esta a su vez lo divide en la formalidad del primer trabajo, además el valor del salario
real se encuentra entre 50 y 100 u.m., interpretamos que en la dispersión existen pocos
hombres que ganan un salario real entre 50 a 100 u.m. con una edad entre los 20 a 60
años mientras que en el caso de las mujeres nos muestran mayores datos con un salario
real entre esos valores con una edad de 20 a 60 años. Además observamos la tendencia
de la dispersión, que es positiva.

También podría gustarte