Está en la página 1de 7

1.

Estadística descriptiva
(a) Obtener estadÌsticos descriptivos de las variables salhora, antig y sexoh

Estadísticos principales, usando las observaciones 1 - 4716


Variable Media Mediana Mínimo Máximo
sexoh 0.56764 1.0000 0.00000 1.0000
antig 10.595 8.7917 0.083333 47.167
salnet 1494.9 1390.8 277.55 3802.8
Variable Desv. Típica. C.V. Asimetría Exc. de
curtosis
sexoh 0.49546 0.87283 -0.27308 -1.9254
antig 9.5577 0.90211 1.0489 0.65607
salnet 604.78 0.40455 0.86247 0.90644
Variable Porc. 5% Porc. 95% Rango IQ Observaciones
ausentes
sexoh 0.00000 1.0000 1.0000 0
antig 0.33333 30.013 13.729 0
salnet 632.16 2634.2 732.85 0

(b) Dibujar histogramas de las variables salnet y edad

0.12

0.1
Frecuencia relativa

0.08

0.06

0.04

0.02

0
500 1000 1500 2000 2500 3000 3500
salnet
Podemos observar una clara acumulación de muestras en la zona de 1000 hasta 1500 , justo en
el rango donde se encuentra la media total de salnet . Por encima de esta se ve una tendencia
bajista cuanto incrementamos la variable salnet

0.4

0.35

0.3
Frecuencia relativa

0.25

0.2

0.15

0.1

0.05

0
1 2 3 4 5
edad

Este histograma representa la distribución del salario en franjas de 5 años . El mayor


porcentaje de las muestras tiene entre 35 y 45 años.

(c) Generar la variable log(salnet) y dibujar su histograma. Comparar el gráfico con el


obtenido para la variable sin transformar.
0.1
Frecuencia relativa

0.08

0.06

0.04

0.02

0
6 6.5 7 7.5 8
l_salnet

El histograma del salario neto normal y el logarítmico presenta distribuciones inversas donde
llevándolo a escala logarítmica la concentración mas abrupta tiene lugar en la franja de 7 hasta
7.5t

(d) Obtener la media, mediana y desviación tÌpica del salario total (saltot) para hombres y
para mujeres.
Salario total mujeres.

Estadísticos principales, usando las observaciones 1 - 2039


para la variable saltot (2039 observaciones válidas)
Media Mediana Mínimo Máximo
1742.0 1530.6 312.42 5396.5
Desv. Típica.
896.20

Salario total hombres

Estadísticos principales, usando las observaciones 1 - 2677


para la variable saltot (2677 observaciones válidas)
Media Mediana Mínimo Máximo
1998.2 1815.2 308.75 5385.1
Desv. Típica.
851.05
Como podemos observar en este muestreo estadístico descriptivo , el salario total medio de
los hombres es claramente superior al de las mujeres . Su mediana nos indica la misma
conclusión existiendo una diferencia de casi 300 euros . Esta distribución prueba claras
evidencias de la brecha salarial. La desviación típica sin embargo mantiene unos niveles
bastantes homogéneos.

2. Modelo de regresión simple:


(a) Dibuja una nube de puntos de la variable salnet sobre la variable antig. Interpreta el
patrón observado en la nube de puntos.

salnet con respecto a antig (con ajuste mínimo-cuadrático)


4000
Y = 1.27e+003 + 21.5X

3500

3000

2500
salnet

2000

1500

1000

500

0
0 5 10 15 20 25 30 35 40 45
antig

(b) Estima por MCO (MÌnimos Cuadrados Ordinarios) el siguiente modelo de regresión
simple:

Modelo 1: MCO, usando las observaciones 1-4716


Variable dependiente: salnet

Coeficiente Desv. Típica Estadístico t valor p


const 1267.10 12.3671 102.5 <0.0001 ***
antig 21.5054 0.866763 24.81 <0.0001 ***

Media de la vble. Dep. 1494.941 D.T. de la vble. Dep. 604.7842


Suma de cuad. Residuos 1.53e+09 D.T. de la regresión 568.8453
R-cuadrado 0.115505 R-cuadrado corregido 0.115317
F(1, 4714) 615.5943 Valor p (de F) 7.8e-128
Log-verosimilitud −36607.17 Criterio de Akaike 73218.34
Criterio de Schwarz 73231.26 Crit. De Hannan-Quinn 73222.88
c) Interpreta el coeficiente estimado B1 : Según los resultados obtenidos, ¿cual es el salario
estimado para un trabajador con 5 años de antig¸edad? ¿Y para un trabajador con 20 años de
antig¸edad?

A través de la recta de regresión obtenemos B0 y B1 los cuales nos aportan una estimación del
modelo lineal. Para B1 podemos afirmar que el salario neto depende de forma endógena de la
antigüedad multiplicada por 21.5 , esto quiere decir que por cada incremento de un año de
antigüedad el salario aumentará en 21.5. Si estimamos el salario de una persona con 5 años de
antigüedad vemos que su salario corresponderá a 1374.62 , sin embargo para uno con 20 años
son 1697.18 donde se puede apreciar un claro incremento entre las dos variables.

(d) Interpreta el coeficiente R2 : Obtén la matriz de correlación de salnet y antig. ¿Hay alguna
relación entre el coeficiente de correlación de estas dos variables y el coeficiente R2
obtenido en la estimación?

El coeficiente de correlación de estas dos variables (R2) es de 0.115 , lo que explica un 11% de
la variabilidad del modelo. La matríz de correlación sería la siguiente:

Coeficientes de correlación, usando las observaciones 1 - 4716


Valor crítico al 5% (a dos colas) = 0.0285 para n = 4716

salnet antig
1.0000 0.3399 salnet
1.0000 antig

Lo que nos lleva a afirmar que la dependencia en el movimiento entre las variables de antig y
sal net es positivo . Aún no siendo muy elevada explica gran parte de la variabilidad conjunta
de ambas variables. Las diferencias entre ambas medidas está en que la correlación lineal
prueba un relación lineal en la distribución , y la matriz de correlaciones nos indica un
movimiento positivo entre ambas variables.

(e) ¿Cual es el incremento esperado del salario neto asociado a un años de antigüedad para
un trabajador con 5 años de antigüedad? ¿Y para un trabajador con 20 años de antigüedad?
El patrón que encuentras se debe a que el modelo anterior impone una relación lineal entre
salario y antigüedad. ¿Te parece razonable dicho patrón? En caso de que no te lo parezca,
¿como crees que habrá de ser la relación entre estas dos variables? [Nota: No se pide
estimar un modelo alternativo, simplemente razonar (con palabras o dibujando un gráfico)
como crees que es dicha relación.]

En ambos casos , el incremento marginal de un año más de antigüedad corresponde a un


aumento de 21.5 sobre el salario neto previamente calculado . Donde si encontraríamos una
inmensa diferencia es en la comparación entre 5 años de antigüedad frente a 20 ya que ese
diferencial es de 322. 56 euros. El patrón mostrado en la relación lineal se ajusta bastante a un
supuesto de la realidad . En la mayor parte de las empresas el salario neto crece
progresivamente según vamos cumpliendo más años en la empresa . Un becario nunca cobrará
lo mismo que un senior con más de 20 años de experiencia. No obstante hay otros trabajos
que no presentan las mismas características . Este es el caso de trabajos de baja cualificación
como la hostelería , construcción o incluso la limpieza al tener un salario plano el conjunto de
años.
(f) Obtén los residuos del modelo de regresión estimado. ¿Cual es su media muestral? ¿Por
qué obtienes ese valor?

Estadísticos principales, usando las observaciones 1 - 4716


para la variable residuos (4716 observaciones válidas)
Media Mediana Mínimo Máximo
3.7187e-013 -87.437 -1754.9 2473.4
Desv. Típica. C.V. Asimetría Exc. de curtosis
568.78 1.5295e+015 0.82436 1.0953
Porc. 5% Porc. 95% Rango IQ Observaciones
ausentes
-811.15 1083.2 653.74 0
Ese valor se obtiene a través del conjunto total de residuos sumados , dividido entre n.

(g) Estima por MCO el modelo sin término constante

Modelo 2: MCO, usando las observaciones 1-4716


Variable dependiente: salnet

Coeficiente Desv. Típica Estadístico t valor p


antig 87.4481 1.04276 83.86 <0.0001 ***

Media de la vble. dep. 1494.941 D.T. de la vble. dep. 604.7842


Suma de cuad. residuos 4.92e+09 D.T. de la regresión 1021.734
R-cuadrado no centrado 0.598652 R-cuadrado centrado -1.854136
F(1, 4715) 7032.924 Valor p (de F) 0.000000
Log-verosimilitud −39369.59 Criterio de Akaike 78741.17
Criterio de Schwarz 78747.63 Crit. de Hannan-Quinn 78743.44

Obtén los residuos y su media muestral

Estadísticos principales, usando las observaciones 1 - 4716


para la variable residuos2 (4716 observaciones válidas)
Media Mediana Mínimo Máximo
568.44 666.38 -3164.0 3553.7
Desv. Típica. C.V. Asimetría Exc. de curtosis
848.97 1.4935 -0.47277 0.96357
Porc. 5% Porc. 95% Rango IQ Observaciones
ausentes
-953.70 1820.1 1026.2 0

También podría gustarte