Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadística descriptiva
(a) Obtener estadÌsticos descriptivos de las variables salhora, antig y sexoh
0.12
0.1
Frecuencia relativa
0.08
0.06
0.04
0.02
0
500 1000 1500 2000 2500 3000 3500
salnet
Podemos observar una clara acumulación de muestras en la zona de 1000 hasta 1500 , justo en
el rango donde se encuentra la media total de salnet . Por encima de esta se ve una tendencia
bajista cuanto incrementamos la variable salnet
0.4
0.35
0.3
Frecuencia relativa
0.25
0.2
0.15
0.1
0.05
0
1 2 3 4 5
edad
0.08
0.06
0.04
0.02
0
6 6.5 7 7.5 8
l_salnet
El histograma del salario neto normal y el logarítmico presenta distribuciones inversas donde
llevándolo a escala logarítmica la concentración mas abrupta tiene lugar en la franja de 7 hasta
7.5t
(d) Obtener la media, mediana y desviación tÌpica del salario total (saltot) para hombres y
para mujeres.
Salario total mujeres.
3500
3000
2500
salnet
2000
1500
1000
500
0
0 5 10 15 20 25 30 35 40 45
antig
(b) Estima por MCO (MÌnimos Cuadrados Ordinarios) el siguiente modelo de regresión
simple:
A través de la recta de regresión obtenemos B0 y B1 los cuales nos aportan una estimación del
modelo lineal. Para B1 podemos afirmar que el salario neto depende de forma endógena de la
antigüedad multiplicada por 21.5 , esto quiere decir que por cada incremento de un año de
antigüedad el salario aumentará en 21.5. Si estimamos el salario de una persona con 5 años de
antigüedad vemos que su salario corresponderá a 1374.62 , sin embargo para uno con 20 años
son 1697.18 donde se puede apreciar un claro incremento entre las dos variables.
(d) Interpreta el coeficiente R2 : Obtén la matriz de correlación de salnet y antig. ¿Hay alguna
relación entre el coeficiente de correlación de estas dos variables y el coeficiente R2
obtenido en la estimación?
El coeficiente de correlación de estas dos variables (R2) es de 0.115 , lo que explica un 11% de
la variabilidad del modelo. La matríz de correlación sería la siguiente:
salnet antig
1.0000 0.3399 salnet
1.0000 antig
Lo que nos lleva a afirmar que la dependencia en el movimiento entre las variables de antig y
sal net es positivo . Aún no siendo muy elevada explica gran parte de la variabilidad conjunta
de ambas variables. Las diferencias entre ambas medidas está en que la correlación lineal
prueba un relación lineal en la distribución , y la matriz de correlaciones nos indica un
movimiento positivo entre ambas variables.
(e) ¿Cual es el incremento esperado del salario neto asociado a un años de antigüedad para
un trabajador con 5 años de antigüedad? ¿Y para un trabajador con 20 años de antigüedad?
El patrón que encuentras se debe a que el modelo anterior impone una relación lineal entre
salario y antigüedad. ¿Te parece razonable dicho patrón? En caso de que no te lo parezca,
¿como crees que habrá de ser la relación entre estas dos variables? [Nota: No se pide
estimar un modelo alternativo, simplemente razonar (con palabras o dibujando un gráfico)
como crees que es dicha relación.]