Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CUANTITATIVAS.
a. Escribe el modelo de regresión lineal que explique el salario actual en
función del inicial.
Salida R:
Call:
Residuals:
Coefficients:
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
b. Con los datos muestrales haz un análisis gráfico para ver si tiene sentido el
modelo.
[ GRÁFICO ]
80000 100000 120000
s a la rio
60000
40000
20000
1 00 0 0 20 0 00 3 00 00 4 00 0 0 50 0 00 6 0 000 7 000 0 8 00 00
s a li n i
c. Si crees que tiene sentido, estima el modelo con los datos muestrales.
Para la estimación, se ha escogido el caso Nº 1 (ID=253), que corresponde a una mujer con un
salario inicial de 10.200 dólares (X) y un salario actual de 17.100 dólares (Y).
Observando el P valor de X(<2e-16 ***), rechazamos H0, y decimos que parte de la varianza de
Y puede ser explicada por X significativamente.
Por otro lado la Adjusted R-squared (0.7741 ), nos indique que el 77% de la varianza de Y
puede ser explicada por X.
Salida R:
Estimate 0.5 % 99.5 %
Límite superior del intercepto es -370.17 y el líimite superior es de 4226.58. Para el salario
inicial, el límite inferior es de 1.79 y el superior es de 2.03
Salida R:
Hypothesis:
salini = 0
Res.Df Df F Pr(>F)
1 473
La prueba da a conocer un valor p < 0.001 (2.2e-16), por lo que se rechaza H0 y se concluye
que existe una pendiente para la variable salario.
EDAD (X)
SALARIO (Y)
Call:
Coefficients:
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Modelo:
• Aunque pueda no tener mucho sentido, el gráfico si muestra cierta regresión negativa:
Gráfico:
120000
20000 40000 60000 80000
s a la rio
0 10 20 30 40 50 60
E dad
Se ha escogido el caso Nº 1 (ID=253), que corresponde a una mujer con una edad de 53 años y
un salario actual de 17100 dólares.
Hypothesis:
Edad = 0
1 473 1.3792e+11
data: .Table
X-squared = 2.5009, df = 3, p-value = 0.4751
Atendiendo al P valor (0.4751), mayor que 0.05, y a X-squared que tiene un valor muestral de
2.5009 (valor no muy lejano de 0 ) no se rechaza H0, y se concluye que hay independencia
entre las dos variables.
2. Contraste de homogeneidad: estudia si la variable estado civil es la misma para todos
los niveles de estatura.
H0: si la variable estado civil tienen una distribución homogénea en los distintos niveles de
estatura.
Row percentages:
niv_estatura
estado baja normal alta Total Count
C 0.0 76 24.0 100 50
S 0.3 80 19.7 100 350
data: .Table
X-squared = 0.62773, df = 2, p-value = 0.7306
3. Contraste de ajuste: estudia si puede creerse que la variable estado civil mantiene
estas proporciones: 30% solteros y un 60% casados.
counts:
estado
C S
50 350
percentages:
estado
C S
12.5 87.5
data: .Table
X-squared = 528.13, df = 1, p-value < 2.2e-16
Atendiendo al p valor (menor que 0.05) y a la x-squared (528.13, muy alejada de 0) que nos
arroja el test para las posibilidades dadas podemos rechazar esta hipótesis. NOTA (al meter
esos porcentajes, como no suman 1 r commander te lanza el siguiente aviso “AVISO:
Probabilidades escaladas para sumar 1.”)
4. Contrasta hipótesis como las anteriores que tengan sentido en el archivo de datos
“trabajo.rda”.
data: .Table
X-squared = 2.7139, df = 1, p-value = 0.09948
Atendiendo al p valor (mayor que 0.05) y a x-squared (2,71, no muy alejada de 0) no podemos
rechazar h0 y concluimos que hay independencia entre las variables.
Al solo poder establecer esta relación entre variables cualitativas en ese conjunto de datos, los
resultados del contraste de homogeneidad, darian unos resultados similares.
-Contraste de ajuste: estudia si puede creerse que la variable sexo mantiene estas proporciones
20% mujeres 80% hombres:
counts:
sexo
hombre mujer
258 216
percentages:
sexo
hombre mujer
54.43 45.57
data: .Table
X-squared = 193.69, df = 1, p-value < 2.2e-16
Atendiendo a lo arrojado, x-squared de 193.69 (muy alejada de 0) y un p valor menor que 0.05
podemos descartar la hipótesis planteada.