Documentos de Académico
Documentos de Profesional
Documentos de Cultura
# tamaño de la muestra
n <- nrow(datos)
# grafico de barras
b <- barplot(tab, ylab = "Porcentaje (%)", xlab = "Sexo", col =
"gray95", border = "darkgray")
text(x = b, y = tab-2, labels = tab, font = 4)
# TODOS
# datos
y <- datos$ingresos
# tamaño
length(y)
# medidas de tendencia
summary(y)
# DE y CV
round(c(sd(y), 100*sd(y)/mean(y)), 3)
# HOMBRES
# tamaño
length(x_h)
# medidas de tendencia
summary(x_h)
# DE y CV
round(c(sd(x_h), 100*sd(x_h)/mean(x_h)), 3)
# MUJERES
# tamaño
length(x_m)
# medidas de tendencia
summary(x_m)
# DE y CV
round(c(sd(x_m), 100*sd(x_m)/mean(x_m)), 3)
par(mfrow=c(2,2))
# HOMBRES
hist(x_h, freq = F, nclass = 15, xlab = "Ingresos (en millones)",
col = "lightblue", border = "blue", ylab = "Densidad", main =
"Hombres")
boxplot(x_h, horizontal = T, col = "lightblue", border = "blue")
# MUJERES
hist(x_m, freq = F, nclass = 15, xlab = "Ingresos (en millones)",
col = "mistyrose", border = "red", ylab = "Densidad", main =
"Mujeres")
boxplot(x_h, horizontal = T, col = "mistyrose", border = "red")
s2T=1n−1∑i=1n(yi−y¯)2=2.65337.sT2=1n−1∑i=1n(yi−y¯)2=2.65337.
# variabilidad TOTAL
var_t <- var(y)
var_t
# variabilidad INTRA
var_w <- ((length(x_h)-1)*var(x_h) + (length(x_m)-
1)*var(x_m))/(length(y)-1)
var_w
# variabilidad INTER
var_b <- (length(x_h)*(mean(x_h)-mean(y))^2 + length(x_m)*(mean(x_m)-
mean(y))^2)/(length(y)-1)
var_b
# suma INTRA e INTER
var_w + var_b
# proporcion INTRA
var_w/var_t*100
# proporcion INTRA
var_b/var_t*100
Los resultados del numeral b. indican que, aunque la dispersión de ambos grupos respecto
al promedio es semejante (alta en ambos casos), tanto en promedio como mediana los
hombres perciben un ingreso ligeramente superior que el de las muejeres. Como era de
esperarse, tanto los gráficos como las medidas de tendencia indican que la distribución de
los ingresos es sesgada positivamente en ambos grupos (observe que la mediana es menor
que la media, y la presencia de datos atípicos superiores). De otra parte, los resultados del
numeral c. indican que la variabildad total de los ingresos se debe casi que totalmente
debido a las diferencias dentro de cada uno de los grupos, dado que las diferencia entre el
promedio de los grupos y el promedio total no es substancial.
a - 4.
b - 2.
c - 1.
d - 3.