Documentos de Académico
Documentos de Profesional
Documentos de Cultura
La distribución de los costes salariales de los 100 000 empleados de una empresa
minera multinacional se presenta en la tabla siguiente:
Salarios N° de empleados
0-15000 2145
15000-20000 1520
20000-25000 840
25000-30000 955
30000-35000 1110
35000-40000 2342
40000-50000 610
50000-100000 328
100000-300000 150
Calcular el salario medio por trabajador, el salario más frecuente y el salario tal que la
mitad de los restantes sea inferior a él. Calcular también el primer cuartel salarial y el
percentil 75.
SOLUCIÓN
La tabla siguiente contiene los elementos relativos a la distribución de frecuencia de
la variable salario (X) necesarios para realizar los cálculos pedidos en el problema.
- Para hallar el salario más frecuente se calcula la moda de la variable X. Para ello
hemos de tener presente que los intervalos de la distribución de frecuencias son
desiguales, por lo que el intervalo modal será el correspondiente al mayor valor
de di, es decir será el intervalo (35000 – 40000). Por lo tanto, la moda se calcula
como sigue:
di +1
M 0=Li−1 + c
d i−1 +d i +1 i
0,061
¿ 35000+ 5000=36077,74
0,222+ 0,061
- Para hallar el salario tal que la mitad de los restantes sea inferior a él se calcula
la mediana. Para ello, como N/2 = 5000, el intervalo mediano será (25000 –
3000) ya que Ni-1 < N/2 < Ni es equivalente en este problema a 4505 < 5000
<5460. La mediana se calculará como sigue:
N
−N i−1
2
M e =Li−1+ ci
ni
10000
−2145
2
25000+ 5000=27591,62
955
- Para calcular el primer cuartel (primer cuantil de orden 4) observamos que como
N/4 = 2500, el intervalo relativo al primer cuartel será (15000-20000) ya que
Ni1<2500<Ni es equivalente en este problema a 2145<2500<3665.El primer
cuartel se calculará como sigue:
N
−N i−1
4
Q1,4 =Li−1+ ci
ni
10000
−2145
4
15000+ 5000=16167,76
1520
75 N
−N i−1
100
1+ c i=16167,76
ni
75∗10000
−6570
100
35000+ 5000=36985,48
2342
3N
−N i−1
4
Q3,4 =Li−1+ ci
ni
3∗10000
−6570
4
35000+ 5000=36985,48
2342
- El tercer cuartil se interpreta como el valor de la variable para el que las tres
cuartas partes de los valores son inferiores a él y la cuarta parte restante es
superior. Como las tres cuartas partes son el 75%, el percentil 75 coincide con el
tercer cuartil.
EJERCICIO DISTRIBUCIÓN NORMAL
Sea X una variable aleatoria que se distribuye según una normal de media 5 y
desviación típica 2. Calcular la probabilidad de que dicha variable tome valores
inferiores a 4.
2
−( x−5 )
4 2∗2
2
e
F (4)=P [ x ≤ 4 ] =∫ dx
−∝ 2 √ 2 π
- Para no tener que resolver dicha integral y dado que no podemos tener tabuladas
todas las posibles distribuciones normales (por ejemplo esta, la N(5;2))
transformaremos el valor de la variable sobre el que queremos calcular una
probabilidad aun valor tipificado (estandarizado), para poder usar la tabla de la
N(0;1) que habitualmente tenemos a mano realizada-calculada por varios
autores. Así, siendo t → N ( N ; 01) que habitualmente tenemos a mano realizada-
calculada por varios autores. Así, siendo t → N (0 ; 1)tendríamos:
5−u 5−4
P( x ≤5)=P(t ≤t 1)=P(t ≤
σ (
)=P t ≤
2 )
=P (t ≤ 0.5)
3) ¿Era correcta la impresión inicial basada? ¿Por qué? ¿Qué provincia tiene mejores
condiciones de mortalidad?
SOLUCION
Chart Title
250
200
150
100
50
0
Edad 5-25 Edad 26-36 Edad 40-60 Edad 75-85+
Soria Cadiz
Una vez calculado el total de defunciones en cada provincia, si las dos tuviesen la
misma población (la de España en este caso), obtenemos un número notablemente
superior en Cádiz. De hecho, si dividimos las defunciones totales por la población total
española, obtenemos unas TASAS ESTANDARIZADAS DE MORTALIDAD de 6,91
por mil para Soria, y de 11,66 por mil para Cádiz.
3) Por tanto, ya podemos confirmar que la impresión inicial provocada por las tasas
brutas de mortalidad, a saber, que la mortalidad es peor, más alta, en Soria que, en
Cádiz, es en realidad una falsa impresión. Si estandarizamos las dos tablas de
mortalidad provinciales aplicándoselas a una misma población, la española, el número
de defunciones es superior en Cádiz. Por tanto, la falsa impresión provenía de las
pirámides de edades, muy diferentes, de estas dos provincias. Aunque Soria tiene una
mortalidad por edades más baja, tiene un peso mucho mayor de las edades avanzadas y,
en tales edades, las tasas de mortalidad son lógicamente más elevadas que en las edades
jóvenes. Por eso el número total de defunciones se más alto en Soria, porque tiene más
personas mayores, no porque su mortalidad, edad por edad, sea peor que la de Cádiz.
Por el contrario, es mucho mejor.
Ejercicio Estadístico Bivariable
La tabla siguiente representa la distribución bidimensional de un grupo de 11137
trabajadores de una minería en España clasificados según la EDAD y el SALARIO que
perciben:
Salario Miles Edad
18-25 25-35 35-65
20-50 335 1022 2132
50-100 402 1429 2437
100-150 38 841 2511
A) Marginales
Identificamos los salarios bajos medios y altos de acuerdo al joven, edad media y mayor
quedando
salario joven medio
mayor
bajo 335 1022 2132
medio 402 1429 2427
alto 38 841 2511
La distribución marginal del salario está formada por las clases salariales (20-50, 50-
100, 100-150) (etiquetadas con bajo medio y alto) y las correspondientes frecuencias en
la columna Sum. La distribución marginal está formada por las clases de la edad (18-25,
25-35, 35-65) (etiquetadas como joven, medio y mayor) y las correspondientes
frecuencias en la fila Sum.
Distribución condicional del salario a la edad de 18-25 años: Está formada por los
valores del salario y los porcentajes de la primera columna (18-25 años): 43,2, 51,9 y
4,9 que representan las frecuencias relativas, multiplicadas por 100, correspondientes a
los valores salariales. De modo similar se obtienen las condicionadas del salario a los
otros valores de la edad. Observe que las frecuencias se obtienen dividiendo cada casilla
por el total de columna.