Está en la página 1de 9

EJERCICIO CENTRALIDAD Y VARIABILIDAD

La distribución de los costes salariales de los 100 000 empleados de una empresa
minera multinacional se presenta en la tabla siguiente:
Salarios N° de empleados
0-15000 2145
15000-20000 1520
20000-25000 840
25000-30000 955
30000-35000 1110
35000-40000 2342
40000-50000 610
50000-100000 328
100000-300000 150

Calcular el salario medio por trabajador, el salario más frecuente y el salario tal que la
mitad de los restantes sea inferior a él. Calcular también el primer cuartel salarial y el
percentil 75.

SOLUCIÓN
La tabla siguiente contiene los elementos relativos a la distribución de frecuencia de
la variable salario (X) necesarios para realizar los cálculos pedidos en el problema.

Salarios N°de Marcas=xi Xi*ni Ni ci Di=ni/ci


empleados=ni
0-15000 2145 7500 16087500 2145 15000 0.143
15000- 1520 17500 266000000 3665 5000 0.304
20000
20000- 840 22500 18900000 4505 5000 0,168
25000
25000- 955 27500 26262500 5460 5000 0,191
30000
30000- 1110 32500 36075000 6570 5000 0,222
35000
35000- 2342 37500 87825000 8912 5000 0,4684
40000
40000- 610 45000 27450000 9522 10000 0,061
50000
50000- 328 75000 2460000 9850 50000 0,0056
100000
100000- 150 200000 30000000 10000 200000 0,00075
300000
0000 293800000

Para hallar el salario medio por trabajador calculamos la media de la variable X.


k
1
X̄ =
N
∑ x i n i= 293800000
10000
=29380
i=1

- Para hallar el salario más frecuente se calcula la moda de la variable X. Para ello
hemos de tener presente que los intervalos de la distribución de frecuencias son
desiguales, por lo que el intervalo modal será el correspondiente al mayor valor
de di, es decir será el intervalo (35000 – 40000). Por lo tanto, la moda se calcula
como sigue:

di +1
M 0=Li−1 + c
d i−1 +d i +1 i
0,061
¿ 35000+ 5000=36077,74
0,222+ 0,061

- Para hallar el salario tal que la mitad de los restantes sea inferior a él se calcula
la mediana. Para ello, como N/2 = 5000, el intervalo mediano será (25000 –
3000) ya que Ni-1 < N/2 < Ni es equivalente en este problema a 4505 < 5000
<5460. La mediana se calculará como sigue:

N
−N i−1
2
M e =Li−1+ ci
ni

10000
−2145
2
25000+ 5000=27591,62
955

- Para calcular el primer cuartel (primer cuantil de orden 4) observamos que como
N/4 = 2500, el intervalo relativo al primer cuartel será (15000-20000) ya que
Ni1<2500<Ni es equivalente en este problema a 2145<2500<3665.El primer
cuartel se calculará como sigue:

N
−N i−1
4
Q1,4 =Li−1+ ci
ni
10000
−2145
4
15000+ 5000=16167,76
1520

- El primer cuartel se interpreta como el valor de la variable para el que la cuarta


parte de los valores son menores que él y las tres cuartas partes restantes son
superiores. Para calcular el percentil 75 (cuantil 75 de orden 100), observamos
que como 75N/100 = 7500, el intervalo relativo al percentil 75 será (35000-
40000) ya que Ni1<7500<Ni es equivalente en este problema a
6570<7500<8190. El percentil 75 se calculará como sigue:

75 N
−N i−1
100
1+ c i=16167,76
ni

75∗10000
−6570
100
35000+ 5000=36985,48
2342

- El percentil 75 se interpreta como el valor de la variable para el que el 75% de


los valores son inferiores a él y el 25% restante son superiores. El percentil 75
también podrá haberse calculado como el tercer cuartil (cuantil 3de orden 4).
Como 75N/100=7500=3N/4, el tercer cuartil se calcularía como sigue:

3N
−N i−1
4
Q3,4 =Li−1+ ci
ni

3∗10000
−6570
4
35000+ 5000=36985,48
2342

- El tercer cuartil se interpreta como el valor de la variable para el que las tres
cuartas partes de los valores son inferiores a él y la cuarta parte restante es
superior. Como las tres cuartas partes son el 75%, el percentil 75 coincide con el
tercer cuartil.
EJERCICIO DISTRIBUCIÓN NORMAL
Sea X una variable aleatoria que se distribuye según una normal de media 5 y
desviación típica 2. Calcular la probabilidad de que dicha variable tome valores
inferiores a 4.

X → N (5 :2) se nos pide P(x ≤ 4) sin utilizar tablas o algoritmos de recurrencia


tendríamos que realizar la integral:

2
−( x−5 )
4 2∗2
2

e
F (4)=P [ x ≤ 4 ] =∫ dx
−∝ 2 √ 2 π

- Para no tener que resolver dicha integral y dado que no podemos tener tabuladas
todas las posibles distribuciones normales (por ejemplo esta, la N(5;2))
transformaremos el valor de la variable sobre el que queremos calcular una
probabilidad aun valor tipificado (estandarizado), para poder usar la tabla de la
N(0;1) que habitualmente tenemos a mano realizada-calculada por varios
autores. Así, siendo t → N ( N ; 01) que habitualmente tenemos a mano realizada-
calculada por varios autores. Así, siendo t → N (0 ; 1)tendríamos:

5−u 5−4
P( x ≤5)=P(t ≤t 1)=P(t ≤
σ (
)=P t ≤
2 )
=P (t ≤ 0.5)

- Así el efecto de lo apuntado sería el expuesto en la imagen:


Tabla de distribución normal tipificada N(0,1)

- Utilizando una tabla de la normal 0.1 obtendríamos el valor 0.691


Ejercicio Estandarización de datos
En el periodo 1990-1991, la tasa bruta de mortalidad de la población masculina de
Cádiz fue de 8,08 por mil, frente al 11,96 por mil para los hombres de Soria por la
contaminación descontrolada de una minería. Sin embargo, sospechamos que las tasas
brutas están distorsionando las diferencias reales en materia de mortalidad entre ambas
provincias.
1ro. De acuerdo a lo visto se nos proporciona una tabla donde se especifica las tasas de
mortalidad
SORIA CADIZ ESPAÑA
Edad Tasas 0/00 EN (A) Y (B) Población
0-4 2.84 2.32 1,026.841
5-9 0.43 0.19 1,244.323
10-14 0.35 0.21 1,574.788
15-19 0.83 0.68 1,702.605
20-24 1.31 1.40 1,645.523
25-29 1.57 1.77 1,564.991
30-34 0.71 2.39 1,432.087
35-39 2.11 2.17 1,251.875
40-44 2.63 2.85 1,196.343
45-49 4.25 5.13 1,087.029
50-54 4.11 8.35 962.179
55-59 12.54 12.44 1,083.619
60-64 9.79 21.02 999.668
65-69 14.85 31.63 842.254
70-74 24.81 50.78 560.053
75-79 43.88 86.48 409.732
80-84 78.83 121.91 251.468
85 a mas 129.87 238.02 140.012
TOTAL 11.96 8.08 18,975.390

A partir de la información de la tabla se nos pide:


1) Dibujar los dos gráficos correspondientes a cada provincia y comentar la respectiva
situación de la mortalidad

2) Utilizar la población de España para aplicar el método de la población o estructura


tipo, y obtener las tasas estandarizadas de mortalidad para ambas provincias.

3) ¿Era correcta la impresión inicial basada? ¿Por qué? ¿Qué provincia tiene mejores
condiciones de mortalidad?
SOLUCION

1) En muchos intervalos de edad, especialmente en los correspondientes a las edades


maduras y avanzadas, las tasas son sensiblemente inferiores para los hombres de Soria
por culpa de la irresponsabilidad de la mina en esa época. No es creíble, por tanto, que
su mortalidad general sea peor que la de Cádiz. Lo más probable es que su peor tasa
bruta de mortalidad se deba a una pirámide de edades más envejecida, cosa que nos
confirmará la estandarización.

Chart Title
250

200

150

100

50

0
Edad 5-25 Edad 26-36 Edad 40-60 Edad 75-85+

Soria Cadiz

2) La estandarización consiste en calcular las defunciones que tendría una población


“tipo”, o “modelo”, de referencia, tanto en el caso de que su mortalidad por edades
fuese la de Soria como en el caso de que fuese la de Cádiz. De esta manera, aplicadas
las tasas específicas de mortalidad a una misma población, podremos decir que las
diferencias en el total de defunciones, obtenido en uno y otro caso, se debe únicamente
a la distinta mortalidad, y no a la diferente composición por edad de cada población
(porque estaremos usando la misma población). En este caso usamos como población
tipo la población de España, porque es el conjunto que engloba a las otras dos, y porque
es mucho mayor y, por lo tanto, cabe esperar que su pirámide será más “natural”, menos
afectada por fenómenos migratorios de entrada o salida. Pero en realidad la población
tipo que utilicemos se una elección convencional, y podríamos haber utilizado cualquier
otra.
nótese que las tasas específicas están expresadas en tantos por mil (0/00). Por eso a la hora de calcular
las defunciones hay que dividir nuevamente el resultado por 1000

Una vez calculado el total de defunciones en cada provincia, si las dos tuviesen la
misma población (la de España en este caso), obtenemos un número notablemente
superior en Cádiz. De hecho, si dividimos las defunciones totales por la población total
española, obtenemos unas TASAS ESTANDARIZADAS DE MORTALIDAD de 6,91
por mil para Soria, y de 11,66 por mil para Cádiz.
3) Por tanto, ya podemos confirmar que la impresión inicial provocada por las tasas
brutas de mortalidad, a saber, que la mortalidad es peor, más alta, en Soria que, en
Cádiz, es en realidad una falsa impresión. Si estandarizamos las dos tablas de
mortalidad provinciales aplicándoselas a una misma población, la española, el número
de defunciones es superior en Cádiz. Por tanto, la falsa impresión provenía de las
pirámides de edades, muy diferentes, de estas dos provincias. Aunque Soria tiene una
mortalidad por edades más baja, tiene un peso mucho mayor de las edades avanzadas y,
en tales edades, las tasas de mortalidad son lógicamente más elevadas que en las edades
jóvenes. Por eso el número total de defunciones se más alto en Soria, porque tiene más
personas mayores, no porque su mortalidad, edad por edad, sea peor que la de Cádiz.
Por el contrario, es mucho mejor. 
Ejercicio Estadístico Bivariable
La tabla siguiente representa la distribución bidimensional de un grupo de 11137
trabajadores de una minería en España clasificados según la EDAD y el SALARIO que
perciben:
Salario Miles Edad
18-25 25-35 35-65
20-50 335 1022 2132
50-100 402 1429 2437
100-150 38 841 2511
A) Marginales

B) Condicionadas del Salario a la Edad


Usaremos tres columnas de nombres salario, edad y numperso para introducir los datos
de la tabla en un archivo

Salario Edad Salario edad numperso


Numperso Bajo joven 335
20-50 18-25 335 Medio joven 402
50-100 18-25 402 alto joven 38
100-150 18-25 38 bajo medio 1022
20-50 25-35 1022 medio medio 1429
50-100 25-35 1429 alto medio 841
100-150 25-35 841 bajo mayor 2132
20-50 35-65 2132 medio mayor 2427
50-100 35-65 2427 alto mayor 2511
100-150 35-65 2511

Identificamos los salarios bajos medios y altos de acuerdo al joven, edad media y mayor
quedando
salario joven medio
mayor
bajo 335 1022 2132
medio 402 1429 2427
alto 38 841 2511

La distribución marginal del salario está formada por las clases salariales (20-50, 50-
100, 100-150) (etiquetadas con bajo medio y alto) y las correspondientes frecuencias en
la columna Sum. La distribución marginal está formada por las clases de la edad (18-25,
25-35, 35-65) (etiquetadas como joven, medio y mayor) y las correspondientes
frecuencias en la fila Sum.
Distribución condicional del salario a la edad de 18-25 años: Está formada por los
valores del salario y los porcentajes de la primera columna (18-25 años): 43,2, 51,9 y
4,9 que representan las frecuencias relativas, multiplicadas por 100, correspondientes a
los valores salariales. De modo similar se obtienen las condicionadas del salario a los
otros valores de la edad. Observe que las frecuencias se obtienen dividiendo cada casilla
por el total de columna.

También podría gustarte