La mediana para datos agrupados

Distribución de frecuencias del peso de 500 estudiantes de 3o básico
No

clases

f

1 64.545 77.545
1
2 77.545 90.545
8
3 90.545 103.545 21
4 103.545116.545 59
5 116.545129.545 98
6 129.545142.545 126
7 142.545155.545 111
8 155.545168.545 45
9 168.545181.545 25
10 181.545194.545 4
11 194.545207.545 2
500

xi

fa

fr

far

f x

71.045
84.045
97.045
110.045
123.045
136.045
149.045
162.045
175.045
188.045
201.045

1
9
30
89
187
313
424
469
494
498

0.002
0.016
0.042
0.118
0.196
0.252
0.222
0.09
0.05
0.008

0.002
0.018
0.06
0.178
0.374
0.626
0.848
0.938
0.988
0.996

71.045
672.36
2037.945
6492.655
12058.41
17141.67
16543.995
7292.025
4376.125
752.18
402.09
67840.5

0.996

f x 2

xi  x

 x  x

2

i

5047.392025 -64.6364177.812496
56508.4962 -51.63621330.21197
197772.3725 -38.63631347.55042
714484.2195 -25.63638775.06526
1483727.058 -12.63615647.51261
2332038.495 0.364 16.694496
2465799.735 13.364 19824.21106
1181636.191 26.364 31277.72232
766018.8006 39.364 38738.1124
141443.6881 52.364 10967.95398
80838.18405 65.364 8544.904992
9425314.633 4.004 220647.752

Para calcular la mediana o cualquier medida de posición de una serie de datos agrupados en
determinadas clases podríamos hacer el siguiente análisis. En el caso de la mediana, se busca el
número que divida en dos partes de igual número de datos que sean, respectivamente, menores y
mayores que ese número. En el caso que nos ocupa, como n=500 la posición que define la
mediana es (500+1)/2=250.5. Observe que se sumó 1 a n porque es par. Es decir, la mediana
deberíamos buscarlo en la clase que contenga al hipotético dato 250.5. Si observamos la
columna de frecuencia acumulada, de la clase 5 indica que hasta esa clase se tienen
contabilizados 187 datos, mientras que la siguiente clase, se tienen contabilizados 313. Es
evidente que la mediana estará incluida en la clase 6 (129.545,142.545). En esa clase se
contabilizan 126 datos (su frecuencia). Entre esos datos deberá encontrarse la mediana. La
posición que ocupe la mediana será la diferencia entre 250.5 y la frecuencia acumulada de la
clase anterior a la de la clase mediana, esto es 250.5–187=63.5. Por otro lado, los 126 datos en
la clase mediana se suponen uniformemente distribuidos a lo largo de todo el intervalo de la
1
clase. De ello se desprende que a cada uno de los datos le corresponde
del intervalo y
126
13
como la clase tiene un ancho de 13, a cada dato le corresponderá
de la clase mediana.
126
Sabiendo que la mediana está en la posición 63.5, se tiene que la mediana se obtendrá del
13
producto de de 63.5 y
más el límite real inferior de la clase en estudio. Esto es
126
13
129.545  63.5
 136.1 . La mediana de la serie de no agrupados es 135.2, por lo que el
126
error es mínimo.
Un procedimiento similar se sigue para obtener cualquier cuantil de la distribución. Por ejemplo
en el caso del tercer cuartil, se busca el número para el cual, el 75% de los datos dela distribución
son menores o iguales a él, y el 25% son mayores o iguale a él. La posición que ocupa
corresponde al 75% de los datos de la distribución, es decir 500*0.75=375. Las clases 6 y 7
tienen fa de 313 y 424, respectivamente, por lo que se deduce que Q3 deberá estar en la clase 7.

Ésta tiene una frecuencia de 111 y la diferencia entre la posición de Q3 y la fa de la clase anterior
es 375-313=62.
Como la clase 7 tiene un ancho de 13, entonces, finalmente
13
Q3  142.545  62
 149.81 . El cuartil 3 de la serie de no agrupados es 149.53, por lo que el
111
error es mínimo.
Aunque existen fórmulas que simplifican los cálculos, hacerlo “a pié” clarifica mucho el
concepto.
Luis Solórzano
1 agosto 2008

Sign up to vote on this title
UsefulNot useful