Está en la página 1de 8

Cálculo de cuantiles de datos agrupados en intervalos

Calcularemos el cuantil de orden 0.30 de la edad de la población de una aldea resumida en la


tabla:

Edad de la población habitantes frecuencia acumulada


0-20 9 9
20-40 18 27
40-60 26 53
60-80 7 60
80-100 4 64

Nuestro primer paso será hallar el intervalo en que se encuentra nuestro cuant il: De un total de
64 datos, el cuantil 0.30 ocupará la posición np=64×0.3=19.2. Observamos en la columna de
frecuencias acumuladas que este valor, por estar comprendido entre 9 y 27, corresponde al
intervalo 20-40.

Dentro de este intervalo, seleccionaremos el valor de nuestro cuantil por simple interpolación
lineal. Para ello, siguiendo las indicaciones del gráfico, sólo será necesario hacer una regla de
tres.

Observamos en la figura dos triángulos semejantes: OAB y OCD. El cuantil buscado


corresponderá a la abscisa 20+x. Razonando por semejanza, OB=x es a AB=10.2, como OD=20
es a CD=18. Despejando obtenemos x=11.33, luego el cuantil buscado es a 20+x=31.33.

[editar] Cuantiles destacados


[editar] Cuartiles

Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes
porcentualmente iguales. Aparecen citados en la literatura científica por primera vez en 1879 por
D. McAlister.1

La diferencia entre el tercer cuartil y el primero se conoce como rango intercuartílico. Se


representa gráficamente como la anchura de las cajas en los llamados diagramas de cajas.

Dada una serie de valores X1,X2,X3 ...Xn ordenados en forma creciente, podemos pensar que su
cálculo podría efectuarse:

 Primer cuartil (Q1) como la mediana de la primera mitad de valores;


 Segundo cuartil (Q2) como la propia mediana de la serie;
 Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.

Pero esto conduce a distintos métodos de cálculo de los cuartiles primero (resp. tercero) según la
propia mediana se incluya o excluya en la serie de la primera (resp. segunda) mitad de valores.

Cálculo con datos no Agrupados

No hay uniformidad sobre su cálculo. en la bibliografía se encuentran hasta cinco métodos que
dan resultados diferentes. 2 Uno de los métodos es el siguiente: dados n datos ordenados,

 El primer cuartil:

(n+3)/4

 Para el tercer cuartil

(3n+1)/4

[editar] Percentiles

Se representan con la letra P. Para el percentil i-ésimo, donde la i toma valores del 1 al 99. El i %
de la muestra son valores menores que él y el 100-i % restante son mayores.

Aparecen citados en la literatura científica por primera vez por Francis Galton en 1885 3

 P25 = Q1.
 P50 = Q2 = mediana.
 P75 = Q3.

Cálculo con datos no Agrupados


Un método para calcular un percentil sería el siguiente: Calculamos donde n es el
número de elementos de la muestra e i el percentil. El resultado de realizar esta operación da
como resultado un número real con parte entera E y parte decimal D. Teniendo en cuenta estos 2
valores, aplicamos la siguiente función:

El resultado de esta última operación es el valor del percentil pedido.

[editar] Cálculos con ordenador


[editar] Con paquetes de software estadístico

Hay varios métodos, que conducen a resultados distintos, para estimar el valor de los cuantiles.4
La batería completa de nueve métodos está disponible en el lenguaje de programación R;5 SAS
incluye cinco de los métodos citados; STAT, cuatro. A diferencia de estos, software de propósito
general como Microsoft Excel incluye sólo uno de los métodos.

[editar] Con software matemático de propósito general

Citaremos en este caso el uso de Scilab, Matlab y Excel.

Percentiles

En Scilab, los percentiles de un conjunto de datos son calculados con la instrucción “perctl”. A
esta instrucción hay que introducirle dos vectores. Uno de ellos “x” debe contener los datos que
queremos procesar y en el otro “y”, valores enteros comprendidos entre el 1 y el 100. La función
calcula cuales son los valores de “x” que se corresponden con los percentiles indicados en “y”.
Por ejemplo:

x=[7,12,4,8,3,10,11,5,13,1,12,3,5,1,17,4,8,8,7,19,8,1,7,17,4,7,1,7,3,7,3,13,3,
4,7,8,10,2,5,11,5,4,3,5,8];
y=[15,25,60,80]

calcularía los percentiles 15, 25, 60 y 80 del conjunto de datos del vector “x”, mostrando en la
salida una matriz de dos columnas. En la primera de ellas aparecen los valores de los percentiles
pedidos y en la segunda aparece la posición que ocupan en el vector “x” dichos valores:

prctile(x,y)
ans =
3. 43.
4. 3.
7. media de los elementos 1 y 19.
10.5 media de los elementos 6 y 7

Cuartiles

Siguiendo con Scilab, los cuartiles de la muestra son calculados con la instrucción “quart”. Esta
instrucción es más sencilla que la anterior. Basta con introducirle un vector o matriz de valores y
nos devolverá un vector con el valor de los cuartiles de los datos introducidos. Scilab también
nos permite calcular el rango intercuartilico que es la distancia que hay entre un cuartil y otro.
Podemos hacerlo con la instrucción “iqr”. Voy a usar el mismo vector “x” que en el caso
anterior:

quart(x)
ans = 3.75 7. 8.5
iqr(x)
ans = 4.75

Para MSExcel se puede usar

=cuartil(RANGO, 1)

=cuartil(RANGO, 2)

=cuartil(RANGO, 3)

donde RANGO son los datos de los cuales queremos extraer el cuartil y el valor 1, 2 y 3 indican
el primer, segunto y tercer cuartil.
Datos Agrupados

Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la fórmula:

k= 1,2,3,... 99

Donde:

Lk = Límite real inferior de la clase del decil k

n = Número de datos

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.

fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k

Otra forma para calcular los percentiles es:

 Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa
y nueve por ciento restante.

 El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es


superado por el 40% de las observaciones.
 El percentil 99 supera 99% de los datos y es superado a su vez por el 1% restante.

Fórmulas Datos No Agrupados

Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas:

Para los percentiles, cuando n es par:

Cuando n es impar:

Siendo A, el número del percentil.

Es fácil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil
50 y el tercer cuartil con el percentil 75.

3. EJEMPLO

Determinación del primer cuartil, el séptimo decil y el 30 percentil, de la siguiente tabla:

Salarios No. De fa
(I. De Clases) Empleados (f1)
200-299 85 85
300-299 90 175
400-499 120 295
500-599 70 365
600-699 62 427
700-800 36 463

Como son datos agrupados, se utiliza la fórmula

Siendo,

La posición del primer cuartil.


La posición del 7 decil.

La posición del percentil 30.

Entonces,

El primer cuartil:

115.5 – 85 = 30.75

Li = 300, Ic = 100 , fi = 90

El 7 decil:

Posición:

324.1 – 295 = 29.1

Li = 500, fi = 70

El percentil 30

Posición:

138.9 – 85 = 53.9
fi = 90

Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334;
que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de los empleados.

También podría gustarte