Está en la página 1de 5

Calcular cuartiles, deciles y

percentiles para datos no agrupados


En el ámbito de la Estadística Descriptiva, se conoce como Medidas de Posición a
aquellas entidades numéricas utilizadas para señalar la posición que ocupa un dato
determinado, en relación con el resto de datos numéricos, permitiendo así conocer otros
puntos propios de la distribución de datos, que no son inherentes a los valores centrales.
Entre las Medidas de Posición más comunes en el campo de la Estadística se
encuentran los Cuartiles, Deciles y Percentiles. Resulta pertinente entonces hacer una
breve descripción de cada una de estas medidas, así como de las formas de calcularlos.
A continuación, los Cuartiles, Deciles y Percentiles:

Cuartiles
Los cuartiles corresponden a los valores que tiene una variable y que cumplen con
la función de dividir los datos ordenados en cuartos o cuatro partes con igual valor
porcentual.

Cómo calcular Cuartiles


El procedimiento para calculas cuartiles correspondientes a datos no agrupados resulta
bastante sencillo, pues sólo toma cuatro pasos, los cuales serán explicados a
continuación:
1. Se deben ordenar los datos de forma sucesiva, y de mayor a menor.
2. Se deberá calcular el cuartil usando la fórmula siguiente:

En donde n corresponde al tamaño total de la muestra, y k a la medida de


posición que se está calculando.
3. Obtenido el resultado se debe determinar la naturaleza del valor, si
corresponde a un número entero, se le debe sumar el valor de 0.5, si por el
contrario el cálculo arrojó un número no entero se tomará con el valor del
siguiente número entero de mayor tamaño.
4. Una vez obtenida la medida de posición debe ubicarse en los datos que han sido
ordenados.

Ejemplo
A continuación, se ofrece un ejemplo de cómo calcular el primer y tercer cuartil (Q1
y Q3) en base a la cantidad de alumnos que han asistido a clases a un colegio privado
durante la primera quincena de clases (15 días) entre lunes y viernes.
En primer lugar, se ofrecerán los datos estadísticos correspondientes a la asistencia,
según sucedió esta:

30 28 27 30 25
30 29 29 27 29
28 30 30 30 29

De esta forma, a fin de calcular el Q1 y el Q3, lo primero que debe hacerse es ordenar
de menor a mayor los datos:
25 27 27 28 28
29 29 29 29 30
30 30 30 30 30

Hecho esto se procede entonces a calcular el primer cuartil Q1. Para esto, se
designa a cada variable un valor, procedimiento que generaría entonces que n= 15, k=
25 (porque esa es la medida de posición que busca el primer percentil. Entonces se
aplica la ecuación:

La cuenta ha dado 3,75 número éste que señala que el Q1 se encuentra entonces entre
el tercer y cuarto dato, se regresa a los datos, y se busca cuáles son los valores del
tercer y cuarto dato. En este ejemplo, el tercer dato correspondería a “27” y el cuarto
dato a “28”. Obtenidos, se procede entonces a sumarlos y dividirlos entre dos:

Es decir, que, durante 15 días, el Q1 correspondiente a los alumnos que asistieron a


clases fue de 27,5. A fines de calcular el Q3, se realiza el mismo procedimiento, solo
que el valor de la k será 75.

Deciles
Por su parte los Deciles constituyen otro tipo de Medidas de Posición, conformados por
ciertos valores que dividen la sucesión de datos que han sido ordenadas en diez
partes, que son equitativas porcentualmente hablando. Ellos se denotan de la siguiente
forma: D1, D2, D3…D9, aun cuando se leen “primer decil”, “cuarto decil”, etc. De
acuerdo con las fuentes estadísticas son utilizados sobre todo para calcular el
aprovechamiento académico.

Cómo calcular Deciles


Al igual que con los Cuartiles, los Deciles pueden ser calculados en base a si los datos
se encuentran no agrupados, o por el contrario sí lo están. De esta forma, se
tendrían dos formas de calcularlos:
Si se tiene una serie de números o datos, correspondientes a distintos valores X1, X2…
Xn, se deberán usar las siguientes fórmulas, según si el valor es un número par o impar.
A continuación, cada una de las ecuaciones a emplear de acuerdo con el caso:
Si n (número que corresponde al número de datos) y es par se deberá emplear la
siguiente fórmula:

Si por el contrario n es impar, entonces se deberá aplicar la fórmula que se expresa a


continuación:
Es importante señalar que en todos los casos A corresponderá al Decil que se desea
calcular.

Percentiles
Finalmente, los percentiles, también conocidos como centiles son otras de las Medidas
de Posición más comunes y empleadas, utilizadas sobre todo para clasificación de
datos correspondientes a las medidas de las personas, como la estatura, el peso,
el diámetro craneal, etc. Igualmente, técnicamente, son definidos como ciertos valores
que dividen en cien partes idénticas porcentualmente hablando los datos que han sido
ordenados de forma sucesiva de menor a mayor. En cuanto a su denotación, ésta
corresponde a la forma P1, P2…. Pn, no obstante, son leídas como Percentil 10,
Percentil 90, etc.

Cómo calcular Percentiles


Tal como con las otras Medidas de Posición, los percentiles pueden ser medidos en
cuanto a si corresponden a Datos no Agrupados o Agrupados, en cuyo caso se usarán
procedimientos matemáticos distintos. A continuación, una descripción de cada uno
de ellos:

Percentiles de Datos no agrupados


Si se trata del cálculo de percentiles de datos no ordenados, se deberá tomar calcular
en base a la siguiente fórmula:

En donde x es el número del percentil, n es equivalente al número total de datos y k


el percentil.

Desviación estándar
La desviación típica o estándar, denotada por la literal s, es una medida de dispersión
que se emplea para variables de razón (también conocidas como ratio o cociente) y para
variables de intervalo. La desviación estándar se considera una medida cuadrática que
representa el promedio de las desviaciones (distancias) de los datos muestrales
respecto de su media aritmética, expresada en las mismas unidades que la variable.

La fórmula para calcular la desviación estándar para datos no agrupados está dada por
la siguiente expresión:
Dónde:

Por su parte, la fórmula para calcular la desviación estándar de datos agrupados está
dada por la siguiente expresión:

Donde:

Coeficiente de variación
El coeficiente de variación, también denominado como coeficiente de variación de
Spearman, es una medida estadística que nos informa acerca de la dispersión relativa
de un conjunto de datos. Su cálculo se obtiene de dividir la desviación típica entre el
valor absoluto de la media del conjunto y por lo general se expresa en porcentaje para
su mejor comprensión.

El coeficiente de variación se puede ver expresado con las letras CV o r, dependiendo


del manual o la fuente utilizada. Su fórmula es la siguiente:
El coeficiente de variación se utiliza para comparar conjuntos de datos pertenecientes a
poblaciones distintas. Si atendemos a su fórmula, vemos que este tiene en cuenta el
valor de la media. Por lo tanto, el coeficiente de variación nos permite tener una medida
de dispersión que elimine las posibles distorsiones de las medias de dos o más
poblaciones.

Varianza
La varianza es una medida de dispersión, por tanto, se utiliza para estudiar el
comportamiento de los valores de la variable aleatoria en función de la media (μ o E[x]),
es decir, estudia lo alejado o no que están los valores de la media.
Llamamos varianza de una variable aleatoria X con media μ=E[x] a la esperanza del
cuadrado de la diferencia entre la variable y su esperanza. Lo denotamos
por Var[x] o σ^2:

Desarrollando esta expresión, obtenemos la fórmula que utilizamos normalmente para


poder calcular la esperanza de forma práctica; dejando la de la definición para
demostraciones o enunciados teóricos:

Propiedades:
Sean a y b números reales (constantes) y X e Y variables aleatorias, entonces se
cumplen las siguientes propiedades:

1. La varianza de una constante es nula: Var[a]=0.


2. La varianza de cualquier variable aleatoria siempre es positiva o cero: Var[X]≥0.
3. Las constantes salen de la varianza al cuadrado. Es decir, la varianza de una
constante por una variable aleatoria es igual al cuadrado de la constante por la
varianza de X:

4. La varianza de la suma de dos variables aleatorias independientes X e Y es igual a


la suma de sus varianzas: Var(X+Y)=Var(X)+Var(Y).
5. Cuando las variables no son independientes se tiene que la suma de dos variables
aleatoria es igual a la suma de las varianzas más dos veces la covarianza:
Var (X+Y)=Var (X)+Var(Y)+2Cov(X,Y).
6. Como consecuencia de la primera y la tercera se deduce que:

También podría gustarte