Está en la página 1de 27

MEDIDAS ESTADÍSTICAS

Las diferentes medidas estadísticas que estudiaremos son las que se muestran en el
siguiente diagrama:

Media
De tendencia
Mediana
central
Moda
De posición
Cuartiles
De tendencia
Deciles
no central

Medidas Percentiles
estadísticas Rango

Desviación media

De dispersión Varianza

Desviación estándar

Coeficiente de variación

Las fórmulas que utilizaremos siempre harán referencia a muestras, a menos que se indique
lo contrario. También, calcularemos las diferentes medidas, tanto para datos no agrupados
como para datos agrupados.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS NO AGRUPADOS


Se llaman medidas de tendencia central porque el dato numérico que se calcula, y que
representa a la muestra, tiende a estar en el centro de la distribución de los datos. Son tres
las medidas de tendencia central que estudiaremos: media (aritmética, geométrica y
armónica), mediana y moda.

Media aritmética: O simplemente media, es la medida o valor que resulta del promedio
aritmético de todos los datos. Matemáticamente se representa como:

Prof. Jesús Ramos Rivas


∑ 𝒙𝒊
̅=
𝒙
𝒏

𝑥𝑖 = cada uno de los elementos de la muestra


𝑛 = tamaño de la muestra

Ejemplo: Determina el valor de la media para la siguiente muestra de datos: (2, 9, 1, 6, 0, 8,


8, 2).

Solución: Lo primero que debemos determinar es el valor de n, es decir, el tamaño de la


muestra. En este caso n = 8, ya que la muestra tiene 8 datos. Ahora, sumemos todos los
datos y dividamos entre 8:

∑ 𝒙𝒊 2 + 9 + 1 + 6 + 0 + 8 + 8 + 2 36
̅=
𝒙 = = = 4.5
𝒏 8 8

̅ = 𝟒. 𝟓
Por lo tanto, el valor de la media es 4.5 y se representa como 𝒙

Es importante mencionar que la suma debe respetar el signo de cada dato. Si en la muestra
hubiera datos negativos, estos se deberán considerar para realizar la suma.

Ejemplo: Determina el valor de la media para la siguiente muestra de datos: (-2, 9, 1, 6, 0,


8, -8, 2).

Solución: Sabemos que n = 8, pero ahora hay valores negativos, por lo tanto, el
procedimiento es:

∑ 𝒙𝒊 −2 + 9 + 1 + 6 + 0 + 8 − 8 + 2 16
̅=
𝒙 = = =2
𝒏 8 8

̅ = 𝟐.
La media, ahora resulta de 2, es decir, 𝒙

Media geométrica: Se calcula como la raíz enésima del producto de todos los datos de la
muestra. Matemáticamente, su fórmula es la siguiente:

𝒏
̅𝒈 = √(𝒙𝟏 )(𝒙𝟐 ) … (𝒙𝒏 )
𝒙

Prof. Jesús Ramos Rivas


𝑥𝑖 = cada uno de los elementos de la muestra
𝑛 = tamaño de la muestra

Ejemplo: Determina el valor de la media geométrica para la siguiente muestra de datos: (2,
9, 1, 6, 4, 1, 8, 2).

Solución: Lo primero que debemos determinar es el valor de n, es decir, el tamaño de la


muestra. En este caso n = 8, ya que la muestra tiene 8 datos. Ahora, multipliquemos todos
los datos entre sí y apliquemos al resultado raíz octava (porque son 8 datos):

𝟖
̅𝒈 = 𝟖√(𝟐)(𝟗)(𝟏)(𝟔)(𝟒)(𝟏)(𝟖)(𝟐) = √𝟔𝟗𝟏𝟐 = 𝟑. 𝟎𝟏𝟗𝟔
𝒙

Observa que, para poder calcular la media geométrica, en la muestra no deben existir
valores negativos. También, observa que, si la muestra contiene un cero como dato, el
resultado automáticamente será cero.

Media armónica: Se calcula como el número total de elementos de la muestra entre la suma
de los inversos de cada uno de ellos. Su fórmula es la siguiente:

𝒏
̅𝒉 =
𝒙
𝟏 𝟏 𝟏
+ +⋯+
𝒙𝟏 𝒙𝟐 𝒙𝒏
𝑥𝑖 = cada uno de los elementos de la muestra
𝑛 = tamaño de la muestra

Ejemplo: Determina el valor de la media armónica para la siguiente muestra de datos: (2,
4, 1, 8, 2).

Solución: Lo primero que debemos determinar es el valor de n, es decir, el tamaño de la


muestra. En este caso n = 5, ya que la muestra tiene 5 datos. Ahora, apliquemos la fórmula
y sustituyamos los respectivos valores:

𝟓 𝟓 (𝟓)(𝟖) 𝟒𝟎
̅𝒉 =
𝒙 = = = = 𝟐. 𝟏𝟎𝟓𝟐
𝟏 𝟏 𝟏 𝟏 𝟏 𝟏𝟗 𝟏𝟗 𝟏𝟗
𝟐+𝟒+𝟏+𝟖+𝟐 𝟖

Observa que, para poder calcular la media armónica, en la muestra no deben existir valores
nulos (ceros).

Prof. Jesús Ramos Rivas


Mediana: Es el valor que está justo en el centro de una muestra ordenada de datos. Habrá
dos situaciones que considerar: cuando el tamaño de la muestra es par y cuando es impar.

Ejemplo: Determina la mediana de la siguiente muestra: (2, 3, 1, 0, 0, 6, 1, 3, 4, 5, 9, 12, 3).

Solución: Para calcular la mediana, primero debemos ordenar la muestra, ya sea de menor
a mayor o al revés. Aquí lo importante es que esté ordenada.

La muestra ordenada es: (0, 0, 1, 1, 2, 3, 3, 3, 4, 5, 6, 9, 12). Observa que el tamaño de la


muestra es impar, ya que n = 13.

Lo que sigue es ir quitando un dato de la izquierda y uno de la derecha, y repetir este


procedimiento hasta que solo quede un dato. Ese dato es el valor de la mediana:

0, 0, 1, 1, 2, 3, 3, 3, 4, 5, 6, 9, 12

Después de haber eliminado el mismo número de datos de la izquierda y de la derecha,


observamos que el único valor que queda es 3, por lo tanto, el valor de la mediana de la
muestra es 3.

Ejemplo: Determina la mediana de la siguiente muestra: (2, 3, 1, 0, 6, 1, 2, 4, 5, 9).

Solución: Observa que el tamaño de la muestra es par, ya que n = 10. De acuerdo con el
procedimiento, primero debemos ordenar la muestra y después, remover sucesivamente
un dato de la izquierda y uno de la derecha:

0, 1, 1, 2, 2, 3, 4, 5, 6, 9

Debido a que el tamaño de la muestra es par, al final del proceso, nos quedarán dos
números y no uno, como en el caso de una muestra impar. Ahora, y tomando en cuenta que
la mediana es el valor que queda justo en el centro, lo que debemos hacer es promediar
esos dos valores finales y el resultado será el valor de la mediana de la muestra:

2+3 5
Mediana = = = 2.5
2 2
Moda: La moda es el dato que más veces se repite en una muestra.

Ejemplo: Determina la moda de la siguiente muestra: (1, 3, 1, 0, 6, 1, 2, 0, 5, 9).

Solución: Aunque no es un requisito ordenar la muestra, sí es recomendable hacerlo para


apreciar de mejor manera, todos los elementos y visualmente, determinar sin problema,
quién es el que más veces se repite.

Prof. Jesús Ramos Rivas


La muestra ordenada es (0, 0, 1, 1, 1, 2, 3, 5, 6, 9) y ahí, podemos observar que 1 es el dato
que más veces se repite, por lo tanto, la moda de la muestra es 1.

Ejemplo: Determina la moda de la siguiente muestra: (1, 3, 1, 0, 6, 1, 2, 0, 0, 9).

Solución: La muestra ordenada es (0, 0, 0, 1, 1, 1, 2, 3, 6, 9) y ahí, podemos observar que


tanto 0 como 1, son los datos que más veces se repiten, por lo tanto, la moda de la muestra
es 0 y 1. En este caso es bimodal, ya que hay 2 datos que son moda.

Ejemplo: Determina la moda de la siguiente muestra: (1, 2, 3, 4, 5, 6, 7, 8).

Solución: Debido a que ningún dato se repite más de una vez, decimos que la muestra no
tiene moda.

MEDIDAS DE TENDENCIA NO CENTRAL PARA DATOS NO AGRUPADOS


Las medidas de tendencia no central o cuantiles permiten conocer puntos característicos
de una serie de valores, que no necesariamente tienen que estar localizados en el centro
de la muestra. La intención de estas medidas es dividir o seccionar el conjunto de datos en
grupos con el mismo número de valores. Los cuantiles más comunes son los cuartiles, los
deciles y los percentiles.

Todos los cuantiles que estudiaremos tienen un comportamiento similar. Entendiendo uno
de ellos, podremos fácilmente, comprender el resto.

Cuartiles: Son valores que dividen una muestra ordenada de datos en cuatro partes iguales.
Utilizando cuartiles, se puede evaluar rápidamente la dispersión y la tendencia central de la
muestra, lo que ayuda a su comprensión. Se representan por Q1, Q2 y Q3 y gráficamente, los
podemos entender de la siguiente manera:

Q1 Q2 Q3

¿Cuál sería la interpretación de esta gráfica? El 25% de los datos de la muestra son menores
o iguales que Q1. El 50% de los datos de la muestra son menores o iguales que Q2. Y que el
75% de los datos de la muestra son menores o igual que Q3.

Para determinar el valor del cuartil correspondiente, primero se debe localizar la posición
que le corresponde y después, ubicar el valor en la muestra. La posición se determina con
la siguiente fórmula:

Prof. Jesús Ramos Rivas


𝒌(𝒏 + 𝟏)
𝑷𝒐𝒔(𝑸𝒌 ) =
𝟒
𝑘 = número de cuartil
𝑛 = tamaño de la muestra

Ejemplo: Determina los valores de Q1, Q2 y Q3 para la siguiente muestra: (7, 9, 16, 36, 39,
45, 45, 46, 48, 51).

Solución: Observa que la muestra ya está ordenada, pero si no lo estuviera, hay que
ordenarla antes de realizar cualquier cálculo. El valor de n = 10. Ahora, busquemos las
posiciones de cada cuartil:

(𝟏𝟎 + 𝟏) 𝟏𝟏
𝑷𝒐𝒔(𝑸𝟏 ) = = = 𝟐. 𝟕𝟓
𝟒 𝟒
𝟐(𝟏𝟎 + 𝟏) 𝟐𝟐
𝑷𝒐𝒔(𝑸𝟐 ) = = = 𝟓. 𝟓
𝟒 𝟒
𝟑(𝟏𝟎 + 𝟏) 𝟑𝟑
𝑷𝒐𝒔(𝑸𝟑 ) = = = 𝟖. 𝟐𝟓
𝟒 𝟒

Con las posiciones, debemos buscar los correspondientes valores en la muestra. Para ello,
nos apoyaremos de la siguiente tabla:

1 2 3 4 5 6 7 8 9 10
7 9 16 36 39 45 45 46 48 51

El color verde indica la posición de cada elemento de la muestra. Para Q1, el valor que
buscamos se ubica en la posición 2.75. ¿Cómo lo ubicamos en la tabla? Debería ser un valor
que se encuentra entre la posición 2 y la posición 3, es decir, entre 9 y 16. Debido a que los
cuartiles dividen en 4 partes un intervalo, realizaremos esa segmentación entre 9 y 16, para
determinar exactamente el valor de la posición 2.75. Primero, calculamos la diferencia entre
los valores 16 y 9, es decir: 16 – 9 = 7. Una vez que conocemos este dato, lo separamos en
4 partes iguales, lo que significa que debemos dividirlo entre 4, es decir:

7
= 1.75
4
El valor de 1.75 se interpreta como el valor de cada uno de los 4 segmentos que hay entre
9 y 16. Gráficamente sería algo como esto:

Prof. Jesús Ramos Rivas


1.75 1.75 1.75 1.75
9 16

Los valores que se localizan en donde apuntan las flechas, se pueden calcular de la siguiente
manera:

• 9 + 1.75 = 10.75
• 10.75 + 1.75 = 12.5
• 12.5 + 1.75 = 14.25

Recuerda que las posiciones del 9 y del 16 son 2 y 3, respectivamente. Esto quiere decir,
que podemos incluir las “nuevas” posiciones y sus valores, de la siguiente manera:

2 2.25 2.5 2.75 3


9 10.75 12.5 14.25 16

Con la tabla anterior es muy sencillo determinar que el valor que corresponde a la posición
2.75 es 14.15, es decir, Q1 = 14.25. Observa que nuestra primera aproximación fue cierta:
el valor correcto está entre 9 y 16.

Para calcular Q2, podemos hacerlo de la misma manera o aprovechar el hecho de que, dicho
valor, siempre coincidirá con la mediana de la muestra:

1 2 3 4 5 6 7 8 9 10
7 9 16 36 39 45 45 46 48 51

Entonces, para calcular Q2, bastará con calcular la mediana, es decir:

39 + 45 84
𝑄2 = = = 42
2 2
Recuerda que, en una muestra par, siempre quedan dos valores al centro, por lo que se
deben promediar.

Si el valor de Q2 se hubiera calculado como el mismo procedimiento con el que se calculó


Q1, hubiéramos llegado exactamente al mismo resultado. A manera de práctica, comprueba
que así es.

Para Q3, el valor que buscamos se ubica en la posición 8.25. ¿Cómo lo ubicamos en la tabla?
Debería ser un valor que se encuentra entre la posición 8 y la posición 9, es decir, entre 46
y 48. Debido a que los cuartiles dividen en 4 partes un intervalo, realizaremos esa

Prof. Jesús Ramos Rivas


segmentación entre 46 y 48, para determinar exactamente el valor de la posición 8.25.
Primero, calculamos la diferencia entre los valores 48 y 46, es decir: 48 – 46 = 2. Una vez
que conocemos este dato, lo separamos en 4 partes iguales, lo que significa que debemos
dividirlo entre 4, es decir:

2
= 0.5
4
El valor de 0.5 se interpreta como el valor de cada uno de los 4 segmentos que hay entre 46
y 48. Gráficamente sería algo como esto:

0.5 0.5 0.5 0.5


46 48

Los valores que se localizan en donde apuntan las flechas, se pueden calcular de la siguiente
manera:

• 46 + 0.5 = 46.5
• 46.5 + 0.5 = 47
• 47 + 0.5 = 47.5

Recuerda que las posiciones del 46 y del 48 son 8 y 9, respectivamente. Esto quiere decir,
que podemos incluir las “nuevas” posiciones y sus valores, de la siguiente manera:

8 8.25 8.5 8.75 9


46 46.5 47 47.5 48

Con la tabla anterior es muy sencillo determinar que el valor que corresponde a la posición
8.25 es 46.5, es decir, Q3 = 46.5. Observa que nuestra primera aproximación fue cierta: el
valor correcto está entre 46 y 48.

Deciles: Son valores que dividen una muestra ordenada de datos en diez partes iguales. Se
representan por D1, D2, …, D9 y gráficamente, los podemos entender de la siguiente manera:

D1 D2 D3 D4 D5 D6 D7 D8 D9

¿Cuál sería la interpretación de esta gráfica? El 10% de los datos de la muestra son menores
o iguales que D1. El 20% de los datos de la muestra son menores o iguales que D2. Y así
sucesivamente. El valor de D5 coincide con la mediana de la muestra.

Prof. Jesús Ramos Rivas


Para determinar el valor del decil correspondiente, primero se debe localizar la posición que
le corresponde y después, ubicar el valor en la muestra. La posición se determina con la
siguiente fórmula:

𝒌(𝒏 + 𝟏)
𝑷𝒐𝒔(𝑫𝒌 ) =
𝟏𝟎
𝑘 = número de decil
𝑛 = tamaño de la muestra

La metodología de análisis y cálculo es la misma que la que se aplicó para el estudio de


cuartiles. Intenta realizarla como ejercicio de práctica.

Percentiles: Son valores que dividen una muestra ordenada de datos en cien partes iguales.
Se representan por P1, P2, …, P99 y gráficamente, los podemos entender de la siguiente
manera:

P1 P2 P3 … P99

¿Cuál sería la interpretación de esta gráfica? El 1% de los datos de la muestra son menores
o iguales que P1. El 2% de los datos de la muestra son menores o iguales que P2. Y así
sucesivamente. El valor de P50 coincide con la mediana de la muestra.

Para determinar el valor del percentil correspondiente, primero se debe localizar la posición
que le corresponde y después, ubicar el valor en la muestra. La posición se determina con
la siguiente fórmula

𝒌(𝒏 + 𝟏)
𝑷𝒐𝒔(𝑷𝒌 ) =
𝟏𝟎𝟎
𝑘 = número de percentil
𝑛 = tamaño de la muestra

La metodología de análisis y cálculo es la misma que la que se aplicó para el estudio de


cuartiles. Intenta realizarla como ejercicio de práctica. ¿Qué cambia? La fórmula para
calcular la posición: ahora tenemos que dividir entre 100.

Prof. Jesús Ramos Rivas


MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS
Las medidas de dispersión miden el grado de dispersión o alejamiento respecto a los valores
centrales de la muestra. Las medidas de dispersión que estudiaremos son: el rango, la
desviación media absoluta, la varianza, la desviación estándar y el coeficiente de variación.

Rango: Determina la amplitud de los valores en la muestra y se calcula como la diferencia


entre el dato mayor y el menor.

Ejemplo: Determina el rango de la muestra (2, 0, 6, 8, 10, 1, 12).

Solución: El dato mayor en la muestra es 12 y el dato menor es 0, por lo tanto, el rango es:

Rango = 12 – 0 = 12

Ejemplo: Determina el rango de la muestra (2, –2, 6, 8, 9, 1, 11).

Solución: El dato mayor en la muestra es 11 y el dato menor es –2, por lo tanto, el rango es:

Rango = 11 – (–2) = 11 + 2 = 13

Desviación media absoluta: Es la media aritmética de los valores absolutos que resultan de
la diferencia de cada dato de la muestra respecto a la media. Matemáticamente se expresa
como:

∑|𝒙𝒊 − 𝒙
̅|
𝑫𝒙̅ =
𝒏
𝑥𝑖 = cada uno de los elementos de la muestra
𝑥̅ = media de la muestra
𝑛 = tamaño de la muestra

Ejemplo: Determina la desviación media absoluta de la siguiente muestra: (4, 6, 2, 8, 9, 9,


10, 3).

Solución: Para calcular la desviación media absoluta, necesitamos calcular primero el valor
de la media de la muestra. Observa que n = 8.

∑ 𝒙𝒊 4 + 6 + 2 + 8 + 9 + 9 + 10 + 3 51
̅=
𝒙 = = = 6.375
𝒏 8 8

Prof. Jesús Ramos Rivas


Ahora, debemos calcular la sumatoria de ∑|𝑥𝑖 − 𝑥̅ | y el resultado dividirlo entre 8.
Utilicemos la siguiente tabla para facilitar el cálculo:

𝒙𝒊 ̅
𝒙𝒊 − 𝒙 |𝒙𝒊 − 𝒙
̅|
4 4 – 6.375 = –2.375 2.375
6 6 – 6.375 = 0.375 0.375
2 2 – 6.375 = –4.375 4.375
8 8 – 6.375 = 1.625 1.625
9 9 – 6.375 = 2.625 2.625
9 9 – 6.375 = 2.625 2.625
10 10 – 6.375 = 3.625 3.625
3 3 – 6.375 = –3.375 3.375
Σ = 21

El color azul indica que sumamos los valores de esa columna.

Ahora, ya podemos sustituir en la fórmula de la desviación media absoluta:

∑|𝑥𝑖 − 𝑥̅ | 21
𝐷𝑥̅ = = = 2.625
𝑛 8
El valor de la desviación media absoluta es 2.625 y se expresa como 𝐷𝑥̅ = 2.625.

El valor de la desviación media absoluta necesariamente siempre será positivo, debido a


que utilizamos el valor absoluto en su cálculo.

Varianza: Esta medida nos permite cuantificar la diferencia promedio que existe de cada
dato en la muestra respecto a la media. Se expresa como S2 y matemáticamente se
determina a través de la siguiente fórmula:

(∑ 𝒙𝒊 𝟐 ) − 𝒏𝒙
̅2
𝑺𝟐 =
𝒏−𝟏
𝑥𝑖 = cada uno de los elementos de la muestra
𝑥̅ = media de la muestra
𝑛 = tamaño de la muestra

Prof. Jesús Ramos Rivas


Ejemplo: Determina la varianza de la siguiente muestra: (4, 6, 2, 8, 9, 9, 10, 3).

Solución: Debido a que la muestra es la misma que la del ejemplo anterior, ya sabemos que
n = 8 y que 𝑥̅ = 6.375. Ahora, requerimos calcular el resultado de la sumatoria ∑ 𝒙𝒊 𝟐 (es
decir, el resultado de elevar cada dato al cuadrado y después, sumarlos entre sí).

Realizando la sumatoria, obtenemos el siguiente resultado:

∑ 𝒙𝒊 𝟐 = 42 + 62 + 22 + 82 + 92 + 92 + 102 + 32
= 16 + 36 + 4 + 64 + 81 + 81 + 100 + 9 = 391

̅2 e indica que debemos multiplicar el valor


La otra parte del numerador de la fórmula es 𝒏𝒙
del tamaño de la muestra por el valor del cuadrado de la media, es decir:

̅2 = (8) (6.375)2 = (8) (40.640625) = 325.125


𝒏𝒙

Ahora, ya tenemos todos los valores necesarios para sustituirlos en la fórmula de la


varianza:

(∑ 𝒙𝒊 𝟐 ) − 𝒏𝒙
̅2 391 − 325.125 65.875
𝑺𝟐 = = = = 9.4107
𝒏−𝟏 8−1 7

El valor de la varianza de la muestra es 9.4107, es decir, S2 = 9.4107.

Observa también que, el valor de la varianza siempre debe ser, necesariamente, un valor
positivo (¿podrías explicar por qué?).

Desviación estándar: La desviación estándar es simplemente la raíz cuadrada de la varianza.


Se representa con la letra S.

Ejemplo: Determina la desviación estándar de la muestra del ejemplo anterior.

Solución: Para calcular S, será suficiente con calcular la raíz cuadrada de la varianza:
2 2
S = √𝑆 2 = √9.4107 = 3.0676

El valor de la desviación estándar de la muestra es 3.0676, es decir, S = 3.0676.

Observa también que, el valor de S siempre debe ser, necesariamente, un valor positivo.

Coeficiente de variación: Permite el análisis de las desviaciones de los datos con respecto
a la media y al mismo tiempo, las variaciones que tienen los datos dispersos entre sí.

Prof. Jesús Ramos Rivas


Se obtiene de dividir la desviación estándar entre la media de la muestra y por lo general, se
expresa en porcentaje, para su mejor comprensión. Su fórmula es la siguiente:

𝑺
𝑪𝑽 =
𝑥̅
Ejemplo: Determina el coeficiente de variación de la muestra del ejemplo anterior.

Solución: Del ejemplo anterior, ya sabemos que 𝑥̅ = 6.375 y S = 3.0676, por lo que al
sustituir estos valores en la fórmula obtenemos lo siguiente:

𝑺 𝟑. 𝟎𝟔𝟕𝟔
𝑪𝑽 = = = 𝟎. 𝟒𝟖𝟏𝟏 = 𝟒𝟖. 𝟏𝟏%
𝑥̅ 𝟔. 𝟑𝟕𝟓
El valor del coeficiente de variación es 48.11%.

Ejercicio: Verifica para la muestra siguiente, que los valores indicados, son los correctos.

Muestra: (12, 16, 12, 10, 10, 15, 11, 10, 13, 17, 17, 10, 9, 18, 12)

MEDIDA VALOR
Media 12.8
Media geométrica 12.1821
Media armónica 12.4805
Mediana 12
Moda 10
Primer cuartil 10
Segundo cuartil 12
Tercer cuartil 16
Rango 9
Desviación media absoluta 2.56
Varianza 9.1714
Desviación estándar 3.0284
Coeficiente de variación 23.65%

Prof. Jesús Ramos Rivas


MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS
Al igual que en los datos no agrupados, estudiaremos tres medidas de tendencia central:
media, mediana y moda.

Media: Se calcula a través de la siguiente fórmula:

∑ 𝒇𝒊 𝒙𝒊
̅=
𝒙
𝒏
𝑓𝑖 = frecuencia de clase
𝑥𝑖 = marca de clase
𝑛 = suma total de frecuencias observadas

Ejemplo: Determina el valor de la media para los siguientes datos agrupados.

Clase Frecuencia de clase (𝒇𝒊 )


8 – 12 9
13 – 17 12
18 – 22 4
23 – 27 8
28 – 32 5
33 – 37 3
38 – 42 11
43 – 47 1

Solución: De acuerdo con la fórmula de la media para datos agrupados, vamos a requerir
calcular la marca de clase (𝑥𝑖 ) de cada intervalo. Agreguemos una columna con dicho valor.
Recuerda que la marca de clase es el punto medio de cada intervalo o clase.

Clase Frecuencia de clase (𝒇𝒊 ) Marca de clase (𝒙𝒊 )


8 – 12 9 10
13 – 17 12 15
18 – 22 4 20
23 – 27 8 25
28 – 32 5 30

Prof. Jesús Ramos Rivas


33 – 37 3 35
38 – 42 11 40
43 – 47 1 45

Ahora, necesitamos calcular el resultado de la sumatoria ∑ 𝑓𝑖 𝑥𝑖 y después dividir entre el


total de frecuencias. Agreguemos otra columna con el producto de estos valores:

Clase 𝒇𝒊 𝒙𝒊 𝒇𝒊 𝒙𝒊
8 – 12 9 10 90
13 – 17 12 15 180
18 – 22 4 20 80
23 – 27 8 25 200
28 – 32 5 30 150
33 – 37 3 35 105
38 – 42 11 40 440
43 – 47 1 45 45
Σ = 53 Σ = 1290

El color azul indica que los valores de esas columnas se sumaron. Ahora, ya tenemos los
valores necesarios para calcular la media. Sustituyéndolos en la fórmula obtenemos que:

∑ 𝒇𝒊 𝒙𝒊 1290
̅=
𝒙 = = 24.3396
𝒏 53
̅ = 24.3396.
El valor de la media es 24.3396, es decir, 𝒙

Media geométrica: Se calcula a través de la siguiente fórmula:

∑ 𝒇𝒊 𝒍𝒐𝒈(𝒙𝒊 )
̅𝒈 = 𝟏𝟎
𝒙 𝒏

𝑓𝑖 = frecuencia de clase
𝑥𝑖 = marca de clase
𝑛 = suma total de frecuencias observadas

Ejemplo: Calcula la media geométrica para los datos del ejemplo anterior.

Prof. Jesús Ramos Rivas


Solución: De acuerdo con la fórmula de la media geométrica para datos agrupados, vamos
a requerir calcular el logaritmo de la marca de clase (𝑥𝑖 ) y multiplicarlo por la frecuencia de
clase de cada intervalo. Agreguemos las columnas correspondientes con esos valores.
Recuerda que la marca de clase es el punto medio de cada intervalo o clase:

Clase 𝒇𝒊 𝒙𝒊 𝒍𝒐𝒈(𝒙𝒊 ) 𝒇𝒊 𝒍𝒐𝒈(𝒙𝒊 )


8 – 12 9 10 1 9
13 – 17 12 15 1.176091259 14.11309511
18 – 22 4 20 1.301029996 5.204119983
23 – 27 8 25 1.397940009 11.18352007
28 – 32 5 30 1.477121255 7.385606274
33 – 37 3 35 1.544068044 4.632204133
38 – 42 11 40 1.602059991 17.6226599
43 – 47 1 45 1.653212514 1.653212514
Σ = 53 Σ = 70.7944180

El color azul indica que los valores de esas columnas se sumaron. Ahora, ya tenemos los
valores necesarios para calcular la media geométrica. Sustituyéndolos en la fórmula
obtenemos que:
∑ 𝒇𝒊 𝒍𝒐𝒈(𝒙𝒊 ) 𝟕𝟎.𝟕𝟗𝟒𝟒𝟏𝟖𝟎
̅𝒈 = 𝟏𝟎
𝒙 𝒏 = 𝟏𝟎 𝟓𝟑 = 𝟏𝟎𝟏.𝟑𝟑𝟓𝟕𝟒𝟑𝟕𝟒 = 𝟐𝟏. 𝟔𝟔𝟒𝟐𝟓𝟑𝟖

El valor de la media geométrica es 21.6642, es decir, 𝑥̅𝑔 = 21.6642.

Media armónica: Se obtiene al dividir el número de total de observaciones entre lo que


resulte de la suma de cada frecuencia dividida por su respectiva marca de clase. Su
fórmula es la siguiente:
𝒏
̅𝒉 =
𝒙
𝒇
∑ 𝒊
𝒙𝒊

𝑓𝑖 = frecuencia de clase
𝑥𝑖 = marca de clase
𝑛 = suma total de frecuencias observadas

Ejemplo: Calcula la media armónica para los datos del ejemplo anterior.

Prof. Jesús Ramos Rivas


Solución: De acuerdo con la fórmula de la media armónica para datos agrupados, vamos a
requerir calcular la división de cada frecuencia de clase 𝑓𝑖 entre cada marca de clase 𝑥𝑖 .
Agreguemos las columnas correspondientes con esos valores. Recuerda que la marca de
clase es el punto medio de cada intervalo o clase:

Clase 𝒇𝒊 𝒙𝒊 𝒇𝒊 /𝒙𝒊
8 – 12 9 10 0.9
13 – 17 12 15 0.8
18 – 22 4 20 0.2
23 – 27 8 25 0.32
28 – 32 5 30 0.166666667
33 – 37 3 35 0.085714286
38 – 42 11 40 0.275
43 – 47 1 45 0.022222222
Σ = 53 Σ = 2.769603175

El color azul indica que los valores de esas columnas se sumaron. Ahora, ya tenemos los
valores necesarios para calcular la media armónica. Sustituyéndolos en la fórmula
obtenemos que:

𝟓𝟑
̅𝒉 =
𝒙 = 𝟏𝟗. 𝟏𝟑𝟔𝟑𝟏𝟓𝟒𝟒
𝟐. 𝟕𝟔𝟗𝟔𝟎𝟑𝟏𝟕𝟓

El valor de la media armónica es 19.1363, es decir, 𝑥̅ℎ = 19.1363.

Mediana: Para calcular la mediana de datos agrupados, se utiliza la siguiente fórmula:

𝒏
− 𝑭𝒊−𝟏
𝑴𝒆𝒅𝒊𝒂𝒏𝒂 = 𝑳𝒊 + (𝟐 )𝑨
𝒇𝒊

𝐿𝑖 = límite inferior de la clase mediana


𝐴 = amplitud de clase
𝐹𝑖−1 = frecuencia acumulada anterior a la de la clase mediana
𝑓𝑖 = frecuencia absoluta de la clase mediana
𝑛 = suma total de frecuencias observadas

Prof. Jesús Ramos Rivas


Expliquemos lo que significa la clase mediana para que los componentes de la fórmula
tengan sentido y podamos entender cómo calcularlos.

La clase mediana es aquella clase o intervalo en la que el valor de la frecuencia acumulada


𝑭𝒊 contiene el valor de (n / 2), es decir, debemos buscar la primera frecuencia acumulada
cuyo valor sea igual o mayor que el resultado de (n / 2). Cuando lo encontremos, la clase
correspondiente, es la clase mediana.

Ejemplo: Determina la mediana de los datos agrupados del ejemplo anterior.

Solución: A la tabla de datos, agreguemos la columna de frecuencia acumulada Fi.

Clase 𝒇𝒊 𝑭𝒊
8 – 12 9 9
13 – 17 12 21
18 – 22 4 25
23 – 27 8 33
28 – 32 5 38
33 – 37 3 41
38 – 42 11 52
43 – 47 1 53
Σ = 53

Ahora, lo siguiente es “encontrar” la clase mediana. Para ello, necesitaremos calcular el


resultado de n / 2, es decir:

𝑛 53
= = 26.5
2 2
Busquemos ahora en la tabla, en la columna de frecuencia acumulada (Fi), el primer valor
que sea igual o mayor que 26.5:

Clase 𝒇𝒊 𝑭𝒊
8 – 12 9 9
13 – 17 12 21
18 – 22 4 25

Prof. Jesús Ramos Rivas


23 – 27 8 33
28 – 32 5 38
33 – 37 3 41
38 – 42 11 52
43 – 47 1 53
Σ = 53

El valor que cumple dicha condición es Fi = 33, por lo tanto, la clase mediana es la clase del
intervalo 23 – 27. Se ha marcado en verde para una mejor referencia. Ahora, extraigamos
de ahí los datos necesarios para el cálculo de la mediana:

• 𝐿𝑖 = límite inferior de la clase mediana = 23


• 𝐹𝑖−1 = frecuencia acumulada anterior a la de la clase mediana = 25
• 𝑓𝑖 = frecuencia absoluta de la clase mediana = 8
• 𝐴 = amplitud de clase = 5 (recuerda cómo se calcula este valor)
• 𝑛 = suma total de frecuencias observadas = 53

Sustituyendo estos valores en la fórmula, obtenemos que:

𝑛 53
− 𝐹𝑖−1 − 25 26.5 − 25
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝐿𝑖 + ( 2 ) 𝐴 = 23 + ( 2 ) 5 = 23 + ( )5
𝑓𝑖 8 8
1.5
= 23 + ( ) 5 = 23 + (0.1875)5 = 23 + 0.9375 = 23.9375
8

Por lo tanto, el valor de la mediana es 23.9375.

Moda: Para determinar la moda, utilizaremos la siguiente fórmula:

𝒇𝒊 − 𝒇𝒊−𝟏
𝑀𝑜𝑑𝑎 = 𝐿𝑖 + [ ]𝐴
(𝒇𝒊 − 𝒇𝒊−𝟏 ) + (𝒇𝒊 − 𝒇𝒊+𝟏 )

𝐿𝑖 = límite inferior de la clase modal


𝑓𝑖 = frecuencia absoluta de la clase modal
𝑓𝑖−1 = frecuencia absoluta anterior a la de la clase modal
𝑓𝑖+1 = frecuencia absoluta posterior a la de la clase modal
𝐴 = amplitud de clase

Prof. Jesús Ramos Rivas


Ahora, expliquemos lo que significa la clase modal para que los componentes de la fórmula
tengan sentido y podamos entender cómo calcularlos.

La clase modal es aquella clase o intervalo cuya frecuencia absoluta 𝒇𝒊 es la mayor de todas.

Ejemplo: Determina la moda de los datos agrupados del ejemplo anterior.

Solución: Determinemos la clase modal. Para ello, ubiquemos el valor más grande de 𝒇𝒊 en
la tabla:

Clase 𝒇𝒊
8 – 12 9
13 – 17 12
18 – 22 4
23 – 27 8
28 – 32 5
33 – 37 3
38 – 42 11
43 – 47 1
Σ = 53

El valor que cumple dicha condición es 𝒇𝒊 = 12, por lo tanto, la clase modal es la clase del
intervalo 13 – 17. Se ha marcado en verde para una mejor referencia. Ahora, extraigamos
de ahí los datos necesarios para el cálculo de la moda:

• 𝐿𝑖 = límite inferior de la clase modal = 13


• 𝑓𝑖 = frecuencia absoluta de la clase modal = 12
• 𝑓𝑖−1 = frecuencia absoluta anterior a la de la clase modal = 9
• 𝑓𝑖+1 = frecuencia absoluta posterior a la de la clase modal = 4
• 𝐴 = amplitud de clase = 5 (recuerda cómo se calcula este valor)

Sustituyendo estos valores en la fórmula, obtenemos que:

𝑓𝑖 − 𝑓𝑖−1 12 − 9
𝑀𝑜𝑑𝑎 = 𝐿𝑖 + [ ] 𝐴 = 13 + [ ]5
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 ) (12 − 9) + (12 − 4)
3 3
= 13 + [ ] 5 = 13 + ( ) 5 = 13 + (0.2727)(5) = 13 + 1.3636
3+8 11
= 14.3636

Prof. Jesús Ramos Rivas


Por lo tanto, el valor de la moda es 14.3636.

Si la clase modal está en la primera clase, entonces 𝒇𝒊−𝟏 = 0. Por el contrario, si la clase
modal está en la última clase, entonces 𝒇𝒊+𝟏 = 0. Si hay dos o más clases modales, entonces
puede haber más de dos modas.

MEDIDAS DE TENDENCIA NO CENTRAL PARA DATOS AGRUPADOS


Al igual que lo hicimos con datos no agrupados, estudiaremos los cuartiles, deciles y
percentiles.

Cuartiles: Se calcula a través de la siguiente fórmula:

𝒌𝒏
− 𝑭𝒊−𝟏
𝑸𝒌 = 𝑳𝒊 + ( 𝟒 )𝑨
𝒇𝒊

𝑘 = número del cuartil


𝐿𝑖 = límite inferior de la clase cuartil
𝐴 = amplitud de clase
𝐹𝑖−1 = frecuencia acumulada anterior a la de la clase cuartil
𝑓𝑖 = frecuencia absoluta de la clase cuartil
𝑛 = suma total de frecuencias observadas

Expliquemos lo que significa la clase cuartil para que los componentes de la fórmula tengan
sentido y podamos entender cómo calcularlos.

La clase cuartil es aquella clase o intervalo en la que el valor de la frecuencia acumulada 𝑭𝒊


contiene el valor de la posición, es decir, debemos buscar la primera frecuencia acumulada
cuyo valor sea igual o mayor que el resultado de 𝑘𝑛⁄4. Cuando la encontremos, la clase o
intervalo correspondiente, será la clase cuartil.

Ejemplo: Determina el tercer cuartil de los datos agrupados del ejemplo anterior.

Solución: Determinemos la clase cuartil. Para ello, debemos calcular el valor de la posición,
es decir, hay que calcular el valor de 𝑘𝑛⁄4, con 𝑘 = 3, ya que lo que buscamos es el tercer
cuartil.

Prof. Jesús Ramos Rivas


𝑘𝑛 (3)(53) 159
𝑃𝑜𝑠 = = = = 39.75
4 4 4
Ahora, en la tabla debemos buscar en la columna de frecuencia acumulada, aquel valor que
sea igual o mayor que 39.75.

Clase 𝒇𝒊 𝑭𝒊
8 – 12 9 9
13 – 17 12 21
18 – 22 4 25
23 – 27 8 33
28 – 32 5 38
33 – 37 3 41
38 – 42 11 52
43 – 47 1 53
Σ = 53

El valor que cumple dicha condición es 𝑭𝒊 = 41, por lo tanto, la clase cuartil es la clase del
intervalo 33 – 37. Se ha marcado en verde para una mejor referencia. Ahora, extraigamos
de ahí los datos necesarios para el cálculo de la mediana:

• 𝑘=3
• 𝐿𝑖 = límite inferior de la clase cuartil = 33
• 𝐹𝑖−1 = frecuencia acumulada anterior a la de la clase mediana = 38
• 𝑓𝑖 = frecuencia absoluta de la clase cuartil = 3
• 𝐴 = amplitud de clase = 5 (recuerda cómo se calcula este valor)
• 𝑛 = suma total de frecuencias observadas = 53

Sustituyendo estos valores en la fórmula, obtenemos que:

𝑘𝑛
− 𝐹𝑖−1 39.75 − 38 1.75
𝑄3 = 𝐿𝑖 + ( 4 ) 𝐴 = 33 + ( ) 5 = 33 + ( ) 5 = 33 + 5(0.5833)
𝑓𝑖 3 3

= 33 + 2.9166 = 35.9166

Podrás observar que el valor de 35.9166 que se ha calculado, se encuentra dentro


del intervalo [33 – 37].

Prof. Jesús Ramos Rivas


Para los deciles y los percentiles, la metodología de trabajo es la misma que hemos
estudiado en los cuartiles. ¿Qué es lo único que cambia? La fórmula para calcular la
posición: para los deciles se divide entre 10 y para los percentiles entre 100:

𝒌𝒏
− 𝑭𝒊−𝟏
𝑫𝒌 = 𝑳𝒊 + ( 𝟏𝟎 )𝑨
𝒇𝒊

𝒌𝒏
− 𝑭𝒊−𝟏
𝑷𝒌 = 𝑳𝒊 + (𝟏𝟎𝟎 )𝑨
𝒇𝒊

Las clases deciles y percentiles se calculan con la misma metodología que se utilizó para
calcular la clase cuartil.

MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS


Las medidas de dispersión que estudiaremos para datos agrupados son el rango, la
desviación media absoluta, la varianza y la desviación estándar.

Rango: Es la diferencia entre el límite superior de la última clase y el límite inferior de la


primera clase.

Ejemplo: Determina el rango para las siguientes clases o intervalos.

Clase Frecuencia de clase (𝒇𝒊 )


8 – 12 9
13 – 17 12
18 – 22 4
23 – 27 8
28 – 32 5
33 – 37 3
38 – 42 11
43 – 47 1

Prof. Jesús Ramos Rivas


Solución:

Rango = límite superior de la última clase – límite inferior de la primera clase

Rango = 47 – 8 = 39

Por lo tanto, el rango es 39.

Desviación media absoluta: Se calcula a través de la siguiente fórmula:

∑|𝒙𝒊 − 𝒙
̅|𝒇𝒊
𝑫̅𝒙 =
𝒏
𝑥𝑖 = marca de clase
𝑥̅ = media de la muestra
𝑓𝑖 = frecuencia de clase
𝑛 = suma total de frecuencias observadas

Ejemplo: Determina el valor de la desviación media absoluta para los datos del ejemplo
anterior.

Solución: En el ejemplo del cálculo de la media de estos datos, el valor que obtuvimos fue
de 𝑥̅ = 24.3396. Ahora, adicionaremos las columnas necesarias a la tabla para determinar
los demás valores requeridos:

Clase 𝒇𝒊 𝒙𝒊 ̅
𝒙𝒊 − 𝒙 |𝒙𝒊 − 𝒙
̅| |𝒙𝒊 − 𝒙
̅|𝒇𝒊
8 – 12 9 10 10 – 24.3396 = –14.3396 14.3396 (14.3396) (9) = 129.0566
13 – 17 12 15 15 – 24.3396 = –9.3396 9.3396 (9.3396) (12) = 112.0754
18 – 22 4 20 20 – 24.3396 = –4.3396 4.3396 (4.3396) (4) = 17.3584
23 – 27 8 25 25 – 24.3396 = 0.6603 0.6603 (0.6603) (8) = 5.2830
28 – 32 5 30 30 – 24.3396 = 5.6603 5.6603 (5.6603) (5) = 28.3018
33 – 37 3 35 35 – 24.3396 = 10.6603 10.6603 (10.6603) (3) = 31.9811
38 – 42 11 40 40 – 24.3396 = 15.6603 15.6603 (15.6603) (11) = 172.2641
43 – 47 1 45 45 – 24.3396 = 20.6603 20.6603 (20.6603) (1) = 20.6603
Σ = 53 Σ = 516.9811

Prof. Jesús Ramos Rivas


El color azul indica que los valores de esa columna se sumaron. Ahora, ya tenemos todos
los valores necesarios para calcular la desviación media absoluta y al sustituirlos en la
fórmula obtenemos que:

∑|𝑥𝑖 − 𝑥̅ |𝑓𝑖 516.9811


𝐷𝑥̅ = = = 9.7543
𝑛 53
El valor de la desviación media absoluta es 9.7543, es decir, 𝐷𝑥̅ = 9.7543.
Varianza: Se calcula a través de la siguiente fórmula:

𝟐
∑(𝒇𝒊 𝒙𝒊 𝟐 ) − 𝑛𝑥̅ 2
𝑺 =
𝒏−𝟏
𝑥𝑖 = marca de clase
𝑥̅ = media de la muestra
𝑓𝑖 = frecuencia de clase
𝑛 = suma total de frecuencias observadas

Ejemplo: Determina el valor de la varianza para los datos del ejemplo anterior.

Solución: En el ejemplo del cálculo de la media de esos datos, el valor que se obtuvo fue de
𝑥̅ = 24.3396. Ahora, necesitaremos el valor de la sumatoria de 𝒇𝒊 𝑥𝑖 2 . Adicionaremos las
columnas necesarias a la tabla para determinar los demás valores requeridos:

Clase 𝒇𝒊 𝒙𝒊 𝒙𝒊 𝟐 𝒇𝒊 𝒙𝒊 𝟐
8 – 12 9 10 102 = 100 (9) (100) = 900
13 – 17 12 15 152 = 225 (12) (225) = 2700
18 – 22 4 20 202 = 400 (4) (400) = 1600
23 – 27 8 25 252 = 625 (8) (625) = 5000
28 – 32 5 30 302 = 900 (5) (900) = 4500
33 – 37 3 35 352 = 1225 (3) (1225) = 3675
38 – 42 11 40 402 = 1600 (11) (1600) = 17600
43 – 47 1 45 452 = 2025 (1) (2025) = 2025
Σ = 53 Σ = 38000

Prof. Jesús Ramos Rivas


El color azul indica que los valores de esa columna se sumaron. Ahora, ya tenemos todos
los valores necesarios para calcular la varianza y al sustituirlos en la fórmula obtenemos
que:

2
∑ 𝑓𝑖 𝑥𝑖 2 − 𝑛𝑥̅ 2 38000 − 53(24.3396)2 38000 − 53(592.4161)
𝑆 = = =
𝑛−1 53 − 1 52
38000 − 31398.0548 6601.9452
= = = 126.9604
52 52
El valor de la varianza es 126.9604, es decir S2 = 126.9604.

Desviación estándar: Al igual que en los datos no agrupados, la desviación estándar es la


raíz cuadrada de la varianza y se representa como S.

Ejemplo: Determina el valor de la desviación estándar para los datos del ejemplo anterior.

Solución: Como el valor de la varianza es S2 = 124.5639, entonces el valor de la desviación


estándar será:
2 2
S = √𝑆 2 = √126.9604 = 11.2676

El valor de la desviación estándar es 11.2676, es decir S = 11.2676.

Coeficiente de variación: Al igual que en los datos no agrupados, se calcula como:

𝑺
𝑪𝑽 =
𝑥̅
Ejemplo: Determina el coeficiente de variación para los datos del ejemplo anterior.

Solución: Sabemos que 𝑆 = 11.2676 y que 𝑥̅ = 24.3396. Al sustituir estos valores en la


fórmula, obtenemos que:

𝑆 11.2676
𝐶𝑉 = = = 0.4629 = 46.29%
𝑥̅ 24.3396

Prof. Jesús Ramos Rivas


BIBLIOGRAFÍA
Triola, M. (2013). Estadística. México: Pearson Educación.

Prof. Jesús Ramos Rivas

También podría gustarte