Está en la página 1de 65

MEDIDAS DE

TENDENCIA CENTRAL Y
DISPERSIÓN

1
Dirección de Educación a Distancia
Apartado Postal, 1874, San Salvador, El Salvador
Tel: 2251-8200 ext: 1743

2
Sumario

5. Medida de posición ................................................................. 5


5.1 Definiciones .......................................................................... 6
5.2 Serie simple .......................................................................... 6
5.2.1 Media aritmética ............................................................... 6
5.2.2 Mediana ............................................................................. 8
5.2.3 Moda X ............................................................................... 9
5.3 Serie de datos y frecuencias ............................................... 10
5.3.1 Media aritmética x .......................................................... 10
5.3.2 Mediana x ....................................................................... 11
5.3.3 Moda x ............................................................................ 13
5.4.1 Media aritmética ............................................................. 14
5.4.2 Mediana ........................................................................... 16
5.4.3 Moda (x) ........................................................................... 19
5.5 Relación entre la media, la mediana y la moda ................... 20
6. Otras medidas de posición ................................................... 23
6.1 Deciles ................................................................................ 23
6.1.1 Series simples ................................................................. 23
6.1.2. Serie de datos y frecuencias ........................................... 24
6.1.3 Serie de clases y frecuencias ........................................... 26
6.2 Cuartiles ............................................................................ 27
6.2.1. Series simples ................................................................ 28
6.2.2 Serie de datos y frecuencias ........................................... 30
6.2.3 Serie de clases y frecuencias .......................................... 31
6.3 Percentiles.......................................................................... 33
6.3.1 Series simples ................................................................. 33
6.3.2 Serie de datos y frecuencias ............................................ 34
6.3.3 Serie de clases y frecuencias ........................................... 36
7. Medidas de dispersión ......................................................... 38
7.1 Serie simple ........................................................................ 39
7.1.1 Rango .............................................................................. 39
7.1.2 Desviación media............................................................. 39
7.1.3 Varianza .......................................................................... 42
7.1.4 Desviación estándar ........................................................ 44
7.1.5 Coeficiente de variación................................................... 46
7.2 Serie de datos y frecuencias ............................................... 49
7.2.1 Varianza .......................................................................... 49
7.2.2 Desviación estándar ........................................................ 51
7.2.3 Coeficiente de variación................................................... 53
8. Medidas de dispersión .......................................................... 54

3
8.1 Serie de clases y frecuencias .............................................. 54
8.1.1 Varianza ......................................................................... 54
8.1.2 Desviación estándar ........................................................ 57
8.1.3 Coeficiente de variación................................................... 60

4
En las temáticas que se abordan en la presente unidad, se pretende identificar la diferencia
entre las medidas de tendencia central y de dispersión. Se debe tener presente que las
medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo en cambio, las medidas de dispersión nos dicen hasta que punto estas
medidas de tendencia central son representativas como síntesis de la información. En
términos generales, se busca analizar las características particulares donde se aplica cada
medida de tendencia central y de dispersión, además, se busca calcular las diversas medidas
para un conjunto de datos representados en serie simples, serie de datos y frecuencias así
como también, en series de clases y frecuencias para luego interpretar las diversas medidas
calculadas.

Clase 5 | Medidas de
tendencia central

5. Medida de posición
Los datos que caracterizan a una población reciben el nombre de parámetros a diferencia de
un estadístico que caracterizan a una muestra. Un ejemplo de parámetro sería el porcentaje
de personas que no saben leer ni escribir en toda la República de El Salvador y si tomamos
de un total de personas a unas doscientas de estas que se encuentran en un parque nos
enfocaríamos a un ejemplo de un estadístico.

Cuando la información estadística se resume por medio de una tabla de distribución de


frecuencias, el propósito que se persigue es el de facilitar la interpretación de los datos,
puesto que en dicha tabla está contenida toda la información concerniente a una muestra.
Sin embargo, existe una manera de resumir aún más una serie de datos y esta consiste en
reducir toda la información de la muestra a un pequeño número de características o
estadísticos que sustituyen a todos los datos dando una idea clara y precisa de los aspectos
fundamentales de la muestra.

Los estadísticos que estudiaremos son de dos tipos: (a) estadísticos de posición, y (b)
estadísticos de dispersión. Entre los principales estadísticos de posición son: media
aritmética, mediana, moda, cuartiles, deciles, percentiles, media armónica y media
geométrica. Los estadísticos de posición media aritmética, mediana y moda reciben el
nombre de medidas de tendencia central. Esto se debe a que si todos los datos se ordenan
de menor a mayor, estos estadísticos de posición tienen siempre a ocupar las posiciones
centrales, por cuanto, a las medidas de posición se les conoce también como medidas de
tendencia central o medidas de localización, ya que su finalidad consiste en señalar el centro
de un conjunto de valores.

5.1 Definiciones
La media aritmética o promedio se define como un valor que
representa de forma sencilla y razonable comportamiento de un
conjunto de datos completo. Esta brinda el valor típico de una
serie de datos.

La mediana se considera un solo valor del conjunto de datos que


mide la observación central del conjunto. Esta sola observación
es el elemento que está más al centro del conjunto de números.
La mitad de los elementos están por arriba de este punto y la otra
mitad está por debajo.

La moda se define como el valor que más se repite; es decir, que


se considera el valor que tiene mayor frecuencia dentro del
conjunto de datos.

5.2 Serie simple


5.2.1 Media aritmética
La media aritmética de un conjunto de datos se calcula sumando cada uno de los elementos
o datos para luego dividirlos entre el número de elementos o datos que se tienen. Si se
tienen los siguientes datos: 𝑋1 , 𝑋2 , 𝑋3 , ….. 𝑋𝑛 , entonces, la media aritmética se calcula
𝑋1 +𝑋2 +⋯+𝑋𝑛
mediante la siguiente expresión: 𝑋̅ = 𝑛
, por lo tanto, para representar la suma de

varios valores se usa la letra griega Σ.

∑ 𝑋𝑖
𝑋̅ =
𝑛

6
Recordemos que una muestra de una población consiste en n observaciones con n minúscula
con una media de 𝑥̅ . La media de una población se simboliza con 𝜇, que es la letra griega
mu. El número de elementos de una población se denota con la letra mayúscula cursiva N.
La letra griega sigma Σ indica que todos los valores de x se suman.

Analicemos el ejemplo enfocado en una familia salvadoreña del área rural que comúnmente
está formada por más de dos hijos. Si la familia Pérez García tiene cuatro hijos varones cuyos
nombres son Juan, Pedro, Luis y Antonio cada uno de los cuales posee respectivamente las
siguientes edades 12, 14, 16 y 18 años. Encuentre la edad media de los cuatro hijos.

12+14+16+18
𝑋 = 𝐸𝑑𝑎𝑑 , 𝑋̅ = 𝐸𝑑𝑎𝑑 𝑚𝑒𝑑𝑖𝑎 por cuanto, 𝑋̅ = 4
= 15 𝑎ñ𝑜𝑠

A veces las cantidades 𝑋1 , 𝑋2 , 𝑋3 , ….. 𝑋𝑛 tiene asociado un número 𝑋1 , 𝑋2 , 𝑋3 ,…𝑋𝑛 𝑚1 , 𝑚2 , 𝑚3,


….. 𝑚𝑛 que las pondera de manera especial. Esta ponderación depende de la significación o
importancia que se asigna a cada una de las cantidades. En este caso la media aritmética de
𝑋1 , 𝑋2 , 𝑋3 , ….. 𝑋𝑛 recibe el nombre de la media aritmética ponderada y se calcula de la siguiente
manera:

𝑋1 𝑓1 + 𝑋2 𝑓2 + 𝑋3 𝑓3 + ⋯ + 𝑋𝑛 𝑓𝑛
𝑋̅ =
𝑓1 + 𝑓2 + 𝑓3 +. . . . + 𝑓𝑛

Analicemos otro ejemplo en el que encontraremos el peso medio de las veinticinco personas
que conforman el salón de clases del curso de Estadística de Negocios, si los pesos en libras
son las siguientes:

Tabla 36. Pesos en libras de veinticinco personas que cursan Estadística de negocios.

90 110 105 115 120


110 120 100 105 105
115 115 115 115 90
120 110 100 115 105
100 115 100 110 100
Fuente: Elaboración propia.

7
Tabla 37. Distribución de frecuencias.

PESO FRECUENCIA

90 2
100 5
105 4
110 4
115 7
120 3
TOTAL 25

Fuente: Elaboración propia.

Por cuanto;

2(90) + 5(100) + 4(105) + 4(110) + 7(115) + 3(120)


𝑋̅ = = 108.2 𝑙𝑖𝑏𝑟𝑎𝑠
2+5+4+4+7+3

5.2.2 Mediana
Se considera una medida de posición que puede definirse de la siguiente manera: la mediana,
de una serie simple ordenada conforme a sus valores crecientes o decrecientes, es un valor
que ocupa el lugar central de la serie. De otra manera, se considera todo valor que supera a
no más de la mitad de las observaciones y sea simultáneamente superado por no más de la
mitad de las observaciones. La mediana se encuentra ubicada en el centro de la serie de
datos. (Rodríguez, 2007)

Para hallar la mediana de un conjunto de datos se tomarán en cuenta el siguiente


procedimiento: (a) se organizan en orden descendente o ascendente, (b) se determina si el
conjunto de dato contiene un número impar de elementos, el dato que ocupa la posición
central en el arreglo es la mediana, o si hay un número par de observaciones, la mediana es
el promedio de los dos elementos de en medio. La posición del término en el arreglo de datos
que representará la mediana será aquel que se determine mediante la fórmula:

8
𝑛+1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = ( )
2

Ahora, resolveremos un ejercicio relacionado con la mediana para la serie de datos formada
por los números 11, 4, 9, 13, 16, 10 y 25. El procedimiento a seguir se describe así: (1)
ordenar los siete datos de menor a mayor: 4, 9, 10,11, 13, 16, 25. (2) encontrar la posición
de la mediana es (7 + 1)⁄2 = (8/2) = 4. (3) Identificar el valor de la mediana, como el dato
que ocupa la posición cuatro es el 11 concluimos que la mediana es 11.

Otro ejercicio enfocado a encontrar la mediana para una serie de datos que comprende los
números 18, 4, 14, 22, 28, 12, 16, 46, 9 y 31. El procedimiento a seguir se describe así: (1)
ordenar los ordenamos los diez datos de menor a mayor: 4, 9, 12, 14, 16, 18, 22, 28, 31,
46. (2) encontrar la posición de la mediana (10 + 1)⁄2 = (11/2) = 5.5. (3) Identificar el valor
de la mediana, como el valor encontrado para la posición que ocupará la mediana es un
número decimal, el que se encuentra comprendido entre la posición 5 y 6, la mediana resulta
de la semisuma del número que ocupa la posición cinco y seis; es decir, que la semisuma es
(16 + 18)⁄2 = 17. Esto significa, que la mediana es simplemente 17.

5.2.3 Moda (𝑋̂ )


La moda es el valor más frecuente en una serie de datos; es decir, es el valor más común.
Se identifica el o los datos que más se repiten. Si la frecuencia mayor se presenta una sola
vez esta se denomina unimodal. Hay situaciones en que la frecuencia mayor se presenta
con dos o más valores distintos. Cuando esto ocurre hay más de una moda. Si los datos
contienen más de una moda se dice los datos son bimodales. Si contienen más de dos moda
se denominan multimodales. En los casos multimodales casi nunca se da la moda, porque
dar tres o más modas no resulta de mucha ayuda para describir la localización de los datos.

Se representa por 𝑋̂. La moda es el concepto que la mayoría de las personas tienen en la
mente cuando escuchan expresiones como las siguientes: el consumidor promedio, el
tamaño promedio de zapatos que vende una zapatería, la calificación promedio de un buen
estudiante. Aunque la moda es un concepto sencillo, su aplicación plantea algunos
problemas.

9
Analicemos las siguientes listas de datos:

a) 2, 7, 7, 7, 8, 9, 9, 9, 15, 15, 15, 15, 23


b) 3, 10, 10, 10, 12, 12, 18, 18, 18, 19, 20
c) 1, 6, 6, 13, 13, 26, 26, 30

Si revisamos cada serie de datos enunciados en cada uno de los incisos anteriores podríamos
concluir lo siguiente: en el inciso (a) la moda es 𝑋̂ =15, en el inciso (b) la moda es 𝑋̂=10 y
𝑋̂=18, y por último, en el inciso (c) no hay moda.

5.3 Serie de datos y frecuencias


5.3.1 Media aritmética ( 𝒙
̅)
Para calcular la media aritmética en una serie de datos y frecuencias se emplea la
siguiente fórmula:

∑(𝑥𝑖 . 𝑓𝑖 )
𝑥̅ =
∑ 𝑓𝑖

En donde:

∑ 𝑥𝑖 𝑓𝑖 : Suma de los productos de cada valor por su frecuencia absoluta.


∑ 𝑓𝑖 : Suma de las frecuencias absolutas de las series.

Analicemos el siguiente ejemplo donde una empresa denominada UNILEVER ESPAÑA


S.A. dedicada a la fabricación de jabón, realiza la contabilización del número de
accidentes laborales que ocurrieron en los últimos 30 meses. La finalidad es calcular la
media aritmética de los resultados que se muestran a continuación:

10
Tabla 38. Serie de datos y frecuencias que muestra el número de accidentes laborales.

Número de accidentes laborales Frecuencia absoluta


𝒙𝒊 . 𝒇𝒊
𝒙𝒊 f
0 3 0
1 4 4
2 5 10
3 5 15
4 4 16
5 3 15
6 3 12
7 2 14
8 1 8
9 1 9
10 1 10
TOTAL 30 106

Fuente: Elaboración propia.

Para calcular la media aritmética de una serie de datos y frecuencias únicamente se


debe seguir el procedimiento descrito de la siguiente manera: (1) multiplicar el valor del
dato asociado a la variable 𝑥𝑖 por su respectiva frecuencia de ocurrencia o frecuencia
absoluta, (2) encontrar la sumatoria de todos los valores asignados en la columna
de 𝑥𝑖 . 𝑓𝑖 , (3) encontrar la sumatoria de las frecuencias absolutas, (4) calcular el
valor de la media aritmética.

∑(𝑓𝑖 . 𝑥𝑖 ) 106
𝑥̅ = = = 3.53 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠
∑ 𝑓𝑖 30

5.3.2 Mediana ( 𝒙
̃)
Para el cálculo de la mediana utilizaremos una columna extra para calcular la frecuencia
acumulada ascendente, la que a su vez permitirá construir una columna de posiciones.
Para determinar la mediana se debe tener en cuenta el siguiente proceso:

(a) Construir dos columnas extras para calcular la frecuencia acumulada ascendente y
otra para el intervalo de posiciones.

11
(b) Determinar la posición de la mediana.

(c) Identificar el intervalo de posiciones en el que se encuentra el valor encontrado en


la posición anterior.

(d) Identificar el valor de la variable x que corresponde a la frecuencia absoluta


ascendente identificada en el intervalo de posiciones seleccionado.

Ahora, retomaremos el ejemplo anterior de la empresa UNILEVER ESPAÑA S.A. dedicada


a la fabricación de jabón donde se contabilizaron el número de accidentes laborales que
ocurrieron en los últimos 30 meses. Se pretende calcular la mediana de los resultados
que se muestran a continuación:

Tabla 39. Serie de datos y frecuencias que muestra el número de accidentes laborales
con sus respectivas frecuencias absolutas y acumuladas ascendentes.

NÚMERO DE ACCIDENTESFRECUENCIA
LABORALES ABSOLUTA 𝑭𝑨 ↑ POSICIONES
𝒙𝒊 𝒇
0 3 3 1 a la 3
1 4 7 4 a la 7
2 5 12 8 a la 12
3 5 17 13 a la 17
4 4 21 18 a la 21
5 3 24 22 a la 24
6 3 26 25 a la 26
7 2 27 27
8 1 28 28
9 1 29 29
10 1 30 30
TOTAL 30

Fuente: Elaboración propia.

El procedimiento para calcular la mediana en una serie de datos y frecuencias consiste


en la aplicación de los siguientes pasos:

Paso 1. Se calcula la posición de la mediana mediante su fórmula respectiva.


12
𝑛 30
(2 ) = ( 2 ) = 15 ,

Paso 2. Identificar en que intervalo de posiciones se encuentra la posición de


la mediana

Si observamos 15 se encuentra en el intervalo que va de la posición 13 a la 17.

Paso 3. Calcular el valor de la mediana ( 𝒙


̃)

Una vez que identifica el intervalo de posiciones se asocia la frecuencia acumulada


ascendente de 17, la que permite determinar el valor x asociado, el cual es de 3
accidentes; por cuanto, la mediana es 𝑥̃ = 3 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠

5.3.3 Moda ( 𝒙
̂)
Para calcular la moda en una serie de datos y frecuencias se busca en la columna de
frecuencias absolutas la mayor de ellas, que permitirá identificar el valor de x asociado
a esta frecuencia para luego asignar el valor asociado a la moda.

Si retomamos el ejemplo de la empresa que se dedica a la fabricación de jabón donde


se contabiliza el número de accidentes laborales que ocurrieron en los últimos 30 meses.
Calcule la moda de los resultados tal y como se muestran a continuación:

A continuación, se muestra el número de accidentes laborales ocurridos en la empresa


UNILEVER ESPAÑA S.A.:

13
Tabla 40. Serie de datos y frecuencias que muestra el número de acciones laborales
con su respectiva frecuencia absoluta.

Número de accidentes Frecuencia


laborales absoluta
𝒙𝒊 f
0 3
1 4
2 5
3 5
4 4
5 3
6 3
7 2
8 1
9 1
10 1
TOTAL 30

Fuente: Elaboración propia.

Para calcular la moda en una serie de datos y frecuencias será necesario tomar en cuenta
los siguientes pasos:
Paso 1. Identificar el mayor valor de las frecuencias absolutas.
En este caso, se tienen dos frecuencias con el valor de 5, por cuanto, existirán dos
modas.
Paso 2. Calcular el valor de la moda.
En esta serie de datos, la moda es bimodal; ya que existen dos valores que representan
el mayor valor de las frecuencias absolutas; por consiguiente, la moda es 𝑥̂ = 2 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠
y 𝑥̂ = 3 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠.

5.4 Serie de clases y frecuencias


5.4.1 Media aritmética
Cuando se desea calcular la media aritmética en una serie de clases y frecuencias, se
toma como dato representativo de cada intervalo, su respectiva marca de clase o punto

14
medio 𝑃𝑀𝑖 (semisuma del límite inferior y superior) y la frecuencia correspondiente 𝑓𝑖 .
En otras palabras la media se obtiene de la siguiente manera:

∑ 𝑓𝑖 . 𝑃𝑀𝑖
𝑋̅ =
∑ 𝑓𝑖

El procedimiento en término generales para calcular la media aritmética para una serie
de clases y frecuencias será el siguiente:

Paso 1. Calcular la marca de clase o punto medio de todas las clases.

Paso 2. Multiplicar cada marca de clase por la respectiva frecuencia absoluta.

Paso 3. Realizar la suma de estos productos.

Paso 4. Dividir esta suma entre el número de elementos o total de las frecuencias
absolutas.

Analicemos el siguiente ejemplo relacionado con los precios de las acciones, al dólar
más cercano, del promedio industrial Dow Jones a enero de 2006, se presentan a
continuación:

Tabla 41. Serie de clases y frecuencias mostrada con límites reales y aparentes con su
respectiva frecuencia absoluta.

Precio de las acciones Precio de las acciones


𝒇𝒊 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊
Límites reales Límites aparentes

[19.5, 30.5[ 20 - 30 7 25 175


[30.5, 41.5[ 31 – 41 9 36 324
[41.5, 52.5[ 42 – 52 9
3 47 141
[52.5, 63.5[ 53 – 63 6 58 348
[63.5, 74.5[ 64 – 74 3
2 69 138
[74.5, 85.5] 75 – 85 3 80 240
TOTAL 6
30 1,366

TOTAL 2
Fuente: The Wall Street Journal.
3

15
Calcular la media aritmética de los precios de las acciones.

Para calcular la media aritmética para una serie de clases y frecuencias se tomará como
base el siguiente procedimiento:

Paso 1. Calcular las marcas de clase o puntos de medios de cada clase.


Los puntos medios de cada clase consisten en calcular la semisuma del límite inferior y
20+30
superior de cada clase. Por ejemplo, para la 1ª clase se tiene 𝑃𝑀 = 2
= 25, para la 2ª
31+41 42+52 53+63
clase 𝑃𝑀 = = 36, para la 3ª clase 𝑃𝑀 = = 47, para la 4ª clase 𝑃𝑀 = = 58, y
2 2 2

así sucesivamente hasta la 6ª clase.


Paso 2. Multiplicar los puntos medios de cada clase por su respectiva frecuencia
absoluta. Por ejemplo, para la primera clase se tiene el producto de 7x25=175, para
la segunda clase se tiene el producto de 9x36=324 y así sucesivamente hasta la sexta
clase.
Paso 3. Realizar la suma de estos productos.

∑ 𝑓𝑖 . 𝑃𝑀𝑖 = 1,366

Paso 4. Dividir esta suma entre el número de elementos o total de las


frecuencias absolutas
∑ 𝑓𝑖 . 𝑃𝑀𝑖 1,366
𝑋̅ = = 45.53 𝑑ó𝑙𝑎𝑟𝑒𝑠
∑ 𝑓𝑖 30
Interpretación: El precio promedio de las 30 acciones del promedio de Dow Jones es
de $45.53 dólares.

5.4.2 Mediana
Para calcular la mediana para una serie de clases y frecuencias se emplea la siguiente
fórmula:

(a) Si el número de datos n es impar:

𝑛+1
− 𝑓𝑎𝑎
𝑥̃ = 𝐿𝑖𝑟 + ( 2 ) ∗ 𝑖𝑐
𝑓𝑖

16
(b) Si el número de datos n es par:

𝑁
− 𝑓𝑎𝑎
𝑥̃ = 𝐿𝑖𝑟 + ( 2 ) ∗ 𝑖𝑐
𝑓𝑖

Donde:

𝐿𝑖𝑟 : Límite inferior real de la clase mediana

𝑛 : Número de datos o sumatoria de las frecuencias absolutas.

𝑓𝑎𝑎: Frecuencia acumulada antes de la clase mediana

𝑓𝑖 : Frecuencia acumulada de la clase mediana

𝑖𝑐 : Ancho o amplitud de clase

El procedimiento para calcular la media aritmética para una serie de clases y frecuencias
será el siguiente:

Paso 1. Calcular las frecuencias acumuladas ascendentes de la serie de datos.

Paso 2. Determinar la posición de la mediana.

Paso 3. Identificar el intervalo de posiciones en el que se encuentra el valor encontrado


en el paso anterior, con la finalidad de identificar la clase mediana.

Paso 4. Sustituir los valores en la fórmula para calcular la mediana.

Analicemos el ejemplo de los precios de las acciones, al dólar más cercano, del promedio
industrial Dow Jones a enero de 2006:

17
Tabla 42. Serie de clases y frecuencias con límites reales y aparentes con su
respectiva frecuencia absoluta y acumulada ascendente.

Precio de las acciones Precio de las acciones


f 𝐅𝐀 ↑ Posiciones
Límites reales Límites aparentes

[19.5, 30.5[ 20 - 30 7 7 1 a la 7
[30.5, 41.5[ 31 – 41 9 16 8 a la 16
9
[41.5, 52.5[ 42 – 52 3 19 17 a la 19
[52.5, 63.5[ 53 – 63 6
3 25 20 a la 25
[63.5, 74.5[ 64 – 74 2 27 26 a la 27
[74.5, 85.5] 75 – 85 6
3 30 28 a la 30
TOTAL 30
Fuente: Elaboración propia. 2
TOTAL
Calcular la mediana de los precios de las acciones. 3

Paso 1. Calcular las frecuencias acumuladas ascendentes

Para la primera clase 7, la segunda clase 7+9=16, la tercera clase 16+3=19, la cuarta
clase 19+6=25, la quinta clase 25+2=27, la sexta clase 27+3=30.

Paso 2. Identificar la posición de la mediana. Recuerde que el número de datos


equivale a la sumatoria de las frecuencias absolutas, siendo estas un número par

𝑛 30 30
( )= ( )= = 15
2 2 2

Paso 3. Identificar el valor encontrado de la posición de la mediana en la


columna de posiciones.

El valor de 15 se encuentra en el intervalo que comprende desde la posición 8 a la 16,


por cuanto, la clase mediana es [30.5, 41.5[

Paso 4. Sustituir los valores en la fórmula para calcular la mediana.

𝑛 30
2 − 𝑓𝑎𝑎 −7
𝑥̃ = 𝐿𝑖𝑟 + ( ) ∗ 𝑖𝑐 = 30.5 + ( 2 ) ∗ (41.5 − 30.5) = 40.28
𝑓𝑖 9

18
Interpretación: la mediana revela que el 50% de las acciones del promedio de Dow
Jones tienen un precio menor de 40.28 dólares mientras que el otro 50% tiene un precio
mayor.

5.4.3 Moda (𝑥̂)


Para calcular la moda para una serie de clases y frecuencias se emplea la siguiente
fórmula:

∆1
𝑥̂ = 𝐿𝑖𝑟 + (∆ ) ∗ 𝑖𝑐 ;
1 +∆2

donde:

𝑙𝑖 : Límite inferior real de la clase modal


∆1 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase anterior
a la modal (premodal)
∆2 : Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase
posterior a la modal (postmodal)
𝑖𝑐 : Amplitud o ancho del intervalo de clase

Analicemos el ejemplo de los precios de las acciones, al dólar más cercano, del promedio
industrial Dow Jones a enero de 2006:

Tabla 43. Serie de clases y frecuencias con límites reales y aparentes con su
respectiva frecuencia absoluta.

Precio de las acciones Precio de las acciones


f
Límites reales Límites aparentes

[19.5, 30.5[ 20 – 30 7
[30.5, 41.5[ 31 – 41 9
[41.5, 52.5[ 42 – 52 9
3
[52.5, 63.5[ 53 – 63 6
[63.5, 74.5[ 64 – 74 3
2
[74.5, 85.5] 75 – 85 3
TOTAL 6
30
Fuente: Elaboración propia.
TOTAL 2
19
3
Calcular la moda de los precios de las acciones.

Paso 1. Identificar el mayor valor de las frecuencias absolutas

Para este caso por simple inspección se observa que 19 es el mayor valor de estas.

Paso 2. Calcular la moda

∆1 9−7
𝑥̂ = 𝐿𝑖𝑟 + ( ) ∗ 𝑖𝑐 = 30.5 + [ ] ∗ 11 = 33.25
∆1 + ∆2 (9 − 7) + (9 − 3)

Interpretación: La moda del precio de las acciones del promedio de Dow jones es de
33.25 dólares.

5.5 Relación entre la media, la mediana y la moda


La relación que guarda la media, la mediana y la moda, se le conoce comúnmente como
la formula empírica de Pearson, debido a su creador. Establece que la moda es tres
veces que la mediana menos dos veces la media aritmética. En fórmula se expresa: 𝑥̂ =
3𝑥̃ − 2𝑥̅

De acuerdo con la forma de la distribución, las posiciones relativas de la media, la


mediana y la moda establece que:

(a) Cuando una distribución de frecuencias es simétrica, la media, la mediana y la moda


son iguales. En este caso las tres medidas serían adecuadas para representar el
centro de l distribución.

Figura 10. Simetría (cero sesgo).

Fuente: Elaboración propia.

20
(b) Cuando una distribución es sesgada a la derecha; es decir, esta es asimétrica a la
derecha. En este caso la moda es menor que la mediana y esta, a su vez, es menor
que la media (𝑥̂ < 𝑥̃ < 𝑥̅ ). Observemos que la media aritmética es la mayor de las
tres medidas, ya que en ella influyen más sobre la mediana o la moda unos valores
extremadamente altos. Por cuanto, la medida más representativa sería la moda y la
mediana.

Figura 11. Asimetría a la derecha (sesgo positivo).

Fuente: Elaboración propia.

(c) Cuando una distribución es sesgada a la izquierda, se considera que esta es


asimétrica a la izquierda, donde la moda es mayor que la mediana y esta, a su vez,
es mayor que la media (𝑥̅ < 𝑥̃ < 𝑥̂). En este tipo de sesgo la media aritmética es la
menor de las tres medidas, ya que la media es sensible a la influencia de una
cantidad extremadamente pequeña de observaciones. La mediana y la moda serían
las medidas más representativas.

21
Figura 12. Asimetría a la izquierda (sesgo negativo).

Fuente: Elaboración propia.

Ahora apliquemos las la fórmula empírica de Pearson para calcular el salario modal de
los 65 empleados de una empresa donde su media aritmética es de $279.77 y su
mediana es de $279.00. Se requiere:

(a) ¿Qué tipo de distribución describen estos datos?

𝑀𝑜𝑑𝑎 = 3 ∗ 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 − 2 ∗ 𝑀𝑒𝑑𝑖𝑎

𝑥̂ = 3𝑥̃ − 2𝑥̅ = 3($279.06) − 2($279.77) = $277.64

Como 277.64 < 279.06 < 279.77 entonces implica que la moda es menor que la
mediana y esta a su vez, es menor que la media. Por cuanto, se hace referencia a
una distribución sesgada a la derecha.

(b) ¿Cuál medida sería la más adecuada para representar el conjunto de datos?

La mediana y la moda serías las más representativas.

En el siguiente video se presentan algunos


ejemplos que incluyen algunas distribuciones.
Para ver el video haz clic aquí Formas de
distribución, (05 de septiembre de 2011).

22
Clase 6 | Otras medidas de
tendencia central

6. Otras medidas de posición


6.1 Deciles

Los deciles son las nueve marcas que fraccionan la


distribución en diez partes iguales, conteniendo cada una de
ellas la décima parte de las observaciones y se nombran
como D1 D2 … D8 y D9 (Cardiel, N., Gorgas, J., y Zamorano,
J. 2011).

Figura 13. Distribución de deciles.

Fuente: Elaboración propia.

Los deciles son valores de la variable que dividen los datos ordenados en diez partes
iguales (nueve divisiones).

6.1.1 Series simples


El proceso para localizar cuartiles de para una serie simple consiste en colocar la serie
de datos en orden, es decir, del menor hasta el mayor. Luego, la posición del decil k se
𝑁
determina por medio de la expresión 𝐾 ( ).
10

Analicemos la siguiente colección de datos 1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20 y 20 y


se requiere calcular el octavo decil.

23
Paso 1 Ordenar los datos de menor a mayor.

1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20 y 20

Paso 2. Calcular la posición del decil

14
8 (10) = 11.2 , este valor indica que el decil 8 se encuentra entre la posición 11 y la 12.

Paso 3. Calcular el decil 8

Entre el valor 9 y el 19 (que son los datos cuyas posiciones son 11 y 12 respectivamente)
hay exactamente 10 unidades, por cuanto, el decil 8 resulta ser más cercano a la
posición 11 que es 9, esto permite calcular su valor de la siguiente manera: 𝐷8 = 9 +
0.2(10) = 11

Ahora, analicemos las edades de los trabajadores de una micro empresa: 25, 28, 30,
30, 35, 35, 36, 37, 37, 38, 40, 40, 40, 40, 40, 40, 41, 43, 48, 50. Como la serie de
datos, ya está ordenada de menor a mayor, se procede a encontrar la posición del decil
cuatro, para luego identificar su valor correspondiente.

Paso 1 Ordenar los datos de menor a mayor.

25, 28, 30, 30, 35, 35, 36, 37, 37, 38, 40, 40, 40, 40, 40, 40, 41, 43, 48, 50

Paso 2. Calcular la posición del decil

20 80
4 (10) = 10 = 8 , Esto quiere decir, que el dato que se encuentra en la posición 8

Paso 3. Calcular el decil 4

𝐷4 = 37

24
6.1.2. Serie de datos y frecuencias
Para calcular el decil de una serie de datos y frecuencias analizaremos las edades de
sesenta estudiantes de tercer ciclo educación básica y de educación media, la que se
resume en la siguiente tabla de frecuencias:

Tabla 44. Serie de datos y frecuencias de las edades se sesenta estudiantes de tercer
ciclo de educación básica.
EDAD (AÑOS) FRECUENCIA FA↑ POSICIONES
13 3 3 1 a la 3

14 14 17 4 a la 17

15 23 40 18 a la 40

16 10 50 41 a la 50

17 5 55 51 a la 55

18 4 59 56 a la 59

19 1 60 60

TOTAL 60

Fuente: Elaboración propia.

Calcular el decil 6

Paso 1. Calcular la posición del decil

60 360
6 (10) = 10
= 36 , esto quiere decir, que el dato se encuentra en la posición 36.

Paso 2. Identificar el valor de la posición del decil en la columna de posiciones.

El valor de 36 se encuentra en el intervalo de posiciones que comprende desde la


posición 18 a la 40.

Paso 3. Calcular el decil 6

25
Identificar el valor x “años (edad)” asociado a la frecuencia 23, por tanto, el decil 6 𝐷6 =
15 𝑎ñ𝑜𝑠

6.1.3 Serie de clases y frecuencias


Si los datos se agrupan en clases y frecuencias los cuartiles se obtienen a través de un
proceso un tanto laborioso. Para datos agrupados los cuartiles se obtienen por medio de
las siguientes fórmulas:

𝐾𝑁
− 𝐹𝑎𝑎
𝐷𝑘 = 𝐿𝑖𝑟 + [ 10 ] ∗ 𝑖𝑐
𝑓𝑖

Analizaremos la siguiente tabla de distribución de frecuencias que representa la edad de


sesenta estudiantes de un grupo de inscritos en la Maestría en Estadística aplicada a la
investigación en el presente semestre. Determine el decil dos:

Tabla 45. Distribución de frecuencia de las edades de sesenta estudiantes.

EDAD (años) Frecuencia Frecuencia


Acumulada Posiciones
Límites reales (f)
(Fa)
[ 30 , 35 [ 3 3 1 al 3
[ 35 , 40 [ 7 10 4 al 10
[ 40 , 45 [ 12 22 11 al 22
[ 45 , 50 [ 23 45 23 al 45
[ 50 , 55 [ 14 59 46 al 59
[ 55 , 60 ] 1 60 60
TOTAL 60

Fuente: Elaboración propia.

26
Calcular el decil 2.

𝐾𝑁 𝐾∑𝑓
Paso 1. Determinar la posición que ocupa el decil dos 10
= 10

2(60) 120
= = 12
10 10

Paso 2. Identificar el valor de la posición del decil en la columna de posiciones

El valor de 12 se encuentra en el intervalo de posiciones que comprende desde la


posición 11 a la 22.

Paso 3. Calcular el decil 2

Identificar la clase asociada a la frecuencia absoluta 12, la que permitirá calcular el


respectivo decil
2(60)
− 10 12 − 10 2 10
𝐷2 = 40 + [ 10 ] ∗ 5 = 40 + [ ] ∗ 5 = 40 + [ ] ∗ 5 = 40 +
12 12 12 12

𝐷2 ≅ 40.83 𝑎ñ𝑜𝑠

6.2 Cuartiles
Los cuartiles dividen el conjunto de las observaciones en cuatro partes iguales, son por
tanto tres puntos y se denotan como Q1 Q2 y Q3. Si una serie de datos se encuentra
ordenada de menor a mayor se denomina cuartiles a los valores que dividen la serie de
datos en cuatro partes iguales. De acuerdo, con la definición existen tres cuartiles:

Figura 14. Distribución de cuartiles.

Fuente: Elaboración propia.

27
El cuartil uno 𝑄1 es el que supera como máximo al 25% de los datos y es superado a su
vez por el 75% de dichos datos. El cuartil dos 𝑄2 supera como máximo al 50% y es
superado a su vez por el 50% de los datos. El cuartil tres 𝑄3 supera como máximo al
75% de los datos y es superado a su vez por el 25%. Recuerda que el cuartil dos 𝑄2 es
la misma mediana. (Cardiel, N., Gorgas, J., y Zamorano, J. 2011).

La determinación de los cuartiles con frecuencia es de utilidad. Por ejemplo muchas


escuelas de posgrados admitirán sólo a aquellos estudiantes que estén en el 25%
superior (tercer cuartil) de los candidatos. Las empresas, con frecuencia, desean señalar
las plantas cuyos deficientes registros de producción los colocan por debajo del cuartil
inferior. Con un poco de imaginación es posible prever numerosos ejemplos en los cuales
la determinación de cuartiles puede ser de gran beneficio.

6.2.1. Series simples


El proceso para localizar cuartiles en una serie de datos simples es semejante al que se
utiliza para encontrar la mediana:

a) Ordenar los n datos desde el menor al mayor


b) Encontrar la posición del cuartil uno es 1(n+1)/4
c) Encontrar la posición del cuartil dos es 2(n+1)/4
d) Encontrar la posición del cuartil tres es 3(n+1)/4

Analicemos la siguiente colección de datos 4, 5, 3, 7, 10, 8, 11 la que contiene un


número de datos impar. Se solicita calcular los cuartiles uno, dos y tres.

Paso 1. Ordenar la colección de datos

3, 4, 5, 7, 8, 10, 11.

Paso 2. Determinar la posición que ocupa cada uno de los cuartiles

𝑛+1 7+1 8
Posición de 𝑄1 = 4
= 4
=4=2
2(𝑛+1) 2(7+1) 16
Posición de 𝑄2 = 4
= 4
= 4
=4
28
3(𝑛+1) 3(7+1) 24
Posición de 𝑄3 = 4
= 4
= 4
=6

Paso 3. Determinar el valor de cada uno de los cuartiles

El dato que ocupa la posición 2 es 𝑄1 = 4

El dato que ocupa la posición 4 es 𝑄2 = 7

El dato que ocupa la posición 6 es 𝑄3 = 10

Analicemos otra colección de datos que contiene un número de datos pares: 3, 4, 5, 7,


9, 10, 11, 14. Se solicita calcular los cuartiles uno, dos y tres.

Paso 1. Ordenar los datos de menor a mayor

3, 4, 5, 7, 9, 10, 11, 14

Paso 2. Determinar la posición que ocupa cada uno de los cuartiles

𝑛+1 8+1 9
Posición de 𝑄1 = 4
= 4
= 4 = 2.25.

2(𝑛+1) 2(8+1) 18
Posición de 𝑄2 = 4
= 4
= 4
= 4.50

3(𝑛+1) 3(8+1) 27
Posición de 𝑄3 = 4
= 4
= 4
= 6.75

Paso 3. Determinar el valor de cada uno de los cuartiles

 Como la posición del cuartil 1 es 2.25 se analizan los datos que ocupan las posiciones
2y3 cuyos datos son 4 y 5 respectivamente, lo que reflejan exactamente 1 unidad
de diferencia entre ellos, concluimos que la posición 2.25 se encuentra más cercana
a la posición 2 que es 4, esto permite calcular el valor de 𝑄1 = 4 + 0.25(1) = 4.25

 Como la posición del cuartil 2 es 4.50, se analizan los datos que ocupan las posiciones
4 y 5 cuyos datos son 7 y 9 respectivamente, los que reflejan exactamente 2 unidades
de diferencia entre ellos, concluimos que la posición 4.50 se encuentra igual de
cercana a la posición 7 y 9, esto permite calcular el valor de 𝑄2 = 7 + 0.50(2) = 8

29
 Como la posición del cuartil 3 es 6.75 se analizan los datos que ocupan las posiciones
6 y 7 cuyos datos son 10 y 11 respectivamente, lo que reflejan exactamente 1
unidad de diferencia entre ellos, concluimos que la posición 6.75 se encuentra más
cercana a la posición 7 que es 11, esto permite calcular el valor de 𝑄3 = 11 − 0.25(1) =
10.75 o bien de otra manera 𝑄3 = 10 + 0.75(1) = 10.75

6.2.2 Serie de datos y frecuencias


Para calcular el cuartil de una serie de datos y frecuencias analizaremos las edades de
sesenta estudiantes de tercer ciclo educación básica y de educación media, en donde,
se hará referencia a la distribución de frecuencia de las edades de sesenta estudiantes.

Tabla 46. Serie de datos y frecuencias de las edades de sesenta estudiantes para
determinar cuartiles.

EDAD (AÑOS) FRECUENCIA FA↑ POSICIONES

13 3 3 1 a la 3

14 14 17 4 a la 17

15 23 40 18 a la 40

16 10 50 41 a la 50

17 5 55 51 a la 55

18 4 59 56 a la 59

19 1 60 60

TOTAL 60

Fuente: Elaboración propia.

30
Calcular el cuartil 1.

Paso 1. Calcular la posición del cuartil

𝑛 1(60) 60
𝐾( ) = = = 15
4 4 4

Esto quiere decir, que el dato se encuentra en la posición 15.

Paso 2. Identificar el valor de la posición del cuartil en la columna de posiciones

El valor de la posición 15 se encuentra en el intervalo de posiciones que comprende


desde la posición 4 a la 17.

Paso 3. Calcular el cuartil

Identificar el valor x “años (edad)” asociado a la frecuencia 14, por tanto, el cuartil uno
es 𝑄1 = 14 𝑎ñ𝑜𝑠

6.2.3 Serie de clases y frecuencias


Si los datos se agrupan en clases y frecuencias, los cuartiles se obtienen a través de un
proceso un tanto laborioso. Para este tipo de datos agrupados los cuartiles se obtienen
por medio de las siguientes fórmulas:

(a) Si el número de datos es par

1𝑁 2𝑁 3𝑁
− 𝐹𝑎𝑎 − 𝐹𝑎𝑎 − 𝐹𝑎𝑎
𝑄1 = 𝑙𝑖𝑟 + [ 4 ] ∗ 𝑖𝑐 𝑄2 = 𝑙𝑖𝑟 + [ 4 ] ∗ 𝑖𝑐 𝑄3 = 𝑙𝑖𝑟 + [ 4 ] ∗ 𝑖𝑐
𝑓𝑖 𝑓𝑖 𝑓𝑖

(b) Si el número de datos es impar

31
1(𝑛 + 1) 2(𝑛 + 1) 3(𝑛 + 1)
− 𝐹𝑎𝑎 − 𝐹𝑎𝑎 − 𝐹𝑎𝑎
𝑄1 = 𝑙𝑖𝑟 + [ 4 ] 𝑄2 = 𝑙𝑖𝑟 + [ 4 ] 𝑄1 = 𝑙𝑖𝑟 + [ 4 ]
𝑓𝑖 𝑓𝑖 𝑓𝑖

∗ 𝑖𝑐 ∗ 𝑖𝑐 ∗ 𝑖𝑐

Analizaremos la siguiente tabla de distribución de frecuencias que muestra las edades


de sesenta estudiantes de un grupo inscritos en la Maestría en Estadística aplicada a la
investigación en el presente semestre. En ella se muestra las frecuencias absoluta, las
frecuencias acumuladas ascendentes y el intervalo de posiciones. Se requiere calcular
el cuartil tres:

Tabla 47. Serie de clases y frecuencias con sus respectivas frecuencia absoluta,
frecuencia acumulada e intervalo de posiciones.
EDAD (años) Frecuencia FA↑ Posiciones
[ 30 , 35 [ 3 3 1 al 3
Límites reales (f)
[ 35 , 40 [ 7 10 4 al 10
[ 40 , 45 [ 12 22 11 al 22
[ 45 , 50 [ 23 45 23 al 45
[ 50 , 55 [ 14 59 46 al 59
[ 55 , 60 ] 1 60 60
TOTAL 60

Fuente: Elaboración propia.

Paso 1. Determinar la posición que ocupa el cuartil

3(60)
= 45
4

Paso 2. Identificar el valor de la posición del cuartil en la columna de


posiciones.

El valor de 45 se encuentra en el intervalo de posiciones que comprende desde la


posición 23 a la 45.

32
Paso 3. Calcular el cuartil tres.

Identificar la clase asociada a la frecuencia absoluta 23, la que permitirá calcular el


respectivo cuartil
3𝑁
− 𝐹𝑎𝑎
𝑄3 = 𝑙𝑖𝑟 + [ 4 ] ∗ 𝑖𝑐
𝑓𝑖

3(60)
− 22 45 − 22 23
𝑄3 = 45 + [ 4 ] ∗ 5 = 45 + [ ] ∗ 5 = 45 + [ ] ∗ 5 = 45 + 5
23 23 23

𝑄3 ≅ 50 𝑎ñ𝑜𝑠

6.3 Percentiles
Son los valores de la variable que dividen un conjunto de
datos clasificados en 100 subconjuntos iguales; cada conjunto
de datos tiene 99 percentiles. El k-ésimo percentil 𝑃𝑘 , es un
valor que a lo sumo k% de los datos son menores en valor
que 𝑃𝑘 y a lo sumo (100 - k)% de los datos son mayores
(Cardiel, N., Gorgas, J., y Zamorano, J. 2011)
Figura 15. Distribución de percentiles.

Fuente: Elaboración propia.

6.3.1 Series simples


El proceso para localizar percentiles para serie de datos simples consiste en colocar la
serie de datos en orden, es decir, del menor hasta el mayor. Luego, la posición del decil
𝑁
k se determina por medio de la expresión 𝐾 ( )
100

33
Analicemos la siguiente colección de datos 1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20 y 20.
Calcular el percentil 42 y percentil 87. Con relación a los percentiles pedidos, tendríamos
que ubicar las posiciones correspondientes como lo hicimos con los deciles y cuartiles.
Paso 1. Ordenar los datos de menor a mayor

1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20, 20
Paso 2. Determinar la posición que ocupa cada uno de los percentiles

Posición del 𝑃42


42(14)
= 5.88
100

Posición del 𝑃87


87(14)
= 12.18
100

Paso 3. Determinar el valor de cada uno de los percentiles

 Como la posición del percentil 42 es 5.88, se analizan los datos que ocupan las
posiciones 5 y 6 cuyos datos son 3 para ambos. Esto quiere decir que el percentil 42
se encuentra entre los datos que ocupan la posición 5 y la 6. Afortunadamente en
este caso ambos datos son 3 por lo que 𝑃42 es 3.

 Como la posición del percentil 87 es 12.18 se analizan los datos que ocupan las
posiciones 12 y 13 cuyos datos son 19 y 20 respectivamente, lo que reflejan
exactamente 1 unidad de diferencia entre ellos, concluimos que la posición 12.18 se
encuentra más cercana a la posición 12 que es 19, esto permite calcular el valor de
𝑃87 = 19 + 0.18(1) = 19.18

6.3.2 Serie de datos y frecuencias


Para calcular un percentil de una serie de datos y frecuencias analizaremos las edades
de sesenta estudiantes de tercer ciclo educación básica y de educación media, la que se
resume en la siguiente tabla:

34
Tabla 48. Serie de datos y frecuencias de las edades de sesenta estudiantes para
determinar percentiles.

EDAD (AÑOS) FRECUENCIA FA↑ POSICIONES

13 3 3 1 a la 3

14 14 17 4 a la 17

15 23 40 18 a la 40

16 10 50 41 a la 50

17 5 55 51 a la 55

18 4 59 56 a la 59

19 1 60 60

TOTAL 60

Fuente: Elaboración propia.

Calcular el percentil 5
Paso 1. Calcular la posición del cuartil

5(60) 300
= =3
100 100

Esto quiere decir, que el dato se encuentra en la posición 3.

Paso 2. Identificar el valor de la posición del cuartil en la columna de posiciones

El valor de la posición 3 se encuentra en el intervalo de posiciones que comprende desde


la posición 1 a la 3.

Paso 3. Calcular el cuartil

Identificar el valor x “años (edad)” asociado a la frecuencia 3, por tanto, el percentil 5


es 𝑃5 = 13 𝑎ñ𝑜𝑠

35
6.3.3 Serie de clases y frecuencias
Si los datos se agrupan en clases y frecuencias los cuartiles se obtienen a través de un
proceso un tanto laborioso. Para datos agrupados los percentiles se obtienen por medio
de la siguiente fórmula:

𝐾𝑁
− 𝐹𝑎𝑎
𝑃𝑘 = 𝑙𝑖𝑟 + [ 100 ] ∗ 𝑖𝑐
𝑓𝑖

Analizaremos la siguiente tabla de distribución de frecuencias que representa la edad de


sesenta estudiantes de un grupo de inscritos en la Maestría en Estadística aplicada a la
investigación en el presente semestre con la finalidad de calcular el percentil 55.

Tabla 49. Serie de clases y frecuencias de las edades de sesenta estudiantes para
determinar percentiles.

EDAD (años) Frecuencia FA↑ Posiciones

Límites reales
[ 30 , 35 [ (f)
3 3 1 al 3
[ 35 , 40 [ 7 10 4 al 10
[ 40 , 45 [ 12 22 11 al 22
[ 45 , 50 [ 23 45 23 al 45
[ 50 , 55 [ 14 59 46 al 59
[ 55 , 60 ] 1 60 60
TOTAL 60

Fuente: Elaboración propia.

Paso 1. Determinar la posición que ocupa el percentil

55(60)
= 33
100

Paso 2. Identificar el valor de la posición del cuartil en la columna de posiciones

El valor de 33 se encuentra en el intervalo de posiciones que comprende desde la


posición 23 a la 45.

36
Paso 3. Calcular el percentil 55

Identificar la clase asociada a la frecuencia absoluta 23, la que permitirá calcular el


respectivo percentil
𝑁
𝐾 (100) − 𝐹𝑎𝑎
𝑃55 = 𝑙𝑖𝑟 + [ ] ∗ 𝑖𝑐
𝑓𝑖

55(60)
− 22 33 − 22 11 55
𝑃55 = 45 + [ 100 ] ∗ 5 = 45 + [ ] ∗ 5 = 45 + [ ] ∗ 5 = 45 +
23 23 23 23

𝑃55 ≅ 47.39 𝑎ñ𝑜𝑠

37
Clase 7 | Medidas de
dispersión para serie: simple /
datos y frecuencias

7. Medidas de dispersión
En las últimas dos temáticas, se estudiaron las medidas de tendencia central cuyo
análisis dirige su interés al comportamiento de los datos con relación a un valor central
pero este análisis se olvida de la forma en la que los datos varían o se dispersan.

Las medidas de dispersión se encargan de estudiar el comportamiento de todos los datos


y cómo estos se distribuyen alrededor de un valor central, por ejemplo la media
aritmética. Expresado de otra manera, las medidas de dispersión nos informan cuanto
están alejadas del centro los valores de distribución. Para su fácil comprensión,
estableceremos un ejemplo entre dos datos, tal es el caso del número ocho y el cuatro,
que al calcular su media aritmética nos da como resultado 6, esto implica que, cada uno
de los números 8 y 4 no se encuentran muy distantes de su media aritmética; caso
contrario, si tuviéramos el número 0 y 1,000, y calculáramos su respectiva media
aritmética, esta nos da como resultado 500; pero la distancia de ambos números a 500
estaría bastante lejos o distante.

Por cuanto, esto se resume en que una medida de dispersión pequeña indica que los
datos se acumulan con proximidad alrededor de la media aritmética, por consiguiente,
la media aritmética en este caso se considera representativa. Por el contrario, una
medida grande de dispersión, indica que la media no es confiable debido a ese
alejamiento que existe entre los valores de distribución con la media aritmética. Dentro
de las medidas de dispersión se encuentran: el rango, la desviación media, la desviación
estándar y la varianza entre otros.

38
7.1 Serie simple
7.1.1 Rango
Se considera la medida de dispersión más simple. Se define
como la variación o diferencia entre el dato mayor y el dato
menor de un conjunto de datos u observaciones. Para
calcular el rango se emplea la siguiente fórmula: 𝑅 =
𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟𝑚𝑒𝑛𝑜𝑟

Si situamos un ejemplo para estudiar el rango como medida de dispersión


estableceríamos lo siguiente: En San Salvador, una familia de fabricantes de calzado se
dedica a producir exclusivamente zapatos para adulto. Las tallas (longitud del pie en
centímetros) que maneja en zapatos para mujer las siguientes: 21.5, 22.0, 22.5, 23.0,
23.5, 24.0, 24.5, 25.0, 25.5, 26.0, 26.5, 27. De esta lista de tallas de calzado, ¿cuál es
la talla menor?, ¿cuál es la talla mayor? Al observar la tabla te podrás percatar que la
talla menor que maneja esta familia de fabricantes de calzado es 21.5 y la talla mayor
es 27. A partir de esta información se puede decir que la variación en las tallas de los
zapatos, desde la talla menor hasta la talla mayor es:

𝑅 = 27.0 − 21.5 = 5.5

7.1.2 Desviación media


El rango como medida de dispersión tiene la desventaja de sólo considerar dos datos;
es decir, el dato mayor y el dato menor. Sin embargo, es conveniente contar con otra
medida de dispersión de los datos respecto a la media en la que se tome en cuenta
todas las observaciones.

Se define la desviación media como el promedio de las


distancias o diferencias entre todas las observaciones y la
media aritmética, es decir, es el promedio de las
desviaciones respecto a la media. Además, esta se usa para
medir la variabilidad de un conjunto de datos y se calcula
mediante la siguiente ecuación:

39
Para una muestra Para una población

∑|𝑋 − 𝑋̅| ∑|𝑋 − 𝜇|


𝐷𝑥̅ = 𝐷𝑥̅ =
𝑛 𝑁

Donde: Donde:

𝑋: valor o dato 𝑋: valor o dato

𝑋̅: Media aritmética 𝜇: Media aritmética

n: Número de datos de la muestra N: Número de datos de la población

Para comprender la definición de desviación media analizaremos la siguiente serie de de


datos: 5, 10, 15, 20, 25, 30, 35 a través del cálculo del promedio de las diferencias de
los datos con respecto a la media aritmética. El procedimiento para calcular la desviación
media será el siguiente:

Paso 1. Calcular la sumatoria de los valores x,

Paso 2. Dividir la sumatoria de los valores x entre el número de datos, con la


finalidad de encontrar la media aritmética, y

Paso 3. Restar la media aritmética a cada uno de los valores X, recordemos que
utilizaremos el valor absoluto, ya que lo que nos interesa es la diferencia no el signo.

Paso 4. Calcular el valor de la desviación media, a través de la división entre los


valores encontrados para |𝑋 − 𝑋̅| y su respectivo número de datos.

Veamos de manera ordenada y simplificada ambos pasos en la siguiente tabla:

Tabla 50. Serie de datos simples.

𝑿 ̅|
|𝑿 − 𝑿
5 |5 − 20| = 15
10 |10 − 20| = 10
15 |15 − 20| = 5
20 |20 − 20| = 0
25 |25 − 20| = 5
30 |30 − 20| = 10
35 |35 − 20| = 15
∑ 𝑋 = 140 ∑|𝑋 − 𝑋̅| = 60
Fuente: Elaboración propia.
40
La media aritmética se calcula de la siguiente manera:

Paso 1. Calcularemos la suma de los valores x

Paso 2. Dividiremos la suma de los valores x con el número de datos para encontrar la
media aritmética.

∑ 𝑋 140
𝑋̅ = = = 20
𝑁 7

Paso 3. Restar la media aritmética a cada uno de los valores x

Paso 4. Dividir la sumatoria de los valores |𝑋 − 𝑋̅| con el número de datos con la finalidad
de encontrar la desviación media

∑|𝑋 − 𝑋̅| 60
𝐷𝑥̅ = = = 8.57
𝑁 7

Interpretación: la desviación media obtenido indica que los datos de la variable se


separan 8.57 en promedio de la media aritmética. Será necesario aclarar que una
desviación media menor a 8.57, por ejemplo el dato 25, cuya diferencia con la media es
5, nos indicaría que los datos se encuentran más cercanos a su media aritmética. Si la
desviación media fuera cero, como el dato 20, significaría que todas las observaciones
son idénticas a la media aritmética.

Esta medida de dispersión cada vez se utiliza menos, pero aún puede ayudar a
comprender el significado de las siguientes medidas de dispersión: la varianza y la
desviación estándar. Las descripciones más completas de la dispersión son aquellas que
manejan la desviación promedio respecto a alguna medida de tendencia central. Dos de
estas medidas son importantes para nuestro estudio de la estadística: la varianza y la
desviación estándar.

41
7.1.3 Varianza
Se define varianza como la media aritmética del cuadrado
de las desviaciones respecto a la media de una distribución
estadística. La varianza nos da una distancia promedio de
cualquier observación del conjunto de datos respecto a la
media de la distribución. Cada población tiene una varianza,
su símbolo es 𝜎 2 (sigma cuadrada).

La varianza de una población se considera la suma de los cuadrados de las distancias


entre la media y cada elemento de la población se divide entre el número total de
observaciones en población. Al elevar al cuadrado cada distancia, logramos que todos
los números sean positivos y, al mismo tiempo, asignamos más peso a las desviaciones
más grandes. La fórmula para calcular la varianza de población es la siguiente:

∑(𝑋 − 𝜇)2
𝜎2 =
𝑁

Donde:

𝜎2: Varianza de la población

X: Elemento u observación

𝜇: Media de la población

N: Número total de elementos de la población

La varianza muestral se considera el promedio de los cuadrados de las diferencias entre


cada dato y la media aritmética del conjunto. La varianza se representa con el símbolo
𝑆 2 . La fórmula para calcular la varianza de la muestra es la siguiente:

∑(𝑋 − 𝑋̅)2
𝑆2 =
𝑛−1

Donde:

𝑆2: Varianza de la muestra

X: Elemento u observación

𝑋̅: Media de la muestra

42
n: Número total de elementos de la muestra.

Para comprender el término varianza muestral analizaremos un ejemplo relacionado con


el control de calidad, el cual establece lo siguiente que la fábrica de dulces “EL
ARTESANAL” elabora una variedad de producto de los que estudiará una muestra de 10
diferentes productos cuyos costos de producción por cada 100 piezas de las diferentes
golosinas se presentan en la siguiente tabla.

Tabla 51. Costos de producción de diez productos que elabora la fábrica “EL
ARTESANAL”.
PRODUCTO COSTO
Bombón $20.00
Caramelo $33.00
Caramelo suave $41.00
Chocolate $63.00
Cocada $38.00
Mentas $27.00
Nuez garapiñada $56.00
Oblea $19.00
Paleta $16.00
Tamarindo $52.00
TOTAL $365.00
Fuente: Elaboración propia.

Calcular la varianza de los costos de producción de los diferentes productos de la fábrica


“EL ARTESANAL”.

Para determinar el valor de la varianza muestral se debe cumplir el siguiente


procedimiento:

Paso 1. Calcular la sumatoria de los valores de 𝑋𝑖

Paso 2. Dividir la sumatoria de los valores de 𝑋𝑖 entre el número de datos

∑ 𝑋𝑖 365
𝑋̅ = = = 36.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛 10

Paso 3. Restar la media aritmética a cada uno de los costos (𝑋𝑖 )

43
Paso 4. Elevar al cuadro la resta de la media aritmética con cada uno de los costos (𝑋𝑖 )

Paso 5. Dividir los valores de (𝑋𝑖 − 𝑋̅)2 entre el número de datos restado de 1 para
encontrar la varianza muestral de los datos:

∑(𝑋 − 𝑋̅)2 2,246.50 2,246.50


𝑆2 = = = = 249.61 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
𝑛−1 10 − 1 9

Tabla 52. Serie simple para calcular la varianza muestral.


PRODUCTO 𝐂𝐎𝐒𝐓𝐎 (𝐗 𝐢 ) ̅|
|𝑿𝒊 − 𝑿 ̅ )𝟐
(𝑿𝒊 − 𝑿
Bombón $20.00
( )𝐄𝐬𝐜𝐫𝐢𝐛𝐚 𝐚𝐪𝐮í16.5
𝐥𝐚 𝐞𝐜𝐮𝐚𝐜𝐢ó𝐧. 272.25
Caramelo $33.00 3.5 12.25
Caramelo suave $41.00 4.5 20.25
Chocolate $63.00 26.5 702.25
Cocada $38.00 1.5 2.25
Mentas $27.00 9.5 90.25
Nuez garapiñada $56.00 19.5 380.25
Oblea $19.00 17.5 306.25
Paleta $16.00 20.5 420.25
Tamarindo $52.00 15.5 240.25
TOTAL $365.00 2,246.50

Fuente: Elaboración propia.

7.1.4 Desviación estándar


Se considera la medida de dispersión más frecuente por ser la más práctica. Podemos
definirla, dado que ya conocemos la varianza, como la raíz cuadrada de la varianza, esto
es, la desviación estándar.

La desviación estándar de la población, es simplemente la raíz cuadrada de la varianza


de la población. Como la varianza es el promedio de los cuadrados de las distancias de
las observaciones a la media, la desviación estándar es la raíz cuadrada del promedio
de los cuadrados de las distancias entre las observaciones y la media. Mientras que la
varianza se expresa con el cuadrado de las unidades utilizadas para medir los datos, la

44
desviación estándar está en las mismas unidades que las que se usaron para medir los
datos.

La fórmula para la desviación estándar es:

∑(𝑋 − 𝜇)2
𝜎 = √𝜎 2 = √
𝑁

Donde:

𝜎2: Varianza de la población

X: Elemento u observación

𝜇: Media de la población

N: Número total de elementos de la población

La desviación estándar de la muestra se calcula mediante la fórmula:

∑(𝑋 − 𝑋̅)2
𝑠 = √𝑠 2 = √
𝑛−1

Donde:

𝑆2: Varianza de la población

X: Elemento u observación

𝑋̅: Media de la población

n: Número total de elementos de la muestra

Para comprender el término de desviación estándar, retomaremos el ejemplo realizado


anteriormente, donde utilizaremos la tabla 10 (Serie simple para calcular la varianza
muestral), recordemos que en este, se hace referencia al control de calidad sobre la
elaboración de diez diferentes productos que realiza la fábrica “EL ARTESANAL” cuyos
costos de producción por cada 100 piezas de las diferentes golosinas que se presentan
en la siguiente tabla:

45
Tabla 53. Serie simple para calcular la desviación estándar.

PRODUCTO 𝐂𝐎𝐒𝐓𝐎 (𝐗 𝐢 ) ̅|
|𝑿𝒊 − 𝑿 ̅ )𝟐
(𝑿𝒊 − 𝑿
Bombón $20.00
( )𝐄𝐬𝐜𝐫𝐢𝐛𝐚 𝐚𝐪𝐮í16.5
𝐥𝐚 𝐞𝐜𝐮𝐚𝐜𝐢ó𝐧. 272.25
Caramelo $33.00 3.5 12.25
Caramelo suave $41.00 4.5 20.25
Chocolate $63.00 26.5 702.25
Cocada $38.00 1.5 2.25
Mentas $27.00 9.5 90.25
Nuez garapiñada $56.00 19.5 380.25
Oblea $19.00 17.5 306.25
Paleta $16.00 20.5 420.25
Tamarindo $52.00 15.5 240.25
TOTAL $365.00 2,246.50

Fuente: Elaboración propia.

Se solicita calcular la desviación estándar de la muestra.

Para calcular la desviación estándar, se requiere únicamente calcular de manera previa


la media aritmética que luego permita calcular la varianza muestral. Por último, para
determinar el valor de la desviación estándar muestral se procede a calcular la raíz
cuadrada de la varianza muestral calculada, entonces se tiene:

∑ 𝑋𝑖 365
𝑋̅ = = = 36.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛 10

2
∑(𝑋 − 𝑋̅)2 2,246.50 2,246.50
𝑆 = = = = 249.61 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
𝑛−1 10 − 1 9

∑(𝑋 − 𝑋̅)2 2,246.50 2,246.50


𝑆=√ =√ =√ = 15.80 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛−1 10 − 1 9

7.1.5 Coeficiente de variación


La desviación estándar es una medida absoluta de la
dispersión que expresa la variación en las mismas unidades
que los datos originales.

46
Además, la desviación estándar no puede ser la única base para la comparación de dos
distribuciones. Si tenemos una desviación estándar de 10 y una media de 5, los valores
varían en una cantidad que es el doble de la media. Si, por otro lado, tenemos una
desviación estándar de 10 y una media de 5,000, la variación relativa a la media es
insignificante. En consecuencia, no podemos conocer la dispersión de un conjunto de
datos hasta que conocemos su desviación estándar, su media y cómo se compara la
desviación estándar con la media.

Lo que necesitamos es una medida relativa que nos proporcione una estimación de la
magnitud de la desviación respecto a la magnitud de la media. El coeficiente de
variación es una de estas medidas relativas de dispersión. Relaciona la desviación
estándar y la media, expresando la desviación estándar como porcentaje de la media.
La unidad de medida, entonces, es “porcentaje”, en lugar de las unidades de los datos
originales. Para una población, la fórmula para el coeficiente de variación es:

(a) Si los datos son muestrales


𝜎
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 = ∗ 100%
𝜇
(b) Si los datos son poblacionales
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅

El coeficiente de variación se emplea fundamentalmente para: (a) comparar la


variabilidad entre dos grupos de datos referidos a distintos sistemas de unidades de
medida, por ejemplo, kilogramos y centímetros, (b) comparar la variabilidad entre dos
grupos de datos obtenidos por dos o más personas distintas, (c) determinar la
representatividad de la media aritmética de una serie de datos.

La interpretación del coeficiente de variación implica conocer el grado de


representatividad de la media, valor que será mayor cuanto menor sea el coeficiente de
variación. El grado de representatividad de la media representado por medio del
coeficiente de variación se presenta en la siguiente tabla:

47
Tabla 54. Representatividad de la media según el valor del coeficiente de variación.

Valor del coeficiente de variación Grado de representatividad de la media


De 0 a menos de 10% Media altamente representativa
De 10% a menos de 20% Media bastante representativa
De 20% a menos de 30% Media tiene representatividad
De 30% a menos de 40% Media cuya representatividad es dudosa
De 40% o más Media carente de representatividad
Fuente: Bonilla G. (2000) Estadística: Elementos de estadística descriptiva y
probabilidad.

Ahora, calcularemos e interpretaremos el coeficiente de variación de la fábrica de dulces


“EL ARTESANAL” relacionado con la elaboración de 10 tipos de una variedad de sus
productos cuyos costos de producción por cada 100 piezas de las diferentes golosinas
que se presentan en la tabla 10 (Serie simple para calcular la varianza muestral)

Tabla 55. Serie simple para calcular la varianza y la desviación estándar

PRODUCTO 𝐂𝐎𝐒𝐓𝐎 (𝐗 𝐢 ) ̅|
|𝑿𝒊 − 𝑿 ̅ )𝟐
(𝑿𝒊 − 𝑿
Bombón $20.00
( )𝐄𝐬𝐜𝐫𝐢𝐛𝐚 𝐚𝐪𝐮í16.5
𝐥𝐚 𝐞𝐜𝐮𝐚𝐜𝐢ó𝐧. 272.25
Caramelo $33.00 3.5 12.25
Caramelo suave $41.00 4.5 20.25
Chocolate $63.00 26.5 702.25
Cocada $38.00 1.5 2.25
Mentas $27.00 9.5 90.25
Nuez garapiñada $56.00 9.5 380.25
Oblea $19.00 17.5 306.25
Paleta $16.00 20.5 420.25
Tamarindo $52.00 15.5 240.25
TOTAL $365.00 2,246.5
Fuente: Elaboración propia. 0

Al realizar el proceso de control de calidad se encontró la siguiente información:

∑ 𝑋𝑖 365
𝑋̅ = = = 36.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛 10

∑(𝑋 − 𝑋̅)2 2,246.50 2,246.50


𝑆2 = = = = 249.61 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
𝑛−1 10 − 1 9

∑(𝑋 − 𝑋̅)2 2,246.50 2,246.50


𝑆=√ =√ =√ = 15.80 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛−1 10 − 1 9

48
Esta información nos permite calcular el coeficiente de variación mediante la fórmula:

𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅

15.80
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 43.28%
36.5

Interpretación: significa que la desviación estándar representa el 43.28% de la media.


Por lo que es una media que tiene representatividad.

7.2 Serie de datos y frecuencias


7.2.1 Varianza
Para calcular la varianza y la desviación media en una serie de datos y frecuencias será
necesario emplear las siguientes fórmulas:

(a) Si se quiere calcular una varianza muestral:

∑ 𝑓(𝑋𝑖 − 𝑋̅)2
𝑆2 =
𝑛−1

(b) Si se quiere calcular una varianza poblacional:

∑ 𝑓(𝑋𝑖 − 𝜇)2
𝜎2 =
𝑁

La siguiente tabla representa las calificaciones de un estudiante de las doce asignaturas


evaluadas sobre 100 durante los dos años académicos cursados en la educación media,
por cuanto, analiza los datos como una población:

Tabla 56. Calificaciones de un estudiante en las asignaturas cursadas en educación


media para encontrar la varianza muestral.

CALIFICACION CANTIDAD DE 𝑿 𝒊 . 𝒇𝒊 (𝑿𝒊 − 𝝁)𝟐 𝒇(𝑿𝒊


(𝑿𝒊 ) ASIGNATURAS − 𝝁)𝟐
6 4 24 2.25 9.00
7 2 (𝒇) 14 0.25 0.50
8 3 24 0.25 0.75
9 2 18 2.25 4.50
10 1 10 6.25 6.25
TOTAL 12 90 21

Fuente: Elaboración propia.


49
El procedimiento para calcular la varianza poblacional se describe mediante el cálculo
de las siguientes medidas:

Paso 1. Multiplicar el valor de la variable 𝑋𝑖 por su respectiva frecuencia de ocurrencia


Paso 2. Realizar la sumatoria de los valores ∑ 𝑓𝑖 𝑋𝑖
Paso 3. Dividir la sumatoria de los valores ∑ 𝑓𝑖 𝑋𝑖 entre el número de datos.
Paso 4. Restar la media poblacional a cada uno de los valores de 𝑋𝑖
Paso 5. Elevar esta diferencia al cuadrado (𝑿𝒊 − 𝝁)𝟐
Paso 6. Multiplicar la diferencia al cuadrado por su respectiva frecuencia 𝒇(𝑿𝒊 − 𝝁)𝟐
Paso 5. Encontrar la sumatoria de los valores de 𝒇(𝑿𝒊 − 𝝁)𝟐
Paso 6. Dividir la sumatoria de los valores de 𝒇(𝑿𝒊 − 𝝁)𝟐 entre el número de datos para
encontrar la varianza poblacional para una serie de datos y frecuencias
∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 ∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 21
𝜎2 = = = = 1.75 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
∑ 𝑓𝑖 𝑁 12

Tabla 57. Serie de datos y frecuencias sobre las calificaciones de un estudiante en las
asignaturas cursadas en educación media para encontrar la desviación
media.

CALIFICACION CANTIDAD DE 𝑿 𝒊 . 𝒇𝒊 |𝑿𝒊 − 𝝁| 𝒇|𝑿𝒊 − 𝝁|


(𝑿𝒊 ) ASIGNATURAS
6 4 24 1.5 6.0
7 2 (𝒇) 14 0.5 1.0
8 3 24 0.5 1.5
9 2 18 1.5 3.0
10 1 10 2.5 2.5
TOTAL 12 90 14
Fuente: Elaboración propia.

El procedimiento para calcular desviación media poblacional se describe mediante el


cálculo de las siguientes medidas:

Paso 1. Multiplicar el valor de la variable 𝑋𝑖 por su respectiva frecuencia de ocurrencia


Paso 2. Realizar la sumatoria de los valores ∑ 𝑓𝑖 𝑋𝑖
Paso 3. Dividir la sumatoria de los valores ∑ 𝑓𝑖 𝑋𝑖 entre el número de datos.

50
∑ 𝑓𝑖 𝑋𝑖 ∑ 𝑓𝑖 𝑋𝑖 90
𝜇= = = = 7.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
∑ 𝑓𝑖 𝑁 12
Paso 4. Restar la media poblacional a cada uno de los valores de 𝑋𝑖
Paso 5. Multiplicar los valores de |𝑿𝒊 − 𝝁| por su respectiva frecuencia de ocurrencia
Paso 6. Sumar todos los valores de 𝒇|𝑿𝒊 − 𝝁|
Paso 7. Dividir la sumatoria de 𝒇|𝑿𝒊 − 𝝁| entre la sumatoria de las frecuencias absolutas
∑ 𝑓|𝑋𝑖 − 𝜇| ∑ 𝑓|𝑋𝑖 − 𝜇| 14
𝐷𝑥̅ = = = = 1.17 𝑑ó𝑙𝑎𝑟𝑒𝑠
∑ 𝑓𝑖 𝑁 12

7.2.2 Desviación estándar


Para calcular la varianza en una serie de datos y frecuencias será necesario emplear las
siguientes fórmulas:

(a) Si se quiere calcular una varianza muestral:

∑ 𝑓𝑖 (𝑋𝑖 − 𝑋̅)2
𝑆 = √𝑆 2 =
𝑛−1

(b) Si se quiere calcular una varianza poblacional:

∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 ∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2


𝜎 = √𝜎 2 = =
𝑓𝑖 𝑁

Si retomamos el ejercicio anterior, donde se muestran las calificaciones de un estudiante


en doce asignaturas evaluadas sobre 100 durante los dos años académicos cursados en
la educación media reflejados en la siguiente tabla:

51
Tabla 58. Serie de datos y frecuencias sobre las calificaciones de un estudiante en las
asignaturas cursadas en educación media para encontrar la varianza
muestral.

CALIFICACION CANTIDAD DE 𝑿 𝒊 . 𝒇𝒊 (𝑿𝒊 − 𝝁)𝟐 𝒇(𝑿𝒊


(𝑿𝒊 ) ASIGNATURAS − 𝝁)𝟐
6 4 24 2.25 9.00
7 2 (𝒇) 14 0.25 0.50
8 3 24 0.25 0.75
9 2 18 2.25 4.50
10 1 10 6.25 6.25
TOTAL 12 90 21

Fuente: Elaboración propia.

El procedimiento para calcular la varianza se describe mediante el cálculo de las


siguientes medidas, entonces se tiene ya calculado:

Paso 1. Multiplicar el valor de la variable 𝑋𝑖 por su respectiva frecuencia de ocurrencia


Paso 2. Realizar la sumatoria de los valores ∑ 𝑓𝑖 𝑋𝑖
Paso 3. Dividir la sumatoria de los valores ∑ 𝑓𝑖 𝑋𝑖 entre el número de datos.
Paso 4. Restar la media poblacional a cada uno de los valores de 𝑋𝑖
Paso 5. Elevar esta diferencia al cuadrado (𝑿𝒊 − 𝝁)𝟐
Paso 6. Multiplicar la diferencia al cuadrado por su respectiva frecuencia 𝒇(𝑿𝒊 − 𝝁)𝟐
Paso 5. Encontrar la sumatoria de los valores de 𝒇(𝑿𝒊 − 𝝁)𝟐
Paso 6. Dividir la sumatoria de los valores de 𝒇(𝑿𝒊 − 𝝁)𝟐 entre el número de datos para
encontrar la varianza poblacional para una serie de datos y frecuencias

2
∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 ∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 21
𝜎 = = = = 1.75 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
∑ 𝑓𝑖 𝑁 12

Paso 7. Calcular la desviación estándar a través de la raíz cuadrada de la varianza o


mediante el empleo de su respectiva fórmula

∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 ∑ 𝑓(𝑋𝑖 − 𝜇)2 21


𝜎 = √𝜎 2 = √ =√ = √ = 1.32 𝑑ó𝑙𝑎𝑟𝑒𝑠
∑ 𝑓𝑖 𝑁 12

52
7.2.3 Coeficiente de variación
Para calcular el coeficiente de variación únicamente tenernos que aplicar su fórmula
respectiva para una serie de datos y frecuencias donde los datos son poblacionales.

𝜎
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝜇

1.32
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 17.60%
7.5

Interpretación: significa que la desviación estándar representa el 22.22% de la media.


Por lo que es una media que tiene representatividad.

En el siguiente video se presentan algunos ejemplos que


incluyen algunas distribuciones. Para ver el video haz
clic aquí Varianza, desviación estándar y coeficiente de
variación, Datos agrupados puntualmente, (15 de junio
de 2017).

53
Clase 8 | Medidas de
dispersión para serie de clases
y frecuencias

8. Medidas de dispersión
8.1 Serie de clases y frecuencias
8.1.1 Varianza
Para calcular la varianza para una serie de clases y frecuencias utilice la siguiente
fórmula:
(1) Si los datos hacen referencia a una muestra:
∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2
𝑆2 =
∑𝑓 −1
(2) Si los datos hacen referencia a una población:
∑ 𝑓(𝑃𝑀𝑖 − 𝜇)2
𝜎2 =
∑𝑓
Analizaremos un primer ejemplo relacionado con una serie de datos de clases y
frecuencias relacionadas con el número de cheques cobrados diariamente en las 50
sucursales de un banco durante el último trimestre el que se sintetiza en la siguiente
tabla de frecuencias:

Tabla 59. Distribución de frecuencias respecto al número de cheques cobrados en las


últimas sucursales de un banco durante el último trimestre.
CANTIDAD DE CHEQUES 𝒇
[ 0, 200[ 8
[200, 400[ 10
[400, 600[ 16
[600, 800[ 9
[800,1000] 7
TOTAL 50
Fuente: Elaboración propia.
54
Calcular la varianza muestral del cobro de cheques en las últimas sucursales del banco
durante el último semestre.

Para calcular la varianza muestral de datos agrupados se requiere el cumplimiento del


siguiente procedimiento:
Paso 1. Encontrar el punto medio de cada clase
Paso 2. Multiplica cada frecuencia de cada clase por su respectivo punto medio
Paso 3. Encuentre la media aritmética para una serie de clases y frecuencias
∑ 𝑓𝑖 . 𝑃𝑀𝑖 24,400
𝑥̅ = = = 488 𝑐ℎ𝑒𝑞𝑢𝑒𝑠
∑ 𝑓𝑖 50

Tabla 60. Serie de clases y frecuencias para calcular la media aritmética.


CANTIDAD DE CHEQUES 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊
[ 0, 200[ 8 100 800
[200, 400[ 10 300 3,000
[400, 600[ 16 500 8,000
[600, 800[ 9 700 6,300
[800,1000] 7 900 6,300
TOTAL 50 24,400
Fuente: Elaboración propia.

Paso 4. Reste la media aritmética de cada punto medio para obtener los valores de
|𝑃𝑀𝑖 − 𝑋̅|

Tabla 61. Serie de clases y frecuencias para encontrar valores de |𝑃𝑀𝑖 − 𝑋̅|.
CANTIDAD DE CHEQUES 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿
[ 0, 200[ 8 100 800 800 388
[200, 400[ 10 300 3,000 3,000 188
[400, 600[ 16 500 8,000 8,000 12
[600, 800[ 9 700 6,300 6,300 212
[800,1000] 7 900 6,300 6,300 412
TOTAL 50 24,400 24,400

Fuente: Elaboración propia.


55
Paso 5. Eleve al cuadrado cada valor que se obtuvo en el paso anterior para lograr
valores de (𝑃𝑀𝑖 − 𝑋̅)2

Tabla 62. Serie de clases y frecuencias para calcular los valores de (𝑃𝑀𝑖 − 𝑋̅)2 .
CANTIDAD DE CHEQUES 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿
[ 0, 200[ 8 100 800 388 150,044
[200, 400[ 10 300 3,000 188 35,344
[400, 600[ 16 500 8,000 12 144
[600, 800[ 9 700 6,300 212 44,944
[800,1000] 7 900 6,300 412 169,744
TOTAL 50 24,400
Fuente: Elaboración propia.

Paso 6. Multiplique la frecuencia por el respectivo valor (𝑃𝑀𝑖 − 𝑋̅)2

Tabla 63. Serie de clases y frecuencias para calcular los valores de (𝑃𝑀𝑖 − 𝑋̅)2 .
CANTIDAD DE
𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
𝒇(𝑷𝑴𝒊 − 𝑿
CHEQUES
[ 0, 200[ 8 100 800 388 150,044 1,204,352
[200, 400[ 10 300 3,000 188 35,344 353,440
[400, 600[ 16 500 8,000 12 144 2,304
[600, 800[ 9 700 6,300 212 44,944 404,496
[800,1000] 7 900 6,300 412 169,744 1,188,208
TOTAL 50 24,400 3,152,800
Fuente: Elaboración propia.

Paso 7. Divida la sumatoria de los valores de 𝑓(𝑃𝑀𝑖 − 𝑋̅)2 entre la diferencia de la


sumatoria de las frecuencias menos uno para encontrar la varianza muestral
∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2 3,152,800 3,152,800
𝑆2 = = = = 64,342.85714 𝑐ℎ𝑒𝑞𝑢𝑒𝑠 2
∑𝑓 − 1 50 − 1 49

56
8.1.2 Desviación estándar
Para calcular la estándar para una serie de clases y frecuencias utilice la siguiente
fórmula:

(1) Si los datos hacen referencia a una muestra:

∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2
𝑆 = √𝑆 2 = √
∑𝑓 −1

(2) Si los datos hacen referencia a una población:

∑ 𝑓(𝑃𝑀𝑖 − 𝜇)2
𝜎 = √𝜎 2 = √
∑𝑓

Ahora, retomaremos el ejercicio de aplicación donde utilizaremos la serie de clases y


frecuencias para calcular los valores de (𝑃𝑀𝑖 − 𝑋̅)2 relacionado con el número de cheques
cobrados diariamente en las 50 sucursales de un banco durante el último trimestre, el
que se sintetiza en la siguiente tabla de frecuencias:

Tabla 64. Serie de clases y frecuencias para calcular la desviación estándar muestral.
CANTIDAD DE
𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
𝒇(𝑷𝑴𝒊 − 𝑿
CHEQUES
[ 0, 200[ 8 100 800 388 150,044 1,204,352
[200, 400[ 10 300 3,000 188 35,344 353,440
[400, 600[ 16 500 8,000 12 144 2,304
[600, 800[ 9 700 6,300 212 44,944 404,496
[800,1000] 7 900 6,300 412 169,744 1,188,208
TOTAL 50 24,400 3,152,800
Fuente: Elaboración propia.

Calcular la desviación estándar muestral del cobro de cheques en las últimas sucursales
del banco durante el último semestre.

57
Para encontrar la desviación estándar muestral encontramos la media aritmética
muestral y luego la varianza muestral, esto implica que le agregaremos un paso después
de encontrar la varianza muestral en el paso 6.

Paso 7. Calcule la desviación estándar muestral

∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2 3,152,800 3,152,800


𝑠 = √𝑆 2 = √ =√ =√ = 253.66 𝑐ℎ𝑒𝑞𝑢𝑒𝑠
∑𝑓 − 1 50 − 1 49

Analizaremos un segundo ejemplo, relacionado con el cálculo de la desviación estándar


a partir de una distribución de frecuencias el que se sintetiza los niveles de cotinina de
fumadores. Calcule la desviación estándar de los 40 valores que se resumen en la
distribución de frecuencias de la siguiente tabla, considerando que no se dispone del
conjunto original de datos.

Tabla 65. Niveles de cotinina en los fumadores.


COTININA 𝒇
[ 00 , 099[ 11
[100, 199[ 12
[200, 299[ 14
[300, 399[ 1
[400,499] 2
TOTAL 40
Fuente: Elaboración propia.

Para calcular la desviación estándar muestral de datos agrupados se requiere el


cumplimiento del siguiente procedimiento:
Paso 1. Encontrar el punto medio de cada clase.
Paso 2. Multiplica cada frecuencia de cada clase por su respectivo punto medio
Paso 3. Encuentre la media aritmética para una serie de clases y frecuencias
∑ 𝑓𝑖 . 𝑃𝑀𝑖 7,080
𝑥̅ = = = 177 𝑛𝑖𝑣𝑒𝑙𝑒𝑠
∑ 𝑓𝑖 40

58
Tabla 66. Serie de clases y frecuencias para calcular la media aritmética.
COTININA 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊
[ 00 , 099[ 11 49.5 544.5
[100, 199[ 12 149.5 1,794.0
[200, 299[ 14 249.5 3,493.0
[300, 399[ 1 349.5 349.5
[400,499] 2 449.5 899.0
TOTAL 40 7,080.0
Fuente: Elaboración propia.

Paso 4. Reste la media aritmética de cada punto medio para obtener los valores de
(𝑃𝑀𝑖 − 𝑋̅)

Tabla 67. Serie de clases y frecuencias para calcular los valores de |𝑃𝑀𝑖 − 𝑋̅|.
COTININA 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿
[ 00 , 099[ 11 49.5 544.5 127.5
[100, 199[ 12 149.5 1,794.0 27.5
[200, 299[ 14 249.5 3,493.0 72.5
[300, 399[ 1 349.5 349.5 172.5
[400,499] 2 449.5 899.0 272.5
TOTAL 40 7,080.0
Fuente: Elaboración propia.

Paso 5. Eleve al cuadrado cada valor que se obtuvo en el paso anterior para lograr
valores de (𝑃𝑀𝑖 − 𝑋̅)2

Tabla 68. Serie de clase y frecuencias para calcular valores (𝑃𝑀𝑖 − 𝑋̅)2 .
COTININA 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿
[ 00 , 099[ 11 49.5 544.5 127.5 16,256.25
[100, 199[ 12 149.5 1,794.0 27.5 756.25
[200, 299[ 14 249.5 3,493.0 72.5 5,256.25
[300, 399[ 1 349.5 349.5 172.5 29,756.25
[400,499] 2 449.5 899.0 272.5 74,256.25
TOTAL 40 7,080.0
Fuente: Elaboración propia.
Paso 6. Multiplique la frecuencia por el respectivo valor 𝑓(𝑃𝑀𝑖 − 𝑋̅)2

59
Tabla 69. Serie de clase y frecuencias para calcular valores 𝑓(𝑃𝑀𝑖 − 𝑋̅)2 .
COTININA 𝒇𝒊 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
𝒇(𝑷𝑴𝒊 − 𝑿
[ 00 , 099[ 11 49.5 544.5 127.5 16,256.25 178,818.75
[100, 199[ 12 149.5 1,794.0 27.5 756.25 9,075.00
[200, 299[ 14 249.5 3,493.0 72.5 5,256.25 73,587.50
[300, 399[ 1 349.5 349.5 172.5 29,756.25 29,756.25
[400,499] 2 449.5 899.0 272.5 74,256.25 148,512.50
TOTAL 40 7,080.0 439,750.00
Fuente: Elaboración propia.

Paso 7. Divida los valores 𝑓(𝑃𝑀𝑖 − 𝑋̅)2 entre la diferencia de la sumatoria de las
frecuencias menos uno para encontrar la varianza muestral:
∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2 439,750 439,750
𝑆2 = = = = 11,275.64103 𝑛𝑖𝑣𝑒𝑙𝑒𝑠 2
∑𝑓 − 1 40 − 1 39

Paso 8. Calcule la desviación estándar muestral a través de la raíz cuadrada de la


varianza o mediante la fórmula respectiva:

∑ 𝑓𝑖 (𝑃𝑀𝑖 − 𝑥̅ )2 439,750 439,750


𝑆 = √𝑆 2 = √ =√ =√ = 106.19 𝑛𝑖𝑣𝑒𝑙𝑒𝑠
∑ 𝑓𝑖 − 1 40 − 1 39

8.1.3 Coeficiente de variación.


Para calcular el coeficiente de variación para una serie de clase y frecuencias nos
basaremos en los datos muestrales “el número de cheques cobrados diariamente en las
50 sucursales de un banco durante el último trimestre” y “los niveles de cotinina de 40
fumadores” obtendremos los estadísticos que aparecen en la siguiente tabla:

Tabla 70. Media aritmética y desviación estándar de dos muestras.

Media 𝐗
̅ Desviación estándar (s)
Cheques cobrados 488 cheques 253.66 𝑐ℎ𝑒𝑞𝑢𝑒𝑠
Niveles de cotinina 177 niveles 106.19 𝑛𝑖𝑣𝑒𝑙𝑒𝑠
Fuente: Elaboración propia.
60
Calcule el coeficiente de variación de cheques cobrados diariamente en las cincuenta
sucursales de un banco durante el último trimestre, después el coeficiente de variación
de los niveles de cotinina de los cuarenta fumadores; finalmente, compare los dos
resultados.

Debido a que tenemos estadísticos muestrales, los dos coeficientes de variación se


obtienen de la siguiente manera:

 Cheques cobrados:
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
253.66
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 51.98%
488

 Niveles de cotinina:

𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅

106.19
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 59.99%
177

Si utilizamos los datos muestrales de la estatura y peso de 40 hombres, incluidos en el


conjunto de datos que evidencian los estadísticos que aparecen en la siguiente tabla.

Tabla 71. Media aritmética y desviación estándar de la estura y peso de 40 hombres.

Magnitud Media 𝑿
̅ Desviación estándar (s)
Estatura 68.34 pulgadas 3.02 pulgadas
Peso 172.55 libras 26.33 libras
Fuente: Elaboración propia.

61
Debido a que tenemos estadísticos muestrales, los dos coeficientes de variación se
obtienen de la siguiente manera:

 Estaturas
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
3.02 𝑝𝑢𝑙𝑔
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 4.42%
68.34 𝑝𝑢𝑙𝑔
 Pesos
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
26.33 𝑙𝑏
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 15.26%
172.55 𝑙𝑏

Aun cuando la diferencia en unidades imposibilita la comparación de la desviación


estándar de 3.02 pulgadas, con la desviación estándar de 26.33 libras, es posible
comparar los coeficientes de variación, que carecen de unidades.

Se observa que las estaturas con coeficiente de variación de 4.42%, tienen una variación
considerablemente menor que los pesos con coeficiente de variación de 15.26%. Lo
anterior tiene sentido, ya que, por lo general, vemos que los pesos de los hombres
varían mucho más que sus estaturas. Por ejemplo, es muy raro encontrar un adulto que
mida el doble que otro, pero es mucho más común ver a uno que pese el doble que otro.

62
Referencias citadas en la UNIDAD 2

 Aguilera, L. (1990). Estadística I Descriptiva. San Salvador, El Salvador: UCA


editores.

 Bonilla, G. (2000). Elementos de estadística descriptiva y probabilidad. (Séptima


Edición). San Salvador, El Salvador: UCA editores.

 Cardiel, N., Gorgas, J., y Zamorano, J. (2011).Estadística básica para estudiantes


de ciencias. Universidad Complutense de Madrid.

 Rodríguez, L. (2007). Probabilidad y estadística básica para ingenieros. Instituto


de Ciencias Matemáticas. Guayaquil, Ecuador.

 Vilchis, M. (2014) Deciles, cuartiles, percentiles. Universidad Autónoma del


Estado de Hidalgo. Sistema de Universidad Virtual

63
Glosario de los términos citados en la
UNIDAD 2
Medida de Las medidas de posición son aquellas que dividen un conjunto de
posición datos en grupos con el mismo número de individuos. Su requisito
para calcular estas medidas es que los datos estén ordenados de
menor a mayor.

Media Se define en serie simple como la suma de todos los datos dividida
aritmética entre el número total de datos. Se calculan dependiendo de cómo
vengan ordenados los datos.

Para datos agrupados, la media aritmética se define como la suma


de todos los productos de marca clase con la frecuencia absoluta
respectiva y su resultado se divide por el número total de datos.

Mediana Se define en serie simple como el valor que ocupa el lugar central
entre todos los valores del conjunto de datos, cuando estos están
ordenados en forma creciente o decreciente.

Para datos agrupados, la mediana se encuentra en el intervalo


donde la frecuencia acumulada llega hasta la mitad de la suma de
las frecuencias absolutas

Moda Se define en serie simple como el dato que más veces se repite
en un conjunto de datos, es decir, aquel que tiene mayor
frecuencia absoluta.

Para datos agrupados, se identifica aquella clase que contenga la


mayor frecuencia, es decir, se determina la clase modal.

Deciles Un decil es cualquiera de los nueve valores que dividen a un grupo


de datos ordenados en diez partes iguales, de manera que cada
parte representa 1/10 de la muestra o población.

64
Cuartiles Es una medida de posición que consiste en dividir en cuatro
partes iguales un listado de de datos ordenados de menor
a mayor donde cada una de estas partes será un cuartil.

Percentiles Es una medida de posición usada en estadística que indica,


una vez ordenados los datos de menor a mayor, el valor de
la variable por debajo del cual se encuentra
un porcentaje dado de observaciones en un grupo.

Desviación Es el promedio de las distancias de cada uno de los datos


media a la media; es decir, que es la media de lo que se desvía el
conjunto de datos con respecto a la media.
Varianza Definimos la varianza como la media de los cuadrados de
las distancias de los datos a la media, es decir, es la suma
de cada distancia al cuadrado.

Desviación Es una medida que se usa para cuantificar la variación


estándar o dispersión de un conjunto de datos numéricos.

Coeficiente de El coeficiente de variación es la relación entre la desviación


variación típica de una muestra y su media cuya expresión se
manifiesta usualmente en porcentajes, la que permite
comparar las dispersiones de dos distribuciones distintas,
siempre que sus medias sean positivas.

65

También podría gustarte