Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TENDENCIA CENTRAL Y
DISPERSIÓN
1
Dirección de Educación a Distancia
Apartado Postal, 1874, San Salvador, El Salvador
Tel: 2251-8200 ext: 1743
2
Sumario
3
8.1 Serie de clases y frecuencias .............................................. 54
8.1.1 Varianza ......................................................................... 54
8.1.2 Desviación estándar ........................................................ 57
8.1.3 Coeficiente de variación................................................... 60
4
En las temáticas que se abordan en la presente unidad, se pretende identificar la diferencia
entre las medidas de tendencia central y de dispersión. Se debe tener presente que las
medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo en cambio, las medidas de dispersión nos dicen hasta que punto estas
medidas de tendencia central son representativas como síntesis de la información. En
términos generales, se busca analizar las características particulares donde se aplica cada
medida de tendencia central y de dispersión, además, se busca calcular las diversas medidas
para un conjunto de datos representados en serie simples, serie de datos y frecuencias así
como también, en series de clases y frecuencias para luego interpretar las diversas medidas
calculadas.
Clase 5 | Medidas de
tendencia central
5. Medida de posición
Los datos que caracterizan a una población reciben el nombre de parámetros a diferencia de
un estadístico que caracterizan a una muestra. Un ejemplo de parámetro sería el porcentaje
de personas que no saben leer ni escribir en toda la República de El Salvador y si tomamos
de un total de personas a unas doscientas de estas que se encuentran en un parque nos
enfocaríamos a un ejemplo de un estadístico.
Los estadísticos que estudiaremos son de dos tipos: (a) estadísticos de posición, y (b)
estadísticos de dispersión. Entre los principales estadísticos de posición son: media
aritmética, mediana, moda, cuartiles, deciles, percentiles, media armónica y media
geométrica. Los estadísticos de posición media aritmética, mediana y moda reciben el
nombre de medidas de tendencia central. Esto se debe a que si todos los datos se ordenan
de menor a mayor, estos estadísticos de posición tienen siempre a ocupar las posiciones
centrales, por cuanto, a las medidas de posición se les conoce también como medidas de
tendencia central o medidas de localización, ya que su finalidad consiste en señalar el centro
de un conjunto de valores.
5.1 Definiciones
La media aritmética o promedio se define como un valor que
representa de forma sencilla y razonable comportamiento de un
conjunto de datos completo. Esta brinda el valor típico de una
serie de datos.
∑ 𝑋𝑖
𝑋̅ =
𝑛
6
Recordemos que una muestra de una población consiste en n observaciones con n minúscula
con una media de 𝑥̅ . La media de una población se simboliza con 𝜇, que es la letra griega
mu. El número de elementos de una población se denota con la letra mayúscula cursiva N.
La letra griega sigma Σ indica que todos los valores de x se suman.
Analicemos el ejemplo enfocado en una familia salvadoreña del área rural que comúnmente
está formada por más de dos hijos. Si la familia Pérez García tiene cuatro hijos varones cuyos
nombres son Juan, Pedro, Luis y Antonio cada uno de los cuales posee respectivamente las
siguientes edades 12, 14, 16 y 18 años. Encuentre la edad media de los cuatro hijos.
12+14+16+18
𝑋 = 𝐸𝑑𝑎𝑑 , 𝑋̅ = 𝐸𝑑𝑎𝑑 𝑚𝑒𝑑𝑖𝑎 por cuanto, 𝑋̅ = 4
= 15 𝑎ñ𝑜𝑠
𝑋1 𝑓1 + 𝑋2 𝑓2 + 𝑋3 𝑓3 + ⋯ + 𝑋𝑛 𝑓𝑛
𝑋̅ =
𝑓1 + 𝑓2 + 𝑓3 +. . . . + 𝑓𝑛
Analicemos otro ejemplo en el que encontraremos el peso medio de las veinticinco personas
que conforman el salón de clases del curso de Estadística de Negocios, si los pesos en libras
son las siguientes:
Tabla 36. Pesos en libras de veinticinco personas que cursan Estadística de negocios.
7
Tabla 37. Distribución de frecuencias.
PESO FRECUENCIA
90 2
100 5
105 4
110 4
115 7
120 3
TOTAL 25
Por cuanto;
5.2.2 Mediana
Se considera una medida de posición que puede definirse de la siguiente manera: la mediana,
de una serie simple ordenada conforme a sus valores crecientes o decrecientes, es un valor
que ocupa el lugar central de la serie. De otra manera, se considera todo valor que supera a
no más de la mitad de las observaciones y sea simultáneamente superado por no más de la
mitad de las observaciones. La mediana se encuentra ubicada en el centro de la serie de
datos. (Rodríguez, 2007)
8
𝑛+1
𝑃𝑜𝑠𝑖𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 = ( )
2
Ahora, resolveremos un ejercicio relacionado con la mediana para la serie de datos formada
por los números 11, 4, 9, 13, 16, 10 y 25. El procedimiento a seguir se describe así: (1)
ordenar los siete datos de menor a mayor: 4, 9, 10,11, 13, 16, 25. (2) encontrar la posición
de la mediana es (7 + 1)⁄2 = (8/2) = 4. (3) Identificar el valor de la mediana, como el dato
que ocupa la posición cuatro es el 11 concluimos que la mediana es 11.
Otro ejercicio enfocado a encontrar la mediana para una serie de datos que comprende los
números 18, 4, 14, 22, 28, 12, 16, 46, 9 y 31. El procedimiento a seguir se describe así: (1)
ordenar los ordenamos los diez datos de menor a mayor: 4, 9, 12, 14, 16, 18, 22, 28, 31,
46. (2) encontrar la posición de la mediana (10 + 1)⁄2 = (11/2) = 5.5. (3) Identificar el valor
de la mediana, como el valor encontrado para la posición que ocupará la mediana es un
número decimal, el que se encuentra comprendido entre la posición 5 y 6, la mediana resulta
de la semisuma del número que ocupa la posición cinco y seis; es decir, que la semisuma es
(16 + 18)⁄2 = 17. Esto significa, que la mediana es simplemente 17.
Se representa por 𝑋̂. La moda es el concepto que la mayoría de las personas tienen en la
mente cuando escuchan expresiones como las siguientes: el consumidor promedio, el
tamaño promedio de zapatos que vende una zapatería, la calificación promedio de un buen
estudiante. Aunque la moda es un concepto sencillo, su aplicación plantea algunos
problemas.
9
Analicemos las siguientes listas de datos:
Si revisamos cada serie de datos enunciados en cada uno de los incisos anteriores podríamos
concluir lo siguiente: en el inciso (a) la moda es 𝑋̂ =15, en el inciso (b) la moda es 𝑋̂=10 y
𝑋̂=18, y por último, en el inciso (c) no hay moda.
∑(𝑥𝑖 . 𝑓𝑖 )
𝑥̅ =
∑ 𝑓𝑖
En donde:
10
Tabla 38. Serie de datos y frecuencias que muestra el número de accidentes laborales.
∑(𝑓𝑖 . 𝑥𝑖 ) 106
𝑥̅ = = = 3.53 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠
∑ 𝑓𝑖 30
5.3.2 Mediana ( 𝒙
̃)
Para el cálculo de la mediana utilizaremos una columna extra para calcular la frecuencia
acumulada ascendente, la que a su vez permitirá construir una columna de posiciones.
Para determinar la mediana se debe tener en cuenta el siguiente proceso:
(a) Construir dos columnas extras para calcular la frecuencia acumulada ascendente y
otra para el intervalo de posiciones.
11
(b) Determinar la posición de la mediana.
Tabla 39. Serie de datos y frecuencias que muestra el número de accidentes laborales
con sus respectivas frecuencias absolutas y acumuladas ascendentes.
NÚMERO DE ACCIDENTESFRECUENCIA
LABORALES ABSOLUTA 𝑭𝑨 ↑ POSICIONES
𝒙𝒊 𝒇
0 3 3 1 a la 3
1 4 7 4 a la 7
2 5 12 8 a la 12
3 5 17 13 a la 17
4 4 21 18 a la 21
5 3 24 22 a la 24
6 3 26 25 a la 26
7 2 27 27
8 1 28 28
9 1 29 29
10 1 30 30
TOTAL 30
5.3.3 Moda ( 𝒙
̂)
Para calcular la moda en una serie de datos y frecuencias se busca en la columna de
frecuencias absolutas la mayor de ellas, que permitirá identificar el valor de x asociado
a esta frecuencia para luego asignar el valor asociado a la moda.
13
Tabla 40. Serie de datos y frecuencias que muestra el número de acciones laborales
con su respectiva frecuencia absoluta.
Para calcular la moda en una serie de datos y frecuencias será necesario tomar en cuenta
los siguientes pasos:
Paso 1. Identificar el mayor valor de las frecuencias absolutas.
En este caso, se tienen dos frecuencias con el valor de 5, por cuanto, existirán dos
modas.
Paso 2. Calcular el valor de la moda.
En esta serie de datos, la moda es bimodal; ya que existen dos valores que representan
el mayor valor de las frecuencias absolutas; por consiguiente, la moda es 𝑥̂ = 2 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠
y 𝑥̂ = 3 𝑎𝑐𝑐𝑖𝑑𝑒𝑛𝑡𝑒𝑠.
14
medio 𝑃𝑀𝑖 (semisuma del límite inferior y superior) y la frecuencia correspondiente 𝑓𝑖 .
En otras palabras la media se obtiene de la siguiente manera:
∑ 𝑓𝑖 . 𝑃𝑀𝑖
𝑋̅ =
∑ 𝑓𝑖
El procedimiento en término generales para calcular la media aritmética para una serie
de clases y frecuencias será el siguiente:
Paso 4. Dividir esta suma entre el número de elementos o total de las frecuencias
absolutas.
Analicemos el siguiente ejemplo relacionado con los precios de las acciones, al dólar
más cercano, del promedio industrial Dow Jones a enero de 2006, se presentan a
continuación:
Tabla 41. Serie de clases y frecuencias mostrada con límites reales y aparentes con su
respectiva frecuencia absoluta.
TOTAL 2
Fuente: The Wall Street Journal.
3
15
Calcular la media aritmética de los precios de las acciones.
Para calcular la media aritmética para una serie de clases y frecuencias se tomará como
base el siguiente procedimiento:
∑ 𝑓𝑖 . 𝑃𝑀𝑖 = 1,366
5.4.2 Mediana
Para calcular la mediana para una serie de clases y frecuencias se emplea la siguiente
fórmula:
𝑛+1
− 𝑓𝑎𝑎
𝑥̃ = 𝐿𝑖𝑟 + ( 2 ) ∗ 𝑖𝑐
𝑓𝑖
16
(b) Si el número de datos n es par:
𝑁
− 𝑓𝑎𝑎
𝑥̃ = 𝐿𝑖𝑟 + ( 2 ) ∗ 𝑖𝑐
𝑓𝑖
Donde:
El procedimiento para calcular la media aritmética para una serie de clases y frecuencias
será el siguiente:
Analicemos el ejemplo de los precios de las acciones, al dólar más cercano, del promedio
industrial Dow Jones a enero de 2006:
17
Tabla 42. Serie de clases y frecuencias con límites reales y aparentes con su
respectiva frecuencia absoluta y acumulada ascendente.
[19.5, 30.5[ 20 - 30 7 7 1 a la 7
[30.5, 41.5[ 31 – 41 9 16 8 a la 16
9
[41.5, 52.5[ 42 – 52 3 19 17 a la 19
[52.5, 63.5[ 53 – 63 6
3 25 20 a la 25
[63.5, 74.5[ 64 – 74 2 27 26 a la 27
[74.5, 85.5] 75 – 85 6
3 30 28 a la 30
TOTAL 30
Fuente: Elaboración propia. 2
TOTAL
Calcular la mediana de los precios de las acciones. 3
Para la primera clase 7, la segunda clase 7+9=16, la tercera clase 16+3=19, la cuarta
clase 19+6=25, la quinta clase 25+2=27, la sexta clase 27+3=30.
𝑛 30 30
( )= ( )= = 15
2 2 2
𝑛 30
2 − 𝑓𝑎𝑎 −7
𝑥̃ = 𝐿𝑖𝑟 + ( ) ∗ 𝑖𝑐 = 30.5 + ( 2 ) ∗ (41.5 − 30.5) = 40.28
𝑓𝑖 9
18
Interpretación: la mediana revela que el 50% de las acciones del promedio de Dow
Jones tienen un precio menor de 40.28 dólares mientras que el otro 50% tiene un precio
mayor.
∆1
𝑥̂ = 𝐿𝑖𝑟 + (∆ ) ∗ 𝑖𝑐 ;
1 +∆2
donde:
Analicemos el ejemplo de los precios de las acciones, al dólar más cercano, del promedio
industrial Dow Jones a enero de 2006:
Tabla 43. Serie de clases y frecuencias con límites reales y aparentes con su
respectiva frecuencia absoluta.
[19.5, 30.5[ 20 – 30 7
[30.5, 41.5[ 31 – 41 9
[41.5, 52.5[ 42 – 52 9
3
[52.5, 63.5[ 53 – 63 6
[63.5, 74.5[ 64 – 74 3
2
[74.5, 85.5] 75 – 85 3
TOTAL 6
30
Fuente: Elaboración propia.
TOTAL 2
19
3
Calcular la moda de los precios de las acciones.
Para este caso por simple inspección se observa que 19 es el mayor valor de estas.
∆1 9−7
𝑥̂ = 𝐿𝑖𝑟 + ( ) ∗ 𝑖𝑐 = 30.5 + [ ] ∗ 11 = 33.25
∆1 + ∆2 (9 − 7) + (9 − 3)
Interpretación: La moda del precio de las acciones del promedio de Dow jones es de
33.25 dólares.
20
(b) Cuando una distribución es sesgada a la derecha; es decir, esta es asimétrica a la
derecha. En este caso la moda es menor que la mediana y esta, a su vez, es menor
que la media (𝑥̂ < 𝑥̃ < 𝑥̅ ). Observemos que la media aritmética es la mayor de las
tres medidas, ya que en ella influyen más sobre la mediana o la moda unos valores
extremadamente altos. Por cuanto, la medida más representativa sería la moda y la
mediana.
21
Figura 12. Asimetría a la izquierda (sesgo negativo).
Ahora apliquemos las la fórmula empírica de Pearson para calcular el salario modal de
los 65 empleados de una empresa donde su media aritmética es de $279.77 y su
mediana es de $279.00. Se requiere:
Como 277.64 < 279.06 < 279.77 entonces implica que la moda es menor que la
mediana y esta a su vez, es menor que la media. Por cuanto, se hace referencia a
una distribución sesgada a la derecha.
(b) ¿Cuál medida sería la más adecuada para representar el conjunto de datos?
22
Clase 6 | Otras medidas de
tendencia central
Los deciles son valores de la variable que dividen los datos ordenados en diez partes
iguales (nueve divisiones).
23
Paso 1 Ordenar los datos de menor a mayor.
1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20 y 20
14
8 (10) = 11.2 , este valor indica que el decil 8 se encuentra entre la posición 11 y la 12.
Entre el valor 9 y el 19 (que son los datos cuyas posiciones son 11 y 12 respectivamente)
hay exactamente 10 unidades, por cuanto, el decil 8 resulta ser más cercano a la
posición 11 que es 9, esto permite calcular su valor de la siguiente manera: 𝐷8 = 9 +
0.2(10) = 11
Ahora, analicemos las edades de los trabajadores de una micro empresa: 25, 28, 30,
30, 35, 35, 36, 37, 37, 38, 40, 40, 40, 40, 40, 40, 41, 43, 48, 50. Como la serie de
datos, ya está ordenada de menor a mayor, se procede a encontrar la posición del decil
cuatro, para luego identificar su valor correspondiente.
25, 28, 30, 30, 35, 35, 36, 37, 37, 38, 40, 40, 40, 40, 40, 40, 41, 43, 48, 50
20 80
4 (10) = 10 = 8 , Esto quiere decir, que el dato que se encuentra en la posición 8
𝐷4 = 37
24
6.1.2. Serie de datos y frecuencias
Para calcular el decil de una serie de datos y frecuencias analizaremos las edades de
sesenta estudiantes de tercer ciclo educación básica y de educación media, la que se
resume en la siguiente tabla de frecuencias:
Tabla 44. Serie de datos y frecuencias de las edades se sesenta estudiantes de tercer
ciclo de educación básica.
EDAD (AÑOS) FRECUENCIA FA↑ POSICIONES
13 3 3 1 a la 3
14 14 17 4 a la 17
15 23 40 18 a la 40
16 10 50 41 a la 50
17 5 55 51 a la 55
18 4 59 56 a la 59
19 1 60 60
TOTAL 60
Calcular el decil 6
60 360
6 (10) = 10
= 36 , esto quiere decir, que el dato se encuentra en la posición 36.
25
Identificar el valor x “años (edad)” asociado a la frecuencia 23, por tanto, el decil 6 𝐷6 =
15 𝑎ñ𝑜𝑠
𝐾𝑁
− 𝐹𝑎𝑎
𝐷𝑘 = 𝐿𝑖𝑟 + [ 10 ] ∗ 𝑖𝑐
𝑓𝑖
26
Calcular el decil 2.
𝐾𝑁 𝐾∑𝑓
Paso 1. Determinar la posición que ocupa el decil dos 10
= 10
2(60) 120
= = 12
10 10
𝐷2 ≅ 40.83 𝑎ñ𝑜𝑠
6.2 Cuartiles
Los cuartiles dividen el conjunto de las observaciones en cuatro partes iguales, son por
tanto tres puntos y se denotan como Q1 Q2 y Q3. Si una serie de datos se encuentra
ordenada de menor a mayor se denomina cuartiles a los valores que dividen la serie de
datos en cuatro partes iguales. De acuerdo, con la definición existen tres cuartiles:
27
El cuartil uno 𝑄1 es el que supera como máximo al 25% de los datos y es superado a su
vez por el 75% de dichos datos. El cuartil dos 𝑄2 supera como máximo al 50% y es
superado a su vez por el 50% de los datos. El cuartil tres 𝑄3 supera como máximo al
75% de los datos y es superado a su vez por el 25%. Recuerda que el cuartil dos 𝑄2 es
la misma mediana. (Cardiel, N., Gorgas, J., y Zamorano, J. 2011).
3, 4, 5, 7, 8, 10, 11.
𝑛+1 7+1 8
Posición de 𝑄1 = 4
= 4
=4=2
2(𝑛+1) 2(7+1) 16
Posición de 𝑄2 = 4
= 4
= 4
=4
28
3(𝑛+1) 3(7+1) 24
Posición de 𝑄3 = 4
= 4
= 4
=6
3, 4, 5, 7, 9, 10, 11, 14
𝑛+1 8+1 9
Posición de 𝑄1 = 4
= 4
= 4 = 2.25.
2(𝑛+1) 2(8+1) 18
Posición de 𝑄2 = 4
= 4
= 4
= 4.50
3(𝑛+1) 3(8+1) 27
Posición de 𝑄3 = 4
= 4
= 4
= 6.75
Como la posición del cuartil 1 es 2.25 se analizan los datos que ocupan las posiciones
2y3 cuyos datos son 4 y 5 respectivamente, lo que reflejan exactamente 1 unidad
de diferencia entre ellos, concluimos que la posición 2.25 se encuentra más cercana
a la posición 2 que es 4, esto permite calcular el valor de 𝑄1 = 4 + 0.25(1) = 4.25
Como la posición del cuartil 2 es 4.50, se analizan los datos que ocupan las posiciones
4 y 5 cuyos datos son 7 y 9 respectivamente, los que reflejan exactamente 2 unidades
de diferencia entre ellos, concluimos que la posición 4.50 se encuentra igual de
cercana a la posición 7 y 9, esto permite calcular el valor de 𝑄2 = 7 + 0.50(2) = 8
29
Como la posición del cuartil 3 es 6.75 se analizan los datos que ocupan las posiciones
6 y 7 cuyos datos son 10 y 11 respectivamente, lo que reflejan exactamente 1
unidad de diferencia entre ellos, concluimos que la posición 6.75 se encuentra más
cercana a la posición 7 que es 11, esto permite calcular el valor de 𝑄3 = 11 − 0.25(1) =
10.75 o bien de otra manera 𝑄3 = 10 + 0.75(1) = 10.75
Tabla 46. Serie de datos y frecuencias de las edades de sesenta estudiantes para
determinar cuartiles.
13 3 3 1 a la 3
14 14 17 4 a la 17
15 23 40 18 a la 40
16 10 50 41 a la 50
17 5 55 51 a la 55
18 4 59 56 a la 59
19 1 60 60
TOTAL 60
30
Calcular el cuartil 1.
𝑛 1(60) 60
𝐾( ) = = = 15
4 4 4
Identificar el valor x “años (edad)” asociado a la frecuencia 14, por tanto, el cuartil uno
es 𝑄1 = 14 𝑎ñ𝑜𝑠
1𝑁 2𝑁 3𝑁
− 𝐹𝑎𝑎 − 𝐹𝑎𝑎 − 𝐹𝑎𝑎
𝑄1 = 𝑙𝑖𝑟 + [ 4 ] ∗ 𝑖𝑐 𝑄2 = 𝑙𝑖𝑟 + [ 4 ] ∗ 𝑖𝑐 𝑄3 = 𝑙𝑖𝑟 + [ 4 ] ∗ 𝑖𝑐
𝑓𝑖 𝑓𝑖 𝑓𝑖
31
1(𝑛 + 1) 2(𝑛 + 1) 3(𝑛 + 1)
− 𝐹𝑎𝑎 − 𝐹𝑎𝑎 − 𝐹𝑎𝑎
𝑄1 = 𝑙𝑖𝑟 + [ 4 ] 𝑄2 = 𝑙𝑖𝑟 + [ 4 ] 𝑄1 = 𝑙𝑖𝑟 + [ 4 ]
𝑓𝑖 𝑓𝑖 𝑓𝑖
∗ 𝑖𝑐 ∗ 𝑖𝑐 ∗ 𝑖𝑐
Tabla 47. Serie de clases y frecuencias con sus respectivas frecuencia absoluta,
frecuencia acumulada e intervalo de posiciones.
EDAD (años) Frecuencia FA↑ Posiciones
[ 30 , 35 [ 3 3 1 al 3
Límites reales (f)
[ 35 , 40 [ 7 10 4 al 10
[ 40 , 45 [ 12 22 11 al 22
[ 45 , 50 [ 23 45 23 al 45
[ 50 , 55 [ 14 59 46 al 59
[ 55 , 60 ] 1 60 60
TOTAL 60
3(60)
= 45
4
32
Paso 3. Calcular el cuartil tres.
3(60)
− 22 45 − 22 23
𝑄3 = 45 + [ 4 ] ∗ 5 = 45 + [ ] ∗ 5 = 45 + [ ] ∗ 5 = 45 + 5
23 23 23
𝑄3 ≅ 50 𝑎ñ𝑜𝑠
6.3 Percentiles
Son los valores de la variable que dividen un conjunto de
datos clasificados en 100 subconjuntos iguales; cada conjunto
de datos tiene 99 percentiles. El k-ésimo percentil 𝑃𝑘 , es un
valor que a lo sumo k% de los datos son menores en valor
que 𝑃𝑘 y a lo sumo (100 - k)% de los datos son mayores
(Cardiel, N., Gorgas, J., y Zamorano, J. 2011)
Figura 15. Distribución de percentiles.
33
Analicemos la siguiente colección de datos 1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20 y 20.
Calcular el percentil 42 y percentil 87. Con relación a los percentiles pedidos, tendríamos
que ubicar las posiciones correspondientes como lo hicimos con los deciles y cuartiles.
Paso 1. Ordenar los datos de menor a mayor
1, 1, 1, 2, 3, 3, 4, 4, 5, 9, 9, 19, 20, 20
Paso 2. Determinar la posición que ocupa cada uno de los percentiles
Como la posición del percentil 42 es 5.88, se analizan los datos que ocupan las
posiciones 5 y 6 cuyos datos son 3 para ambos. Esto quiere decir que el percentil 42
se encuentra entre los datos que ocupan la posición 5 y la 6. Afortunadamente en
este caso ambos datos son 3 por lo que 𝑃42 es 3.
Como la posición del percentil 87 es 12.18 se analizan los datos que ocupan las
posiciones 12 y 13 cuyos datos son 19 y 20 respectivamente, lo que reflejan
exactamente 1 unidad de diferencia entre ellos, concluimos que la posición 12.18 se
encuentra más cercana a la posición 12 que es 19, esto permite calcular el valor de
𝑃87 = 19 + 0.18(1) = 19.18
34
Tabla 48. Serie de datos y frecuencias de las edades de sesenta estudiantes para
determinar percentiles.
13 3 3 1 a la 3
14 14 17 4 a la 17
15 23 40 18 a la 40
16 10 50 41 a la 50
17 5 55 51 a la 55
18 4 59 56 a la 59
19 1 60 60
TOTAL 60
Calcular el percentil 5
Paso 1. Calcular la posición del cuartil
5(60) 300
= =3
100 100
35
6.3.3 Serie de clases y frecuencias
Si los datos se agrupan en clases y frecuencias los cuartiles se obtienen a través de un
proceso un tanto laborioso. Para datos agrupados los percentiles se obtienen por medio
de la siguiente fórmula:
𝐾𝑁
− 𝐹𝑎𝑎
𝑃𝑘 = 𝑙𝑖𝑟 + [ 100 ] ∗ 𝑖𝑐
𝑓𝑖
Tabla 49. Serie de clases y frecuencias de las edades de sesenta estudiantes para
determinar percentiles.
Límites reales
[ 30 , 35 [ (f)
3 3 1 al 3
[ 35 , 40 [ 7 10 4 al 10
[ 40 , 45 [ 12 22 11 al 22
[ 45 , 50 [ 23 45 23 al 45
[ 50 , 55 [ 14 59 46 al 59
[ 55 , 60 ] 1 60 60
TOTAL 60
55(60)
= 33
100
36
Paso 3. Calcular el percentil 55
55(60)
− 22 33 − 22 11 55
𝑃55 = 45 + [ 100 ] ∗ 5 = 45 + [ ] ∗ 5 = 45 + [ ] ∗ 5 = 45 +
23 23 23 23
37
Clase 7 | Medidas de
dispersión para serie: simple /
datos y frecuencias
7. Medidas de dispersión
En las últimas dos temáticas, se estudiaron las medidas de tendencia central cuyo
análisis dirige su interés al comportamiento de los datos con relación a un valor central
pero este análisis se olvida de la forma en la que los datos varían o se dispersan.
Por cuanto, esto se resume en que una medida de dispersión pequeña indica que los
datos se acumulan con proximidad alrededor de la media aritmética, por consiguiente,
la media aritmética en este caso se considera representativa. Por el contrario, una
medida grande de dispersión, indica que la media no es confiable debido a ese
alejamiento que existe entre los valores de distribución con la media aritmética. Dentro
de las medidas de dispersión se encuentran: el rango, la desviación media, la desviación
estándar y la varianza entre otros.
38
7.1 Serie simple
7.1.1 Rango
Se considera la medida de dispersión más simple. Se define
como la variación o diferencia entre el dato mayor y el dato
menor de un conjunto de datos u observaciones. Para
calcular el rango se emplea la siguiente fórmula: 𝑅 =
𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟𝑚𝑒𝑛𝑜𝑟
39
Para una muestra Para una población
Donde: Donde:
Paso 3. Restar la media aritmética a cada uno de los valores X, recordemos que
utilizaremos el valor absoluto, ya que lo que nos interesa es la diferencia no el signo.
𝑿 ̅|
|𝑿 − 𝑿
5 |5 − 20| = 15
10 |10 − 20| = 10
15 |15 − 20| = 5
20 |20 − 20| = 0
25 |25 − 20| = 5
30 |30 − 20| = 10
35 |35 − 20| = 15
∑ 𝑋 = 140 ∑|𝑋 − 𝑋̅| = 60
Fuente: Elaboración propia.
40
La media aritmética se calcula de la siguiente manera:
Paso 2. Dividiremos la suma de los valores x con el número de datos para encontrar la
media aritmética.
∑ 𝑋 140
𝑋̅ = = = 20
𝑁 7
Paso 4. Dividir la sumatoria de los valores |𝑋 − 𝑋̅| con el número de datos con la finalidad
de encontrar la desviación media
∑|𝑋 − 𝑋̅| 60
𝐷𝑥̅ = = = 8.57
𝑁 7
Esta medida de dispersión cada vez se utiliza menos, pero aún puede ayudar a
comprender el significado de las siguientes medidas de dispersión: la varianza y la
desviación estándar. Las descripciones más completas de la dispersión son aquellas que
manejan la desviación promedio respecto a alguna medida de tendencia central. Dos de
estas medidas son importantes para nuestro estudio de la estadística: la varianza y la
desviación estándar.
41
7.1.3 Varianza
Se define varianza como la media aritmética del cuadrado
de las desviaciones respecto a la media de una distribución
estadística. La varianza nos da una distancia promedio de
cualquier observación del conjunto de datos respecto a la
media de la distribución. Cada población tiene una varianza,
su símbolo es 𝜎 2 (sigma cuadrada).
∑(𝑋 − 𝜇)2
𝜎2 =
𝑁
Donde:
X: Elemento u observación
𝜇: Media de la población
∑(𝑋 − 𝑋̅)2
𝑆2 =
𝑛−1
Donde:
X: Elemento u observación
42
n: Número total de elementos de la muestra.
Tabla 51. Costos de producción de diez productos que elabora la fábrica “EL
ARTESANAL”.
PRODUCTO COSTO
Bombón $20.00
Caramelo $33.00
Caramelo suave $41.00
Chocolate $63.00
Cocada $38.00
Mentas $27.00
Nuez garapiñada $56.00
Oblea $19.00
Paleta $16.00
Tamarindo $52.00
TOTAL $365.00
Fuente: Elaboración propia.
∑ 𝑋𝑖 365
𝑋̅ = = = 36.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛 10
43
Paso 4. Elevar al cuadro la resta de la media aritmética con cada uno de los costos (𝑋𝑖 )
Paso 5. Dividir los valores de (𝑋𝑖 − 𝑋̅)2 entre el número de datos restado de 1 para
encontrar la varianza muestral de los datos:
44
desviación estándar está en las mismas unidades que las que se usaron para medir los
datos.
∑(𝑋 − 𝜇)2
𝜎 = √𝜎 2 = √
𝑁
Donde:
X: Elemento u observación
𝜇: Media de la población
∑(𝑋 − 𝑋̅)2
𝑠 = √𝑠 2 = √
𝑛−1
Donde:
X: Elemento u observación
45
Tabla 53. Serie simple para calcular la desviación estándar.
PRODUCTO 𝐂𝐎𝐒𝐓𝐎 (𝐗 𝐢 ) ̅|
|𝑿𝒊 − 𝑿 ̅ )𝟐
(𝑿𝒊 − 𝑿
Bombón $20.00
( )𝐄𝐬𝐜𝐫𝐢𝐛𝐚 𝐚𝐪𝐮í16.5
𝐥𝐚 𝐞𝐜𝐮𝐚𝐜𝐢ó𝐧. 272.25
Caramelo $33.00 3.5 12.25
Caramelo suave $41.00 4.5 20.25
Chocolate $63.00 26.5 702.25
Cocada $38.00 1.5 2.25
Mentas $27.00 9.5 90.25
Nuez garapiñada $56.00 19.5 380.25
Oblea $19.00 17.5 306.25
Paleta $16.00 20.5 420.25
Tamarindo $52.00 15.5 240.25
TOTAL $365.00 2,246.50
∑ 𝑋𝑖 365
𝑋̅ = = = 36.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛 10
2
∑(𝑋 − 𝑋̅)2 2,246.50 2,246.50
𝑆 = = = = 249.61 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
𝑛−1 10 − 1 9
46
Además, la desviación estándar no puede ser la única base para la comparación de dos
distribuciones. Si tenemos una desviación estándar de 10 y una media de 5, los valores
varían en una cantidad que es el doble de la media. Si, por otro lado, tenemos una
desviación estándar de 10 y una media de 5,000, la variación relativa a la media es
insignificante. En consecuencia, no podemos conocer la dispersión de un conjunto de
datos hasta que conocemos su desviación estándar, su media y cómo se compara la
desviación estándar con la media.
Lo que necesitamos es una medida relativa que nos proporcione una estimación de la
magnitud de la desviación respecto a la magnitud de la media. El coeficiente de
variación es una de estas medidas relativas de dispersión. Relaciona la desviación
estándar y la media, expresando la desviación estándar como porcentaje de la media.
La unidad de medida, entonces, es “porcentaje”, en lugar de las unidades de los datos
originales. Para una población, la fórmula para el coeficiente de variación es:
47
Tabla 54. Representatividad de la media según el valor del coeficiente de variación.
PRODUCTO 𝐂𝐎𝐒𝐓𝐎 (𝐗 𝐢 ) ̅|
|𝑿𝒊 − 𝑿 ̅ )𝟐
(𝑿𝒊 − 𝑿
Bombón $20.00
( )𝐄𝐬𝐜𝐫𝐢𝐛𝐚 𝐚𝐪𝐮í16.5
𝐥𝐚 𝐞𝐜𝐮𝐚𝐜𝐢ó𝐧. 272.25
Caramelo $33.00 3.5 12.25
Caramelo suave $41.00 4.5 20.25
Chocolate $63.00 26.5 702.25
Cocada $38.00 1.5 2.25
Mentas $27.00 9.5 90.25
Nuez garapiñada $56.00 9.5 380.25
Oblea $19.00 17.5 306.25
Paleta $16.00 20.5 420.25
Tamarindo $52.00 15.5 240.25
TOTAL $365.00 2,246.5
Fuente: Elaboración propia. 0
∑ 𝑋𝑖 365
𝑋̅ = = = 36.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
𝑛 10
48
Esta información nos permite calcular el coeficiente de variación mediante la fórmula:
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
15.80
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 43.28%
36.5
∑ 𝑓(𝑋𝑖 − 𝑋̅)2
𝑆2 =
𝑛−1
∑ 𝑓(𝑋𝑖 − 𝜇)2
𝜎2 =
𝑁
Tabla 57. Serie de datos y frecuencias sobre las calificaciones de un estudiante en las
asignaturas cursadas en educación media para encontrar la desviación
media.
50
∑ 𝑓𝑖 𝑋𝑖 ∑ 𝑓𝑖 𝑋𝑖 90
𝜇= = = = 7.5 𝑑ó𝑙𝑎𝑟𝑒𝑠
∑ 𝑓𝑖 𝑁 12
Paso 4. Restar la media poblacional a cada uno de los valores de 𝑋𝑖
Paso 5. Multiplicar los valores de |𝑿𝒊 − 𝝁| por su respectiva frecuencia de ocurrencia
Paso 6. Sumar todos los valores de 𝒇|𝑿𝒊 − 𝝁|
Paso 7. Dividir la sumatoria de 𝒇|𝑿𝒊 − 𝝁| entre la sumatoria de las frecuencias absolutas
∑ 𝑓|𝑋𝑖 − 𝜇| ∑ 𝑓|𝑋𝑖 − 𝜇| 14
𝐷𝑥̅ = = = = 1.17 𝑑ó𝑙𝑎𝑟𝑒𝑠
∑ 𝑓𝑖 𝑁 12
∑ 𝑓𝑖 (𝑋𝑖 − 𝑋̅)2
𝑆 = √𝑆 2 =
𝑛−1
51
Tabla 58. Serie de datos y frecuencias sobre las calificaciones de un estudiante en las
asignaturas cursadas en educación media para encontrar la varianza
muestral.
2
∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 ∑ 𝑓𝑖 (𝑋𝑖 − 𝜇)2 21
𝜎 = = = = 1.75 𝑑ó𝑙𝑎𝑟𝑒𝑠 2
∑ 𝑓𝑖 𝑁 12
52
7.2.3 Coeficiente de variación
Para calcular el coeficiente de variación únicamente tenernos que aplicar su fórmula
respectiva para una serie de datos y frecuencias donde los datos son poblacionales.
𝜎
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝜇
1.32
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 17.60%
7.5
53
Clase 8 | Medidas de
dispersión para serie de clases
y frecuencias
8. Medidas de dispersión
8.1 Serie de clases y frecuencias
8.1.1 Varianza
Para calcular la varianza para una serie de clases y frecuencias utilice la siguiente
fórmula:
(1) Si los datos hacen referencia a una muestra:
∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2
𝑆2 =
∑𝑓 −1
(2) Si los datos hacen referencia a una población:
∑ 𝑓(𝑃𝑀𝑖 − 𝜇)2
𝜎2 =
∑𝑓
Analizaremos un primer ejemplo relacionado con una serie de datos de clases y
frecuencias relacionadas con el número de cheques cobrados diariamente en las 50
sucursales de un banco durante el último trimestre el que se sintetiza en la siguiente
tabla de frecuencias:
Paso 4. Reste la media aritmética de cada punto medio para obtener los valores de
|𝑃𝑀𝑖 − 𝑋̅|
Tabla 61. Serie de clases y frecuencias para encontrar valores de |𝑃𝑀𝑖 − 𝑋̅|.
CANTIDAD DE CHEQUES 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿
[ 0, 200[ 8 100 800 800 388
[200, 400[ 10 300 3,000 3,000 188
[400, 600[ 16 500 8,000 8,000 12
[600, 800[ 9 700 6,300 6,300 212
[800,1000] 7 900 6,300 6,300 412
TOTAL 50 24,400 24,400
Tabla 62. Serie de clases y frecuencias para calcular los valores de (𝑃𝑀𝑖 − 𝑋̅)2 .
CANTIDAD DE CHEQUES 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿
[ 0, 200[ 8 100 800 388 150,044
[200, 400[ 10 300 3,000 188 35,344
[400, 600[ 16 500 8,000 12 144
[600, 800[ 9 700 6,300 212 44,944
[800,1000] 7 900 6,300 412 169,744
TOTAL 50 24,400
Fuente: Elaboración propia.
Tabla 63. Serie de clases y frecuencias para calcular los valores de (𝑃𝑀𝑖 − 𝑋̅)2 .
CANTIDAD DE
𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
𝒇(𝑷𝑴𝒊 − 𝑿
CHEQUES
[ 0, 200[ 8 100 800 388 150,044 1,204,352
[200, 400[ 10 300 3,000 188 35,344 353,440
[400, 600[ 16 500 8,000 12 144 2,304
[600, 800[ 9 700 6,300 212 44,944 404,496
[800,1000] 7 900 6,300 412 169,744 1,188,208
TOTAL 50 24,400 3,152,800
Fuente: Elaboración propia.
56
8.1.2 Desviación estándar
Para calcular la estándar para una serie de clases y frecuencias utilice la siguiente
fórmula:
∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2
𝑆 = √𝑆 2 = √
∑𝑓 −1
∑ 𝑓(𝑃𝑀𝑖 − 𝜇)2
𝜎 = √𝜎 2 = √
∑𝑓
Tabla 64. Serie de clases y frecuencias para calcular la desviación estándar muestral.
CANTIDAD DE
𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
𝒇(𝑷𝑴𝒊 − 𝑿
CHEQUES
[ 0, 200[ 8 100 800 388 150,044 1,204,352
[200, 400[ 10 300 3,000 188 35,344 353,440
[400, 600[ 16 500 8,000 12 144 2,304
[600, 800[ 9 700 6,300 212 44,944 404,496
[800,1000] 7 900 6,300 412 169,744 1,188,208
TOTAL 50 24,400 3,152,800
Fuente: Elaboración propia.
Calcular la desviación estándar muestral del cobro de cheques en las últimas sucursales
del banco durante el último semestre.
57
Para encontrar la desviación estándar muestral encontramos la media aritmética
muestral y luego la varianza muestral, esto implica que le agregaremos un paso después
de encontrar la varianza muestral en el paso 6.
58
Tabla 66. Serie de clases y frecuencias para calcular la media aritmética.
COTININA 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊
[ 00 , 099[ 11 49.5 544.5
[100, 199[ 12 149.5 1,794.0
[200, 299[ 14 249.5 3,493.0
[300, 399[ 1 349.5 349.5
[400,499] 2 449.5 899.0
TOTAL 40 7,080.0
Fuente: Elaboración propia.
Paso 4. Reste la media aritmética de cada punto medio para obtener los valores de
(𝑃𝑀𝑖 − 𝑋̅)
Tabla 67. Serie de clases y frecuencias para calcular los valores de |𝑃𝑀𝑖 − 𝑋̅|.
COTININA 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿
[ 00 , 099[ 11 49.5 544.5 127.5
[100, 199[ 12 149.5 1,794.0 27.5
[200, 299[ 14 249.5 3,493.0 72.5
[300, 399[ 1 349.5 349.5 172.5
[400,499] 2 449.5 899.0 272.5
TOTAL 40 7,080.0
Fuente: Elaboración propia.
Paso 5. Eleve al cuadrado cada valor que se obtuvo en el paso anterior para lograr
valores de (𝑃𝑀𝑖 − 𝑋̅)2
Tabla 68. Serie de clase y frecuencias para calcular valores (𝑃𝑀𝑖 − 𝑋̅)2 .
COTININA 𝒇 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿
[ 00 , 099[ 11 49.5 544.5 127.5 16,256.25
[100, 199[ 12 149.5 1,794.0 27.5 756.25
[200, 299[ 14 249.5 3,493.0 72.5 5,256.25
[300, 399[ 1 349.5 349.5 172.5 29,756.25
[400,499] 2 449.5 899.0 272.5 74,256.25
TOTAL 40 7,080.0
Fuente: Elaboración propia.
Paso 6. Multiplique la frecuencia por el respectivo valor 𝑓(𝑃𝑀𝑖 − 𝑋̅)2
59
Tabla 69. Serie de clase y frecuencias para calcular valores 𝑓(𝑃𝑀𝑖 − 𝑋̅)2 .
COTININA 𝒇𝒊 𝑷𝑴𝒊 𝒇𝒊 . 𝑷𝑴𝒊 ̅|
|𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
(𝑷𝑴𝒊 − 𝑿 ̅ )𝟐
𝒇(𝑷𝑴𝒊 − 𝑿
[ 00 , 099[ 11 49.5 544.5 127.5 16,256.25 178,818.75
[100, 199[ 12 149.5 1,794.0 27.5 756.25 9,075.00
[200, 299[ 14 249.5 3,493.0 72.5 5,256.25 73,587.50
[300, 399[ 1 349.5 349.5 172.5 29,756.25 29,756.25
[400,499] 2 449.5 899.0 272.5 74,256.25 148,512.50
TOTAL 40 7,080.0 439,750.00
Fuente: Elaboración propia.
Paso 7. Divida los valores 𝑓(𝑃𝑀𝑖 − 𝑋̅)2 entre la diferencia de la sumatoria de las
frecuencias menos uno para encontrar la varianza muestral:
∑ 𝑓(𝑃𝑀𝑖 − 𝑥̅ )2 439,750 439,750
𝑆2 = = = = 11,275.64103 𝑛𝑖𝑣𝑒𝑙𝑒𝑠 2
∑𝑓 − 1 40 − 1 39
Media 𝐗
̅ Desviación estándar (s)
Cheques cobrados 488 cheques 253.66 𝑐ℎ𝑒𝑞𝑢𝑒𝑠
Niveles de cotinina 177 niveles 106.19 𝑛𝑖𝑣𝑒𝑙𝑒𝑠
Fuente: Elaboración propia.
60
Calcule el coeficiente de variación de cheques cobrados diariamente en las cincuenta
sucursales de un banco durante el último trimestre, después el coeficiente de variación
de los niveles de cotinina de los cuarenta fumadores; finalmente, compare los dos
resultados.
Cheques cobrados:
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
253.66
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 51.98%
488
Niveles de cotinina:
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
106.19
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 59.99%
177
Magnitud Media 𝑿
̅ Desviación estándar (s)
Estatura 68.34 pulgadas 3.02 pulgadas
Peso 172.55 libras 26.33 libras
Fuente: Elaboración propia.
61
Debido a que tenemos estadísticos muestrales, los dos coeficientes de variación se
obtienen de la siguiente manera:
Estaturas
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
3.02 𝑝𝑢𝑙𝑔
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 4.42%
68.34 𝑝𝑢𝑙𝑔
Pesos
𝑆
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100%
𝑋̅
26.33 𝑙𝑏
𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 = ∗ 100% = 15.26%
172.55 𝑙𝑏
Se observa que las estaturas con coeficiente de variación de 4.42%, tienen una variación
considerablemente menor que los pesos con coeficiente de variación de 15.26%. Lo
anterior tiene sentido, ya que, por lo general, vemos que los pesos de los hombres
varían mucho más que sus estaturas. Por ejemplo, es muy raro encontrar un adulto que
mida el doble que otro, pero es mucho más común ver a uno que pese el doble que otro.
62
Referencias citadas en la UNIDAD 2
63
Glosario de los términos citados en la
UNIDAD 2
Medida de Las medidas de posición son aquellas que dividen un conjunto de
posición datos en grupos con el mismo número de individuos. Su requisito
para calcular estas medidas es que los datos estén ordenados de
menor a mayor.
Media Se define en serie simple como la suma de todos los datos dividida
aritmética entre el número total de datos. Se calculan dependiendo de cómo
vengan ordenados los datos.
Mediana Se define en serie simple como el valor que ocupa el lugar central
entre todos los valores del conjunto de datos, cuando estos están
ordenados en forma creciente o decreciente.
Moda Se define en serie simple como el dato que más veces se repite
en un conjunto de datos, es decir, aquel que tiene mayor
frecuencia absoluta.
64
Cuartiles Es una medida de posición que consiste en dividir en cuatro
partes iguales un listado de de datos ordenados de menor
a mayor donde cada una de estas partes será un cuartil.
65