Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA
Unidad 4
UNIDAD 4. MEDIDAS DE TENDENCIA CENTRAL Y DE
DISPERSIÓN
1
La Universidad Digital del Estado de México te da la más cordial bienvenida a la Unidad 4
de la asignatura Estadística, correspondiente al cuarto cuatrimestre del Bachillerato
General a Distancia por Competencias. En esta Unidad 4, vamos a estudiar las medidas de
tendencia central, de dispersión y de forma, mediante procedimientos matemáticamente
establecidos para resolver problemas en condiciones de la vida real o hipotéticos que
proporcionen información adicional para establecer la confiabilidad de las medidas
obtenidas, así como realizar comparaciones entre diferentes muestras o poblaciones.
¡Adelante!
COMPETENCIAS ESPECÍFICAS
En las Unidades anteriores se explicaron dos de las tres tareas más importantes de
la estadística descriptiva: la elaboración de tablas de distribución de frecuencias y
3
el trazado de gráficas. Las representaciones gráficas de los datos que resultan de
la distribución de frecuencias, permitieron discernir el patrón de comportamiento y
la tendencia de los mismos. Sin embargo, para abreviar y representar la
información, se utilizan números, a los que se les denomina medidas descriptivas,
las cuales permiten representar cualquier característica que se pretenda medir en
una muestra o población y sintetizar la información proporcionada, a tal punto que
ellos mismos bastan para desarrollar análisis precisos o tomar decisiones (Góngora
& Hernández, 2003).
Ilustración 3. Fuente UDEMEX (2021) con información de Góngora & González (2003)
Una de las medidas de tendencia central más común y útil es la media común o
“media aritmética”, pero también son de importancia, según las circunstancias y el
tipo de variables la “moda” y la “mediana”. Otras medidas de tendencia
central menos usadas son la “media geométrica” y la “media
armónica” (Dicovskiy, 2016).
1𝑛 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + … 𝑥𝑛
Siendo x un valor de medición de la variable en estudio e “i” un índice que varía de
“1 a n“. Recuerda que el número de datos de la muestra se identifica con la letra “n”
(Dicovskiy, 2016).
Ilustración 4. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2015)
Ejemplo:
14 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4
A continuación, se describirán las medidas de tendencia central.
Ilustración 5. Fuente UDEMEX (2021) con información de Góngora & González (2003)
La media para datos no agrupados se define como la suma de todos los datos
dividida entre el número de datos, esto es:
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟐 + 𝒙𝟒 + … 𝒙𝐧
̅=
𝒙
𝒏
𝒙𝟏 + 𝒙𝟐 + 𝒙𝟐 + 𝒙𝟒 + 𝒙𝟓 10 + 9 + 8 + 7 + 6 40
̅=
𝒙 = = =8
𝒏 𝟒 5
∑𝒏𝒊=𝟏 𝒇𝒊 𝑴𝐢
̅=
𝒙
𝒏
donde: 7
𝑥̅ 𝑒𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎
k es el número de intervalos
𝑓𝑖 es la frecuencia de i-ésimo intervalo
𝑀𝑖 𝑒𝑠 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒𝑙 𝑖 − é𝑠𝑖𝑚𝑜 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
n es el número de datos
Ejemplo:
En una competencia de velocidad en 100 metros planos participaron 160
corredores. Los tiempos en segundos logrados por cada son los que se muestran
en la siguiente tabla de distribución de frecuencias. Calcula la media.
Tabla 1.
Ilustración 6. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2015)
Ilustración 7. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2015)
Tabla 3.
iniciales y final del subíndice i que deben ir abajo y arriba del símbolo
respectivamente, esta forma de escribir la suma también es correcta,
se asume que el valor inicial es el uno y el valor final corresponde al
número de intervalos.
La media geométrica, G de N números positivos x1, x2, x3,…, xN, es la raíz n-ésima
del producto de los números (Spiegel & Stephens, 2020 ):
𝐺 = 𝑁√𝑥1 𝑥2 𝑥3 … 𝑥𝑁
Ejemplo
Por su parte, la media armónica, H, de un conjunto de números x1, x2, x3,…, xN, es
el recíproco de la media aritmética de los recíprocos de los números (Spiegel &
Stephens, 2020 ):
1 𝑁
𝐻= =
1 𝑁 1 1
∑ ∑
𝑁 𝑗=1 𝑥𝑗 𝑥
Los elementos del conjunto deben ser necesariamente no nulos. Esta media es
poco sensible a los valores grandes y los infravalora respecto a la media aritmética,
1
pero muy sensible a los valores próximos a cero, ya que los recíprocos son muy
𝑥𝑗 10
altos, por lo que les da más peso que en las medias aritmética y geométrica. Si
algún valor fuese cero, la media armónica quedaría indeterminada
(UniversoFórmulas, 2021).
Ejemplo:
Ejercicio.
a) 4 13 12 17 7 4 8 7 17 19 13 14 25 8 23
4 4 7 7 8 8 12 13 14 14 17 17 19 23 25
En este caso como el número es par (22), se ordenan los números de menor
a mayor y el valor de la mediana es el promedio entre los dos datos del
centro, esto es:
3 12 26 28 30 35 37 42 43 50 50 60 63 75 78 85 103 128
50+60
Por lo que la mediana es 𝑥̃ = = 55
2
12
Donde:
n es el número de datos
Ilustración 11. Fuente UDEMEX (2021) con información de Levin & Levin (2004)
13
Ilustración 12. Fuente UDEMEX (2021) con información de Levin & Levin (2004)
Tabla 6.
Ilustración 13. Fuente UDEMEX (2021) con información de Levin & Levin (2004)
c) Se obtienen los valores que se encuentran en la ecuación de
la mediana:
𝑛
− 𝐹𝑎
𝑥̃ = 𝐿 + (2 )𝑐
𝑓𝑥̃
14
L = 51 (es el límite inferior del intervalo que contiene la mediana)
160
− 64
𝑥̃ = 51 + ( 2 ) 10 = 56.16
31
4.1.3 Moda
Ilustración 14. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2016)
Cuando el conjunto de datos no está agrupado, se busca el dato que aparece con
mayor frecuencia, es decir, más veces y su valor corresponde a la moda (Contreras
& colaboradores, 2016).
Ejemplos:
Los siguientes casos se muestra cómo se obtiene el valor de la moda para tres
conjuntos de datos no agrupados.
a) 4 3 7 2 5 6 3 2 5 7 3 6 4 3
El número que más se repite es el tres, por lo cual la moda es tres
b) 10 15 13 14 10 8 13 10 21 13 7 6 1 0 3
𝑓𝑖 − 𝑓𝑖−1
𝑥̂ = 𝐿 + ( ).𝑐
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
Donde: 16
Tabla 7.
17
b) Se calcula el límite real inferior del intervalo que contiene a la moda, esto es:
18.5
c) Se obtienen los valores de la ecuación de la moda:
𝑓𝑖 − 𝑓𝑖−1
𝑥̂ = 𝐿 + ( ).𝑐
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )
fi es la frecuencia absoluta del intervalo modal, en este caso, su valor es vale 11.
11 − 5 6
𝑥̂ = 18.5 + ( ) . 9 = 18.5 + ( ) . 9 = 18.5 + 6 = 24.5
(11 − 5) + (11 − 8) 6+3
Ilustración 18. Fuente UDEMEX (2021) con información de Góngora & Hernández (2003).
Ilustración 19. Fuente UDEMEX (2021) con información de Góngora & Hernández (2003).
Los pasos a seguir para calcular la varianza para datos no agrupados son:
• Calcular la media de los datos
• Por cada número restar la media y elevar el resultado al cuadrado (la
diferencia elevada al cuadrado)
• Calcular la media de esas diferencias al cuadrado
Ejemplo
a) Se calcula la media:
La altura media es 394 mm. En la siguiente gráfica se muestra cada altura del perro
con la marca roja y el valor de la media con la línea verde.
21
La siguiente ilustración muestra que los Rottweilers son perros grandes y los
Dachsunds son pequeños y que se encuentran fuera de las líneas que marcan el
valor de la desviación estándar.
(𝑥𝑖 − 𝑥̅ )2
𝜎2 = ∑
𝑛
Donde:
𝑥𝑖 es el valor del i-ésmo dato
𝑥̅ es la media del conjunto de datos
n es el número total de datos
23
Ejercicio:
11, 13, 13, 13, 13, 13, 14, 14, 15, 15, 17
2
(𝑥𝑖 − 𝑥̅ )2
𝜎 =∑
𝑛
𝑥̅ = 13.727
(Recuerda que para obtener la media se suman todos los datos y se dividen
entre el número total de estos)
24
2
∑ 𝑓𝑖 (𝑀𝑖 − 𝑥̅ )2
𝜎 =
𝑛
25
Donde:
𝑓𝑖 es el valor de la frecuencia del i-ésimo intervalo
𝑀𝑖 es el valor de la marca de clase del i-ésimo intervalo
𝑥̅ es la media del conjunto de datos
n es el número total de datos
Ejercicio
Tabla 10.
Tabla 11.
Ejercicio:
Calcula el valor de la desviación media para el siguiente conjunto de datos:
4 14 12 8 12 6 16 8
Tabla 12.
28
Ilustración 28. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2016).
̅
𝑓𝑖 |𝑀𝑖 − 𝑥|
𝐷𝑀 = ∑
𝑛
donde:
fi= es el valor de la frecuencia del i-ésimo intervalo
Mi= es el valor de la marca de clase del i-ésimo intervalo
𝑥̅ = es la media del conjunto de datos
n= es el número total de datos
Ejemplo
En una muestra formada por 100 jugadores de futbol de la liga Olmeca en Tuxtla
Gutiérrez, Chiapas, sus edades fluctuaron entre 18 y 38 años, de esta manera:
Para calcular su desviación media se construye paso a paso la tabla
13.
a) Se calcula la media aritmética (3ra. columna): (5(19) + 25(22) + 33(25) +
17(28) + 8(31) + 4(34) + 8(37)) / 100 = 26.26
b) Se calcula la diferencia de cada marca de clase con respecto a la media
aritmética (4ta. columna).
29
c) Se multiplica cada diferencia por la frecuencia respectiva y se suman los
resultados (5ta. columna).
d) La desviación media (D.M.) se obtiene al dividir la suma obtenida entre el
número de datos (última columna).
Tabla 13.
En este caso, se invita al estudiante a verificar si las fórmulas aplicadas son correctas
para calcular la desviación media para datos agrupados.
Son medidas que indican la posición que ocupa cierto elemento dentro de una
lista o de una tabla de frecuencias.
Para obtener las medidas de posición, se divide al conjunto de
datos en varias partes iguales y de acuerdo con el tipo de división que se realiza,
reciben un nombre específico: presentándose tres casos que constituyen una
generalización del concepto de mediana.
30
Así como la mediana divide al conjunto de datos en dos partes con el mismo
número de elementos cada una, estas nuevas divisiones se pueden hacer en 4,
10 o en 100 partes iguales, con lo cual se establece el concepto de cuantil. Estos
tres tipos de cuantiles reciben el nombre de cuartiles, deciles y percentiles
(Contreras & colaboradores, 2016).
4.3.1 Cuartiles
El primer cuartil considera 25% del conjunto de datos; el segundo cuartil, 50% y el
tercer cuartil, 75% del conjunto de datos. El segundo cuartil corresponde con el valor
de la mediana.
𝑖. (𝑛 + 1)
𝑄𝑖 =
4
Cuando al aplicar la fórmula, resulta un número entero, entonces el valor del cuartil
deseado corresponde al valor del dato que se encuentra en la posición obtenida.
Si al aplicar la fórmula, no resulta un número entero, entonces el valor
del cuartil deseado corresponde al valor del dato que se encuentra en
la posición entera obtenida más la parte proporcional de ese valor entero con el
siguiente. Esa proporción se obtiene al multiplicar la parte decimal obtenida por la
diferencia entre el valor del dato que ocupa la parte entera y el siguiente.
31
Ejemplos:
i.2) Se calcula la posición del dato que corresponde el cuartil 3 con la fórmula:
𝑖.(𝑛+1) 3(15+1) 48
𝑄𝑖 = = = = 12
4 4 4
Se obtuvo un número entero, por lo que en el conjunto de datos anterior, la posición
12 da el valor del cuartil 3, el cual es 17.
32
4.3.2 Deciles
El primer decil considera el 10% del conjunto de datos; el segundo, 20%; el tercero,
30% y así sucesivamente hasta que el noveno que considera 90% del conjunto de
datos. El quinto corresponde al valor de la mediana (Contreras & colaboradores,
2016).
Ejemplo:
120, 160, 150, 110, 170, 130, 125, 140, 125, 145
Calcula el decil 2.
4.3.3 Percentiles
Ejemplo:
Los padres lo comentan con las abuelas cuando les llaman para preguntar por el
niño y les dejan claro que la cosa va bien porque el niño tiene un percentil por
encima de la media. Están tan contentos que incluso hablan con sus hermanos y
les preguntan qué percentil tenían sus hijos a la edad del suyo. Sin querer, durante
la semana, el percentil se convierte en el tema de conversación con amigos y otros
padres y madres. Llegan por tanto a la conclusión de que están haciendo la cosa
bien porque tienen un hijo con un percentil por encima de la media. ¡Felicidades!
Pero, ¿alguien se ha preguntado alguna vez qué es eso del percentil? Y todavía
mejor, ¿para qué sirve? La cosa es sencilla, pero solo para los matemáticos, en mi
caso lo he tenido que preguntar varias veces y me ha sorprendido descubrir que es
un término que todos los padres y madres tenemos en cuenta, pero pocos sabemos
qué es realmente.
Un percentil es una medida estadística para comparar resultados, nos permite saber
cómo está situado un valor en función de una muestra. Si hablamos de bebés, nos
permitiría comparar los datos de nuestro bebé con otros de sus mismas
características. Estas características son la edad y el sexo.
Si el pediatra dice que nuestro bebé de 6kg está en el percentil 25, quiere decir que
hay un 25% de los bebés estudiados que están en el mismo peso o menos y un
75% que están por encima.
35
36
Ahora que has concluido con los temas de la unidad 4, es momento de que
pongas a prueba el aprendizaje obtenido. Para ello, deberás contestar tu
evaluación final. Esta evaluación comprende los temas estudiados en las 4
unidades temáticas. Te recomendamos dar un repaso general para que
obtengas buenos resultados. ¡Mucha suerte!
TABLA DE EVALUACIÓN
37
REFERENCIAS BIBLIOGRÁFICAS
Contreras, G.L., Laredo, S. J., Rojas, G.J., Salazar, J.N., Gómez Tagle, F.C. (2015)
UAEMex. Estadística. México: Librería Universitaria.
Pagano, R. R. (2006). Estadística para las ciencias del comportamiento. México: Thomson.
CIBERGRAFÍA
UniversoFórmulas (2021). Media armónica. Obtenido de
https://www.universoformulas.com/estadistica/descriptiva/media-armonica/
http://herzog.economia.unam.mx/profesores/blopez/estadistica-
descriptiva.pdf