Está en la página 1de 39

Bachillerato General a

Distancia por Competencias

ESTADÍSTICA

Unidad 4
UNIDAD 4. MEDIDAS DE TENDENCIA CENTRAL Y DE
DISPERSIÓN

1
La Universidad Digital del Estado de México te da la más cordial bienvenida a la Unidad 4
de la asignatura Estadística, correspondiente al cuarto cuatrimestre del Bachillerato
General a Distancia por Competencias. En esta Unidad 4, vamos a estudiar las medidas de
tendencia central, de dispersión y de forma, mediante procedimientos matemáticamente
establecidos para resolver problemas en condiciones de la vida real o hipotéticos que
proporcionen información adicional para establecer la confiabilidad de las medidas
obtenidas, así como realizar comparaciones entre diferentes muestras o poblaciones.

Recuerda que la constancia es un elemento fundamental para tu formación académica, y


lo que aprendas en esta unidad te permitirá responder a las necesidades de tu área
personal o profesional.

Es importante mencionar que contarás con el apoyo de un(a) asesor(a), quién te


acompañará durante tu proceso de formación. En la Universidad Digital del Estado de
México, estamos convencidos de que formaremos un gran equipo a lo largo de tu desarrollo.
Te deseamos mucho éxito.

¡Adelante!

Te invitamos a participar en el foro de bienvenida, este espacio servirá para


que intercambies ideas con tus compañeros que, al igual que tú, inician esta
aventura educativa, por favor participa con ánimo, y comparte respetuosamente con
tus compañeros. 
MAPA DE CONTENIDOS DE LA UNIDAD 4

Ilustración 1. Fuente UDEMEX (2021)

COMPETENCIAS ESPECÍFICAS

Ilustración 2. Fuente UDEMEX (2021)


4.1 Medidas de tendencia central

En las Unidades anteriores se explicaron dos de las tres tareas más importantes de
la estadística descriptiva: la elaboración de tablas de distribución de frecuencias y
3
el trazado de gráficas. Las representaciones gráficas de los datos que resultan de
la distribución de frecuencias, permitieron discernir el patrón de comportamiento y
la tendencia de los mismos. Sin embargo, para abreviar y representar la
información, se utilizan números, a los que se les denomina medidas descriptivas,
las cuales permiten representar cualquier característica que se pretenda medir en
una muestra o población y sintetizar la información proporcionada, a tal punto que
ellos mismos bastan para desarrollar análisis precisos o tomar decisiones (Góngora
& Hernández, 2003).

Ilustración 3. Fuente UDEMEX (2021) con información de Góngora & González (2003)

Un promedio es un valor típico o representativo de un conjunto de datos. Como este


valor típico tiende a encontrarse en el centro de los conjuntos de datos, ordenados
de acuerdo con su magnitud, a los promedios se les conoce también como medidas
de tendencia central (Spiegel & Stevens, 2020).

Una de las medidas de tendencia central más común y útil es la media común o
“media aritmética”, pero también son de importancia, según las circunstancias y el
tipo de variables la “moda” y la “mediana”. Otras medidas de tendencia
central menos usadas son la “media geométrica” y la “media
armónica” (Dicovskiy, 2016).

La sumatoria, un concepto básico introductorio:

En matemática, el símbolo Griego Sigma “” en mayúscula se utiliza para indicar 4

sumatoria de datos donde:

1𝑛 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4 + … 𝑥𝑛
Siendo x un valor de medición de la variable en estudio e “i” un índice que varía de
“1 a n“. Recuerda que el número de datos de la muestra se identifica con la letra “n”
(Dicovskiy, 2016).

Ilustración 4. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2015)

Ejemplo:

Desarrolla la siguiente expresión 1 𝑥𝑖 .


4

14 𝑥𝑖 = 𝑥1 + 𝑥2 + 𝑥3 + 𝑥4
A continuación, se describirán las medidas de tendencia central.

4.1.1 Media aritmética, geométrica y armónica

La media aritmética, también llamada media o promedio, es una de las medidas


más utilizadas en Estadística (Contreras & colaboradores, 2016). Se denota por 5

𝑥̅ 𝑜 𝜇. Se puede calcular tanto para datos agrupados como para no agrupados,


siendo la principal característica de la media es su valor que es representativo
de todo el conjunto de datos (Contreras & colaboradores, 2016).

La media, en su forma más general, es un número entre el máximo y el mínimo


valor observados que representa un punto tal que, si los datos fueran pedazos de
masa, la distribución de los valores de un conjunto de datos se mantendría
equilibrada. Si se hace una analogía con el centro de gravedad en la física, la
media representa el punto de equilibrio de una distribución de objetos a lo largo
de una viga, tal y como se muestra en la ilustración 5.
Si se asume que cada uno de los bloques tiene el mismo peso y que la viga no
tiene masa, entonces el punto de equilibrio para cada una de las figuras
dependerá de la posición relativa que tengan los bloques entre sí, es decir, de la
distribución. Los triángulos indican el punto de equilibrio. Nótese que, en los tres
casos, aun cuando los datos tienen el mismo intervalo de valores (2, 9), el punto
de equilibrio depende de la posición relativa de los bloques y de la cantidad de
ellos en cada posición determinada.
En el caso estadístico, consideraremos que la media es semejante al punto de
equilibrio de los ejemplos de la ilustración 5, es decir, aquel valor en el cual la
distribución de datos se equilibra.
6

Ilustración 5. Fuente UDEMEX (2021) con información de Góngora & González (2003)

La media para datos no agrupados se define como la suma de todos los datos
dividida entre el número de datos, esto es:

𝒙𝟏 + 𝒙𝟐 + 𝒙𝟐 + 𝒙𝟒 + … 𝒙𝐧
̅=
𝒙
𝒏

donde n es el número de datos de la muestra.

La fórmula simplificada de la media es:


𝑥𝑖
𝑥̅ = 1𝑛
𝑛
Ejemplo
Si las calificaciones obtenidas en el módulo 1 de la UDEMEX fueron 10, 9, 8, 7 y 6.
Calcula la media.
a) Usando la fórmula de la media para datos no agrupados, se sustituyen
valores y se realiza el cálculo

𝒙𝟏 + 𝒙𝟐 + 𝒙𝟐 + 𝒙𝟒 + 𝒙𝟓 10 + 9 + 8 + 7 + 6 40
̅=
𝒙 = = =8
𝒏 𝟒 5

b) La interpretación es que el promedio obtenido fue de 8


Cuando se tienen datos agrupados en una distribución de
frecuencias, es necesario calcular la marca de clase. La media para
se calcula de la siguiente forma:

∑𝒏𝒊=𝟏 𝒇𝒊 𝑴𝐢
̅=
𝒙
𝒏
donde: 7

𝑥̅ 𝑒𝑠 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎
k es el número de intervalos
𝑓𝑖 es la frecuencia de i-ésimo intervalo
𝑀𝑖 𝑒𝑠 𝑙𝑎 𝑚𝑎𝑟𝑐𝑎 𝑑𝑒 𝑐𝑙𝑎𝑠𝑒 𝑑𝑒𝑙 𝑖 − é𝑠𝑖𝑚𝑜 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜
n es el número de datos

Ejemplo:
En una competencia de velocidad en 100 metros planos participaron 160
corredores. Los tiempos en segundos logrados por cada son los que se muestran
en la siguiente tabla de distribución de frecuencias. Calcula la media.

Tabla 1.

Ilustración 6. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2015)

a) La media se obtiene mediante la fórmula:


∑𝒏𝒊=𝟏 𝒇𝒊 𝑴𝐢
̅=
𝒙
𝒏
b) Se calcula la marca de clase de cada intervalo, agregando una columna
para incluirla, se denota por 𝑀𝑖 , esto es:
Tabla 2.

Ilustración 7. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2015)

c) Para cada intervalo, se obtiene el producto de la frecuencia por marca de


clase en una columna que se representa por 𝑓𝑖 𝑀𝑖 ; además, se obtiene la
suma de esta columna y se divide entre el número total de datos que
corresponde a la suma de frecuencias, esto es:

Tabla 3.

Intervalo Frecuencia Mi fiM i


1-10 5 5.5 27.5
11 – 20 11 15.5 170.5
21 – 30 21 25.5 535.5
41 – 50 27 35.5 958.5
51 – 60 31 45.5 1410.5
61 – 70 35 55.5 1942.5
71 – 80 21 65.5 1375.5
81-90 9 75.5 679.5
Total 160 7100
Ilustración 8. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2015)

d) Se sustituye la suma de 𝑓𝑖 𝑀𝑖 =7100 y n = 160 en la fórmula de la media:


𝑓𝑖 𝑀𝑖 7100
̅=
𝒙 = = 𝟒𝟒. 𝟑𝟖
𝒏 160
𝑓𝑖 𝑀𝑖
̅=
Observa en este último caso, que en la fórmula 𝒙 no se incluyen los valores
𝒏

iniciales y final del subíndice i que deben ir abajo y arriba del símbolo
respectivamente, esta forma de escribir la suma también es correcta,
se asume que el valor inicial es el uno y el valor final corresponde al
número de intervalos.

Ilustración 9. Fuente UDEMEX (2021) con información de Dicovskiy (2016).

La media geométrica, G de N números positivos x1, x2, x3,…, xN, es la raíz n-ésima
del producto de los números (Spiegel & Stephens, 2020 ):

𝐺 = 𝑁√𝑥1 𝑥2 𝑥3 … 𝑥𝑁

Ejemplo

Calcula le media geométrica de los números 2, 4 y 8.


a) Sustituyendo los valores anteriores en la fórmula de la media geométrica, se
tiene:
3 3
𝐺 = 𝑁√𝑥1 𝑥2 𝑥3 … 𝑥𝑁 =√(2)(4)(8) = √64 = 4

b) La interpretación es que el promedio obtenido es 4, es el valor representativo


del conjunto de datos.

Por su parte, la media armónica, H, de un conjunto de números x1, x2, x3,…, xN, es
el recíproco de la media aritmética de los recíprocos de los números (Spiegel &
Stephens, 2020 ):
1 𝑁
𝐻= =
1 𝑁 1 1
∑ ∑
𝑁 𝑗=1 𝑥𝑗 𝑥

Los elementos del conjunto deben ser necesariamente no nulos. Esta media es
poco sensible a los valores grandes y los infravalora respecto a la media aritmética,
1
pero muy sensible a los valores próximos a cero, ya que los recíprocos son muy
𝑥𝑗 10

altos, por lo que les da más peso que en las medias aritmética y geométrica. Si
algún valor fuese cero, la media armónica quedaría indeterminada
(UniversoFórmulas, 2021).

Ejemplo:

Un coche realiza un trayecto de 400 km. La autopista se encuentra en mal estado,


por lo que los primeros 100 km los recorre a 120 km/h, los siguientes 100 km a 20
km/h, los terceros a 100 km/h y los 100 últimos a 130 km/h. Calcula la media
armónica.

Ilustración 10. Fuente UDEMEX (2021) con información de Contreras (2015).

a) Utilizando la ecuación de la media armónica se sustituyen los valores, esto


es:
4 4 31200
𝐻= = =
1 1 1 1 593 593
120 + 20 + 100 + 130 7800
b) Se realizan los cálculos:
4 31200
𝐻= = = 52.61
593 593
7800
c) La media armónica es de 52.61, lo que significa que en promedio el auto
recorrió 52.61 km en 1 hora
4.1.2 Mediana

La mediana es al valor central de un conjunto de datos ordenados en forma


̃.
ascendente o descendente, se representa por 𝒙

Mediana para datos no agrupados


Si el número de datos es impar, la mediana es igual al valor que se encuentra en
11
el centro de la distribución una vez que estos se han ordenado en forma
ascendente o descendente.

Si el número de datos es par, la mediana es igual al promedio de los dos datos


que se encuentran en el centro de la distribución una vez que estos se han
ordenado en forma descendente o ascendente (Contreras, 2016).

Ejercicio.

Obtén el valor de la mediana de los siguientes números

a) 4 13 12 17 7 4 8 7 17 19 13 14 25 8 23

En este caso como el número es impar (15), se ordenan los números de


menor a mayor y el valor de la mediana es el dato del centro, esto es:

4 4 7 7 8 8 12 13 14 14 17 17 19 23 25

Por lo que la mediana es 13.

b) 150 28 330 42 12 50 63 30 3 60 150 128 201 103 37 85 35 26 43


75 50 78

En este caso como el número es par (22), se ordenan los números de menor
a mayor y el valor de la mediana es el promedio entre los dos datos del
centro, esto es:

3 12 26 28 30 35 37 42 43 50 50 60 63 75 78 85 103 128

150 150 201 330

50+60
Por lo que la mediana es 𝑥̃ = = 55
2

Mediana para datos agrupados


Si el conjunto de datos se presenta en forma agrupada, esto es
mediante una distribución de frecuencias, la mediana se obtiene de
forma aproximada con la siguiente fórmula:
𝑛
− 𝐹𝑎
𝑥̃ = 𝐿 + (2 )𝑐
𝑓𝑥̃

12
Donde:

L es el límite inferior del intervalo que contiene la mediana

n es el número de datos

Fa es la frecuencia acumulada del intervalo anterior al que contiene la mediana

𝑓𝑥̃ es la frecuencia del intervalo que contiene la mediana

c es el tamaño del intervalo que contiene a la mediana

Lo primero que se debe identificar, es el intervalo en el cual se encuentra el valor


de la mediana, lo cual corresponde al dato que se encuentra en medio de la
distribución, es decir, el dato número n/2 (Contreras, 2016).

EJERCICIO: Obtener el valor de la mediana para los siguientes conjuntos de datos


Tabla 4.

Ilustración 11. Fuente UDEMEX (2021) con información de Levin & Levin (2004)

a) Se obtienen los límites reales y frecuencia acumulada, para establecer el


intervalo que contiene a la mediana
Tabla 5.

13

Ilustración 12. Fuente UDEMEX (2021) con información de Levin & Levin (2004)

b) Se identifica el intervalo en el cual se encuentra el valor de la mediana, lo


cual corresponde al dato que se encuentra en medio de la distribución, es
decir, el dato número n/2 = 160 / 2 = 80. Por lo que para identificar el
intervalo se analizan los datos de la columna de la frecuencia acumulada,
hasta el intervalo 4, se tienen 64 datos, el cual no contiene el valor
intermedio de 80, por su parte, el intervalo 5, tiene 95 datos, entonces el
dato 80 se encuentra en este intervalo, es decir, la mediana corresponde a
uno de los 31 datos (frecuencia) que se encuentran en ese intervalo, esto
es:

Tabla 6.

Ilustración 13. Fuente UDEMEX (2021) con información de Levin & Levin (2004)
c) Se obtienen los valores que se encuentran en la ecuación de
la mediana:
𝑛
− 𝐹𝑎
𝑥̃ = 𝐿 + (2 )𝑐
𝑓𝑥̃

14
L = 51 (es el límite inferior del intervalo que contiene la mediana)

n = 160 (es el número de datos

Fa = 64 (es la frecuencia del intervalo anterior al que contiene la mediana)

𝑓𝑥̃ = 31 (es la frecuencia del intervalo que contiene la mediana)

c =10 (es el tamaño del intervalo que contiene a la mediana

c = LS – LI + variación = 10-1+1 =10)

d) Se sustituyen los valores en la fórmula de la mediana y se realizan los


cálculos:

160
− 64
𝑥̃ = 51 + ( 2 ) 10 = 56.16
31

El valor de la mediana es 56.16, el cual se encuentra en el quinto intervalo.

4.1.3 Moda

La moda, es el valor que más veces se repite en un conjunto de datos. Se representa


por 𝑥̂ (UNAM_FDE, 2017).
15

Ilustración 14. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2016)

Moda para datos no agrupados

Cuando el conjunto de datos no está agrupado, se busca el dato que aparece con
mayor frecuencia, es decir, más veces y su valor corresponde a la moda (Contreras
& colaboradores, 2016).

Ejemplos:

Los siguientes casos se muestra cómo se obtiene el valor de la moda para tres
conjuntos de datos no agrupados.

a) 4 3 7 2 5 6 3 2 5 7 3 6 4 3
El número que más se repite es el tres, por lo cual la moda es tres

b) 10 15 13 14 10 8 13 10 21 13 7 6 1 0 3

En este caso el 13 y 10 se repiten tres veces, entonces el conjunto de datos es


bimodal
c) 7 8 9 5 4 1 2
En este caso no se repite ningún valor, el conjunto es amodal.

Moda para datos agrupados


La moda para datos agrupados corresponde a aquel intervalo que
posee la frecuencia absoluta más alta (MatesFáciles, 2021), se calcula
con la siguiente fórmula:

𝑓𝑖 − 𝑓𝑖−1
𝑥̂ = 𝐿 + ( ).𝑐
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )

Donde: 16

L es el límite inferior del intervalo modal.

fi es la frecuencia absoluta del intervalo modal.

fi-1 es la frecuencia absoluta anterior al intervalo modal.

fi+1 es la frecuencia absoluta siguiente al intervalo modal.

c es la amplitud del intervalo modal..

EJERCICIO: Obtener el valor de la moda para los siguientes conjuntos de datos


obtenidos de 50 personas a las cuales se les preguntó su edad en un centro
comercial reconocido

Tabla 7.

Ilustración 15. Fuente UDEMEX (2021) con información de MatesFáciles (2021)

a) La moda se encuentra en el segundo intervalo, ya que contiene la mayor


frecuencia que es 11
Tabla 8.

17

Ilustración 16. Fuente UDEMEX (2021) con información de MatesFáciles (2021)

b) Se calcula el límite real inferior del intervalo que contiene a la moda, esto es:
18.5
c) Se obtienen los valores de la ecuación de la moda:
𝑓𝑖 − 𝑓𝑖−1
𝑥̂ = 𝐿 + ( ).𝑐
(𝑓𝑖 − 𝑓𝑖−1 ) + (𝑓𝑖 − 𝑓𝑖+1 )

L es el límite inferior del intervalo modal, en este caso, su valor es 18.5.

fi es la frecuencia absoluta del intervalo modal, en este caso, su valor es vale 11.

fi-1 es la frecuencia absoluta anterior al intervalo modal, en este caso, su valor es


5.}

fi+1 es la frecuencia absoluta siguiente al intervalo modal, su valor es 8.

c es la amplitud del intervalo modal, su valor es 9 (c = LS - LI +1)

d) Se sustituyen los valores en la ecuación:

11 − 5 6
𝑥̂ = 18.5 + ( ) . 9 = 18.5 + ( ) . 9 = 18.5 + 6 = 24.5
(11 − 5) + (11 − 8) 6+3

24.5, es el valor aproximado de la moda.


18

Ilustración 17. Fuente UDEMEX (2021) con información UNAM-SUAyDE (2017)

Video 1. Práctica 1. Medidas de centralización en Excel (Media, Mediana, Moda)


Online
IngE Darwin (2019). Práctica 1. Medidas de centralización en Excel
Online [Videoclip] en: Youtube: recuperado el 4 de septiembre 2021.
https://www.youtube.com/watch?app= desktop&v= mHZtO_NUGhc

4.2 Medidas de dispersión

Usar la media, la mediana y la moda como medidas de tendencia central no es


suficiente, pues solo describen el centro de la distribución, pero no su dispersión,
como bien puede verse en la siguiente ilustración, en los tres casos, la media, la
moda y la mediana son iguales: 25, pero de ninguna manera las distribuciones son
las mismas, por lo que es importante medir una nueva propiedad denominada
variabilidad o dispersión (Góngora & Hernández, 2003).
19

Ilustración 18. Fuente UDEMEX (2021) con información de Góngora & Hernández (2003).

Ilustración 19. Fuente UDEMEX (2021) con información de Góngora & Hernández (2003).

Existen diversas medidas de variabilidad, a continuación, se mencionan algunas de


las más importantes.
4.2.1 Varianza y desviación estándar

La varianza (que es el cuadrado de la desviación estándar: σ 2) se define como la


media de las diferencias con la media elevadas al cuadrado. Por su parte, la
desviación estándar es la raíz cuadrada de la varianza (FAEDIS, 2017). 20

Varianza para datos no agrupados

Los pasos a seguir para calcular la varianza para datos no agrupados son:
• Calcular la media de los datos
• Por cada número restar la media y elevar el resultado al cuadrado (la
diferencia elevada al cuadrado)
• Calcular la media de esas diferencias al cuadrado

Ejemplo

Calcula la media, la varianza y la desviación estándar de 4 perros a los cuales se


les han medido las alturas de los lomos, sus valores son: 600 mm, 470 mm, 170
mm, 430 mm y 300 mm, como se muestra en la siguiente ilustración.

Ilustración 20. Fuente UDEMEX (2021) con información de FAEDIS (2017).

a) Se calcula la media:

600 + 470 + 170 + 430 + 300 = 1970 = 394


𝑥̅ =
5 5

La altura media es 394 mm. En la siguiente gráfica se muestra cada altura del perro
con la marca roja y el valor de la media con la línea verde.

21

Ilustración 21. Fuente UDEMEX (2021) con información de FAEDIS (2017).

b) Se calcula la diferencia de cada altura con la media, los valores se


muestran en la siguiente gráfica:

Ilustración 22. Fuente UDEMEX (2021) con información de FAEDIS (2017)

c) Se calcula la varianza, para ello se eleva al cuadrado cada diferencia


calculada en el paso anterior y se calcula la media de esas diferencias

2062 + 762 + (-224)2 + 362 + (-94)2 108 520


Varianza: σ2 = = = 21 704
5 5

Así que la varianza es 21 704.


d) Se calcula la desviación estándar, la cual es la raíz de la
varianza
σ = √21 704= 147

Con el valor de la media y de la desviación estándar se puede diferenciar las alturas


de los perros que están a menor o mayor distancia de la desviación estándar
22
(147mm) con respecto a la media y, se tiene una manera "estándar" de saber qué
perro es de tamaño normal, o extra grande o extra pequeño.

La siguiente ilustración muestra que los Rottweilers son perros grandes y los
Dachsunds son pequeños y que se encuentran fuera de las líneas que marcan el
valor de la desviación estándar.

Ilustración 23. Fuente UDEMEX (2021) con información de FAEDIS (2017).

Varianza y desviación estándar para datos no agrupados

La varianza para datos no agrupados se calcula con la siguiente fórmula


(Contreras & colaboradores, 2016):

(𝑥𝑖 − 𝑥̅ )2
𝜎2 = ∑
𝑛
Donde:
𝑥𝑖 es el valor del i-ésmo dato
𝑥̅ es la media del conjunto de datos
n es el número total de datos
23

Ejercicio:

El médico Mauricio Kuri registra los tiempos de supervivencia, en meses, de once


pacientes masculinos después de la aparición de metástasis pulmonar:

11, 13, 13, 13, 13, 13, 14, 14, 15, 15, 17

Calcula la varianza y desviación estándar


a) Se calcula la media de los datos, ya que para la fórmula de la desviación
estándar se resta a cada dato la media:

2
(𝑥𝑖 − 𝑥̅ )2
𝜎 =∑
𝑛
𝑥̅ = 13.727
(Recuerda que para obtener la media se suman todos los datos y se dividen
entre el número total de estos)

b) En una tabla, se escriben los valores en una columna vertical y se resta a


cada valor la media, en otra columna se eleva al cuadrado los resultados de
la columna anterior
Tabla 9.

24

Ilustración 24. Fuente UDEMEX (2021) con información de UNAM (2018).

Se aplica la fórmula de varianza, sustituyendo la suma de las diferencias de


los datos respecto a la media al cuadrado y el número total de datos, esto
es:
(𝑥𝑖 − 𝑥̅ )2 24.176
𝜎2 = ∑ = = 2.20
𝑛 11
El valor de la varianza es 2.20, para obtener la desviación estándar, se
obtiene la raíz cuadrada de la varianza:
Desviación estándar: 𝜎 = √𝜎 = √2.20 = 1.48

Varianza y desviación estándar para datos agrupados


La fórmula para calcular la varianza para datos agrupados es (Contreras &
colaboradores, 2016):

2
∑ 𝑓𝑖 (𝑀𝑖 − 𝑥̅ )2
𝜎 =
𝑛
25
Donde:
𝑓𝑖 es el valor de la frecuencia del i-ésimo intervalo
𝑀𝑖 es el valor de la marca de clase del i-ésimo intervalo
𝑥̅ es la media del conjunto de datos
n es el número total de datos

Ejercicio

En el estudio para introducir tractores a una región de Miahuatlán, Oaxaca, se midió


la fuerza promedio de tiro empleada por 38 bueyes cuando se abrieron surcos con
arado vertedera en igual número de cultivo. Los resultados se organizaron en la
siguiente tabla (UNAM, 2018), en donde la segunda columna corresponde a la
frecuencia. Calcular la desviación estándar y varianza.

Tabla 10.

Ilustración 25. Fuente UDEMEX (2021) con información de UNAM (2018).


a) Calcular la media para datos agrupados, para ello se obtiene la marca de
clase y se sigue el procedimiento descrito en la sección 4.1.1, el resultado se
muestra en la Tabla 11, donde 𝑥̅ = 1112.97

b) Se calcula la desviación de cada dato (marca de clase) con respecto a la


media (4ta. columna de la tabla). 26

c) Se elevan al cuadrado las desviaciones (5ta. columna).


d) Se multiplica cada desviación elevada al cuadrado por su frecuencia
correspondiente (6ta. columna), y se suman los resultados (final de la 6a.
columna).
Se obtiene la varianza, 𝝈𝟐 , dividiendo la suma resultante entre el número de
datos:
∑ 𝑓𝑖 (𝑀𝑖 −𝑥̅ )2
𝜎2 = = 2475.64/38 = 65.14
𝑛

a) Se calcula la desviación estándar 𝝈 extrayendo raíz cuadrada


𝜎 = √𝜎 = √65.14 = 8.07

Tabla 11.

Ilustración 26. Fuente UDEMEX (2021) con información de UNAM (2018).


4.2.2 Desviación media

Es el promedio el número de unidades en que cada dato se encuentra alejado de la


media (Contreras & colaboradores, 2016).

Desviación media para datos no agrupados


27

Se calcula con la siguiente fórmula:


∑ |𝑥𝑖 − 𝑥 |
𝐷𝑀 =
𝑛
donde:
xi = es el valor del i-ésimo dato
x̅ = es la media del conjunto de datos
n = es el número total de datos

Ilustración 27. con información de Economipedia (2021).

Ejercicio:
Calcula el valor de la desviación media para el siguiente conjunto de datos:
4 14 12 8 12 6 16 8

a) Se calcula la media para datos no agrupados, la cual es:


𝑥̅ = 10
b) Se calcula la diferencia de cada dato con respecto a la media aritmética
(segunda columna de la tabla 12)
c) Se obtiene el valor absoluto de la diferencia calculada en el inciso anterior
(tercer columna de la tabla 12)
d) Se calcula la desviación media:
∑ |𝑥𝑖 − 𝑥 | 28
𝐷𝑀 = = = 3.5
𝑛 8

Tabla 12.

28

Ilustración 28. Fuente UDEMEX (2021) con información de Contreras & colaboradores (2016).

Desviación media para datos agrupados

Se calcula con la siguiente fórmula (Contreras & colaboradores) :

̅
𝑓𝑖 |𝑀𝑖 − 𝑥|
𝐷𝑀 = ∑
𝑛
donde:
fi= es el valor de la frecuencia del i-ésimo intervalo
Mi= es el valor de la marca de clase del i-ésimo intervalo
𝑥̅ = es la media del conjunto de datos
n= es el número total de datos

Ejemplo
En una muestra formada por 100 jugadores de futbol de la liga Olmeca en Tuxtla
Gutiérrez, Chiapas, sus edades fluctuaron entre 18 y 38 años, de esta manera:
Para calcular su desviación media se construye paso a paso la tabla
13.
a) Se calcula la media aritmética (3ra. columna): (5(19) + 25(22) + 33(25) +
17(28) + 8(31) + 4(34) + 8(37)) / 100 = 26.26
b) Se calcula la diferencia de cada marca de clase con respecto a la media
aritmética (4ta. columna).
29
c) Se multiplica cada diferencia por la frecuencia respectiva y se suman los
resultados (5ta. columna).
d) La desviación media (D.M.) se obtiene al dividir la suma obtenida entre el
número de datos (última columna).

Tabla 13.

Ilustración 29. Fuente UDEMEX (2021) con información de UNAM (2018).

En este caso, se invita al estudiante a verificar si las fórmulas aplicadas son correctas
para calcular la desviación media para datos agrupados.

4.3 Medidas de posición

Son medidas que indican la posición que ocupa cierto elemento dentro de una
lista o de una tabla de frecuencias.
Para obtener las medidas de posición, se divide al conjunto de
datos en varias partes iguales y de acuerdo con el tipo de división que se realiza,
reciben un nombre específico: presentándose tres casos que constituyen una
generalización del concepto de mediana.

30
Así como la mediana divide al conjunto de datos en dos partes con el mismo
número de elementos cada una, estas nuevas divisiones se pueden hacer en 4,
10 o en 100 partes iguales, con lo cual se establece el concepto de cuantil. Estos
tres tipos de cuantiles reciben el nombre de cuartiles, deciles y percentiles
(Contreras & colaboradores, 2016).

4.3.1 Cuartiles

Un cuartil es el valor obtenido al dividir el conjunto de datos en cuatro partes iguales,


por lo que se tiene tres cuartiles.
Los cuartiles se representan por 𝑄𝑖 donde i = 1, 2, 3

El primer cuartil considera 25% del conjunto de datos; el segundo cuartil, 50% y el
tercer cuartil, 75% del conjunto de datos. El segundo cuartil corresponde con el valor
de la mediana.

Para un conjunto de datos no agrupados, se ordenan los datos en forma ascendente


o descendente y la posición del valor del cuartil i donde i = 1, 2, 3 lo obtenemos
mediante fórmula:

𝑖. (𝑛 + 1)
𝑄𝑖 =
4
Cuando al aplicar la fórmula, resulta un número entero, entonces el valor del cuartil
deseado corresponde al valor del dato que se encuentra en la posición obtenida.
Si al aplicar la fórmula, no resulta un número entero, entonces el valor
del cuartil deseado corresponde al valor del dato que se encuentra en
la posición entera obtenida más la parte proporcional de ese valor entero con el
siguiente. Esa proporción se obtiene al multiplicar la parte decimal obtenida por la
diferencia entre el valor del dato que ocupa la parte entera y el siguiente.

31
Ejemplos:

i. Obtener el cuartil 3 para el siguiente conjunto de datos no agrupados


4 14 12 17 7 4 8 7 17 19 13 14 25 8 23

i.1) Se tienen 15 datos, se ordenan en forma ascendente:


4 4 7 7 8 8 12 13 14 14 17 17 19 23 25

i.2) Se calcula la posición del dato que corresponde el cuartil 3 con la fórmula:

𝑖.(𝑛+1) 3(15+1) 48
𝑄𝑖 = = = = 12
4 4 4
Se obtuvo un número entero, por lo que en el conjunto de datos anterior, la posición
12 da el valor del cuartil 3, el cual es 17.

ii) Obtener el cuartil 3 para el siguiente conjunto de datos no agrupados


150 28 330 42 12 50 63 30 3 60 150 128 201 103 37 85 35 26 43 75 50
78
ii.1) Se ordenan en forma ascendente los 22 datos
3 12 26 28 30 35 37 42 43 50 50 60 63 75 78 85 102 128 150 150 201
330
ii.2) Se calcula la posición del dato que corresponde al cuartil 3 con la fórmula:
3.(22+1) 69
𝑄𝑖 = = =17.25
4 4
Se obtuvo un valor decimal cuya parte entera es 17.
ii.3) En los datos ordenados, se obtienen los que ocupan la posición
17 y la siguiente, estos valores son 102 y 128.
ii.4) La parte proporcional se obtiene multiplicando la parte decimal por la diferencia
que existe entre el 102 y 128, lo cual es 0.25 (128 – 102) = 0.25 (26) = 6.5

Entonces el valor del cuartil es 𝑄3 =102+6.5 = 108.5

32

4.3.2 Deciles

Un decil es el valor obtenido al dividir el conjunto de datos en 10 partes iguales, por


lo que se tienen 9 deciles. Se representan por 𝑑𝑖 donde i = 1, 2, 3, … 9.

El primer decil considera el 10% del conjunto de datos; el segundo, 20%; el tercero,
30% y así sucesivamente hasta que el noveno que considera 90% del conjunto de
datos. El quinto corresponde al valor de la mediana (Contreras & colaboradores,
2016).

Ejemplo:

Los datos que se relacionan a continuación son un grupo de presiones arteriales


sistólicas medidas en mm de Hg correspondientes a un grupo de pacientes:

120, 160, 150, 110, 170, 130, 125, 140, 125, 145
Calcula el decil 2.

a) Se ordenan los datos de menor a mayor:

x1 = 110, x2= 1 20, x3 = 125, x4 = 125, x5 = 130, x6 = 140, x7 = 145,


x8 = 150, x9 = 160, x10 = 170

b) Se calcula el decil 2, el cuartil 3 y el percentil 50 (la mediana):

Decil 2 (i=2). Se calcula la posición del decil 2 mediante la expresión:


𝑖.(𝑛+1) 2.(10+1)
𝑑𝑖 = = = 2.2
10 10

c) Como este número es decimal, se consideran los valores de las posiciones 2ª y


3ª, es decir: x2 = 120 y x3 = 125, se calcula la diferencia: 125-120 = 5, este resultado
se multiplica por la parte decimal 0.2, así: (0.2)(5)=1 Finalmente, este resultado se
sumas a la posición 2ª: 120+1=121 Es decir: D2 = 121
33

La conclusión es que de los 10 pacientes el 20% de ellos tiene presiones arteriales


sistólicas menores a 121 medidas en mm de Hg.

4.3.3 Percentiles

Los percentiles son medidas de posición relativa. Se utilizan asiduamente en la


educación con el fin de comparar el rendimiento de un individuo con el rendimiento
de un grupo de referencia. En lo referente a psicología, las puntuaciones que se
obtienen en forma directa en una prueba psicológica o, en general, cualquier
medición) no indican nada en lo relativo al desempeño de las personas y del lugar
que ocupan respecto del resultado de dicha prueba respecto al grupo al que
pertenecen (Pagano, 2006).

Un percentil o punto percentil es el valor sobre la escala de medición, debajo del


cual se encuentra un porcentaje dado de los datos incluidos en la distribución.

Ejemplo:

- El sexagésimo punto percentil es el valor sobre la escala de medida, debajo


del cual está el 60% de los datos de la distribución, se denomina con P 60
- El quincuagésimo punto percentil es el valor de la escala debajo del cual se
encuentra el 50% de los datos de distribución
- El septuagésimo punto percentil es el valor de la escala debajo del cual se
encuentra el 70% de los datos de distribución
- El vigésimo punto percentil es el valor de la escala debajo del cual se
encuentra el 20% de los datos de distribución
Para clarificar el concepto de percentil, imagina una revisión en el
pediatra de un bebé cualquiera. Todo bien, el peso bien, la altura genial y un
percentil por encima de lo que a su edad le corresponde. El padre o madre mira al
médico, le devuelve la sonrisa que demuestra lo orgulloso que está de su bebé y
sale de la consulta contentísimo sabiendo que su hijo o hija, a pesar de estar
enfermo de gripa, tiene un percentil por encima de la media. 34

Los padres lo comentan con las abuelas cuando les llaman para preguntar por el
niño y les dejan claro que la cosa va bien porque el niño tiene un percentil por
encima de la media. Están tan contentos que incluso hablan con sus hermanos y
les preguntan qué percentil tenían sus hijos a la edad del suyo. Sin querer, durante
la semana, el percentil se convierte en el tema de conversación con amigos y otros
padres y madres. Llegan por tanto a la conclusión de que están haciendo la cosa
bien porque tienen un hijo con un percentil por encima de la media. ¡Felicidades!

Pero, ¿alguien se ha preguntado alguna vez qué es eso del percentil? Y todavía
mejor, ¿para qué sirve? La cosa es sencilla, pero solo para los matemáticos, en mi
caso lo he tenido que preguntar varias veces y me ha sorprendido descubrir que es
un término que todos los padres y madres tenemos en cuenta, pero pocos sabemos
qué es realmente.

Un percentil es una medida estadística para comparar resultados, nos permite saber
cómo está situado un valor en función de una muestra. Si hablamos de bebés, nos
permitiría comparar los datos de nuestro bebé con otros de sus mismas
características. Estas características son la edad y el sexo.

Si el pediatra dice que nuestro bebé de 6kg está en el percentil 25, quiere decir que
hay un 25% de los bebés estudiados que están en el mismo peso o menos y un
75% que están por encima.

Si nuestro bebé se encuentra en el percentil 75 de peso, quiere decir entonces que


de toda la muestra solo hay un 25% que pesen más que nuestro hijo (ElMundo,
2005).
INFOGRAFÍA

35

Ilustración 30. Fuente UDEMEX (2021)


Te invitamos a resolver la actividad complementaria 4.1, que si bien, no tiene un valor
numérico para tu calificación final, te ayudará a repasar los temas estudiados en la unidad
4.

36

Excelente, concluiste de manera satisfactoria los temas presentados en la unidad 4, por lo


tanto, te invitamos a resolver la actividad de aprendizaje 4.1 para verificar el conocimiento
adquirido. Adelante y Éxito.

Ahora que has concluido con los temas de la unidad 4, es momento de que
pongas a prueba el aprendizaje obtenido. Para ello, deberás contestar tu
evaluación final. Esta evaluación comprende los temas estudiados en las 4
unidades temáticas. Te recomendamos dar un repaso general para que
obtengas buenos resultados. ¡Mucha suerte!
TABLA DE EVALUACIÓN

37

Ilustración 31. Fuente: UDEMEX (2021)

REFERENCIAS BIBLIOGRÁFICAS

Góngora, C. J., Hernández. R.R. (2003). Estadística descriptiva. México: Trillas.

Spiegel, M. R., Sthephens, L. J. (2020). Estadística. México: Mc Graw Hill.

Dicovskiy, R. L. (2016). Estadística para ingenieros. Nicaragua: UNI

Contreras, G.L., Laredo, S. J., Rojas, G.J., Salazar, J.N., Gómez Tagle, F.C. (2015)
UAEMex. Estadística. México: Librería Universitaria.

Levin, J., Levin, W.C. (2004). FUNDAMENTOS DE ESTADÍSTICA EN LA INVESTIGACIÓN


SOCIAL. México: Alfaomega.

Pagano, R. R. (2006). Estadística para las ciencias del comportamiento. México: Thomson.
CIBERGRAFÍA
UniversoFórmulas (2021). Media armónica. Obtenido de
https://www.universoformulas.com/estadistica/descriptiva/media-armonica/

UNAM_FDE (2017). Estadística, algunos conceptos. Obtenido de 38

http://herzog.economia.unam.mx/profesores/blopez/estadistica-
descriptiva.pdf

MatesFáciles (2021). Media, mediana y moda para datos no agrupados. Obtenido


de https://lasmatesfaciles.com/2021/05/07/media-mediana-y-moda-para-
datos-agrupados/

UNAM-SUAyDE (2017). Medidas de tendencia central. Obtenido de


https://programas.cuaed.unam.mx/repositorio/moodle/pluginfile.php/860/mo
d_resource/content/3/contenido/index.html

FAEDIS (2017). Medidas de dispersión. Obtenido de:


http://virtual.umng.edu.co/distancia/ecosistema/ovas/administracion_empres
as/estadistica_i/unidad_1/medios/documentacion/p9h17.pdf

UNAM (2018). Estadística descriptiva y probabilidad. Obtenido de https://www.cch-


sur.unam.mx/recursos_prof/matematicas/estadistica_I_javier_guillen.pdf

Economipedia (2021). Valor absoluto. Obtenido de


https://economipedia.com/definiciones/valor-absoluto.html

UNAL (2018). Deciles para datos no agrupados. Obtenido de


http://red.unal.edu.co/cursos/ciencias/1000012/un2/html/exp4.html

ElMundo (2005). Percentil. Obtenido de


https://saposyprincesas.elmundo.es/consejos/salud-infantil/tiene-tu-bebe-su-
percentil/

También podría gustarte