Está en la página 1de 19

Universidad Autónoma de Querétaro

Escuela de Bachilleres

Matemáticas VI
Estadística y Probabilidad
Unidad I: Estadística

Primer Parcial
Semana 4
Medidas de Tendencia Central y Medidas de Dispersión
Datos Agrupados
Autoridades
Dra. Margarita Teresa de Jesús García Gasca
Rectora

Dr. Javier Ávila Morales


Secretario Académico

M. en E.D. Jaime Nieves Medrano


Director de la Escuela de Bachilleres

M. en C. Rita Ochoa Cruz


Secretaria Académica de la EBA

M. en C. Lucero Canto Guerrero


Coordinadora del Plantel Sur

M. en C. Edgar Ulloa Hernández


Coordinador del Plantel Norte

Dra. Cypatly Rojas Miranda


Coordinadora del Plantel San Juan del Río

Lic. María Patricia Pérez Velázquez


Coordinadora del Plantel Colón

M. en D. Antonio Pérez Martínez


Coordinador del Plantel Pedro Escobedo

C.P. Gloria Inés Rendón García


Coordinadora del Plantel Pinal de Amoles

M. en A. Óscar Uriel Cárdenas Rosas


Coordinador del Plantel Bicentenario

M. en LIT. José Cupertino Ramírez Zúñiga


Coordinador del Plantel Amazcala

Ing. Juan Fernando Rocha Mier


Coordinador del Plantel Concá

M. en A. Hugo Enrique Suárez Camacho


Coordinador del Plantel Jalpan

Mtra. María de la Luz Ruiz Maqueda


Coordinadora del Plantel Amealco

M. en A. José Antonio Cárdenas Rosas


Coordinador del Bachillerato Semiescolarizado
Autores

EDICIÓN 2021-1 :

Mtra. Maribel Villegas Villegas

Mtro. Leticia García Sánchez

EDICIÓN 2022-1

Mtra. Georgina Infante Izaguirre

Mtra. Ellis Peñaloza Soberanes


UNIDAD I. ESTADÍSTICA

¡ Hola !

El siguiente documento es un material especialmente diseñado para estudiar las


medidas de tendencia central y dispersión para datos agrupados en una distribución
de frecuencias. Este recurso es útil cuando la cantidad de datos es mucha para tratarlos
de forma individual.
Cada vez, estás conociendo más sobre la estadística, la cual completa tu formación
como estudiante de bachiller y universitario.

Espero lo disfrutes.
¡Comencemos!
Bloque 1

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

En la sesión anterior vimos las medidas estadísticas más simples y útiles para interpretar
datos. Sin embargo esos datos aparecen en un listado, que si contiene muchos elementos
ya es difícil de operar, sobre todos sin ayuda de programas como Excel. Hoy veremos que
es posible calcular de forma aproximada las medidas de tendencia central y dispersión si
los datos se encuentran agrupados, es decir, en una distribución de frecuencias.

Recomendamos ir haciendo un formulario para que sea fácil identificar de cada problema
la fórmula que debe utilizarse.

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

Muchas veces tendremos una gran cantidad de datos para una variable cuantitativa, por
lo que se requiere agrupar los valores de la variable en intervalos, principalmente si la
variable es continua. Establecemos una tabla de frecuencias en donde los valores de la
variable ahora están en intervalos del mismo tamaño, por supuesto tendremos la columna
de frecuencias, y agregaremos la columna para escribir “la marca de clase” en cada
intervalo, este valor lo usaremos para calcular las medidas de tendencia central, así como
las de dispersión.

Las medidas de tendencia central para datos agrupados son la media aproximada, la
mediana aproximada y la moda aproximada. Se dice que son aproximadas porque no se
utilizan cada uno de los datos para su cálculo, sino la información de la distribución de
frecuencias, por lo que las medidas pueden variar un poco. Algunas veces se desconocen
los valores “en bruto”, cada una de las observaciones que se obtienen en un estudio
estadístico, y se conoce sólo la tabla de frecuencia, de aquí la necesidad de trabajar los
datos agrupados.
La media para datos agrupados

La media se obtiene al sumar todos los productos de la frecuencia por la marca de clase
y dividir entre el total de datos, es decir:

En esta fórmula:

𝑓! representa la frecuencia absoluta de la clase i

𝑥! representa la marca de la clase i, 𝑥! es el punto medio en cada intervalo.


Σ Significa sumatoria de todos los valores, desde el primero hasta el n-ésimo.
n es el número de datos en la muestra.

La mediana para datos agrupados

La mediana para datos agrupados sigue el mismo concepto que para datos no agrupados,
es decir, se hace referencia a la ubicación del valor que se encuentra en la posición central
del conjunto de datos. Al tener datos ubicados en intervalos o clases, se hace una
aproximación mediante la fórmula que se muestra. Para utilizarla adecuadamente, es
necesario ubicar la clase mediana, así se denomina, a la clase que puede contener al valor
central.

"#$
Utilizamos la fórmula %
, para identificar el valor central y apoyados de la frecuencia

acumulada identificamos cual es la clase mediana o la clase que contiene a la mediana.

Para obtener la mediana de una distribución de frecuencias se puede utilizar la siguiente


fórmula:

𝐿í𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑛 𝐴𝑛𝑐ℎ𝑜 𝑑𝑒𝑙


− 𝐹𝑟𝑒𝑐 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝐶𝑙𝑎𝑠𝑒 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 + 2 ;𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 ?
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝐶𝑙𝑎𝑠𝑒 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎
La moda para datos agrupados

Finalmente, la moda para datos agrupados, esta ubicada en la clase (o clases) con el mayor
conjunto de datos. Para utilizar adecuadamente la fórmula que se presenta, es necesario,
ubicar la clase modal, que resulta ser la clase (o clases) con el mayor número de datos.

𝑀𝑜𝑑𝑎
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
𝐿í𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 − 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎
𝐴𝑛𝑐ℎ𝑜 𝑑𝑒𝑙
+ 𝑚𝑜𝑑𝑎𝑙 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
= 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎 ;𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 ?
𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 2 ; 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 ? − 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 − 𝑐𝑙𝑎𝑠𝑒 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎 𝐶𝑙𝑎𝑠𝑒 𝑀𝑜𝑑𝑎𝑙
𝑚𝑜𝑑𝑎𝑙 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙

Ejemplo 1. La siguiente tabla muestra los resultados del examen final de estadística
presentado por un grupo de estudiantes de bachillerato:
Marca
Límite Límite de Frecuencia Frecuencia
Clase 𝒇𝒊 × 𝒙𝒊
Inferior Superior Clase 𝒇𝒊 Acumulada
𝒙𝒊
1 50 60 55 9 9 495
2 60 70 65 5 14 325
3 70 80 75 10 24 750
4 80 90 85 3 27 255
5 90 100 95 8 35 760
Suma 35 2,585

La media.

Iniciamos el calculo de la media:

'()))#)(+))#$,(-))#.(/))#/(')) %,)/)
𝑥̅& = .)
= .)
= 73.86 ;

𝑥̅& = 73.86 representa la calificación promedio.


La mediana
"#$
Empezamos ubicando la clase mediana, con la fórmula %
, recuerda que estamos

buscando una aproximación del valor central según los datos de la tabla de distribución
de frecuencias.

"#$ .)#$ .+
Posición de la mediana: %
= %
= %
= 18.

En la columna de la frecuencia acumulada, buscamos en que clase se ubica el dato No.


18:

Marca
Límite Límite de Frecuencia Frecuencia
Clase 𝒇𝒊 × 𝒙𝒊
Clase Inferior Superior Clase 𝒇𝒊 Acumulada
𝒙𝒊
Mediana: 3
1 50 60 55 9 9 495
2 60 70 65 5 14 325
3 70 80 75 10 24 750
4 80 90 85 3 27 255
5 90 100 95 8 35 760
Suma 35 2,585

Ahora, la clase 3 se convierte en la clase mediana, ya que en ella se ubica el dato 18, y
utilizamos los datos proporcionados para realizar los cálculos:

𝐿í𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑛 𝐴𝑛𝑐ℎ𝑜 𝑑𝑒𝑙


− 𝐹𝑟𝑒𝑐 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝐶𝑙𝑎𝑠𝑒 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝑀𝑒𝑑𝑖𝑎𝑛𝑎 = 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 + 2 ;𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 ?
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒 𝑀𝑒𝑑𝑖𝑎𝑛𝑎 𝐶𝑙𝑎𝑠𝑒 𝑀𝑒𝑑𝑖𝑎𝑛𝑎
𝑐𝑙𝑎𝑠𝑒 𝑚𝑒𝑑𝑖𝑎𝑛𝑎

35
− 14 3.5
= 70 + 2 (10) = 70 + (10) = 73.5
10 10
La moda

Para determinar el valor de la moda, iniciaremos identificando la clase o intervalo con


mayor frecuencia, ya que hay que recordar que la moda es justo el conjunto de valores
con mayor frecuencia.

En este ejemplo, se trata de la clase 3, ya que es la más abundante con una frecuencia de
10 calificaciones.

Marca
Límite Límite de Frecuencia Frecuencia
Clase 𝒇𝒊 × 𝒙𝒊
Clase Inferior Superior Clase 𝒇𝒊 Acumulada
𝒙𝒊
Modal: 3
1 50 60 55 9 9 495
2 60 70 65 5 14 325
3 70 80 75 10 24 750
4 80 90 85 3 27 255
5 90 100 95 8 35 760
Suma 35 2,585

Sustituimos los valores en la fórmula y realizamos los cálculos para determinar una
aproximación de la moda:

𝑀𝑜𝑑𝑎
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎
𝐿í𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 − 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎
𝐴𝑛𝑐ℎ𝑜 𝑑𝑒𝑙
= 𝑒𝑥𝑎𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 + 𝑚𝑜𝑑𝑎𝑙 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙
;𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑙𝑎 ?
𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑎
𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 2 ; 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑒 ? − 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎 𝑙𝑎 − 𝑐𝑙𝑎𝑠𝑒 𝑠𝑖𝑔𝑢𝑖𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎 𝐶𝑙𝑎𝑠𝑒 𝑀𝑜𝑑𝑎𝑙
𝑚𝑜𝑑𝑎𝑙 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙 𝑐𝑙𝑎𝑠𝑒 𝑚𝑜𝑑𝑎𝑙

10 − 5 5 5
= 70 + (10) = 70 + (10) = 70 + (10) = 70 + 0.42(10) = 74.2
2(10) − 5 − 3 20 − 8 12

Interpretación:

• La calificación promedio en el examen de estadística es 73.86.


• La moda es de 74.2.
• Aproximadamente el 50% de los jóvenes obtuvo una calificación de 73.5 en su
examen y que existe un ligero sesgo en la distribución.
El sesgo
El sesgo describe cómo es la distribución de los datos, ya que indica hacia dónde tienden
a concentrarse éstos. Una distribución puede ser:

• Simétrica, si la mayor concentración de datos se localiza en el centro de la


distribución. Mediana=Media=Moda.
• Sesgada a la derecha, si la mayor concentración de datos está a la izquierda de la
distribución. Media> Mediana> Moda
• Sesgada a la izquierda, si la mayoría de los datos están concentrados a la derecha.
Media < Mediana < Moda

Bloque 2

MEDIDAS DE DISPERSIÓN PARA DATOS AGRUPADOS

Las medidas de dispersión: rango, varianza y desviación estándar también pueden


calcularse para tablas de distribución de frecuencia, es decir, datos agrupados.

El Rango

El rango o amplitud se calcula igual que para datos no agrupados.

𝑅𝑎𝑛𝑔𝑜 = 𝐷𝑎𝑡𝑜 𝑀á𝑥𝑖𝑚𝑜 − 𝐷𝑎𝑡𝑜 𝑀í𝑛𝑖𝑚𝑜

La varianza muestral

Para calcular la varianza de la muestra se usa la siguiente fórmula. Una


Donde

𝑥! es la marca de clase i.

𝑓! es la frecuencia absoluta de clase i


999
𝑥& es la media aproximada.
n es el tamaño de la muestra (número de observaciones).

La desviación estándar aproximada

Para calcular la desviación estándar aproximada de la muestra, se obtiene


la raíz cuadrada de la varianza, es decir:

Ejemplo 2. Calcula las medidas de dispersión de la tabla de frecuencias anterior.

Puntaje Frecuencia Absoluta Marca de clase


1-4 3 2.5
5-8 5 6.5
9-12 3 10.5
13-16 1 14.5
17-20 1 18.5

El Rango.

𝑥1&2 = 20 𝑥1!" = 1 𝑅 = 20 − 1 𝑅 = 19
La varianza.

La media aritmética aproximada se calculó y resulta:

999
𝑥& = 8.03

Por lo tanto la varianza será.

>3(2.5% ) + 5(6.5% ) + 3(10.5% ) + 1(14.5% ) + 1(18.5% )D − 13(8.03% )


𝑠& % =
13 − 1

(18.75 + 211.25 + 330.75 + 210.25 + 342.25) − 838.25


𝑠& % =
13 − 1

1113.25 − 838.25
𝑠& % =
12

275
𝑠& % =
12

𝑠& % = 22.91

La desviación estándar.

Se calcula como la raíz cuadrada de la varianza:

𝑠& = √22.91

𝑠 = 4.78
Bloque 3

MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN PARA DATOS


AGRUPADOS: EJEMPLOS

Ejemplo 3. La siguiente distribución de frecuencias muestra el ingreso mensual en pesos


de 22 trabajadores de una empresa comercial, determina las medidas de tendencia central
y dispersión. Interprétalas.

La tabla de distribución de frecuencias ya contiene los intervalos correspondientes a los


límites inferior y superior de cada clase; así como la frecuencia absoluta.

La media.

Para calcular la media aproximada debes encontrar primero la marca de clase 𝑥! como el
promedio de ambos límites y colocarlos en la tabla.

Para facilitar el cálculo de la media, se recomienda colocar otra columna correspondiente


a la multiplicación de la marca de clase y la frecuencia absoluta.
𝑓$ 𝑓$ 𝑥$
𝑥$

.% 4,,#%% ,,,#%, /,,#$/ ,,,#+/,,


𝑥
999
& = %%

100 000
𝑥
999
& = %%
; 999
𝑥& = $ 4,545.45

El Rango o amplitud.

En una tabla de frecuencias con clases, el valor máximo es el límite superior de la última
clase y el valor mínimo es el límite inferior de la primera clase. Por lo tanto:

𝑥1&2 = 7200 𝑥1!" = 3200 𝑅 = 7200 − 3200

𝑅 = $4,000
La varianza.

Para calcular la varianza se recomienda agregar una columna a la tabla donde se calcule
𝑥! % y otra columna con 𝑓! 𝑥! % de cada clase.

𝑓$
𝑥$

Tomando los valores de la última columna de la tabla, y el valor 999


𝑥& = $ 4,545.45

(116640000 + 96800000 + 108160000 + 108000000 + 46240000) − 22(4,545.45# )


𝑠" # =
22 − 1

475,840,000 − 22(20661115.7)
𝑠& % =
21

21,295,455
𝑠& % =
21

𝑠& % = 1,014,069.26
La desviación estándar.

Se calcula como la raíz cuadrada de la varianza:

𝑠" = 4 1,014,069.26

𝑠 = $1,007

Como la unidad es en pesos se redondea el cálculo a enteros.

Interpretación

• El salario promedio de un trabajador al mes es de $4,545 MXN.


• La cantidad típica de salario de un trabajador es de $3,600 MXN.
• El 50% de los trabajadores gana más (menos) de $4,400 MXN .
• Es una distribución sesgada a la derecha.
• La diferencia entre la persona que más gana y la que menos es de $4,000MXN.
• La dispersión del salario respecto a la media es de +- $1,007 MXN

*Para calcular la varianza también se puede hacer con otra fórmula conocida como

Donde es el número de datos.

Si la varianza se calcula así, se debe agregar una sola columna a la tabla para calcular
𝑥& % que es a cada marca de clase restarle la media aproximada y luego elevar al
(𝑥! − 999)
cuadrado.

Cualquiera de las dos fórmulas para varianza es correcta.


Actividad Semana 4

En cada uno de los ejercicios encuentra las medidas de tendencia central, las medidas de
dispersión e interprétalas. Realiza la tabla de distribución completa y los cálculos en hojas
aparte.

1. La tabla estadística que a continuación se muestra, resume las estaturas de todos


los alumnos de un grupo de quinto semestre:

2. La siguiente tabla estadística muestra, en forma resumida, las edades de alumnos


de bachillerato:

3. Los datos siguientes muestran de forma resumida en una distribución de


frecuencias absolutas, el tiempo en horas que invierten los 21 empleados del taller
de ensamblado de una fábrica de motores para tracto-camiones.
¡Muy bien!

Has llegado al final de la sesión, recuerda que las medidas estadísticas también pueden
ser obtenidas de las tablas de frecuencia, solo debes tener cuidado en no equivocarte en
ningún cálculo y utilizar la fórmula correcta.
Ahora estás list@ para probar lo que has aprendido con el Quiz.
¡Hasta Pronto!

Si quieres saber más sobre este tema puedes ver estos videos:
https://www.youtube.com/watch?v=5bZXpfxwHqk

https://www.youtube.com/watch?v=1myBo87lYyU

https://www.youtube.com/watch?v=KsVQygSlf4k
Bibliografía

Banegas, A. L. (2012). Probabilidad y estadística. Enfoque por competencias. México: MCGRAW


HILL; INTERAMERICANA EDITORES S.A. DE C.V.

Colegio de Bachilleres del Estado de Sonora . (2016). Probabilidad y estadística 1. México:


Reforma Integral de la Educación Media Superior.

Matemáticas profe Alex. (1 de Marzo de 2017). Media, mediana y moda | Datos agrupados en
intervalos Ejemplo 1. [Obtenido de video] Recuperado de
https://www.youtube.com/watch?v=5bZXpfxwHqk

Matemáticas profe Alex. (15 de Junio de 2017). Varianza, Desviación Estándar y Coeficiente de
Variación | Datos agrupados en intervalos. [Obtenido de video] Recuperado de
https://www.youtube.com/watch?v=1myBo87lYyU

Matemóvil. (14 de Noviembre de 2019). Rango, varianza, desviación estándar, coeficiente de


variación, desviación media: datos no agrupados. [Obtenido de video] Recuperado de
https://www.youtube.com/watch?v=KsVQygSlf4k&t=881s

También podría gustarte