Está en la página 1de 30

ESTADÍSTICA

DESCRIPTIVA
CÁLCULOS DE MEDIDAS
DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS

F.P.: I.Q. IGNACIO ROSALES ORTIZ


MEDIDAS DE TENDENCIA CENTRAL
PARA DATOS AGRUPADOS
 Al igual que en la distribución de los datos no agrupados,
tenemos la moda, la mediana y el promedio; pero ahora, las
medidas de tendencia central en algunas de ellas cambiaran
de nombre; se llamaran:
CLASE MODAL: La clase que más se repite, es la clase donde se
encuentra la mayor frecuencia. Puede haber como en el caso anterior,
dos o más modas, llamándose clase bimodal o multimodal, según sea
el caso.
MEDIANA: Es el dato que se encuentra exactamente a la mitad de los
datos proporcionados en forma ordenada.
MEDIA: Es también conocido como PROMEDIO (también es conocida
como Media Aritmética, -no confundirla con la media geométrica-).
Ahora, en este tipo de arreglo estadístico se ocupa cuando tenemos
variables involucradas en gran cantidad, y además
cuando el Rango de distribución de los datos es muy
grande. Con esto logramos síntesis e
información.
Ejercicio:
 De la producción diaria de una máquina se eligió una
muestra de 100 baterías que se probaron para ver
cuánto tiempo operarían en una lámpara . Los
resultados fueron los siguientes:
◦ NOTA: El tiempo se midió en horas.
228 214 230 247 233 221 217 222 231 220
236 216 213 222 234 227 211 217 243 241
231 239 248 240 241 211 220 223 227 229
212 212 232 243 235 231 240 231 217 229
217 214 219 223 246 240 227 228 231 235
220 217 239 242 241 250 230 217 246 231
211 233 236 237 219 217 222 236 247 217
249 216 237 243 242 241 222 217 219 220
235 217 225 236 239 230 240 236 236 238
223 223 213 216 246 240 222 223 221 239
PRIMEROS CÁLCULOS
 Los primeros cálculos para agrupar los datos y
realizar la tabla de distribución de frecuencias,
son:
◦ 1º) El RANGO, R: También se conoce como RECORRIDO.
Es una forma de medir la variación en un conjunto de
valores. Se calcula tomando el dato mayor y el dato
menor, y se le saca su diferencia. Es decir:

R = D. mayor – D. menor

Nos vamos a nuestros datos, y buscamos


elEn nuestro
dato ejercicio,
que tenga será: de
la mayor magnitud
los números dados, y ése será el DATO
MAYOR; y también, buscamos el de R =Por
250 – 211
tanto, = 39
el rango que
menor magnitud, y ése será el DATO tenemos es de 39 unidades
MENOR. Y aplicamos la fórmula.
◦ 2º) El NÚMERO DE INTERVALOS DE CLASE, i: Se puede
calcular de dos maneras:
 La primera es, utilizando la Regla de Sturges, que consiste en:
k = 1 + 3.322 (log10 n)
o Donde, k, es el número de intervalos de clase y n, el número
de datos.
 La segunda es, calculando por: √n , donde n es el número de
datos.
o Para nuestro ejercicio, utilizaremos la segunda por razones
prácticas.

NOTA: Los dos métodos nos dan un acercamiento ante la


distribución a realizar. Si después de hacer las operaciones, nos
sobran datos por ejemplo, pues aumentamos el número de
intervalos, es decir, ajustamos de acuerdo a nuestras
necesidades.
Como tenemos 100
En nuestro ejercicio es: datos, le sacamos la raíz
cuadrada y obtenemos 10
√100 = 10 intervalos de clase
◦ 3º) La AMPLITUD DE CLASE, A.c. (vamos a simbolizarla
así): Ésta se calcula dividiendo el Rango entre el número
de intervalo de clase; es decir:
Sustituimos
A.c. = R / i los valores ya
encontrados
Para nuestro ejercicio, será: en la fórmula
y tenemos:
A.c. = 39 = 3.9 ≈ 4
10

Con esto, ya podemos empezar a trabajar en nuestra tabla


de distribución de frecuencias.
Tabla de Distribución de frecuencias
 Para trabajar estos datos lo haremos llenando
una tabla de distribución de frecuencias, para
obtener los resultados e interpretarlos. Ésta
consiste en:: Frecuencia
Frecuencia relativa
acumulada: Es el ir
Marca de absoluta: sumando todos los
Frecuencia
clase, es Es el Frecuencia datos para
Límite relativa: Es
el número de absoluta corroborar la
real de el dato de
promedio veces con acumulada cantidad de datos
Clase, clase, la la
de los que los : Es el ir dados, nos tiene
que intención frecuencia
Número números valores que dar el 100% o la
es tener sumando absoluta,
de consta de que tiene unidad.
datos sin que consta todos los representan
intervalo un dato la clase,
dejar el datos para do en
inferior y entre el Es el producto
espacios intervalo corroborar forma
un límite entre la
entre se la cantidad porcentual
superior inferior y frecuencia
dato y encuentre de datos (o decimal).
el repetido. dados. absoluta y el
dato dato en
superior
cuestión.

i Clase L.R.C. Xi fi f. ac. f. rel. f. rel. xi (fi)


(%) ac. (%)
 Procedamos al llenado de la tabla de distribución de frecuencias.
 Comenzamos a calcular LA
EstaCLASE.
la calcularemos de la siguiente manera:
* Como ya hicimos los cálculos acerca de la
El número i Clase Amplitud de clase, que nos arrojó el valor de
de
intervalos,
1 211 - 214 4.
lo 2 215 - 218 * Ahora, vamos a contar las primeras cuatro
ponemos cantidades de nuestros resultados, a saber:
de 3 219 – 222
211, 212, 213 y 214.
acuerdo a
las 4 223 – 226 • Lo vamos a representar como: 211 – 214; y
operacion 5 227 – 230 lo colocamos en la primera celda de nuestra
es clase.
primeras, 6 231 – 234
• NOTA: No caigamos en el error de decir:
cuando
aplicamos 7 235 – 238 211 + 4 = 215; y ponemos de 211 – 215.
la regla de
8 239 – 242
Esto es un error, porque aquí ya hay 5 y no 4
Sturges o datos.
por medio 9 243 – 246
de la raíz
• En todo caso, lo que podemos hacer sería:
cuadrada; 10 247 - 250 211 + 4 – 1 = 214; y llegamos al resultado.
que nos • Una vez que ya tenemos el primero,
resultó en
nuestro
continuamos con el siguiente número, que
ejercicio es el 215 y si hacemos lo anterior,
de 10. tenderíamos: 215 + 4 – 1= 218; y sería 215
– 218.
• Y así sucesivamente, hasta completar la
 Ahora calcularemos los Límites Reales de Clase (L.R.C.).
 Para esto, debemos identificar el LÍMITE INFERIOR DE CLASE (L.I.C) y el LÍMITE

SUPERIOR DE CLASE (L.S.C.). Lo podemos representar como:


XL – Xs
Donde:
XL : Es el Límite Inferior de Clase
XS : Es el Límite Superior de Clase

Ahora, una vez identificados, pasamos a calcular los L.R.C., haremos lo siguiente:
Tomamos el L.I.C. y tomamos el número anterior a él, y los promediamos. Es decir:

En nuestro ejemplo, tenemos como L.I.C. en el intervalo 1: 211 y el número


anterior a él, es 210. Así, por tanto, el Límite Real Inferior de Clase (L.R.I.C.), será:

L.R.I.C. = 210 + 211 = 421 = 210.5


2 2
Y Para calcular el Límite Real Superior de Clase (L.R.S.C.), se hace lo mismo; pero
ahora, tomamos el Límite Superior de Clase que, en nuestro ejemplo es 214, y ahora
tomamos el número posterior a él, que es 215, y de igual manera los promediamos y
obtenemos el L.R.S.C.:

L.R.S.C. = 214 + 215 = 429 = 214.5


2 2
Nos queda, por tanto, la tabla de distribución de frecuencias:
210 + 211 = 421 = 210.5
2 2

i Clase L.R.C. 214 + 215 = 429 = 214.5


2 2
1 211 - 214 210.5 – 214.5

2 215 - 218 214.5 – 218.5 214 + 215 = 429 = 214.5


2 2
3 219 – 222 218.5 – 222.5
218 + 219 = 437 = 218.5
4 223 – 226 222.5 – 226.5 2 2

5 227 – 230 226.5 – 230.5


218 + 219 = 437 = 218.5
6 231 – 234 230.5 – 234.5 2 2

7 235 – 238 234.5 – 238.5 222 + 223 = 445 = 222.5


2 2
8 239 – 242 238.5 – 242.5

9 243 – 246 242.5 – 246.5


Esto se realiza para tener
10 247 - 250 246.5 – 250.5
datos en forma consecutiva,
para que a la hora de graficar,
Y seguimos teniendo de tengamos en caso del
amplitud de clase = 4. Por Histograma barras
tanto, no se han alterado las consecutivas y no separadas
operaciones.
 Ahora, calcularemos la Marca de Clase, Xi.
 La tabla queda así: Para calcular, la marca de clase,
hacemos lo siguiente:
i Clase L.R.C. Xi Tomamos los Límites de Clase,
1 211 - 214 210.5 – 214.5 212.5 tanto el Inferior como el Superior y
2 215 - 218 214.5 – 218.5 216.5 los promediamos, y de esa manera
encontramos la marca de clase. Es
3 219 – 222 218.5 – 222.5 220.5
decir:
4 223 – 226 222.5 – 226.5 224.5 En el intervalo 1, tenemos 211
5 227 – 230 226.5 – 230.5 228.5
(como L.I.C.) y 214 (como L.S.C.);
los sumamos y los dividimos entre
6 231 – 234 230.5 – 234.5 232.5
2:
7 235 – 238 234.5 – 238.5 236.5

239 – 242 238.5 – 242.5 240.5


X1 = 211 + 214 = 425 = 212.5
8
2 2
9 243 – 246 242.5 – 246.5 244.5
Para el intervalo 2, tenemos:
10 247 - 250 246.5 – 250.5 248.5
X2 = 215 + 218 = 433 = 216.5
2 2
Y así, sucesivamente hasta
completar los datos.
 Ahora vamos a calcular la frecuencia absoluta, fi.
 1º) Vamos a identificar los eventos (los datos) que están dentro del rango
de la clase y los colocamos en nuestra columna que le llamamos, fi.
 2º) Contamos cuantas veces se repiten los eventos, en este caso son
números.

Regreso a mis resultados


i Clase L.R.C. Xi fi
obtenidos y empiezo a
1 211 - 214 210.5 – 214.5 212.5
contar cuántos números del
2 215 - 218 214.5 – 218.5 216.5 211 al 214 encuentro ( es
219 – 222 218.5 – 222.5 220.5
decir, veo cuántos 211, 212,
3
213 y 214 hay, los junto y
4 223 – 226 222.5 – 226.5 224.5
esa va a ser la fi del primer
5 227 – 230 226.5 – 230.5 228.5 intervalo) y coloco esa
231 – 234 230.5 – 234.5 232.5
cantidad en la primera
6
celda; luego cuento cuantos
7 235 – 238 234.5 – 238.5 236.5 215 al 218 y lo pongo en la
8 239 – 242 238.5 – 242.5 240.5 segunda celda, y así
sucesivamente hasta
9 243 – 246 242.5 – 246.5 244.5
terminar de contar todos los
10 247 - 250 246.5 – 250.5 248.5 datos. Así empiezo a vaciar
los resultados en la tabla.
Una forma de resolver el problema sería de
la siguiente manera, reconocer todos los
datos de una clase (los identifico de un
color) y los sumo; colocando el dato en la
celda correspondiente al intervalo de clase al
cual estamos trabajando y así hacerlo con
cada una de las clases. O se puede ocupar
otro recurso para diferenciar y agrupar, ya
sea tachando con alguna figura, una cruz los
de un intervalo, con un círculo los de otro
intervalo, etc.
 Quedándonos así la tabla de distribución de
frecuencias, hasta el momento:

i Clase L.R.C. Xi fi
1 211 - 214 210.5 – 214.5 212.5 9

2 215 - 218 214.5 – 218.5 216.5 13

3 219 – 222 218.5 – 222.5 220.5 16

4 223 – 226 222.5 – 226.5 224.5 4

5 227 – 230 226.5 – 230.5 228.5 10

6 231 – 234 230.5 – 234.5 232.5 10

7 235 – 238 234.5 – 238.5 236.5 11

8 239 – 242 238.5 – 242.5 240.5 19

9 243 – 246 242.5 – 246.5 244.5 5

10 247 - 250 246.5 – 250.5 248.5 3


 A partir de estos cálculos que vamos a realizar, serán de la misma manera
como los hicimos con los datos no agrupados.
 Una vez que tenemos estos datos, pasamos a corroborar nuestros datos con la
frecuencia acumulada, además también nos es útil para verificar hacia donde
vamos a encontrar la mediana.

i fi f. ac. Para esto, tomamos el primer


término de la frecuencia
1 9 9
absoluta, lo copiamos y lo
2 13
=22 ponemos en la primera celda de
=38 la columna de la frecuencia
3 16 acumulada de nuestra tabla,
4 4 42 después sumamos ese número
con el siguiente de la segunda
5 10 52 frecuencia absoluta y lo
ponemos en la segunda celda de
6 10 62 la frecuencia acumulada y así
7 11 73 sucesivamente, en la última
debemos obtener el número
8 19 92 total de datos.
9 5 97
 Quedándonos así la tabla de distribución de
frecuencias, hasta el momento:

i Clase L.R.C. Xi fi f.ac.


1 211 - 214 210.5 – 214.5 212.5 9 9

2 215 - 218 214.5 – 218.5 216.5 13 22

3 219 – 222 218.5 – 222.5 220.5 16 38

4 223 – 226 222.5 – 226.5 224.5 4 42

5 227 – 230 226.5 – 230.5 228.5 10 52

6 231 – 234 230.5 – 234.5 232.5 10 62

7 235 – 238 234.5 – 238.5 236.5 11 73

8 239 – 242 238.5 – 242.5 240.5 19 92

9 243 – 246 242.5 – 246.5 244.5 5 97

10 247 - 250 246.5 – 250.5 248.5 3 100


 Ahora, calculamos la frecuencia relativa, como lo hicimos en Datos no agrupados:

F. rel (%) = fi . (100%)


Σfi

 Quedándonos de la siguiente manera:


F. rel (%) = 9 (100%) = 9.0 %
xi fi f. ac. f. rel. % 100
F. rel (%) = 13 (100%) = 13.0 %
1 9 9 9.0 100
F. rel (%) = 16 (100%) = 16.0 %
2 13 22 13.0 100
F. rel (%) = 4 (100%) = 4.0 %
3 16 38 16.0 100
F. rel (%) = 10 (100%) = 10.0 %
4 4 42 4.0 100
F. rel (%) = 10 (100%) = 10.0 %
5 10 52 10.0 100
F. rel (%) = 11 (100%) = 11.0 %
6 10 62 10.0 100
F. rel (%) = 19 (100%) = 19.0 %
7 11 73 11.0
100
F. rel (%) = 5 (100%) = 5.0 %
8 19 92 19.0
100
9 5 97 5.0 F. rel (%) = 3 (100%) = 3.0 %
100
10 3 100 3.0
 Pasamos a la penúltima columna, para el cálculo de la frecuencia
relativa acumulada, vamos hacer lo mismo que hicimos en la
frecuencia absoluta acumulada, nada más que ahora la suma nos
tiene que dar 100% (o cercano a 100%, por los decimales tomados, -
o si lo tomamos en decimales el total debe ser 1 o cercano a 1-):

xi fi f. ac. f. rel. % f.rel.ac. %

1 9 9 9.0 9.0
2 13 22 13.0 22.0
¡Lo
3 16 38 16.0 38.0 hicimos!

4 4 42 4.0 42.0
5 10 52 10.0 52.0
6 10 62 10.0 62.0
7 11 73 11.0 73.0
8 19 92 19.0 92.0
9 5 97 5.0 97.0
100 %
10 3 100 3.0 100.0
 Quedándonos así la tabla de distribución de frecuencias, hasta
el momento:
i Clase L.R.C. Xi fi f.ac. f. rel. % f.rel.ac. %
1 211 - 214 210.5 – 214.5 212.5 9 9 9.0 9.0

2 215 - 218 214.5 – 218.5 216.5 13 22 13.0 22.0

3 219 – 222 218.5 – 222.5 220.5 16 38 16.0 38.0

4 223 – 226 222.5 – 226.5 224.5 4 42 4.0 42.0

5 227 – 230 226.5 – 230.5 228.5 10 52 10.0 52.0

6 231 – 234 230.5 – 234.5 232.5 10 62 10.0 62.0

7 235 – 238 234.5 – 238.5 236.5 11 73 11.0 73.0

8 239 – 242 238.5 – 242.5 240.5 19 92 19.0 92.0

9 243 – 246 242.5 – 246.5 244.5 5 97 5.0 97.0

10 247 - 250 246.5 – 250.5 248.5 3 100 3.0 100.0


 Por último, pasamos a la última celda, que corresponde a la multiplicación de la marca de clase,
Xi, por la frecuencia absoluta, fi, (tengan cuidado, no se vayan a equivocar con la acumulada).
 Es decir:

i Xi fi Xi(fi)
Aquí vamos a multiplicar Xi
1 212.5 9 1912.5 (fi), es decir:
2 216.5 13 2814.5 212.5(9) = 1912.5
216.5(13) = 2814.5
3 220.5 16 3528 220.5(16) = 3528
.
4 224.5 4 898
.
5 228.5 10 2285 .
Hasta el último: 248.5(3) =
6 232.5 10 2325 745.5
7 236.5 11 2601.5 Una vez, hecho esto, sumo
la columna y pongo el valor
8 240.5 19 4569.5 de la suma en la celda de
abajo.
9 244.5 5 1222.5
Quedándonos así:
10 248.5 3 745.5
22905
 Quedándonos así la tabla de
distribución de frecuencias:

i Clase L.R.C. Xi fi f.ac. f. rel. % f.rel.ac. % Xi(fi)


1 211 - 214 210.5 – 214.5 212.5 9 9 9.0 9.0 1912.5
2 215 - 218 214.5 – 218.5 216.5 13 22 13.0 22.0 2814.5
3 219 – 222 218.5 – 222.5 220.5 16 38 16.0 38.0 3528
4 223 – 226 222.5 – 226.5 224.5 4 42 4.0 42.0 898
5 227 – 230 226.5 – 230.5 228.5 10 52 10.0 52.0 2285
6 231 – 234 230.5 – 234.5 232.5 10 62 10.0 62.0 2325
7 235 – 238 234.5 – 238.5 236.5 11 73 11.0 73.0 2601.5
8 239 – 242 238.5 – 242.5 240.5 19 92 19.0 92.0 4569.5
9 243 – 246 242.5 – 246.5 244.5 5 97 5.0 97.0 1222.5
10 247 - 250 246.5 – 250.5 248.5 3 100 3.0 100.0 745.5
 ¿Para qué hacer este último cálculo?
◦ Es necesario, porque vamos a empezar a calcular las llamadas
“Medidas de Tendencia Central”, recordando: la Moda, la
Media, y la Mediana.
 Y de esta manera se facilitarán los cálculos.

CÁLCULO DE LA CLASE MODAL


 Para este dato (que es el más fácil de ubicar), ahora se llamará
Clase Modal, lo vamos a reconocer de la siguiente manera, nos
vamos a nuestra tabla de distribución de frecuencias, buscamos
el intervalo de clase que mayor frecuencia presente y ese es la
Clase Modal.
 En caso de haber dos datos que tengan la misma
moda, se llamará: clase bimodal (y así
sucesivamente).

 En nuestro ejercicio, la CLASE MODAL, será el intervalo de clase: 8,


que corresponde a 239 -242, por tener de frecuencia = 19.
CÁLCULO DE LA MEDIA
 Para el cálculo de la media, vamos a ocupar la siguiente
fórmula:
X = Σ Xi(fi)

Σfi o

◦ Para representar la media, se pone una “x testada”, o algunos


ponen la letra griega m. Nosotros ocuparemos la x.
 Regresamos a nuestra tabla de distribución de
frecuencias, nos dirigimos a la columna que tiene Xi(fi),
y vemos cuanto nos resultó la suma, y sustituimos los
valores en nuestra fórmula. Quedándonos así:

X = 22905 = 229.05 ¡Y esta es nuestra media o


promedio de los datos!
100 hrs
CÁLCULO DE LA MEDIANA
 Procedemos a realizar el último cálculo
correspondiente a las medidas de Tendencia Central,
la Mediana.
Algunos representan a la Mediana, como Me. Nosotros también
la utilizaremos.
Cuando se calcula la mediana, se supone que los
valores están distribuidos uniformemente en todo el
intervalo. Para ello vamos a recurrir a la frecuencia
acumulada.
Para esto, seguiremos los siguientes pasos:

1º) Localizamos el intervalo de clase donde se encuentra la llamada


Mediana Teórica, que es dividir el número total de datos por 2:Me t = n/2.

En nuestro ejercicio, será: 100 / 2 = 50


 Continuación de los pasos a seguir:

2º) Una vez calculada la mediana teórica, localizamos el intervalo donde se


encuentra este valor, lo vamos a buscar en la frecuencia acumulada de
nuestra Tabla de distribución de frecuencias.

En nuestro ejercicio, observamos que hasta el intervalo 4, se tiene una


frecuencia acumulada de 42, por tanto, en el intervalo 5, tenemos 52. Es
aquí, en este intervalo donde vamos a encontrar la mediana. Está entre la
clase 226.5 – 230.5, si se consideran los límites de clase verdaderos.

3º) ¿Qué tanto debemos avanzar en este intervalo antes de llegar a la


mediana? Debemos hacer lo siguiente: Restamos la Mediana teórica y la
frecuencia acumulada del intervalo anterior donde se encuentra la mediana;
y dividimos este valor por la frecuencia absoluta del intervalo donde se
encuentra la mediana.

En nuestro ejercicio, será: (50 – 42) / 10 = 8 /10 = 0.8

4º) Una vez, teniendo este valor lo vamos a multiplicar por la diferencia de la
clase (límite superior menos límite inferior de clase) y lo sumaremos al límite
inferior verdadero.
 Continuación de los pasos a seguir:
En general, la mediana puede calcularse a partir de datos agrupados
mediante la siguiente fórmula:

Mediana =
Mediana = Me
Me =
= Li
Li +
+ jj (Ls
(Ls –– Li)
Li)
fifi
Donde
Li = Límite inferior verdadero del intervalo que contiene a la mediana.
Ls = Límite superior verdadero del intervalo que contiene a la mediana.
j = Número de observaciones que aún faltan por alcanzar a la mediana una
vez que se ha alcanzado el límite inferior del intervalo que contiene a la
mediana
fi = Frecuencia del intervalo que contiene a la mediana.

En nuestro ejercicio, la mediana será entonces:

Me = 226.5 + 8 (230.5 – 226.5) = 226.5 + 0.8(4) = 226.5 + 3.2


10
Esta es la mediana de
Me = 229.7 nuestros datos agrupados
En Excel:
GRÁFICOS
 Ahora, ya teniendo los
datos lo vamos a presentar
en gráficos. Se puede
presentar la información
en:
◦ Un histograma,
◦ Un polígono de frecuencias
◦ Y un gráfico circular.
Va a depender de cómo queremos presentarla,
para una mejor, fácil y rápida comprensión de los
resultados.
En Excel, lo puedes hacer de la
siguiente manera:

También podría gustarte