Está en la página 1de 58

Universidad Nacional Mayor de San Marcos

(Universidad del Perú, DÉCANA DE AMÉRICA)

FACULTAD DE INGENIERÍA INDUSTRIAL


ACREDITADA INTERNACIONALMETE

DISTRIUCIÓN DE
FRECUENCIAS
Profesor: Jorge Esponda Véliz
Profesor: Jorge Esponda Véliz
DISTRIBUCIÓN DE FRECUENCIAS
En un estudio estadístico una vez que se recopilan los
datos del caso, es necesario clasificarlos y ordenarlos
antes de intentar su interpretación. Generalmente se
tienen números grandes de observaciones que se anotan
simplemente en el orden en que esas observaciones se
vayan haciendo. La clasificación adecuada de esas
observaciones es necesaria y de

gran importancia para poder llegar

a conclusiones mediante su análisis.


ELABORACIÓN DE UNA DISTRIBUCIÓN DE
FRECUENCIAS
Es el agrupamiento de datos en categorías que muestren
el número de observaciones en cada categoría
mutuamente excluyente.
EJEMPLO:
Se tiene las edades de 30 obreros
de una cierta compañía

28 34 43 30 47 38 34 40 31 33
42 33 42 39 30 32 47 37 32 35
41 35 37 33 39 34 32 43 40 38
SOLUCIÓN:
CALCULAMOS
: EL RANGO (R):
R = Máximo - Mínimo

La edad mínima es: 28 y la edad máxima es: 47.

Entonces el rango es: R = 47 – 28 = 19.

CALCULAMOS EL NÚMERO DE CLASES O

INTERVALOS (K):

Hay varios métodos para hallar el número de clases, estos son sólo una

sugerencia.

Primer método: Lnn 


K
Ln(2)
Donde “n” es el número total de datos. Para nuestro
ejemplo:
Ln 30  K=5
K   4.91
Ln( 2)

Segundo método:
K  1  3.322 * Log( n)
Para nuestro ejemplo por la fórmula de Sturges:

K  1  3.322 * Log( 30)  5.91 K=6

Tercer método: N K
n < 50 5a7
Este es una sugerencia
50 ≤ n < 100 6a7
de los expertos: 100 ≤ n <250 7 a 12
n ≥ 250 10 a 20
Cuarto método:
La experiencia profesional puede determinar el número de clases.

Demasiadas clases o muy pocas no podrían dar a conocer la forma

básica del conjunto de datos. Por regla general, es mejor no utilizar

menos de 5, ni más de 15 clases en la elaboración

de una distribución de frecuencias.

Quinto método:
También se puede utilizar la regla de “la potencia de 2” para

determinar el número de clase. Seleccionamos el número entero

más pequeño tal que 2^k ≥ n, donde “n” es el número total de

observaciones. Veamos una pequeña tabla con esta regla:


Nº total de observaciones Nº recomendado de clases K
9 – 16 4 24 = 16
17 – 32 5 25 = 32
33 – 64 6 26 = 64
65 – 128 7 27 = 128
129 – 256 8 28 = 256
257 – 512 9 29 = 512
513 – 1024 10 210 = 1024

Para nuestro ejemplo haremos caso del primer método, es decir:

K=5
CALCULANDO LA AMPLITUD DE INTERVALO (A):

La amplitud de una clase, se llama intervalos de clase.


Generalmente los intervalos de clase son de igual
amplitud. En este caso la amplitud de un intervalo de
clase es la diferencia entre dos marcas de clase
sucesivas, o límites superiores (o inferiores) de dos
clases sucesivas.
La amplitud de los intervalos de clase a tabular de un
determinado conjunto de datos, depende de la naturaleza
de esos datos y del uso que de ellos se piense hacer.
Si los intervalos son muy amplios contendrán
observaciones de magnitudes bastante variables, las
que estaremos considerando como un grupo
homogéneo, al hacer la distribución de frecuencias.
La fórmula para hallar la amplitud es:

R
A
Para nuestro caso: K
 19 
A 3.8
5

Tomaremos como nuestro intervalo como A=4


CONSTRUIR LOS LÍMITES DE CLASES:

Vemos que cada intervalo debe tener 4 números:

Entonces 28 + 4 -1 = 31. Contiene al 28, 29, 30 y 31.

Entonces las clases serán:

Límite Inferior Límite Superior


28 31
32 35
36 39
40 43
44 47
CALCULANDO LOS LÍMITES REALES:

Sumamos o restamos la mitad de la unidad de medida:

Es decir: ½ = 0.5.

Límites Límites Reales


Inferior Superior Inferior Superior
28 31 27.5 31.5
32 35 31.5 35.5
36 39 35.5 39.5
40 43 39.5 43.5
44 47 43.5 47.5
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo además punto medio, marca de clase o valor
central.

Límites Límites Reales Marca de Clase


Inferior Superior Inferior Superior ( Xi )
28 31 27.5 31.5 29.5
32 35 31.5 35.5 33.5
36 39 35.5 39.5 37.5
40 43 39.5 43.5 41.5
44 47 43.5 47.5 45.5
TABLA DE FRECUENCIA

Límites Límites Reales Marca de Clase Frecuencia


Inferior Superior Inferior Superior (Xi) (ni)
28 31 27.5 31.5 29.5 4
32 35 31.5 35.5 33.5 11
36 39 35.5 39.5 37.5 6
40 43 39.5 43.5 41.5 7
44 47 43.5 47.5 45.5 2
Puede resultar conveniente convertir las frecuencias
de clase a frecuencia de clase relativas para mostrar
el porcentaje del número total de observaciones en
cada clase.

Xi Marca de clase
ni Frecuencia absoluta
Ni Frecuencia absoluta acumulada
fi Frecuencia relativa
Fi Frecuencia relativa acumulada
Hallamos las frecuencias acumuladas y las frecuencias
relativas:
Límites Límites Reales
Xi ni Ni fi Fi
Li Ls Lri Lrs
27.5  31.5 4
28 31 27.5 31.5 29.5 4 4 0.13 0.13
2 30
31.5  35.5 11
32 35 31.5 35.5 33.5 11 15 0.37 0.50
2 30
27.5  31.5 6
36 39 35.5 39.5 2
37.5 6 21 0.20 0.70
30
39.5  43.5 7
40 43 39.5 43.5 2
41.5 7 28 0.23 0.93
30
43.5  47.5 2
44 47 43.5 47.5 2
45.5 2 30 0.07 1.00
30
EJEMPLO:
Tenemos el puntaje de un concurso de matemática en un

colegio, que participaron 170 estudiantes (la nota máxima

es 100 y la nota mínima es 0).


54.5 52.0 88.0 45.0 68.9 40.0 84.1 71.9 89.0 75.5
69.0 77.4 74.0 60.0 70.2 71.4 30.0 59.8 77.1 58.5
15.1 52.3 80.0 74.5 53.0 70.5 63.0 90.4 67.2 81.4
25.3 70.0 60.5 89.5 41.0 63.5 58.0 56.4 62.3 64.7
73.8 85.2 45.0 56.5 72.2 69.5 80.1 24.0 58.6 75.8
54.0 94.1 70.5 61.5 30.0 54.5 72.2 69.0 55.4 72.9
91.2 99.0 47.6 51.5 64.0 64.2 56.6 60.0 80.1 75.3
63.1 66.9 58.0 51.5 50.6 68.2 65.5 55.0 98.2 62.5
63.0 66.0 69.2 36.5 88.6 53.2 77.5 52.0 64.0 67.4
70.0 87.0 95.6 37.3 74.4 85.1 78.5 71.0 68.0 84.7
79.0 61.0 79.0 66.2 60.6 37.6 65.1 77.7 82.3 84.8
76.9 64.0 25.6 73.0 48.3 82.4 8.0 50.5 58.0 55.8
59.5 83.0 86.0 45.1 41.2 60.4 77.0 76.5 65.8 87.9
95.6 68.1 67.0 68.2 77.2 69.4 56.0 84.6 65.9 55.5
26.0 42.8 58.0 74.3 84.4 45.5 78.1 95.2 63.7 58.5
17.2 62.6 63.0 76.0 41.0 73.5 67.1 59.0 91.7 64.0
63.3 68.5 72.0 55.5 57.0 46.6 76.5 53.0 46.7 95.0
Vamos a organizar los datos en 3 pasos:

PASO 1: Estableceremos Intervalo de Clase


grupos más conocidos Limite Limite
Inferior Superior
como clases. En este 0 - 10
problema la primera clase 10 - 20
puede incluir a todos las 20 - 30
30 - 40
notas que estén entre 0 –
40 - 50
10, es decir las notas que
50 - 60
van de 0 hasta antes del 60 - 70
10 (no incluye el 10 pero 70 - 80
80 - 90
si incluye el 9.999).
90 - 100
PASO 2: Vamos a distribuir en clases las notas de los
estudiantes, sólo haremos las 7 primeras para mostrar
como se hace:

54.5 Pertenece a la clase de 50 – 60


52.0 Pertenece a la clase de 50 – 60
88.0 Pertenece a la clase de 80 – 90
45.0 Pertenece a la clase de 40 – 50
68.9 Pertenece a la clase de 60 – 70
40.0 Pertenece a la clase de 40 – 50
84.1 Pertenece a la clase de 80 – 90
PASO 3: Intervalo de Clase
Limite Limite Frecuencia
Contamos las Inferior Superior
notas que 0 - 10 1
pertenecen a cada 10 - 20 2
20 - 30 4
clase:
30 - 40 5
40 - 50 13
50 - 60 33
60 - 70 45
70 - 80 36
80 - 90 21
90 - 100 10
HALLANDO INTERVALO DE CLASE Y PUNTOS

MEDIOS DE CLASE:

En el ejemplo de las notas, hay 10 clases, todas con

intervalos de clases de 10 unidades y las marcas de clase

o puntos medios son sucesivamente 5, 15, 25, 35,…


CALCULANDO LAS FRECUENCIAS RELATIVAS:

Intervalo de Clase Frecuencia Frecuencia


Frecuencia Frecuencia
Limite Limite Xi Absoluta Relativa
Absoluta Relativa
Inferior Superior Acumulada Acumulada

0 10 5 1 1 0.0059 0.0059
10 20 15 2 3 0.0118 0.0177
20 30 25 4 7 0.0235 0.0412
30 40 35 5 12 0.0294 0.0706
40 50 45 13 25 0.0765 0.1471
50 60 55 33 58 0.1941 0.3412
60 70 65 45 103 0.2647 0.6059
70 80 75 36 139 0.2118 0.8177
80 90 85 21 160 0.1235 0.9412
90 100 95 10 170 0.0588 1
SUPONGAMOS: 0 – 25
En el ejemplo de las notas en vez de las 10 25 – 50
clases consideradas, tomáramos sólo las 4 50 – 75
siguientes: 75 – 100
Vemos que no estaríamos diferenciando entre
calificaciones como 50 y 74. Si los intervalos de clase son
muy pequeños (y por lo tanto el número de clases grande)
también tiene sus inconvenientes. Una distribución hecha
en esa forma, revelaría demasiado detalle para poder
obtener rápidamente una idea clara de los aspectos
importantes del estudio. Nótese, que esa es la razón por la
que el cuadro de los datos originales no se usa.
SUGERENCIAS PARA ELABORAR UNA

DISTRIBUCIÓN DE FRECUENCIAS

A continuación se presenta algunas pautas o guías:

Los intervalos de clase utilizados deben ser iguales.

Los intervalos de clase desiguales ofrecen problemas al

representar en forma gráfica la distribución. Sin

embargo, en algunos casos pueden ser necesarios

intervalos de clase desiguales para evitar un gran

número de clases vacías, o casi vacías.


EJEMPLO:
Veamos el ejemplo
Intervalo de Clase
de las notas de Frecuencia
Limite Inferior Limite Superior
otro concurso
0 - 10 0
de matemática en
10 - 20 2
donde participaron
1000 estudiantes: 20 - 30 3
30 - 40 15
40 - 50 90
50 - 60 220
60 - 70 350
70 - 80 200
80 - 90 100
90 - 100 20
Entonces vemos que las clases de 0-10, 10-20, 20-30, no hay

casi estudiantes. Entonces podemos juntar con la clase 30 -

40:
Intervalo de Clase
Limite Limite Frecuencia
Inferior Superior
0 - 40 20
40 - 50 90
50 - 60 220
60 - 70 350
70 - 80 200
80 - 90 100
90 - 100 20
Trate de evitar tener clases abiertas. Este
tipo de clases ocasiona problemas al hacer gráficos, y al

determinar ciertas medidas de tendencia

central y de dispersión.

EJEMPLO:

Los gastos de publicidad son un componente importante

en el costo de mercancías vendidas. A continuación se

presenta una distribución de frecuencias que muestran

los gastos de publicidad de 60 compañías productoras.


Número de compañías
Gasto de publicidad (millones de $)
(f)
Menos de 35 7
35 – 45 10
45 – 55 21
55 – 65 16
Más de 65 10
Total 64

Evite la superposición de límite de clases establecidas. No deben


utilizarse límites de clase como 10 – 20 y 20 – 30. Las clases
establecidas de esta manera no son mutuamente excluyentes, lo que
infringe la definición de distribución de frecuencias. Con la
superposición de clases no estaría claro dónde clasificar un valor de
20.

Estos son sólo para no complicarnos, como en el ejemplo anterior.


REPRESENTACIONES GRÁFICAS DE UNA
DISTRIBUCIÓN DE FRECUENCIAS

HISTOGRAMA:
Son barras verticales presentadas una a continuación de otra. Permite

presentar datos cuantitativos continuos. Es un gráfico muy utilizado.

Propiedades:

El ancho de cada columna es igual en todo el gráfico y representa la

amplitud de clase.

La altura está en función a la frecuencia de la clase.


Intervalo de Clase Punto
Frecuencia
Limite Inferior Limite Superior Medio
0 10 5 1
10 20 15 2
20 30 25 4
30 40 35 5
40 50 45 13
50 60 55 33
60 70 65 45
70 80 75 36
80 90 85 21
90 100 95 10
50
40
30
20
10
0
10 20 30 40 50 60 70 80 90 100
0 10 20 30 40 50 60 70 80 90
Serie1 1 2 4 5 13 33 45 36 21 10
POLÍGONOS DE FRECUENCIAS:
Es otra forma de conocer la distribución de los datos. Se
construye uniendo los puntos medios del lado superior
de las barras del histograma.

50

40
frecuencia

30

20

10

0
5 15 25 35 45 55 65 75 85 95
Notas
POLÍGONO DE FRECUENCIAS ACUMULADAS:

180
160
140
120
100
80
60
40
20
0
5 15 25 35 45 55 65 75 85 95
EJERCICIO 1:

Un conjunto de datos consta de 38 observaciones.

¿Cuántas clases recomendaría para la distribución de

frecuencias?
SOLUCIÓN:

Para esto tomaremos el quinto método:

entonces seria 2^5 < 38 < 2^6

es decir sugeriríamos 6 clases.

o también puede ser el segundo método:

1 + 3.322 * log(38) = 6.24


EJERCICIO 2:

Un conjunto de datos consta de 230 observaciones

que oscilan desde 235 a 567. ¿Qué intervalo de clase

recomendaría?
SOLUCIÓN:

R 567 235 332


A    37.53
K 1 3.322*log(230) 8.846

Entonces sugerimos un intervalo de 40.


EJERCICIO 3:
La tienda CABRERA Y ASOCIADOS estaba interesada en
efectuar un análisis de sus cuentas por comprar. Uno de
los factores que más interesaba a la administración de la
tienda era el de los saldos de las cuentas de crédito. Se
escogió al azar una muestra aleatoria de 30 cuentas y se
anotó el saldo de cada cuenta (en unidades de soles) como
sigue:
77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99
43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97
32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68

Elaborar un reporte para la gerencia.


SOLUCION:

Efectuar el arreglo ordenado de la población o muestra:


7.42, 8.15, …, …, …, 90.99, 93.91
Encontrar el rango:
R = valor mayor – valor menor = 93.91 – 7.42 = 86.49

Encontrar en número de clases "K" , según la fórmula de


Sturges:
   
K 1 3.322 * Log( 30) 5.9069 6
Determinar la amplitud de la clase :
R 86 .49
A   14 .415
K 6
Clases Xi n f N F

7.420 – 21.835 14.628 10 0.33 10 0.33

21.835 – 36.250 29.043 4 0.13 14 0.46

36.250 – 50.665 43.458 5 0.17 19 0.63

50.665 – 65.080 57.873 3 0.10 22 0.73

65.080 – 79.495 72.288 3 0.10 25 0.83

79.495 – 93.910 86.703 5 0.17 30 1.00

Total 30 1.00
EJEMPLO:

La siguiente data representa al número de alumnos que

asistió a la clase de sociología, se ha pasado lista por 40

días. (el 1er día asistieron 3 cachimbos, el 2do día

asistieron 15 cachimbos, el 3ro 24 cachimbos…)

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34,

36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35,

28, 38, 41, 48, 15, 32, 13.


CALCULEMOS EL RANGO (R):
Se localizan los valores menor y mayor de la distribución.
En este caso son 3 y 48.
R = Máximo - Mínimo
R =48 – 3 = 45.
CALCULAMOS EL NÚMERO DE CLASES O INTERVALOS
(K):
K  1  3.322 * Log (n)
Para nuestro ejemplo:

K  1  3.322 * Log (40)  6.322


Para nuestro ejemplo, vamos a trabajar con: K = 6
Calculamos la amplitud de la distribución:
 R
A
K
45 
A 7.5
6

Entonces la amplitud sería 8.

Límite Inferior Límite Superior


3(valor mínimo) 3+8 = 11
CONSTRUIR
11 19

LOS LÍMITES 19 27

27 35
DE CLASES: 35 43

43 51
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo además punto medio, marca de clase o valor
central.
Límite Inferior Límite Superior Xi

3 11 (3+11)/2 = 7

11 19 (3+11)/2 = 15

19 27 (19+27)/2 = 23

27 35 (27+35)/2 = 31

35 43 (35+43)/2 = 39

43 51 (43+51)/2 = 47
Hallando la frecuencia absoluta y la frecuencia absoluta
acumulada.

Linf Lsup Xi fi Fi
3 11 7 2 2=2
11 19 15 6 2+6 = 8
19 27 23 5 8+5 = 13
27 35 31 11 13+11 = 24
35 43 39 12 24+12 = 36
43 51 47 4 36+4 = 40
Hallando la frecuencia relativa:

Linf Lsup Xi fi Fi hi
3 11 7 2 2 2/40 = 0.05
11 19 15 6 8 6/40 = 0.15
19 27 23 5 13 5/40 = 0.13
27 35 31 11 24 11/40 = 0.27
35 43 39 12 36 12/40 = 0.30
43 51 47 4 40 4/40 = 0.10
Calculando la frecuencia relativa
acumulada:

Linf Lsup Xi fi Fi hi Hi
3 11 7 2 2 0.05 0.05
11 19 15 6 8 0.15 0.20
19 27 23 5 13 0.13 0.33
27 35 31 11 24 0.27 0.60
35 43 39 12 36 0.30 0.90
43 51 47 4 40 0.10 1.00
TOTAL 40 1
EJEMPLO: Suponga que usted es el estadístico oficial de
la línea aérea TACA y que el presidente del consejo
de administración le ha pedido que recoja y organice
datos relativos a las operaciones de vuelo. Su interés
principal a partir de los valores diarios se centra en la
variable de número de pasajeros. Ha obtenido estos datos
de los vuelos diarios de los últimos 50 días y ha reflejado
esta información:
68 72 50 70 65 83 77 78 80 93
71 74 60 84 72 84 73 81 84 92
77 57 70 59 85 74 78 79 91 102
83 67 66 75 79 82 93 90 101 80
79 69 76 94 71 97 95 83 86 69
CALCULEMOS EL RANGO (R):
Se localizan los valores menor y mayor de la distribución.
En este caso son 50 y 102.
R = Máximo - Mínimo
R =102 – 50 = 52.
CALCULAMOS EL NÚMERO DE CLASES O INTERVALOS
(K):
K  1  3.322 * Log (n)
Para nuestro ejemplo:

K  1  3.322 * Log (50)  6.644


Para nuestro ejemplo, vamos a trabajar con: K = 7
Calculamos la amplitud de la distribución:

R
A A  52 
7.43
K 7

Entonces la amplitud sería 8.


Límite Inferior Límite Superior
50 (valor mínimo) 50+8 = 58
CONSTRUIR 58 64
64 72
LOS LÍMITES
72 80
80 88
DE CLASES:
88 96
96 104
CALCULANDO LAS MARCAS DE CLASE (Xi):
El punto medio de un intervalo de clase se acostumbra
llamarlo además punto medio, marca de clase o valor
central.

Límite Inferior Límite Superior Xi


50 58 (50+58)/2 = 54
58 66 (58+66)/2 = 62
66 74 (66+74)/2 = 70
74 82 (74+82)/2 = 78
82 90 (82+90)/2 = 86
90 98 (90+98)/2 = 94
98 106 (98+106)/2 = 102
Hallando la frecuencia absoluta y la frecuencia absoluta
acumulada.
Linf Lsup Xi fi Fi
50 58 54 2 2
58 66 62 3 5
66 74 70 12 17
74 82 78 14 31
82 90 86 9 40
90 98 94 8 48
98 106 102 2 50
TOTAL 50
Calculando la frecuencia relativa absoluta
y acumulada:

Linf Lsup Xi fi Fi hi Hi
50 58 54 2 2 0.04 0.04
58 66 62 3 5 0.06 0.10
66 74 70 12 17 0.24 0.34
74 82 78 14 31 0.28 0.62
82 90 86 9 40 0.18 0.80
90 98 94 8 48 0.16 0.96
98 106 102 2 50 0.04 1.00
TOTAL 50 1
Asistencia de pasajeros

16
14
12
10
Dias

8
6
4
2
0
50-58 58-66 66-74 74-82 82-90 90-98 98-106
# Pasajeros
POLÍGONOS DE FRECUENCIAS: Es otra forma de
conocer la distribución de los datos. Se construye
uniendo los puntos medios del lado superior de las
barras del histograma.
Poligono de Frecuencias

16
14
12
10
Dias

8
6
4
2
0
54 62 70 78 86 94 102
# Pasajeros (Xi)
poligano de frecuencias acumulado

60

50

40
Dias

30

20

10

0
54 62 70 78 86 94 102
# Pajajeros (Xi)
“Una visión sin
acción es un sueño.
Una acción sin
visión es perdida de
tiempo.
Una visión con
acción puede
cambiar al mundo”.

Joel Baker

Muchas gracias

También podría gustarte