Está en la página 1de 8

Facultad de Ingeniería

Estadística 1
Ing. Edwin Bracamonte Orozco

Distribución de Frecuencias
El término Distribución de Frecuencias esta asociado con la agrupación de los datos observados,
en grupos o clases. El objeto de la agrupación es resumir la información para ser presentada de
forma tabular, por lo que es importante tomar en cuenta que la cantidad ideal de grupos o clases
no sea menor de 5 y ni mayor de 15, lo cual dependerá de la cantidad de datos, y la amplitud de los
mismos.

Cabe destacar que en muchos casos de acuerdo a la naturaleza de los datos se pueden utilizar
distribuciones de frecuencias ya establecidas, como por ejemplo, si los datos corresponden a edad,
calificaciones, ingresos mensuales.

Cuando se desea determinar el número de clases para agrupar una serie de datos se puede utilizar,
la conocida formula de STURGES:

k = 1 + 3.3(log (n))

o bien de manera alternativa, se puede utilizar √𝑛, lo que es válido si n<100.

Este valor de k nos proporciona una cantidad aproximada del número requerido de grupos, el cual
nos sirve de base para el calculo de la amplitud de cada clase o tamaño del intervalo al dividirla
entre el rango de los datos, el valor mayor menos el valor menor.

𝑅 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑦𝑜𝑟 − 𝑉𝑎𝑙𝑜𝑟 𝑚𝑒𝑛𝑜𝑟


𝑖= =
𝑘 𝑘

A modo de ejemplo se cuenta con la siguiente información referente a 125 lecturas obtenidas en
un hospital por un analista de tiempos y movimientos, quién realizó cinco lecturas al día, durante
25 días.

Día Lectura 1 Lectura 2 Lectura 3 Lectura 4 Lectura 5


1.00 1.90 1.93 1.95 2.05 2.20
2.00 1.76 1.81 1.81 1.83 2.01
3.00 1.80 1.87 1.95 1.97 2.07
4.00 1.77 1.83 1.87 1.90 1.93
5.00 1.93 1.95 2.03 2.05 2.14
6.00 1.76 1.88 1.95 1.97 2.00
7.00 1.87 2.00 2.00 2.03 2.10
8.00 1.91 1.92 1.94 1.97 2.05
9.00 1.90 1.91 1.95 2.01 2.05
10.00 1.79 1.91 1.93 1.94 2.10

1
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

11.00 1.90 1.97 2.00 2.06 2.28


12.00 1.80 1.82 1.89 1.91 1.99
13.00 1.75 1.83 1.92 1.95 2.04
14.00 1.87 1.90 1.98 2.00 2.08
15.00 1.90 1.95 1.95 1.97 2.03
16.00 1.82 1.99 2.01 2.06 2.06
17.00 1.90 1.95 1.95 2.00 2.10
18.00 1.81 1.90 1.94 1.97 1.99
19.00 1.87 1.89 1.98 2.01 2.15
20.00 1.72 1.78 1.96 2.00 2.05
21.00 1.87 1.89 1.91 1.91 2.00
22.00 1.76 1.80 1.91 2.06 2.12
23.00 1.95 1.96 1.97 2.00 2.00
24.00 1.92 1.94 1.97 1.99 2.00
25.00 1.85 1.90 1.90 1.92 1.92

Con los datos anteriores se cuenta con n=125 datos, con valor máximo de 2.28 min y un valor
mínimo de 1.72 min, los cuales agruparemos en:

k = 1 + 3.3(log (125)) = 7.91 ≅ 8

la amplitud del intervalo sería igual a:

2.28 − 1.72
𝑖= = 0.07
7.91
ordenando los datos de menor a mayor se tiene:

Día Lectura 1 Lectura 1 Lectura 1 Lectura 1 Lectura 1


1 1.72 1.87 1.92 1.97 2.01
2 1.75 1.88 1.92 1.97 2.01
3 1.76 1.89 1.93 1.97 2.03
4 1.76 1.89 1.93 1.97 2.03
5 1.76 1.89 1.93 1.97 2.03
6 1.77 1.90 1.93 1.97 2.04
7 1.78 1.90 1.94 1.98 2.05
8 1.79 1.90 1.94 1.98 2.05
9 1.80 1.90 1.94 1.99 2.05
10 1.80 1.90 1.94 1.99 2.05
11 1.80 1.90 1.95 1.99 2.05
12 1.81 1.90 1.95 1.99 2.06
13 1.81 1.90 1.95 2.00 2.06

2
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

14 1.81 1.90 1.95 2.00 2.06


15 1.82 1.90 1.95 2.00 2.06
16 1.82 1.91 1.95 2.00 2.07
17 1.83 1.91 1.95 2.00 2.08
18 1.83 1.91 1.95 2.00 2.10
19 1.83 1.91 1.95 2.00 2.10
20 1.85 1.91 1.95 2.00 2.10
21 1.87 1.91 1.95 2.00 2.12
22 1.87 1.91 1.96 2.00 2.14
23 1.87 1.92 1.96 2.00 2.15
24 1.87 1.92 1.97 2.01 2.20
25 1.87 1.92 1.97 2.01 2.28

Se pueden agrupar los datos en las siguientes clases:

Límites aparentes Total (𝑓𝑖 )


1.70 1.76 5
1.77 1.83 14
1.84 1.90 21
1.91 1.97 41
1.98 2.04 25
2.05 2.11 14
2.12 2.18 3
2.19 2.25 1
2.26 2.32 1
125

Como podemos ver logramos agrupar los 125 datos en 9 clases. El total en cada clase corresponde
a la frecuencia absoluta “𝑓𝑖 ” de la misma.

Límites reales
Los límites reales nos sirven para darle continuidad a la distribución de frecuencias, para
definirlos el límite inferior de la primera clase comienza con un medio menos de la unidad que
diferencia al límite aparente superior de la clase anterior con el limite aparente inferior de la clase
siguiente, y por lo tanto, el límite superior termina con un medio más, es decir, si la diferencia es:

a. 1 restar 0.5 al límite inferior y sumar 0.5 al límite superior de la clase.


b. 0.1 restar 0.05 al límite inferior y sumar 0.05 al límite superior de la clase.
c. 0.01 restar 0.005 al límite y sumar 0.005 al límite superior inferior de la clase.

En nuestro ejemplo, los límites aparentes se presentan con dos decimales debemos restar a los
limites inferiores 0.005 y a los límites superiores sumar 0.005.

3
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

Límites reales Total (𝑓𝑖 )


1.695 1.765 5
1.765 1.835 14
1.835 1.905 21
1.905 1.975 41
1.975 2.045 25
2.045 2.115 14
2.115 2.185 3
2.185 2.255 1
2.255 2.325 1
Sumatoria 125

Frecuencia acumulada
La frecuencia acumulada “𝐹𝑖 ”, permite obtener la distribución acumulada de las frecuencias, tiene
como finalidad señalar el número de casos que se son menores o iguales a un determinado valor.
Para obtener la frecuencia acumuladas se suman las frecuencias absolutas de las clases, teniendo
en la primera clase la correspondiente a la frecuencia absoluta y en la última clase el total de datos
o suma de frecuencias absolutas

Frecuencia relativa
Nos permite representar la frecuencia absoluta de manera relativa, se obtiene dividiendo la
𝑓
frecuencia de cada clase entre la sumatoria de frecuencias 𝑓𝑟 = ∑ 𝑓𝑖 , al multiplicarla por 100 se
𝑖
obtiene en términos porcentuales.

Punto medio o marca de clase


Debido a que al agrupar los datos en las diferentes clases no es posible reconocer que valores se
tienen en la misma y solo suponemos que se tiene dentro de la clase una distribución uniforme de
todos los datos registrados en la misma, determinar el punto medio Xi nos ayuda a tener una
representación de cada clase dentro de la distribución, y lo determinamos de la siguientes forma:

𝐿í𝑚𝑖𝑡𝑒 𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 + 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟


𝑋𝑖 =
2

4
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

Límites Reales 𝑓𝑖 𝐹𝑖 𝑓𝑟 𝑋𝑖
1.695 1.765 5 5 0.0400 1.73
1.765 1.835 14 19 0.1120 1.80
1.835 1.905 21 40 0.1680 1.87
1.905 1.975 41 81 0.3280 1.94
1.975 2.045 25 106 0.2000 2.01
2.045 2.115 14 120 0.1120 2.08
2.115 2.185 3 123 0.0240 2.15
2.185 2.255 1 124 0.0080 2.22
2.255 2.325 1 125 0.0080 2.29
Sumatorias 125 1.0000

Gráficas de una distribución de frecuencias


Histograma.
Es un diagrama de área, se supone que en cada rectángulo la superficie es igual a la frecuencia de
la clase, correspondiente al producto de una base unitaria (el intervalo de la clase) por la
frecuencia de la clase, siendo el área total bajo el histograma igual a ∑ 𝑓𝑖 .

En la gráfica No. 1, se presenta la distribución de frecuencias en un histograma, para lo cual en el


eje de las ordenadas (Y) colocamos la frecuencia absoluta 𝑓𝑖 y en el eje de las abscisas (X) los
límites reales.

Histograma
45
40
Frecuencia absoluta fi

35
30
25
20
15
10
5
0
1.695 - 1.765 - 1.835 - 1.905 - 1.975 - 2.045 - 2.115 - 2.185 - 2.255 -
1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325
Límites Reales

Gráfica No. 1. Histograma Distribución de frecuencias de lecturas de tiempos en minutos.

5
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

Podemos observar que la tendencia de la gráfica es de un sesgo (asimetría) hacia los valores
inferiores de tiempo, lo cual podremos confirmarlo al calcular las medidas de tendencia central:
promedio aritmético, mediana y moda, es decir, se esperaría que los resultados se presenten de la
siguiente forma:

𝑋̅ ≤ 𝑀𝑒 ≤ 𝑀𝑜

Polígono de frecuencias
Otra forma de representar una distribución de frecuencias es utilizando el polígono, para lo cual se
utilizan los puntos medios de clase sobre el histograma y luego se unen con segmentos de recta,
debiendo agregar media clase antes de la primera y media clase después de la última con
frecuencia cero.

En la Gráfica No. 2, se presenta el polígono de frecuencias y podemos observar con mayor claridad
la tendencia de los datos hacia los valores inferiores de tiempo.

Polígono de frecuencias
45
40
35
Frecuencia absoluta fi

30
25
20
15
10
5
0
1.66 1.730 1.800 1.870 1.940 2.010 2.080 2.150 2.220 2.290 2.360
Puntoa mwdios

Gráfica No. 2. Histograma Distribución de frecuencias de lecturas de tiempos en minutos.

Curva de frecuencias:
De igual manera que con el polígono podemos representar una distribución de frecuencias
utilizando la curva de frecuencias, para lo cual se traza sobre el histograma una curva a mano
alzada que nos permite observar la tendencia de la distribución.

6
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

Es importante señalar que la curva de frecuencias es más útil cuando se tiene un número muy
grande datos y el intervalo de clase puede ser mas pequeño, lo que permite percibir una variación
suave de la frecuencia de una clase a otra, o cuando se establece un modelo matemático adecuado
para describir la variación mostrada por la distribución de frecuencias.

En la Gráfica No. 3, se presenta la curva de frecuencias y podemos observar la tendencia de los


datos hacia los valores inferiores de tiempo.

Ojiva:
Se utiliza para representar la distribución de frecuencias acumulada, se construye colocando en el
eje de las ordenadas la frecuencia acumulada, (puede ser la relativa acumulada) y en el eje de las
abscisas los límites reales, en la Gráfica No 4., se presenta la distribución acumulada.

7
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco

Curva de frecuencias
45
40
Frecuencia absoluta fi

35
30
25
20
15
10
5
0
1.695 1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325 2.395
Límites Reales

Gráfica No. 3. Curva de la distribución de frecuencias de lecturas de tiempos en minutos.

Ojiva
140

120
Frecuencia acumulada Fi

100

80

60

40

20

0
1.695 1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325
Límites reales

Gráfica No. 4. Ojiva de la distribución de frecuencias de lecturas de tiempos en minutos

También podría gustarte