Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Distribucion de Frecuencias Parte 1
Distribucion de Frecuencias Parte 1
Estadística 1
Ing. Edwin Bracamonte Orozco
Distribución de Frecuencias
El término Distribución de Frecuencias esta asociado con la agrupación de los datos observados, en grupos o clases. El objeto de la agrupación es
resumir la información para ser presentada de forma tabular, por lo que es importante tomar en cuenta que la cantidad ideal de grupos o clases no
sea menor de 5 y ni mayor de 15, lo cual dependerá de la cantidad de datos, y la amplitud de los mismos.
Cabe destacar que en muchos casos de acuerdo a la naturaleza de los datos se pueden utilizar distribuciones de frecuencias ya establecidas, como
por ejemplo, si los datos corresponden a edad, calificaciones, ingresos mensuales.
Cuando se desea determinar el número de clases para agrupar una serie de datos se puede utilizar, la conocida formula de STURGES:
k = 1 + 3.3(log (n)
Este valor de k nos proporciona una cantidad aproximada del número requerido de grupos, el cual nos sirve de base para el calculo de la amplitud
de cada clase o tamaño del intervalo al dividirla entre el rango de los datos, el valor mayor menos el valor menor.
A modo de ejemplo se cuenta con la siguiente información referente a 125 lecturas obtenidas en un hospital por un analista de tiempos y
movimientos, quién realizó cinco lecturas al día, durante 25 días.
1
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco
Con los datos anteriores se cuenta con n=125 datos, con valor máximo de 2.28 min y un valor mínimo de 1.72 min, los cuales agruparemos en:
k = 1 + 3.3(log (125) = 7.91 ≅ 8
2.28 − 1.72
𝑖= = 0.07
7.91
ordenando los datos de menor a mayor se tiene:
2
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco
1.91 1.97 41
1.98 2.04 25
2.05 2.11 14
2.12 2.18 3
2.19 2.25 1
2.26 2.32 1
125
Como podemos ver logramos agrupar los 125 datos en 9 clases. El total en cada clase corresponde a la frecuencia absoluta “𝑓𝑖 ” de la misma.
Límites reales
Los límites reales nos sirven para darle continuidad a la distribución de frecuencias, para definirlos el límite inferior de la primera clase comienza
con un medio menos de la unidad que diferencia al límite aparente superior de la clase anterior con el limite aparente inferior de la clase siguiente,
y por lo tanto, el límite superior termina con un medio más, es decir, si la diferencia es:
En nuestro ejemplo, los límites aparentes se presentan con dos decimales debemos restar a los limites inferiores 0.005 y a los límites superiores
sumar 0.005.
Frecuencia acumulada
La frecuencia acumulada “𝐹𝑖 ”, permite obtener la distribución acumulada de las frecuencias, tiene como finalidad señalar el número de casos que se
son menores o iguales a un determinado valor. Para obtener la frecuencia acumuladas se suman las frecuencias absolutas de las clases, teniendo en
la primera clase la correspondiente a la frecuencia absoluta y en la última clase el total de datos o suma de frecuencias absolutas
Frecuencia relativa
Nos permite representar la frecuencia absoluta de manera relativa, se obtiene dividiendo la frecuencia de cada clase entre la sumatoria de
𝑓
frecuencias 𝑓𝑟 = ∑ 𝑖 , al multiplicarla por 100 se obtiene en términos porcentuales.
𝑓𝑖
3
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco
𝑋𝑖
Límites Reales 𝑓𝑖 𝐹𝑖 𝑓𝑟
1.695 1.765 5 5 0.0400 1.73
1.765 1.835 14 19 0.1120 1.80
1.835 1.905 21 40 0.1680 1.87
1.905 1.975 41 81 0.3280 1.94
1.975 2.045 25 106 0.2000 2.01
2.045 2.115 14 120 0.1120 2.08
2.115 2.185 3 123 0.0240 2.15
2.185 2.255 1 124 0.0080 2.22
2.255 2.325 1 125 0.0080 2.29
Sumatorias 125 1.0000
Histograma.
Es un diagrama de área, se supone que en cada rectángulo la superficie es igual a la frecuencia de la clase, correspondiente al producto de una base
unitaria (el intervalo de la clase) por la frecuencia de la clase, siendo el área total bajo el histograma igual a ∑ 𝑓𝑖 .
En la gráfica No. 1, se presenta la distribución de frecuencias en un histograma, para lo cual en el eje de las ordenadas (Y) colocamos la frecuencia
absoluta 𝑓𝑖 y en el eje de las abscisas (X) los límites reales.
Histograma
60
Frecuencia absoluta fi
40
20
0
1.695 - 1.765 - 1.835 - 1.905 - 1.975 - 2.045 - 2.115 - 2.185 - 2.255 -
1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325
Límites Reales
Podemos observar que la tendencia de la gráfica es de un sesgo (asimetría) hacia los valores inferiores de tiempo, lo cual podremos confirmarlo al
calcular las medidas de tendencia central: promedio aritmético, mediana y moda, es decir, se esperaría que los resultados se presenten de la
siguiente forma:
𝑋̅ ≤ 𝑀𝑒 ≤ 𝑀𝑜
Polígono de frecuencias
Otra forma de representar una distribución de frecuencias es utilizando el polígono, para lo cual se utilizan los puntos medios de clase sobre el
histograma y luego se unen con segmentos de recta, debiendo agregar media clase antes de la primera y media clase después de la última con
frecuencia cero.
4
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco
En la Gráfica No. 2, se presenta el polígono de frecuencias y podemos observar con mayor claridad la tendencia de los datos hacia los valores
inferiores de tiempo.
Polígono de frecuencias
50
Frecuencia absoluta fi
40
30
20
10
0
1.66 1.730 1.800 1.870 1.940 2.010 2.080 2.150 2.220 2.290 2.360
Puntoa mwdios
Curva de frecuencias:
De igual manera que con el polígono podemos representar una distribución de frecuencias utilizando la curva de frecuencias, para lo cual se traza
sobre el histograma una curva a mano alzada que nos permite observar la tendencia de la distribución.
Es importante señalar que la curva de frecuencias es más útil cuando se tiene un número muy grande datos y el intervalo de clase puede ser mas
pequeño, lo que permite percibir una variación suave de la frecuencia de una clase a otra, o cuando se establece un modelo matemático adecuado
para describir la variación mostrada por la distribución de frecuencias.
En la Gráfica No. 3, se presenta la curva de frecuencias y podemos observar la tendencia de los datos hacia los valores inferiores de tiempo.
Ojiva:
Se utiliza para representar la distribución de frecuencias acumulada, se construye colocando en el eje de las ordenadas la frecuencia acumulada,
(puede ser la relativa acumulada) y en el eje de las abscisas los límites reales, en la Gráfica No 4., se presenta la distribución acumulada.
5
Facultad de Ingeniería
Estadística 1
Ing. Edwin Bracamonte Orozco
Curva de frecuencias
45
40
Frecuencia absoluta fi
35
30
25
20
15
10
5
0
1.695 1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325 2.395
Límites Reales
Ojiva
140
120
Frecuencia acumulada Fi
100
80
60
40
20
0
1.695 1.765 1.835 1.905 1.975 2.045 2.115 2.185 2.255 2.325
Límites reales