Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Capitulo 2. Distribución de Frecuencias PDF
Capitulo 2. Distribución de Frecuencias PDF
Distribución de Frecuencias.
Introducción.
También podemos definir a una distribución de frecuencias como un arreglo tabular de datos que
muestren sus respectivas frecuencias.
En este tipo de distribuciones es considerado en función al tipo de variable con el cual se está
trabajando, es decir, se considerará a todas las variables como variables discretas, por ejemplo:
La variable discreta será: xi Será el Número de Errores por Página en un libro de Matemáticas.
Nº de errores x i Nº de páginas
0 2
1 4
2 6
3 13
4 20
5 35
Nº Alumnos Nº de Salones
25 1
48 2
78 3
.
.
.
1 Introducción a la Estadística, Wilfredo Caballero. Edit. Instituto Interamericano de Cooperación para la Cultura. 1985.
MAT 233 2
MSc. Ing. Franklin Torres Espada
En las distribuciones de Variables Continuas se asume Valores Reales, es decir, se podrá trabajar con
variables tales como; Por Ejemplo:
Es posible decir que éste es el tipo de distribución más usual dentro de la estadística.
Para generar una Distribución de Frecuencias de Variables Continuas se debe seguir una serie de
recomendaciones con el fin de ordenar y no modificar ó tergiversar una determinada información.
- Se escoger al azar la cantidad de datos ó Se determina en forma experimental una serie de datos
para generar la Distribución de Frecuencias:
En este caso se puede decir, que no existe un consenso unánime entre los autores para generar una
Distribución de Frecuencias pero se debe considerar algunas recomendaciones como las siguientes:
o Bradfor Hill señala que debe tomarse un Número de Intervalos de Clases comprendiendo
entre 10 y 20.
o Camel indica que el Número Apropiado de Intervalo de Clase es de 8 a 15.
Sin embargo, podemos decir, que el Número de Intervalos de Clase no debe ser pequeño debido
a que la concentración de datos generaría una serie de pérdidas de información.
Y cuando se trabaja con un Número de Intervalos de Clase muy grande y si bien proporciona
una determinada información, pero, sin embargo, este no reduce o simplifica el trabajo,
generando en algunas ocasiones, mucho trabajo que preferiblemente es recomendable realizar
el trabajo con los datos originales.
MAT 233 3
MSc. Ing. Franklin Torres Espada
También pude darse el caso que algunos Intervalos de Clase pueden resultar vacíos, es decir,
con frecuencia nula.
De estas tres últimas reglas, la más usual y la más recomendable es la Regla de Sturges a menos
que se indique que opción se debe utilizar.
Es importante señalar que la regla de Sturges está construida bajo un criterio empírico.
Se utilizará el número 1 si se trabaja con números enteros ó también es posible decir, que si se
trabaja con variables continuas no se debe considerar el número 1.
c=I/k
Este valor obtenido se debe redondear al mismo número de Cifras Significativas que los datos
observados.
- Luego se generará un segmento ó magnitud, donde se determinará valores de cada intervalo de clase
y se expresará de la Siguiente forma:
MAT 233 4
MSc. Ing. Franklin Torres Espada
X1 c X2 c X3 ... Xk Xk+1
x1` x n`
En este punto es importante señalar que si X k+1 es menor a xn`, o si el máximo valor
determinado es menor al máximo valor de los datos obtenidos en forma experimental, se debe
incrementar al inmediato valor de c considerando el mismo número de Cifras Significativas de
los datos observados. Hasta que X k+1 sea mayor que xn`.
Encontrado X k+1 que cumpla la condición, se debe calcular el excedente. Este excedente se
puede expresar de la siguiente manera:
X k+1 - xn` = e
Luego se analiza el excedente, es decir, si este excedente es par, se divide entre dos y el segmento
se recorrerá hacia la izquierda en una magnitud equivalente a e/2, y si el excedente es impar, se
buscará la simetría y el segmento se recorrerá hacia la izquierda en el menor número
determinado generado la simetría y nuevamente se genera el segmento:
Y1 Y2 Y3 Yk Yk+1
Y1 Y 2-i n1 f1
Y2 Y 3-i n2 f2
Y3 Y 4-i n3 f3
Y4
.
Y5 Y 6-i n5 f5
.
.
Yk Y k+1 – i nk fk
∑fi = n
Donde i será la unidad considerando el mismo número de Cifras Significativas de los datos
observados.
MAT 233 5
MSc. Ing. Franklin Torres Espada
Luego se generará el Conteo, que consiste en colocar la cantidad de valores o datos que pertenece
a cada Categoría, Clase o Intervalo de Clase, que corresponderá al valor de la Frecuencia de los
Intervalos de Clase.
La Frecuencia será la cantidad de valores que pertenece a cada Intervalo de Clase ó Categoría.
En este punto es importante considerar que todos los datos dentro de cada Intervalo de Clase están
distribuidos uniformemente.
Si se presenta la situación de trabajar con números con mayor apreciación, entonces se requiere
decidir en qué intervalo se debe colocar.
Se determina el valor medio entre el Primer y Segundo Intervalo de Clase. Luego se determina el
valor medio entre el Segundo y Tercer Intervalo, hasta terminar con todos los Intervalos de Clase.
A estos valores se los llama Límites Verdaderos de Clase y se los expresa de la siguiente manera:
Distribución de Frecuencias.
Y1”- Y2” f1
Y2”- Y3” f2
Y3”- Y4” f3
.
.
.
YK”- YK+1” fk
[ ) fi = n
Cuando se presenta la situación de que coincida un valor con el límite verdadero de clase, se debe
considerar a los límites como cerrado en el límite inferior y abierto en superior.
L.V.C.
Marcas de Clase.
Se Trata del Valor Medio de los Límites Simples de Clase o de los Límites Verdaderos de Clase.
Se lo denota como Xi.
Distribución de Frecuencias
X1 f1
X2 f2
X3 f3
Xk fk
∑ fi = n
Esta Distribución de frecuencias es posible también representar gráficamente, a esta representación de
le llama Polígono de Frecuencias. Tiene las mismas características del Histograma de Frecuencias,
solo que esta vez en el eje de las x se colocará las Marcas de Clase.
fi
Xi
MAT 233 7
MSc. Ing. Franklin Torres Espada
Es posible caracterizar las distribuciones de frecuencias como la cantidad de valores que se encuentra
en cada intervalo de clase respecto a la cantidad total de valores observados, tal es el caso de:
% fr
L. V. C.
También se puede expresar una Distribución de Frecuencias Relativas con las Marcas de Clase y las
Frecuencias Relativas.
MAT 233 8
MSc. Ing. Franklin Torres Espada
X1 fr1
X2 fr2
X3 fr3
Xk fr k
% fr
Xi
La distribución acumulada de frecuencias sirve para conocer el total de las observaciones que existen
desde la primera clase hasta una categoría determinada.
Frecuencia Acumulada fa
Datos Observados menores que Y1” fa1. (0)
“ Y2” fa2. (f1)
“ Y3” fa3. (f1+f2)
.
Yk+1” fa k. (n)
MAT 233 9
MSc. Ing. Franklin Torres Espada
fa
L. V. C.
Frecuencia Acumulada
Datos Observados mayores que Y1” fa1. (f1+f2+f3+ … fk = n)
“ Y2” fa2. (n-f1)
“ .
.
Yk+1” fa k. (0)
fa
L. V. C.
MAT 233 10
MSc. Ing. Franklin Torres Espada
La distribución acumulada de frecuencias relativas sirve para conocer el total de las observaciones que
existen desde la primera clase hasta una categoría determinada respecto a la cantidad de valores
observados.
fa r
L. V. C.
Distribución de Frecuencias Acumuladas Relativas “mayor que”.
% far
L. V. C.