Está en la página 1de 10

MAT 233 1

MSc. Ing. Franklin Torres Espada

Distribución de Frecuencias.

Introducción.

Una Distribución de Frecuencias consiste en organizar la información en clases o categorías donde se


determina el número de datos que pertenecen a cada uno de ellos.

También podemos definir a una distribución de frecuencias como un arreglo tabular de datos que
muestren sus respectivas frecuencias.

Se puede generar dos tipos de distribuciones.1

Distribuciones de Frecuencias de Variables Discretas.

En este tipo de distribuciones es considerado en función al tipo de variable con el cual se está
trabajando, es decir, se considerará a todas las variables como variables discretas, por ejemplo:

Número de alumnos de la clase.


Número de accidentes en una autopista.
Cantidad de libros en una biblioteca.
Piezas defectuosas de un determinado lote recibido.

Al generar la distribución de frecuencias se deberá tomar en cuenta intervalos determinados, por


ejemplo:

La variable discreta será: xi Será el Número de Errores por Página en un libro de Matemáticas.

Nº de errores x i Nº de páginas
0 2
1 4
2 6
3 13
4 20
5 35

Es posible también analizar el número de alumnos en determinado salón.

Nº Alumnos Nº de Salones
25 1
48 2
78 3
.
.
.

1 Introducción a la Estadística, Wilfredo Caballero. Edit. Instituto Interamericano de Cooperación para la Cultura. 1985.
MAT 233 2
MSc. Ing. Franklin Torres Espada

Distribuciones de Frecuencias de Variables Continuas.

En las distribuciones de Variables Continuas se asume Valores Reales, es decir, se podrá trabajar con
variables tales como; Por Ejemplo:

El peso de alumnos en una clase.


La utilidad de las empresas en el ramo Metalúrgico.
El tiempo de duración de un transformador.

Es posible decir que éste es el tipo de distribución más usual dentro de la estadística.

Para generar una Distribución de Frecuencias de Variables Continuas se debe seguir una serie de
recomendaciones con el fin de ordenar y no modificar ó tergiversar una determinada información.

Esas recomendaciones son las siguientes:

- Se escoger al azar la cantidad de datos ó Se determina en forma experimental una serie de datos
para generar la Distribución de Frecuencias:

x1, x2, x3, x4,…, xn.

- Se ordenan estos datos en forma creciente o decreciente para su respectivo análisis:

x1`, x2`, x3`, x4`,…, xn`.

- A la diferencia del Valor Máximo menos el Valor Mínimo se llama Rango:

Rango = xn` - x1`.

- Luego se debe determinar el Número de Intervalos de Clase.

En este caso se puede decir, que no existe un consenso unánime entre los autores para generar una
Distribución de Frecuencias pero se debe considerar algunas recomendaciones como las siguientes:

o Bradfor Hill señala que debe tomarse un Número de Intervalos de Clases comprendiendo
entre 10 y 20.
o Camel indica que el Número Apropiado de Intervalo de Clase es de 8 a 15.

Sin embargo, podemos decir, que el Número de Intervalos de Clase no debe ser pequeño debido
a que la concentración de datos generaría una serie de pérdidas de información.

Y cuando se trabaja con un Número de Intervalos de Clase muy grande y si bien proporciona
una determinada información, pero, sin embargo, este no reduce o simplifica el trabajo,
generando en algunas ocasiones, mucho trabajo que preferiblemente es recomendable realizar
el trabajo con los datos originales.
MAT 233 3
MSc. Ing. Franklin Torres Espada

También pude darse el caso que algunos Intervalos de Clase pueden resultar vacíos, es decir,
con frecuencia nula.

Por lo general se sigue tres reglas fundamentales:

- Tomar el Número de Intervalos de Clases igual al número entero más próximo


a 2 n, siendo n el número de datos observados.

- El Número de Intervalos de Clase debe ser un número entero mayor o igual a


n, donde n es el número de observaciones.

- La regla de Sturges nos dice que el Número de Intervalos de Clase es el número


entero más próximo a la relación

k = 1+3.3 Log10 n, donde n es el número de observaciones.

De estas tres últimas reglas, la más usual y la más recomendable es la Regla de Sturges a menos
que se indique que opción se debe utilizar.

Es importante señalar que la regla de Sturges está construida bajo un criterio empírico.

Calculando el Número de Intervalos de Clase, el resultado se debe redondear cumpliendo las


normas de redondeo, Puesto que se trata de Números de Intervalos, Clases ó Categorías.

- Luego se determina el recorrido o extensión; denotado por I.

I = Valor Máx. - Valor Mín. + 1 = xn` - x1` + 1

Se utilizará el número 1 si se trabaja con números enteros ó también es posible decir, que si se
trabaja con variables continuas no se debe considerar el número 1.

- Posteriormente se determina el Valor o Magnitud de cada Intervalo de Clase, donde lo denotaremos


como c.

c=I/k

Este valor obtenido se debe redondear al mismo número de Cifras Significativas que los datos
observados.

- Luego se generará un segmento ó magnitud, donde se determinará valores de cada intervalo de clase
y se expresará de la Siguiente forma:
MAT 233 4
MSc. Ing. Franklin Torres Espada

X1 c X2 c X3 ... Xk Xk+1

x1` x n`

En este punto es importante señalar que si X k+1 es menor a xn`, o si el máximo valor
determinado es menor al máximo valor de los datos obtenidos en forma experimental, se debe
incrementar al inmediato valor de c considerando el mismo número de Cifras Significativas de
los datos observados. Hasta que X k+1 sea mayor que xn`.

Encontrado X k+1 que cumpla la condición, se debe calcular el excedente. Este excedente se
puede expresar de la siguiente manera:

X k+1 - xn` = e

Luego se analiza el excedente, es decir, si este excedente es par, se divide entre dos y el segmento
se recorrerá hacia la izquierda en una magnitud equivalente a e/2, y si el excedente es impar, se
buscará la simetría y el segmento se recorrerá hacia la izquierda en el menor número
determinado generado la simetría y nuevamente se genera el segmento:

Y1 Y2 Y3 Yk Yk+1

De este último segmento se generará la Distribución de Frecuencias. Donde se considerará que


todos los datos experimentales están distribuidos simétricamente respecto a los valores Máximo
y Mínimo de los datos obtenidos en forma Experimental.

- La Distribución de Frecuencias será la siguiente:

Intervalos de Clase Conteo Frecuencia fi

Y1 Y 2-i n1 f1
Y2 Y 3-i n2 f2
Y3 Y 4-i n3 f3
Y4
.
Y5 Y 6-i n5 f5
.
.
Yk Y k+1 – i nk fk
∑fi = n
Donde i será la unidad considerando el mismo número de Cifras Significativas de los datos
observados.
MAT 233 5
MSc. Ing. Franklin Torres Espada

Luego se generará el Conteo, que consiste en colocar la cantidad de valores o datos que pertenece
a cada Categoría, Clase o Intervalo de Clase, que corresponderá al valor de la Frecuencia de los
Intervalos de Clase.

La Frecuencia será la cantidad de valores que pertenece a cada Intervalo de Clase ó Categoría.

En este punto es importante considerar que todos los datos dentro de cada Intervalo de Clase están
distribuidos uniformemente.

Límites Verdaderos de Clase.

Si se presenta la situación de trabajar con números con mayor apreciación, entonces se requiere
decidir en qué intervalo se debe colocar.

Para esto se requiere determinar los Límites Verdaderos de Clase.

Se determina el valor medio entre el Primer y Segundo Intervalo de Clase. Luego se determina el
valor medio entre el Segundo y Tercer Intervalo, hasta terminar con todos los Intervalos de Clase.

A estos valores se los llama Límites Verdaderos de Clase y se los expresa de la siguiente manera:

Distribución de Frecuencias.

Límites Verdaderos de Clase Frecuencia fi

Y1”- Y2” f1
Y2”- Y3” f2
Y3”- Y4” f3
.
.
.
YK”- YK+1” fk
[ )  fi = n

Cuando se presenta la situación de que coincida un valor con el límite verdadero de clase, se debe
considerar a los límites como cerrado en el límite inferior y abierto en superior.

A esta Distribución de Frecuencias es posible representarlo gráficamente. Utilizamos los ejes


coordenados, donde en el eje de las x ó abscisas colocamos a los Límites Verdaderos de Clase y al eje
de las y ó eje de ordenadas colocamos a las frecuencias.
MAT 233 6
MSc. Ing. Franklin Torres Espada

A esta Representación Gráfica se le llama Histograma de Frecuencias.


fi

L.V.C.
Marcas de Clase.

Son aquellos valores representativos de cada Intervalo de Clase.

Se Trata del Valor Medio de los Límites Simples de Clase o de los Límites Verdaderos de Clase.
Se lo denota como Xi.

Distribución de Frecuencias

MARCAS DE CLASE Xi FRECUENCIA fi

X1 f1
X2 f2
X3 f3

Xk fk
∑ fi = n
Esta Distribución de frecuencias es posible también representar gráficamente, a esta representación de
le llama Polígono de Frecuencias. Tiene las mismas características del Histograma de Frecuencias,
solo que esta vez en el eje de las x se colocará las Marcas de Clase.

fi

Xi
MAT 233 7
MSc. Ing. Franklin Torres Espada

Distribución de Frecuencias Relativas.

Es posible caracterizar las distribuciones de frecuencias como la cantidad de valores que se encuentra
en cada intervalo de clase respecto a la cantidad total de valores observados, tal es el caso de:

Límites Verdaderos de Clase Frecuencia fr %.

Y1”- Y2” (f1/n)*100 = fr1


Y2”- Y3” (f2/n)*100 = fr2
Y3”- Y4” (f3/n)*100 = fr3
.
.
.
YK”- Yk+1” (fk/n)*100 = fr k
[ )
La representación gráfica de esta Distribución de Frecuencias Relativas se le llama Histograma de
Frecuencias Relativas y tiene las mismas características de los anteriores, solo que esta vez en el eje
de las y colocaremos la Frecuencia Relativa.

% fr

L. V. C.

También se puede expresar una Distribución de Frecuencias Relativas con las Marcas de Clase y las
Frecuencias Relativas.
MAT 233 8
MSc. Ing. Franklin Torres Espada

Distribución de Frecuencias Relativas

Marcas De Clase Xi Frecuencia Rel. fr %

X1 fr1
X2 fr2
X3 fr3

Xk fr k

Y su representación gráfica tiene también el mismo enfoque, es decir: Polígono de Frecuencias


Relativas.

% fr

Xi

Distribución Frecuencias Acumuladas “menor que”.

La distribución acumulada de frecuencias sirve para conocer el total de las observaciones que existen
desde la primera clase hasta una categoría determinada.

La tabla tendrá las siguientes características:

Frecuencia Acumulada fa
Datos Observados menores que Y1” fa1. (0)
“ Y2” fa2. (f1)
“ Y3” fa3. (f1+f2)
.
Yk+1” fa k. (n)
MAT 233 9
MSc. Ing. Franklin Torres Espada

Donde también se puede expresar gráficamente de acuerdo al sistema de ejes coordenados x, y


Y a esta representación gráfica se le llama Polígono de Frecuencias Acumuladas “menores que”, en
alguna bibliografía es llamada como Ojiva.

fa

L. V. C.

Distribución de Frecuencias Acumuladas “mayor que”.

Frecuencia Acumulada
Datos Observados mayores que Y1” fa1. (f1+f2+f3+ … fk = n)
“ Y2” fa2. (n-f1)
“ .
.
Yk+1” fa k. (0)

Polígono de Frecuencias Acumuladas “mayor que”.

fa

L. V. C.
MAT 233 10
MSc. Ing. Franklin Torres Espada

Distribución de Frecuencias Acumuladas Relativas “menor que”.

La distribución acumulada de frecuencias relativas sirve para conocer el total de las observaciones que
existen desde la primera clase hasta una categoría determinada respecto a la cantidad de valores
observados.

La tabla tendrá las siguientes características:

Frecuencia Acumulada Relativa. far %


Datos Observados menores que Y1” fa r 1. (0)
“ Y2” fa r 2. (f1/n *100)
“ Y3” fa r 3. ((f1+f2)/n *100)
“ .
Yk+1” fa r k. 100%

Polígono de Frecuencias Acumuladas Relativas “menor que”.

fa r

L. V. C.
Distribución de Frecuencias Acumuladas Relativas “mayor que”.

Frecuencia Acumulada Relativa.


Datos Observados mayores que Y1” fa r 1. (100%)
“ Y2” fa r 2. ((n-f1)/n*100)
“ .
.
Yk+1” fa r k. (0)

Polígono de Frecuencias Acumuladas Relativas “mayor que”.

% far

L. V. C.

También podría gustarte