Está en la página 1de 10

1.

3 DATOS AGRUPADOS

1.3.1 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS


Para poder organizar un conjunto de datos y observar su comportamiento, la estadística
descriptiva te ofrece una técnica muy simple: construir una Tabla de distribución de
frecuencias, que consiste en agrupar los datos en intervalos o clases.
La Tabla de distribución de frecuencias es un resumen tabular de datos en clases
mutuamente excluyentes, que muestra el número de observaciones que hay en cada clase.
Se sugiere que el número de intervalos o clases sea un número ENTERO entre 5 y 20. Es
conveniente incluir las frecuencias relativas o porcentuales, las frecuencias acumuladas y los
puntos medios o marcas de clase.

Las tablas de frecuencias deben poseer las siguientes características:


- UNIFORMIDAD: Todos los intervalos o clases deben ser del mismo tamaño.
- UNICIDAD: Cualquiera de los datos debe pertenecer sólo a un intervalo o clase.
- COMPLETEZ: Absolutamente todos los datos deben quedar incluidos en alguno de los
intervalos o clases.

Pasos para construir una distribución de frecuencias para datos cuantitativos:


- Determinar el número de clases. (Min 5, Max 20).
- Definir el ancho de clase.
- Determinar los límites de clase.
- Conteo de datos para llenar la columna de frecuencia real.
- Calcular frecuencia relativa, frecuencias acumuladas y puntos medios.

Paso 1. Definir el número de clases.


Para definir el número de clases usaremos la propuesta de Robert Johnson y Patricia Kuby
en su libro “Estadística elemental. Lo Esencial” 2a edición, donde el número de intervalos se
establece calculando la raíz cuadrada al número de datos, es decir:
Paso 2. Establecer el ancho de las clases.
El ancho de clase, o intervalo de clase, o amplitud de clase se calcula dividiendo el rango de
los datos entre el número de intervalos.

Paso 3. Calcular los límites inferiores y superiores de cada clase.


- El límite inferior de la primera clase 𝐿𝑖 1 será el dato más pequeño.
- El límite superior de la primera clase 𝐿𝑠 1 se calcula sumando 𝐿𝑖 1 + la Amplitud de
clase.
- El límite inferior de la segunda clase 𝐿𝑖 2 será el 𝐿𝑠 1.
- El límite superior de la segunda clase 𝐿𝑠 2 se calcula sumando 𝐿𝑖 2 + la Amplitud de
clase.
- El límite inferior de la tercera clase 𝐿𝑖 3 será el 𝐿𝑠 2.
- El límite superior de la tercera clase 𝐿𝑠 3 se calcula sumando 𝐿𝑖 3 + la Amplitud de
clase.
Y así sucesivamente.
Es importante usar adecuadamente los símbolos matemáticos < y ≤ , de tal forma que quede
muy claro a qué clase pertenece cada dato.

EJEMPLO 1.3.1
Construya una tabla de frecuencias completa usando los datos recabados del gasto en
transporte que hacen 25 alumnos de cierta universidad para llegar a la escuela.
Dinero gastado:
39.70, 46.65, 82.71, 25.94, 60.2, 28.3, 31.47, 43.63, 50.32, 48.14, 28.31, 33.45, 41.17, 35.25,
22.78, 17.95, 29.17, 47.32, 35.70, 38.22, 44.97, 48.39, 52.16, 17.89, 23.25
Solución
Paso 1. Para construir una tabla de frecuencias, requerimos determinar el número de
intervalos o clases con las que es conveniente trabajar.
A continuación, se muestran las columnas que se requieren para construir una Tabla de
distribución de frecuencias completa.

Donde:

Paso 2. Calculamos la amplitud de clase.

Dato mayor= 82.17


Dato menor= 17.89
Paso 3. Se establecen los límites de clase para cada una de las 5 clases, y se calculan de la
siguiente manera:

Y así sucesivamente…

Nota: el signo ≤ está indicando que en esa clase se deben incluir los datos que tengan
exactamente el valor de ese límite, y no en la clase donde sólo se indica con <.
Por ejemplo, si en la lista de datos hubiera un 30.854, ese dato lo incluiríamos en la clase 2 y
no en la clase 1.

Paso 4. Ahora simplemente se cuentan los datos que caen en cada clase, y se registran en la
columna de la frecuencia real (f).

Paso 5. La frecuencia relativa (fr) es la proporción de las observaciones que pertenecen a una
clase (las operaciones se muestran en la columna de la frecuencia relativa). También puede
agregarse otra columna para expresar estas proporciones en términos de porcentaje,
multiplicando cada resultado por 100. Así lo haremos para la columna de la frecuencia
acumulada porcentual (F%).

Paso 6. La frecuencia acumulada de la clase 1 es la frecuencia real de la clase 1. La frecuencia


acumulada de la clase 2 es la suma de las frecuencias de la clase 1 y la clase 2. La frecuencia
acumulada de la clase 3 es la suma de las frecuencias de las clases 1, 2 y 3. Esto quiere decir
que esta columna nos está mostrando la cantidad de datos que son menores o iguales al
límite superior de la clase correspondiente.

Por último, el punto medio (P.M.) ó Marca de clase, es el valor central del intervalo.

Por ejemplo, para la clase 1, el valor central entre 17.89 y 30.854 es 24.372.

La tabla completa queda de la siguiente manera:


EJEMPLO 1.3.2
Analiza el número de clientes atendidos por 42 operadores de la empresa Caro Marketing,
se presentan los siguientes datos en bruto (ya que no han recibido tratamiento alguno,
teniendo los datos de esta manera es difícil sacar conclusiones y tomar decisiones por lo
cual es conveniente hacer un resumen mediante la herramienta estadística conocida como
tabla de distribución de frecuencias.) y resuelve las siguientes preguntas:
¿Cuál es la cantidad mínima de clientes atendidos? Cero
¿Cuál es la cantidad máxima de clientes atendidos? Nueve
¿Qué cantidad de clientes es la que más frecuentemente atienden los operadores? Dos

Las tablas de distribución de frecuencias pueden construirse considerando intervalos o


bien, solo valores finitos conocidos como clases que representen o incluyan a todo el
conjunto de datos, para este caso es conveniente usar valores finitos o clases ya que los
datos se prestan para ello y tendremos la gran ventaja de que contaremos con la
información exacta.
El dato más pequeño corresponderá a la primera clase y el dato mayor a la última clase, por
lo cual escribimos cero como primera clase, a continuación, el 1 que corresponde a la
segunda clase, el 2 como tercera y así sucesivamente hasta la clase décima que es el
número 9.
Ahora, se contará el número de veces que aparece el valor de la clase en la lista de los
datos y se escribe en la columna de las frecuencias reales, por ejemplo, el cero aparece dos
veces, anotamos un dos en la columna de las frecuencias reales de la clase cero, el uno se
repite cuatro veces y el dos se repite siete veces y se hace lo mismo para el resto de las
clases.
Para llenar la columna de la frecuencia porcentual se divide la frecuencia real entre el
numero total de datos y el resultado se multiplica por cien.

Los resultados nos dan una idea de cuanta relevancia tiene cada clase con respecto del
total de los datos.

Pasando a la siguiente columna, la frecuencia acumulada real es la cantidad de datos que


tiene un valor menor o igual a la de esa clase, por ejemplo, la cantidad de datos menores o
iguales a cero son únicamente los dos ceros, los datos iguales o menores a 1 incluye todos
los 1 y todos los 0, por lo tanto, la frecuencia cumulada es 6. ¿Qué se está haciendo?
Simplemente sumando las frecuencias reales hasta la clase que nos interesa, un método
sencillo es sumar la frecuencia real de la clase en cuestión a la frecuencia acumulada de la
clase anterior.
Para calcular la frecuencia acumulada porcentual, esto se realiza dividiendo la frecuencia
acumulada real entre el total de datos y multiplicar el resultado por 100.

Y se tienen los siguientes datos:


Con ayuda de esta columna se puede observar claramente que el 45.24% de los
telefonistas atienden menos de 4 clientes o dicho en otras palabras atienden entre cero y
máximo tres clientes, esto es información real que nos lleva a conclusiones respaldadas y a
tomar decisiones acertadas.

También podría gustarte