Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2. TABLAS DE FRECUENCIAS
Las tablas de frecuencias son un método estadístico para organizar y resumir los
datos de una muestra o una población. Bajo esta metodología los datos que
componen una variable se clasifican y ordenan, indicándose el número de veces en
que se repite cada valor. A las tablas de frecuencias se les conoce también como
tablas de distribución de frecuencias o simplemente distribución de
frecuencias, porque permiten apreciar la forma en la que se distribuyen o
comportan los datos (puede apreciarse, si están cargados hacia un extremo o el
otro, si están concentrados cerca del centro, o si están distribuidos de manera
uniforme).
1
En los textos de estadística a la frecuencia se le llama frecuencia absoluta.
2
En los textos de estadística al porcentaje (caso especial de la proporción) se le llama frecuencia relativa.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.3/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I
U E D M U D M E M E
M D U E M U E M M U
M U D U M E M E M P
U D D M E M U M U M
Donde las categorías observadas presentan las siguientes equivalencias:
U: Universitario, E: Especialización, M: Maestría, D: Doctorado y P: Postdoctorado.
Para calcular las frecuencias, se observa cuantas veces se repiten cada una de las
categorías del nivel de estudios, en los 40 valores obtenidos en la variable, por
ejemplo, la categoría U correspondiente a Universitario se encuentra presente 10
veces en los datos, por tal motivo su frecuencia seria 10; de igual forma se procede
con cada una de las otras categorías del nivel de estudios, hasta la categoría P de
Postdoctorado la cual tiene una frecuencia de 1, pues solo se encuentra una vez
presente en los valores obtenidos en la variable.
Para la construcción de una tabla de frecuencias con datos puntuales, se debe tener
en cuenta los siguientes pasos:
1. Construir los encabezados de la tabla, la cual consta de cinco campos que son:
el nombre de la variable, la frecuencia, el porcentaje, la frecuencia acumulada
y el porcentaje acumulado.
2. Establecer el número de clases de la tabla, para esto se determina cuáles y
cuántos valores diferentes toma la variable, para ubicarlos en el primer campo
referente a la variable de una forma ordenada. Posteriormente se escribe la
palabra total después del último valor observado.
3. Calcular las frecuencias, para ello se cuenta cuantas veces aparece cada valor
observado en los datos obtenidos de la variable. La suma de todas las
frecuencias asociadas con cada valor observado debe coincidir con el total de
datos. Se recomienda hacer siempre esta comparación como un mecanismo de
validación, con el fin de prevenir errores en el conteo de los valores observados,
la cantidad obtenida se escribe después de la última frecuencia al lado derecho
de la palabra total.
4. Calcular los porcentajes, para esto se calcula la fracción (división) entre cada
una de las frecuencias y el total de datos, el resultado obtenido se multiplica por
100 para tener los respectivos porcentajes. La suma de todos los porcentajes
obtenidos para cada valor observado debe ser igual al 100%, este resultado se
escribe después del último porcentaje, al lado derecho de la cantidad total de
datos.
5. Calcular las frecuencias acumuladas, las cuales representan el número de datos
de la variable que son inferiores o iguales a un determinado valor observado.
6 2 4 5 5 5 4 4 4 4
3 4 4 5 2 3 5 2 5 5
2 4 6 3 6 5 5 5 5 5
Ahora para calcular las frecuencias se observa cuantas veces se repiten los valores
observados 2, 3, 4, 5 y 6 en los 30 datos que conforman la muestra seleccionada.
Por ejemplo, el 2 se repite 4 veces, indicando que la primera frecuencia es 4; en el
caso del 3 se repite 3 veces, indicando que la segunda frecuencia es 3 y así se
continúa haciendo el conteo con los otros números, hasta encontrar que el 6 se
repite 3 veces en la muestra y por lo tanto la última frecuencia en este caso es 3.
Por último, se valida que la suma de las frecuencias obtenidas sea igual a 30 que
es el total de datos en esta situación.
Para obtener los porcentajes, se divide cada uno de los valores obtenidos para las
cinco frecuencias sobre 30 y los resultados obtenidos se multiplican por 100 para
pasarlos a porcentaje, por ejemplo: 4 dividido 30 es aproximadamente 0.133, este
resultado se multiplica por 100 obteniendo el 13.3%, que sería el primer porcentaje
por registrar en la tabla.
Frecuencia Porcentaje
Peso en kilogramos Frecuencia Porcentaje
Acumulada Acumulado
De 64.20 a 67.95 4 8% 4 8%
De 67.96 a 71.70 5 10% 9 18%
De 71.71 a 75.45 16 32% 25 50%
De 75.46 a 79.20 16 32% 41 82%
De 79.21 a 82.95 8 16% 49 98%
De 82.96 a 86.70 1 2% 50 100%
Total 50 100.0%
Tabla 5: Distribución de frecuencias del peso de los estudiantes de Estadística.
Para la construcción de una tabla de frecuencias con datos puntuales, se debe tener
en cuenta los siguientes pasos:
1. Construir los encabezados de la tabla, la cual consta de cinco campos que son:
el nombre de la variable, la frecuencia, el porcentaje, la frecuencia acumulada
y el porcentaje acumulado.
2. Establecer el número de clases de la tabla, para esto se determina cuántos y
cuáles intervalos construir. Para esto se debe tener en cuenta que siempre que
se agrupan los datos en intervalos se produce pérdida de información: Si se
usan pocos intervalos se globalizan más los datos y se pierde bastante
información. Por el contrario, si se usan muchos intervalos la manipulación de
los datos se hace compleja y su presentación poco visible. Por tal motivo, se
recomienda utilizar entre 5 a 10 intervalos de clase. Definir un número apropiado
de intervalos, es una decisión que depende de varios factores: como el uso que
se desea dar a los datos, el tipo de datos con los que se trabaja y hasta los
propios gustos de quien hace el trabajo; por lo anterior existen diversas
propuestas para determinar este valor:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.10/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I
𝐿0 = 𝑀𝑖́𝑛𝑖𝑚𝑜
𝐿1 = 𝐿0 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑
𝐿2 = 𝐿1 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑
⋮
𝐿𝑚 = 𝐿𝑚−1 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑
Posteriormente, cada uno de estos valores de los limites se ubican en el primer
campo correspondiente a la variable en la tabla de frecuencias, de la siguiente
forma:
Nombre de la variable
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 1 [ 𝐿0 𝐿1 ]
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 2 ( 𝐿1 𝐿2 ]
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 3 ( 𝐿2 𝐿3 ]
⋮ ⋮ ⋮
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚 ( 𝐿𝑚−1 𝐿𝑚 ]
Valores de Valores de
los limites los limites
inferiores superiores
Figura 2: Estructura de los intervalos de clase en la tabla de frecuencias.
Como se aprecia en la figura, se emplea los símbolos del corchete “[“ ó “]” y el
paréntesis “(“ ó “)”, para indicar que el límite respectivo es abierto (paréntesis
indica que no incluye el valor del límite) o cerrado (corchete indica que si incluye
el valor del límite)3. En todos los intervalos de la tabla los límites superiores son
cerrados y en el caso de los límites inferiores todos son abiertos, excepto en el
primero de los intervalos. Bajo esta metodología el valor de 𝐿0 debe ser igual al
mínimo de los datos y el valor de 𝐿𝑚 debe ser igual al máximo de los datos.
5. Determinar las frecuencias asociadas con cada intervalo, para esto deben
contarse los valores de la variable que pertenecen o se encuentran en cada uno
de los intervalos establecidos, de acuerdo con la metodología anterior. La suma
de todas las frecuencias debe ser igual a la cantidad de datos en la variable.
6. Construir los otros campos (porcentaje, frecuencia acumulada y porcentaje
acumulado) como en el caso de las tablas de frecuencias con datos puntuales.
3
Esta simbología se emplea solo para que el estudiante comprenda como incluir los valores de los datos
dentro de los intervalos, más no es necesaria de representar en las tablas de frecuencias, en su lugar se pueden
emplear palabras como: desde, hasta, a, mayor, menor, o en su defecto iniciar el límite superior del siguiente
intervalo con una cantidad mayor al límite superior del intervalo anterior.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.12/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I
2.6 3.9 4.0 3.1 2.8 2.2 1.9 3.0 3.5 0.7
3.6 2.4 3.2 2.6 1.8 3.4 4.5 2.1 1.6 2.8
3.1 2.7 2.5 1.3 4.2 3.7 1.2 1.8 3.2 3.3
2.6 2.5 1.7 4.3 3.5 0.8 2.2 2.9 4.4 0.5
2.7 2.3 0.3 1.5 2.4 2.3 2.2 3.8 1.4 2.3
𝑚 = 5 25 = 32 < 50
𝑚
2 >𝑘
𝒎 = 𝟔 𝟐𝟔 = 𝟔𝟒 > 𝟓𝟎
De acuerdo con la regla de la potencia, el valor apropiado para 𝑚 es 6, indicando
que la tabla de frecuencias estará conformada por seis intervalos, donde la amplitud
de cada uno es la siguiente:
𝑅𝑎𝑛𝑔𝑜 = 𝑀𝑎́ 𝑥𝑖𝑚𝑜 − 𝑀𝑖́𝑛𝑖𝑚𝑜 = 4.5 − 0.3 = 4.2
𝑅𝑎𝑛𝑔𝑜 4.2
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = = = 0.7
𝑁𝑢́ 𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 6
Por lo tanto, el ancho de los seis intervalos será de 0.7 mg/l. Ya con esta información
se pueden construir los diferentes límites de los intervalos.
𝐿0 = 𝑀𝑖́𝑛𝑖𝑚𝑜 𝑎 𝐿0 = 0.3 + 0.7 = 1.0
𝐿1 = 𝐿0 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿1 = 0.3 + 0.7 = 1.0
𝐿2 = 𝐿1 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿2 = 1.0 + 0.7 = 1.7
𝐿3 = 𝐿2 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿3 = 1.7 + 0.7 = 2.4
𝐿4 = 𝐿3 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿4 = 2.4 + 0.7 = 3.1
𝐿5 = 𝐿4 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿5 = 3.1 + 0.7 = 3.8
𝐿6 = 𝐿5 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿6 = 3.8 + 0.7 = 4.5
Los porcentajes, se obtienen dividiendo cada una de las frecuencias sobre el total
de datos de la muestra y cada uno de los resultados obtenidos se multiplican por
100, por ejemplo, para calcular el primer porcentaje se hace la siguiente operación:
(4/50)*100 = (0.08)*100 = 8%.