Está en la página 1de 15

UNIVERSIDAD SANTIAGO DE CALI

FACULTAD DE CIENCIAS BÁSICAS


Pág.1/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

UNIDAD 2: REPRESENTACIÓN DE LOS DATOS


TABLAS Y GRÁFICOS DE FRECUENCIAS

2. TABLAS DE FRECUENCIAS
Las tablas de frecuencias son un método estadístico para organizar y resumir los
datos de una muestra o una población. Bajo esta metodología los datos que
componen una variable se clasifican y ordenan, indicándose el número de veces en
que se repite cada valor. A las tablas de frecuencias se les conoce también como
tablas de distribución de frecuencias o simplemente distribución de
frecuencias, porque permiten apreciar la forma en la que se distribuyen o
comportan los datos (puede apreciarse, si están cargados hacia un extremo o el
otro, si están concentrados cerca del centro, o si están distribuidos de manera
uniforme).

Las tablas de frecuencias, tiene algunas características importantes como son:


• Permiten manejar gran cantidad de información en espacios pequeños.
• Pueden usarse con variables cualitativas y cuantitativas.
• Resumen información en clases mutuamente excluyentes y colectivamente
exhaustivas. Las cuales muestran las categorías (en los datos categóricos), o los
valores observados (en los datos puntuales) o los intervalos (en datos
agrupados), de la variable donde se obtuvieron los datos.
• Muestran las frecuencias y porcentajes que la clase se encontró en los datos
recopilados.

2.1. TABLAS DE FRECUENCIAS CON DATOS CATEGÓRICOS:


En la primera sesión se definió que las variables cualitativas están asociadas con
modalidades o categorías y al construir una tabla de frecuencias con datos
categóricos, estas pueden agruparse como se muestra en la tabla 1.

Grupo racial Frecuencia Porcentaje


Afrodescendiente 14 14%
Blanco 18 18%
Indio 12 12%
Mestizo 30 30%
Mulato 16 16%
Zambo 10 10%
Total 100 100%
Tabla 1: Distribución de frecuencias de acuerdo con el grupo racial.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.2/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

En la tabla 1, se encuentra el resumen de una variable cualitativa con escala de


medición nominal, que es la raza de un grupo de 100 personas. Como se puede
observar, esta tabla permite identificar fácilmente la categoría que más predomina
dentro del grupo de personas (Mestizo), pues es la que tiene la frecuencia o el
porcentaje más grande.

Para la construcción de una tabla de frecuencias con datos categóricos, se debe


tener en cuenta los siguientes pasos:
1. Construir los encabezados de la tabla, la cual consta de tres campos que son:
el nombre de la variable, la frecuencia1 y el porcentaje2.
2. Establecer el número de clases de la tabla, para esto se determina cuáles y
cuántas son las categorías de la variable, para ubicarlas en el primer campo
referente a la variable. Cuando la variable presenta una escala de medición
nominal, se pueden ubicar en cualquier orden sus categorías, sin embargo,
cuando la variable presenta una escala de medición ordinal, las categorías se
ubican en el orden establecido por la variable. Posteriormente se escribe la
palabra total después de la última categoría.
3. Calcular las frecuencias, para ello se cuenta cuantas veces aparece cada
categoría en los datos obtenidos de la variable. La suma de todas las
frecuencias asociadas con cada categoría debe coincidir con el total de datos.
Se recomienda hacer siempre esta comparación como un mecanismo de
validación, con el fin de prevenir errores en el conteo de las categorías, el valor
obtenido se escribe después de la última frecuencia al lado derecho de la
palabra total.
4. Calcular los porcentajes, para esto se calcula la fracción (división) entre cada
una de las frecuencias y el total de datos, el resultado obtenido se multiplica por
100 para obtener los respectivos porcentajes. La suma de todos los porcentajes
obtenidos para cada categoría de deber ser igual al 100%, este resultado se
escribe después del último porcentaje, al lado derecho de la cantidad total de
datos.

Ejemplo: Suponga que se desea determinar, cuál es el


nivel de estudios de los egresados de uno de los programas
académicos de la universidad. Para ello se tomó una
muestra aleatoria de los egresados de este programa
académico, donde parte de los resultados obtenidos por
medio de un cuestionario se presentan a continuación:

1
En los textos de estadística a la frecuencia se le llama frecuencia absoluta.
2
En los textos de estadística al porcentaje (caso especial de la proporción) se le llama frecuencia relativa.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.3/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

U E D M U D M E M E
M D U E M U E M M U
M U D U M E M E M P
U D D M E M U M U M
Donde las categorías observadas presentan las siguientes equivalencias:
U: Universitario, E: Especialización, M: Maestría, D: Doctorado y P: Postdoctorado.

En este ejemplo, la variable analizada es el nivel de estudios de los egresados de


uno de los programas académicos de la universidad, la cual presenta una escala de
medición ordinal con cinco diferentes categorías, las cuales se pueden ordenar en
la tabla desde el nivel de estudios más bajo (Universitario), hasta el nivel de estudios
más alto (Postdoctorado).

Nivel de estudios Frecuencia Porcentaje


Universitario
Especialización
Maestría
Doctorado
Postdoctorado
Total

Para calcular las frecuencias, se observa cuantas veces se repiten cada una de las
categorías del nivel de estudios, en los 40 valores obtenidos en la variable, por
ejemplo, la categoría U correspondiente a Universitario se encuentra presente 10
veces en los datos, por tal motivo su frecuencia seria 10; de igual forma se procede
con cada una de las otras categorías del nivel de estudios, hasta la categoría P de
Postdoctorado la cual tiene una frecuencia de 1, pues solo se encuentra una vez
presente en los valores obtenidos en la variable.

Nivel de estudios Frecuencia Porcentaje


Universitario 10
Especialización 8
Maestría 15
Doctorado 6
Postdoctorado 1
Total 40

Finalmente, se calculan los porcentajes, los cuales se obtienen dividiendo la


frecuencia de cada categoría entre el total de datos, por ejemplo, en el caso de la
categoría Universitario, se divide 10 sobre 40 que es igual a 0.25 y este resultado
se multiplica por 100 para presentarlo en forma porcentual como el 25%.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.4/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Nivel de estudios Frecuencia Porcentaje


Universitario 10 25.0%
Especialización 8 20.0%
Maestría 15 37.5%
Doctorado 6 15.0%
Postdoctorado 1 2.5%
Total 40 100.0%
Tabla 2: Distribución de frecuencias para el nivel de estudios.

De acuerdo con los resultados obtenidos en la tabla 2, para el nivel de estudios de


los egresados de ese programa académico de la universidad, la interpretación de
algunos de los valores de la tabla de frecuencias es la siguiente: La frecuencia de 5
obtenida para la categoría Maestría, indica que 5 de los 40 egresados encuestados
de ese programa académico de la universidad, tienen estudios de maestría. Por otra
parte, el porcentaje del 15.0% obtenido para la categoría Doctorado, indica que el
15% de los egresados encuestados de ese programa académico de la universidad,
tienen estudios de doctorado.

2.2. TABLAS DE FRECUENCIAS CON DATOS PUNTUALES:


Se procede de forma similar al caso anterior de las tablas de frecuencias con datos
categóricos, aunque en este caso la información a resumir corresponde a la de una
variable cuantitativa y la tabla de frecuencias contiene dos columnas adicionales
que aportan información acumulada de los datos, como se muestra en la tabla 3.

Número de fallas Frecuencia Porcentaje


Frecuencia Porcentaje
del sistema Acumulada Acumulado
0 2 8% 2 8%
1 4 16% 6 24%
2 8 32% 14 56%
3 4 16% 18 72%
4 3 12% 21 84%
5 4 16% 25 100%
Total 25 100%
Tabla 3: Distribución de frecuencias para el número de fallas del sistema.

En la tabla 3, se encuentra el resumen de una variable cuantitativa con escala de


medición de razón, que es el número de fallas de un sistema por semana. Como se
puede observar, esta tabla contiene dos columnas adicionales de gran utilidad
práctica, por ejemplo, puede conocerse que, como máximo se presentaron 2 fallas
en el sistema en el 56% de las semanas.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.5/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Para la construcción de una tabla de frecuencias con datos puntuales, se debe tener
en cuenta los siguientes pasos:
1. Construir los encabezados de la tabla, la cual consta de cinco campos que son:
el nombre de la variable, la frecuencia, el porcentaje, la frecuencia acumulada
y el porcentaje acumulado.
2. Establecer el número de clases de la tabla, para esto se determina cuáles y
cuántos valores diferentes toma la variable, para ubicarlos en el primer campo
referente a la variable de una forma ordenada. Posteriormente se escribe la
palabra total después del último valor observado.
3. Calcular las frecuencias, para ello se cuenta cuantas veces aparece cada valor
observado en los datos obtenidos de la variable. La suma de todas las
frecuencias asociadas con cada valor observado debe coincidir con el total de
datos. Se recomienda hacer siempre esta comparación como un mecanismo de
validación, con el fin de prevenir errores en el conteo de los valores observados,
la cantidad obtenida se escribe después de la última frecuencia al lado derecho
de la palabra total.
4. Calcular los porcentajes, para esto se calcula la fracción (división) entre cada
una de las frecuencias y el total de datos, el resultado obtenido se multiplica por
100 para tener los respectivos porcentajes. La suma de todos los porcentajes
obtenidos para cada valor observado debe ser igual al 100%, este resultado se
escribe después del último porcentaje, al lado derecho de la cantidad total de
datos.
5. Calcular las frecuencias acumuladas, las cuales representan el número de datos
de la variable que son inferiores o iguales a un determinado valor observado.

Figura 1: Forma de cálculo de la frecuencia acumulada.


UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.6/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

En la figura 1, se muestra un diagrama con la forma de cálculo de las


frecuencias acumuladas, donde la primera frecuencia acumulada es igual a la
primera frecuencia registrada en la tabla, la segunda frecuencia acumulada es
igual a la suma de la segunda frecuencia registrada en la tabla más la frecuencia
acumulada anterior, se continua con este procedimiento hasta encontrar la
última frecuencia acumulada, la cual es el resultado de sumar la última
frecuencia registrada en la tabla con la penúltima frecuencia acumulada. El
resultado de la última frecuencia acumulada debe coincidir con el total de datos.
6. Calcular los porcentajes acumulados, estos se pueden obtener al dividir cada
una de las frecuencias acumuladas sobre el total de datos y el resultado
obtenido se multiplica por 100 para obtener los respectivos porcentajes, por lo
cual, el resultado del último porcentaje acumulado debe ser del 100%.

Ejemplo: Suponga que se realizó un estudio en un barrio de


la ciudad de Cali para averiguar el número de habitantes por
vivienda, esto con el fin de implementar servicios de trabajo
social en esa comunidad. Por razones de tiempo y costo, no
se encuestó la totalidad de viviendas de ese sector, sino que
se seleccionó una muestra de tamaño 30. Los resultados
obtenidos se muestran a continuación:

6 2 4 5 5 5 4 4 4 4
3 4 4 5 2 3 5 2 5 5
2 4 6 3 6 5 5 5 5 5

En este ejemplo la variable analizada número de habitantes por vivienda, presenta


solo cinco valores observados diferentes, que son los números 2, 3, 4, 5 y 6. Estos
valores se ubican en forma ordenada en la primera columna de la tabla de
frecuencias correspondiente a la variable.

Número de habitantes Frecuencia Porcentaje


Frecuencia Porcentaje
por vivienda Acumulada Acumulado
2
3
4
5
6
Total
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.7/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Ahora para calcular las frecuencias se observa cuantas veces se repiten los valores
observados 2, 3, 4, 5 y 6 en los 30 datos que conforman la muestra seleccionada.
Por ejemplo, el 2 se repite 4 veces, indicando que la primera frecuencia es 4; en el
caso del 3 se repite 3 veces, indicando que la segunda frecuencia es 3 y así se
continúa haciendo el conteo con los otros números, hasta encontrar que el 6 se
repite 3 veces en la muestra y por lo tanto la última frecuencia en este caso es 3.
Por último, se valida que la suma de las frecuencias obtenidas sea igual a 30 que
es el total de datos en esta situación.

Número de habitantes Frecuencia Porcentaje


Frecuencia Porcentaje
por vivienda Acumulada Acumulado
2 4
3 3
4 8
5 12
6 3
Total 30

Para obtener los porcentajes, se divide cada uno de los valores obtenidos para las
cinco frecuencias sobre 30 y los resultados obtenidos se multiplican por 100 para
pasarlos a porcentaje, por ejemplo: 4 dividido 30 es aproximadamente 0.133, este
resultado se multiplica por 100 obteniendo el 13.3%, que sería el primer porcentaje
por registrar en la tabla.

Número de habitantes Frecuencia Porcentaje


Frecuencia Porcentaje
por vivienda Acumulada Acumulado
2 4 13.3%
3 3 10.0%
4 8 26.7%
5 12 40.0%
6 3 10.0%
Total 30 100.0%

Ahora para encontrar los valores de las frecuencias acumuladas, se procede de


acuerdo con el esquema de cálculo presentado en la figura 1. Obteniendo las
siguientes frecuencias acumuladas: la primera es 4, la segunda es 3 + 4 = 7, la
tercera es 8 + 7 = 15, la cuarta es 12 + 15 = 27 y la quinta es 3 + 27 = 30, donde
este último resultado coincide con el total de datos de la muestra. Es de recalcar
que conforme se obtiene cada uno de los valores de la frecuencia acumulada, estos
se deben ir registrando en la tabla de frecuencias y las nuevas frecuencias
acumuladas obtenidas siempre deben ser mayores que las anteriores.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.8/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Número de habitantes Frecuencia Porcentaje


Frecuencia Porcentaje
por vivienda Acumulada Acumulado
2 4 13.3% 4
3 3 10.0% 7
4 8 26.7% 15
5 12 40.0% 27
6 3 10.0% 30
Total 30 100.0%

Los porcentajes acumulados se calculan dividiendo cada uno de los valores


obtenidos en la frecuencia acumulada sobre 30 que es el total de datos y
multiplicándolos por 100. Por ejemplo, el tercer porcentaje acumulado es igual a
15/30 = 0.50 que al multiplicarlo por 100 da 50.0%.

Número de habitantes Frecuencia Porcentaje


Frecuencia Porcentaje
por vivienda Acumulada Acumulado
2 4 13.3% 4 13.3%
3 3 10.0% 7 23.3%
4 8 26.7% 15 50.0%
5 12 40.0% 27 90.0%
6 3 10.0% 30 100.0%
Total 30 100.0%
Tabla 4: Distribución de frecuencias del número de habitantes por vivienda.

Finalmente, con los resultados obtenidos en la tabla 2, para el número de habitantes


por vivienda, se puede interpretar algunos de los valores de la tabla de frecuencias:
La frecuencia de 8 obtenida para el valor observado 4 en la variable, indica que, de
acuerdo con lo observado en la muestra, 8 viviendas están conformadas por 4
habitantes. El porcentaje del 13.3% obtenido para el valor observado 2 en la
variable, indica que, de acuerdo con la muestra, el 13.3% de las viviendas están
conformadas por 2 habitantes. En la interpretación de la frecuencia acumulada y en
la del porcentaje acumulado, hay que tener presente que estos campos, están
acumulando datos desde el valor mínimo que toma la variable hasta el valor que se
piensa interpretar, por lo tanto, un ejemplo de sus interpretaciones serían las
siguientes: La frecuencia acumulada de 7 obtenida para el valor observado 3 en la
variable, indica que, de acuerdo con la muestra, hay 7 viviendas que están
conformadas por 3 o menos habitantes. El porcentaje acumulado de 90.0% obtenido
para el valor observado 5 en la variable, indica que, indica que el 90% de los datos
son iguales o inferiores a 5, es decir que, de acuerdo con la muestra, el 90% de las
viviendas están conformadas por 5 o menos habitantes.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.9/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

2.3. TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS:


Al igual que en las tablas de frecuencias con datos puntuales, las tablas de
frecuencias con datos agrupados están compuestas por cinco campos, sin
embargo, se presenta una diferencia en el primero de ellos correspondiente a la
información a mostrar de la variable cuantitativa, puesto que en este caso no se
presentan sus valores únicos, sino que se presentan intervalos o grupos de valores,
tal y como se muestra en la tabla 5.

Frecuencia Porcentaje
Peso en kilogramos Frecuencia Porcentaje
Acumulada Acumulado
De 64.20 a 67.95 4 8% 4 8%
De 67.96 a 71.70 5 10% 9 18%
De 71.71 a 75.45 16 32% 25 50%
De 75.46 a 79.20 16 32% 41 82%
De 79.21 a 82.95 8 16% 49 98%
De 82.96 a 86.70 1 2% 50 100%
Total 50 100.0%
Tabla 5: Distribución de frecuencias del peso de los estudiantes de Estadística.

En la tabla 5, se encuentra el resumen de una variable cuantitativa con escala de


medición de razón, que es el peso de una muestra de estudiantes del curso de
Estadística. Como se puede observar, esta tabla contiene en la primera columna la
información de la variable agrupada por medio de seis intervalos, donde los
diferentes valores observados oscilan entre 64.2 y 86.7 kilogramos.

Para la construcción de una tabla de frecuencias con datos puntuales, se debe tener
en cuenta los siguientes pasos:
1. Construir los encabezados de la tabla, la cual consta de cinco campos que son:
el nombre de la variable, la frecuencia, el porcentaje, la frecuencia acumulada
y el porcentaje acumulado.
2. Establecer el número de clases de la tabla, para esto se determina cuántos y
cuáles intervalos construir. Para esto se debe tener en cuenta que siempre que
se agrupan los datos en intervalos se produce pérdida de información: Si se
usan pocos intervalos se globalizan más los datos y se pierde bastante
información. Por el contrario, si se usan muchos intervalos la manipulación de
los datos se hace compleja y su presentación poco visible. Por tal motivo, se
recomienda utilizar entre 5 a 10 intervalos de clase. Definir un número apropiado
de intervalos, es una decisión que depende de varios factores: como el uso que
se desea dar a los datos, el tipo de datos con los que se trabaja y hasta los
propios gustos de quien hace el trabajo; por lo anterior existen diversas
propuestas para determinar este valor:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.10/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

❖ De forma arbitraria por parte del investigador, quien decide cuántos


intervalos crear y la amplitud o ancho de los mismos, que en todos los
intervalos puede ser la misma o puede variar de un intervalo a otro.
❖ Mediante una forma óptima, para la cual existen diferentes métodos, entre
los más conocidos se encuentran:
• La regla de la raíz cuadrada, que consiste en calcular la raíz cuadrada
del número de datos (sea 𝑘 el total de datos en la muestra o en la
población):
√𝑘

• La regla de Scott, que es la raíz cubica de la multiplicación entre 2 por el


número de datos (sea 𝑘 el total de datos en la muestra o en la población):
3
√2𝑘

• La regla de Sturges, que es la suma de 1 más 3.322 por el logaritmo del


número de datos (sea 𝑘 el total de datos en la muestra o en la población):
1 + 3.322 ∗ log(𝑘)

• La regla de la potencia, que consiste en escoger el menor exponente 𝑚,


que satisface que el resultado de elevar 2 a la 𝑚 (2𝑚 ) es mayor que el
número de datos (sea 𝑘 el total de datos en la muestra o en la población):
2𝑚 > 𝑘

El valor de 𝑚 seleccionado determina el número de intervalos a mostrar


en las tablas de frecuencias con datos agrupados.
Los tres primeros métodos pueden generar resultados con valores con
decimales, por lo cual es necesario redondearlos al entero más cercano.
Para efectos prácticos, en este documento se empleará la regla de la
potencia, para el cálculo del número apropiado de intervalos, los
cuales tendrán una amplitud constante.
3. Calcular la amplitud o ancho de los intervalos, para esto primero se debe
calcular un indicador conocido como el Rango, el cual es la diferencia entre el
mayor y el menor valor observado en la variable. A partir de este indicador se
calcula la amplitud de los intervalos mediante la siguiente expresión:
𝑅𝑎𝑛𝑔𝑜
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 =
𝑁𝑢́ 𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
4. Construir cada uno de los intervalos con la misma amplitud, para ello primero
se determinan los diferentes límites de los intervalos, mediante la siguiente
secuencia:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.11/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

𝐿0 = 𝑀𝑖́𝑛𝑖𝑚𝑜
𝐿1 = 𝐿0 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑
𝐿2 = 𝐿1 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑

𝐿𝑚 = 𝐿𝑚−1 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑
Posteriormente, cada uno de estos valores de los limites se ubican en el primer
campo correspondiente a la variable en la tabla de frecuencias, de la siguiente
forma:
Nombre de la variable
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 1 [ 𝐿0 𝐿1 ]
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 2 ( 𝐿1 𝐿2 ]
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 3 ( 𝐿2 𝐿3 ]
⋮ ⋮ ⋮
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑚 ( 𝐿𝑚−1 𝐿𝑚 ]

Valores de Valores de
los limites los limites
inferiores superiores
Figura 2: Estructura de los intervalos de clase en la tabla de frecuencias.

Como se aprecia en la figura, se emplea los símbolos del corchete “[“ ó “]” y el
paréntesis “(“ ó “)”, para indicar que el límite respectivo es abierto (paréntesis
indica que no incluye el valor del límite) o cerrado (corchete indica que si incluye
el valor del límite)3. En todos los intervalos de la tabla los límites superiores son
cerrados y en el caso de los límites inferiores todos son abiertos, excepto en el
primero de los intervalos. Bajo esta metodología el valor de 𝐿0 debe ser igual al
mínimo de los datos y el valor de 𝐿𝑚 debe ser igual al máximo de los datos.
5. Determinar las frecuencias asociadas con cada intervalo, para esto deben
contarse los valores de la variable que pertenecen o se encuentran en cada uno
de los intervalos establecidos, de acuerdo con la metodología anterior. La suma
de todas las frecuencias debe ser igual a la cantidad de datos en la variable.
6. Construir los otros campos (porcentaje, frecuencia acumulada y porcentaje
acumulado) como en el caso de las tablas de frecuencias con datos puntuales.

3
Esta simbología se emplea solo para que el estudiante comprenda como incluir los valores de los datos
dentro de los intervalos, más no es necesaria de representar en las tablas de frecuencias, en su lugar se pueden
emplear palabras como: desde, hasta, a, mayor, menor, o en su defecto iniciar el límite superior del siguiente
intervalo con una cantidad mayor al límite superior del intervalo anterior.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.12/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Ejemplo: Una entidad encargada del control de la


contaminación de cierto rio de Cali, lleva registros sobre el
nivel de oxígeno disuelto en el agua, expresados en mg/l;
los datos obtenidos a partir de una muestra aleatoria se
presentan a continuación:

2.6 3.9 4.0 3.1 2.8 2.2 1.9 3.0 3.5 0.7
3.6 2.4 3.2 2.6 1.8 3.4 4.5 2.1 1.6 2.8
3.1 2.7 2.5 1.3 4.2 3.7 1.2 1.8 3.2 3.3
2.6 2.5 1.7 4.3 3.5 0.8 2.2 2.9 4.4 0.5
2.7 2.3 0.3 1.5 2.4 2.3 2.2 3.8 1.4 2.3

En este ejemplo la variable analizada niveles de oxígeno disuelto en el rio


expresados en mg/l, presenta 36 valores observados diferentes del total de 50 datos
que conforman la muestra. Lo cual indica que la información se debe resumir por
medio de una tabla de frecuencia con datos agrupados. Para ello lo primero es
identificar cuántos intervalos conforman la tabla y cuál sería su respectiva amplitud.

𝑚 = 5 25 = 32 < 50
𝑚
2 >𝑘
𝒎 = 𝟔 𝟐𝟔 = 𝟔𝟒 > 𝟓𝟎
De acuerdo con la regla de la potencia, el valor apropiado para 𝑚 es 6, indicando
que la tabla de frecuencias estará conformada por seis intervalos, donde la amplitud
de cada uno es la siguiente:
𝑅𝑎𝑛𝑔𝑜 = 𝑀𝑎́ 𝑥𝑖𝑚𝑜 − 𝑀𝑖́𝑛𝑖𝑚𝑜 = 4.5 − 0.3 = 4.2
𝑅𝑎𝑛𝑔𝑜 4.2
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = = = 0.7
𝑁𝑢́ 𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 6
Por lo tanto, el ancho de los seis intervalos será de 0.7 mg/l. Ya con esta información
se pueden construir los diferentes límites de los intervalos.
𝐿0 = 𝑀𝑖́𝑛𝑖𝑚𝑜 𝑎 𝐿0 = 0.3 + 0.7 = 1.0
𝐿1 = 𝐿0 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿1 = 0.3 + 0.7 = 1.0
𝐿2 = 𝐿1 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿2 = 1.0 + 0.7 = 1.7
𝐿3 = 𝐿2 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿3 = 1.7 + 0.7 = 2.4
𝐿4 = 𝐿3 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿4 = 2.4 + 0.7 = 3.1
𝐿5 = 𝐿4 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿5 = 3.1 + 0.7 = 3.8
𝐿6 = 𝐿5 + 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝐿6 = 3.8 + 0.7 = 4.5

Y la representación de los intervalos en la tabla de frecuencia es la siguiente:


UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.13/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Niveles de oxígeno Frecuencia Porcentaje


Frecuencia Porcentaje
disuelto en mg/l Acumulada Acumulado
[ 0.3 a 1.0 ]
( 1.0 a 1.7 ]
( 1.7 a 2.4 ]
( 2.4 a 3.1 ]
( 3.1 a 3.8 ]
( 3.8 a 4.5 ]
Total

Para calcular las frecuencias se debe determinar cuántos de los datos de la


muestran caen dentro de cada intervalo. Por ejemplo, para el primer intervalo se
cuentan cuántos registros de oxígeno disuelto en la muestra, hay desde 0.3 mg/l
hasta 1.0 mg/l, encontrando 4 valores que se muestran en color rojo. Para el
segundo intervalo se cuentan cuántos registros de oxígeno disuelto en la muestra,
son mayores a 1.0 mg/l y menores o iguales a 2.4 mg/l, encontrando 6 valores que
se muestran en color verde.
2.6 3.9 4.0 3.1 2.8 2.2 1.9 3.0 3.5 0.7
3.6 2.4 3.2 2.6 1.8 3.4 4.5 2.1 1.6 2.8
3.1 2.7 2.5 1.3 4.2 3.7 1.2 1.8 3.2 3.3
2.6 2.5 1.7 4.3 3.5 0.8 2.2 2.9 4.4 0.5
2.7 2.3 0.3 1.5 2.4 2.3 2.2 3.8 1.4 2.3
De igual forma se continua con este procedimiento para identificar las otras
frecuencias, teniendo en cuenta que ya no se debe incluir el valor de los límites
inferiores de los intervalos en los conteos. Por ejemplo, para el tercer intervalo se
cuentan cuántos registros de oxígeno disuelto en la muestra, hay desde 1.8 mg/l
hasta 2.4 mg/l (hay 12 registros), pues a pesar de que el intervalo es ( 1.7 a 2.4 ], el
símbolo del paréntesis indica que el valor 1.7 del límite inferior, no debe ser tenido
en cuenta pues ya se contó en el segundo intervalo. Los valores obtenidos para
cada una de las frecuencias y la suma total de ellas se muestran a continuación:

Niveles de oxígeno Frecuencia Porcentaje


Frecuencia Porcentaje
disuelto en mg/l Acumulada Acumulado
[ 0.3 a 1.0 ] 4
( 1.0 a 1.7 ] 6
( 1.7 a 2.4 ] 12
( 2.4 a 3.1 ] 13
( 3.1 a 3.8 ] 9
( 3.8 a 4.5 ] 6
Total 50
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.14/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Los porcentajes, se obtienen dividiendo cada una de las frecuencias sobre el total
de datos de la muestra y cada uno de los resultados obtenidos se multiplican por
100, por ejemplo, para calcular el primer porcentaje se hace la siguiente operación:
(4/50)*100 = (0.08)*100 = 8%.

Niveles de oxígeno Frecuencia Porcentaje


Frecuencia Porcentaje
disuelto en mg/l Acumulada Acumulado
[ 0.3 a 1.0 ] 4 8%
( 1.0 a 1.7 ] 6 12%
( 1.7 a 2.4 ] 12 24%
( 2.4 a 3.1 ] 13 26%
( 3.1 a 3.8 ] 9 18%
( 3.8 a 4.5 ] 6 12%
Total 50 100%

Similar al caso de los datos puntuales, se pueden obtener las frecuencias


acumuladas, con base en el procedimiento descrito en la figura 1 y el porcentaje
acumulado se calcula dividiendo cada uno de los valores obtenidos en la frecuencia
acumulada sobre 50 que es el total de datos y multiplicándolos por 100.

Niveles de oxígeno Frecuencia Porcentaje


Frecuencia Porcentaje
disuelto en mg/l Acumulada Acumulado
[ 0.3 a 1.0 ] 4 8% 4 8%
( 1.0 a 1.7 ] 6 12% 10 20%
( 1.7 a 2.4 ] 12 24% 22 44%
( 2.4 a 3.1 ] 13 26% 35 70%
( 3.1 a 3.8 ] 9 18% 44 88%
( 3.8 a 4.5 ] 6 12% 50 100%
Total 50 100%
Tabla 6: Distribución de frecuencias de los niveles de oxígeno disuelto en el agua.

Otra forma de presentar la tabla 6, es como se muestran los intervalos en la tabla 7.

Niveles de oxígeno Frecuencia Porcentaje


Frecuencia Porcentaje
disuelto en mg/l Acumulada Acumulado
De 0.3 a 1.0 4 8% 4 8%
De 1.1 a 1.7 6 12% 10 20%
De 1.8 a 2.4 12 24% 22 44%
De 2.5 a 3.1 13 26% 35 70%
De 3.2 a 3.8 9 18% 44 88%
De 3.9 a 4.5 6 12% 50 100%
Total 50 100%
Tabla 7: Distribución de frecuencias de los niveles de oxígeno disuelto en el agua.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.15/15
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Las interpretaciones de las tablas de frecuencias con datos agrupados se hacen


teniendo en cuenta los límites de los intervalos. Por ejemplo, la interpretación de la
frecuencia de 6 correspondiente al segundo intervalo, indica que, de acuerdo con la
muestra observada, se encontró 6 registros de oxígeno disuelto en el agua que
cuyos niveles están entre 1.0 y 1.7 mg/l. En el caso del porcentaje del 26%
correspondiente al cuarto intervalo se tiene que, de acuerdo con la muestra
observada, el 26% de los registros de oxígeno disuelto en el agua, presentan niveles
entre 2.4 y 3.1 mg/l. Para la frecuencia acumulada de 44 correspondiente al quinto
intervalo, la interpretación es que, en la muestra observada, se encontró 44 registros
de oxígeno disuelto en el agua cuyos niveles son menores o iguales a 3.8 mg/l.
Finalmente, para el porcentaje acumulado de 44% correspondiente al tercer
intervalo, se tiene que, de acuerdo con la muestra observada, se encontró que el
44% de los registros de oxígeno disuelto en el agua presentan niveles menores o
iguales a 2.4 mg/l.

También podría gustarte