Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Algunas herramientas para ordenar los datos son las distribuciones de frecuencias en
tablas estadísticas. El ordenamiento es un arreglo convencional de los datos obtenidos
en una investigación muestral.
Distribución de frecuencias
Es una tabla en la que se presentan en forma ordenada todas las categorías o valores
de una variable y su correspondiente frecuencia. En estas distribuciones cada dato
mantiene su propia identidad, siguiendo un orden lógico con sus respectivas
frecuencias.
EJEMPLO 1:
6 5 7 7 8 6 5 7 7 8
2 5 4 3 2 2 3 3 4 4
4 1 1 5 6 4 5 4 3 3
4 2 2 3 3 1 1 4 4 2
2 6 4 3 3 1 4 3 3 3
5 1 4 2 5 3 4 3 4 2
2 3 5 4 2 4 5 6 4 4
Para confeccionar la tabla, como primer paso, ubicamos los valores de la variable de
menor a mayor.
Luego, calcularemos las distintas frecuencias; para ello definiremos, previamente, cada
una de las mismas:
La sumatoria de las frecuencias absolutas debe ser igual a la cantidad del total
analizado, suele representarse con la letra N.
frecuencia relativa (fr): indica en qué proporción se presenta cada una de las
frecuencias de los valores de la variable respecto del total.
Frecuencia
MENORES Frecuenci absoluta Frecuencia Frecuencia Porcentaje
DE EDAD a acumulada relativa relativa %
POR HOGAR absoluta Fa fr acumulada
fa Fr
1 6 6 6/70 6/70 8,57 %
2 11 17 11/70 17/70 15,71 %
3 15 32 15/70 32/70 21,43 %
4 18 50 18/70 50/70 25,71 %
5 9 59 9/70 59/70 12,86 %
6 5 64 5/70 64/70 7,14 %
7 4 68 4/70 68/70 5,72 %
8 2 70 2/70 70/70 = 1 2,86 %
Total 70 1 100 %
No ocurre lo mismo con las frecuencias acumuladas, ya que éstas sólo tienen sentido
cuando se trabaja con variables cuantitativas o cualitativas ordinales, dado que
permiten realizar lecturas acerca de cuántos datos se encuentran por debajo de un
determinado valor o categoría, por ejemplo.
NOTA: En el ejemplo 1, señalamos que en el barrio hay 50 hogares en los que hay 4
menores de edad o menos, es decir, hay 50 datos por debajo del valor 4, que
representa el número de menores.
EJEMPLO 2:
En este ejemplo, la variable que se analiza es del tipo cualitativa, por ello se
calculan sólo frecuencias absolutas y relativas. Mediante una tabla de distribución
de frecuencias se puede resumir y leer fácilmente, lo que no sería posible con una
tediosa lista de doscientos datos desordenados.
Tabla de distribución de frecuencias para DATOS AGRUPADOS
En el caso de las variables continuas, el número de valores distintos que puede tomar
la variable es infinito, teóricamente, y en la práctica puede ser bastante grande. Si se
midiera, por ejemplo, la estatura en centímetros de un cierto número de personas
podemos tener tantos valores como personas medidas. Esto provoca que los datos sean
muy numerosos. Para evitarlo, se trabaja con datos agrupados en intervalos de igual
amplitud, de tal manera que en ellos queden contenidos el valor mínimo y el valor
máximo de la variable.
Ejemplo:
Se realiza un registro de las alturas de un grupo de deportistas para seleccionar los
integrantes del equipo de baloncesto. Las alturas (en centímetros) de los 40
estudiantes que integran el grupo son las siguientes:
Rango o recorrido
El rango o recorrido (R) se define como la variación numérica de la variable, es el recorrido que toma la
variable desde el valor más pequeño hasta el valor más alto. Se calcula mediante la siguiente ecuación:
R= [Ls - Li]
R: rango o recorrido.
Li: límite inferior (menor valor de la variable).
Ls: límite superior (mayor valor de la variable).
En el ejemplo:
Ls - Li = 180 - 152 = 28
Por lo tanto el Rango = 28
i = 1 + 3.3 x log n
Donde n es el número total de datos. En caso de que se analice la totalidad de elementos de la población,
ésta se representa por N.
i = 1 + 3.3 x log 40
i = 6,28
La amplitud de los intervalos (A) es conveniente que sea la misma para todos los intervalos.
En este caso se recomienda usar 7 intervalos, con una amplitud de 4 centímetros, ya que estamos
analizando alturas de personas.
Si la amplitud del intervalo no es exacta con ninguno de los dos valores arrojados por la fórmula de
Sturges, el número de intervalos se puede variar hasta hacer la división exacta.
Al construir los intervalos, cada uno de ellos está determinado por dos extremos: límite inferior (Li) y límite
superior (Ls). Para el primer intervalo, el límite inferior es igual al límite inferior del rango y el límite
superior de este intervalo se conforma sumando la amplitud (A) al límite inferior. El segundo intervalo
parte del límite superior del primer intervalo y se le suma la amplitud para obtener el límite superior. Este
proceso se repite para el total de intervalos en los cuales se agrupó el conjunto de datos.
Alturas (cm)
[152, 156]
(156, 160]
(160, 164]
(164, 168]
(168, 172]
(172, 176]
(176, 180]
Marca clase o centro de la clase (Xi): es la semisuma de los límites de cada clase y
representa a todos los datos que están contenidos en una clase.
Frecuenc Frecuenc
Frecuenc ia Frecuenc ia
Marca de Porcenta
Alturas ia absoluta ia relativa
clase je
(cm) absoluta acumula relativa acumula
Xi %
fa da fr da
Fa Fr
[152, 156] 154 7 7 7/40 7/40 17,5 %
(156, 160] 158 7 14 7/40 14/40 17,5 %
(160, 164] 162 10 24 10/40 24/40 25 %
(164, 168] 166 4 28 4/40 28/40 10 %
(168, 172] 170 5 33 5/40 33/40 12,5 %
(172, 176] 174 5 38 5/40 38/40 12,5 %
(176, 180] 178 2 40 2/40 1 5%
Total
n = 40 1 100%