Está en la página 1de 12

DISTRIBUCIÓNES DE FRECUENCIAS

Datos en bruto:
Los datos en bruto son los datos recolectados que aún no se han organizado, por ejemplo, las
estaturas de 300 estudiantes tomadas de la lista alfabética de una universidad.

Ordenaciones:
Una ordenación se lleva a cabo cuando los datos numéricos en bruto son dispuestos en orden
creciente o decreciente de magnitud.

En la estadística descriptiva, existen dos formas de tabular los datos numéricos:


a) Datos No Agrupados
b) Datos Agrupados

a) Datos No Agrupados: En este tipo de tabulación, los valores de cada dato no se combinan
para formar “grupos” sino que, cada dato, es un grupo en sí.

Ejemplo 1.- Elaborar la tabla de distribución de frecuencias absolutas, frecuencias


acumuladas, frecuencias relativas y relativas acumuladas en la forma de Datos No Agrupados
para las calificaciones de 22 alumnos que hicieron un examen de matemáticas de una escuela
primaria las cuales son:
Variable Estadística: x = Calificaciones
6,4,3,3,5,6,7,9,0,5,4,9,10,2,7,2,3,5,6,5,9,8

En primer lugar, se debe de ordenar los datos de forma creciente o decreciente, para este
ejemplo, lo haremos de forma creciente, es decir, de menor a mayor:

0,2,2,3,3,3,4,4,5,5,5,5,6,6,6,7,7,8,9,9,9,10

Ahora bien, la frecuencia absoluta (fi) de una variable estadística, es el número de veces que
se repite cada valor de la variable. La frecuencia acumulada (fai) es la frecuencia que se
obtiene sumando sucesivamente los números de la columna de frecuencia absoluta. La
frecuencia relativa (fri) es aquella que se obtiene dividiendo la frecuencia de la clase entre el
número total de datos (n) y, la suma de las frecuencias relativas debe ser siempre igual a 1.

𝒇𝒊
fri = y ∑ 𝑓𝑟𝑖 = 1
𝒏
Las frecuencias relativas acumuladas (frai) son aquellas que se obtienen sumando
sucesivamente los números de la columna de las frecuencias relativas.

La siguiente tabla ilustra la tabla de Distribución de Frecuencias para Datos No Agrupados de


las calificaciones obtenidas por 22 alumnos:

FRECUENCIAS
VARIABLE FRECUENCIAS
FRECUENCIAS RELATIVAS
ESTADÍSTICA ACUMULADAS RELATIVAS
(fi) ACUMULADAS
(Xi) (fai) (fri)
(frai)
0 1 1 1/22 1/22
2 2 3 2/22 3/22
3 3 6 3/22 6/22
4 2 8 2/22 8/22
5 4 12 4/22 12/22
6 3 15 3/22 15/22
7 2 17 2/22 17/22
8 1 18 1/22 18/22
9 3 21 3/22 21/22
10 1 22 1/22 22/22

b) Datos Agrupados: En este tipo de tabulación, la organización de los datos en bruto


también comienza con su ordenación de forma creciente o decreciente y,
posteriormente, se procederá a obtener el Rango que se obtiene de la diferencia entre
el dato mayor y, el dato menor y se simboliza con una “R”. Una vez obtenido el rango, hay
que distribuirlos en clases, intervalos o categorías y determinar la cantidad de datos que
pertenece a cada clase; esta cantidad se conoce como la frecuencia de clase.

Clases, Intervalos o Categorías:


Una clase, intervalo o categoría es el medio por el cual, los datos se van agrupando de manera
que la totalidad de los datos, queden concentrados en dichas clases, intervalos o categorías.
Existen dos formas de calcular el número de clases (que simbolizaremos con la letra “k”),
necesarias para concentrar la totalidad de los datos y dependerá dicho número de la cantidad
total de datos que simbolizaremos con la letra “n”:
1era. Comprende el uso de la regla de Herbert Sturges (1926), la cual, se muestra a
continuación:
k = 1 + 3.32log (n)
2da. Comprende obtener la raíz cuadrada de “n”:

k = √𝒏
Es necesario señalar que algunos autores como Murray Spiegel y Larry Stephens (2009),
recomiendan que la cantidad de clases, intervalos o categorías no deberán ser tan pequeñas
(menos de 5) o tan grandes (más de 20) lo cual, dependerá del total de datos.
Ahora bien, una vez obtenido el rango y el número de clases, podemos obtener la amplitud o
tamaño de cada clase que simbolizaremos con la letra “c” y que se obtiene del cociente entre
el rango y el número de clases:
𝑹 (𝒓𝒂𝒏𝒈𝒐)
c=
𝒌 (𝒄𝒍𝒂𝒔𝒆𝒔)

Una vez obtenida la amplitud de clase, podemos obtener los Límites Inferior y Límite Superior
de cada clase tomando en cuenta que, para la primera clase, el límite inferior será el menor de
los datos obtenidos en el ordenamiento inicial y, a este número, se le sumará la amplitud de la
clase lo cual nos dará automáticamente el límite superior. Para la siguiente clase, el límite
inferior será el límite superior obtenido de la clase anterior y a éste se le sumará la amplitud de
clase para obtener el límite superior de la segunda clase y así sucesivamente para todas las
demás clases.
Cabe señalar que para evitar el “error de agrupamiento”, es necesario qué a los límites de clase
obtenidos anteriormente, se deberán de obtener los Límites Reales de Clase los cuales se
calcularán restando 0.5 a los límites inferiores y sumando 0.5 a los superiores. Este “ajuste”
servirá para elaborar con mayor precisión el histograma de frecuencias absolutas.
Finalmente, con los Límites Reales de Clase calculados, se podrá determinar para cada clase, el
punto medio de clase o Marca de Clase que simbolizaremos como (Xi) y que se obtiene sumando
el límite real de clase superior e inferior y dividiendo entre 2.
Los Límites Reales de Clase y las Marcas de Clase serán muy importantes en la elaboración del
Histograma y polígono de frecuencias.
Las columnas para el cálculo de las frecuencias acumuladas, frecuencias relativas y relativas
acumuladas, se calcularán como se indicó para los datos no agrupados partiendo de las
frecuencias de clase.
A continuación, se dará un ejemplo de cómo se obtiene una tabla de Distribución de
Frecuencias para Datos Agrupados.
Ejemplo 2.- Los siguientes datos corresponden a la estatura, medida en centímetros, de un
grupo de 40 estudiantes de la Universidad de Guadalajara:

160 156 174 157 161 152 154 175


152 170 170 159 159 163 160 164
155 152 175 163 171 165 163 152
165 155 153 154 163 159 165 180
160 165 165 160 152 170 165 175

Primero habremos de ordenar los datos de menor a mayor para facilitar su conteo:

152 153 156 160 163 165 165 174


152 154 157 160 163 165 170 175
152 154 159 160 163 165 170 175
152 155 159 160 163 165 170 175
152 155 159 161 164 165 171 180

Rango = 180 – 152 = 28

k = √40 = 6.32 o usando la regla de Sturges:


k = 1 + 3.32log (40) = 6.32 por lo tanto, se redondea a 6 ∴
k = 6 (número de clases)
28
c= = 4.66 ∴ se redondea al inmediato superior, entonces:
6

c = 5 (amplitud de clase)

TABLA DE DISTRIBUCIÓN DE FRECUENCIAS PARA DATOS AGRUPADOS


FRECUENCIA F. RELATIVA (fri) F. RELATIVA AC. (frai)
M.C. LÍMITES REALES DE CLASE F. ACUMULADA
CLASES C DE CLASE
(Xi) Li Ls (fai)
(fi) FRAC. DEC. FRAC. DEC.
152 - 156 154 5 [151.5 - 156.5) 11 11 11/40 0.275 11/40 0.275
157 - 161 159 5 [156.5 - 161.5) 9 20 9/40 0.225 20/40 0.500

162 - 166 164 5 [161.5 - 166.5) 11 31 11/40 0.275 31/40 0.775


167 - 171 169 5 [166.5 - 171.5) 4 35 4/40 0.100 35/40 0.875
172 - 176 174 5 [171.5 - 176.5) 4 39 4/40 0.100 39/40 0.975
177 - 181 179 5 [176.5 - 181.5) 1 40 1/40 0.025 40/40 1.000
∑ = 𝟒𝟎 ∑= 𝟏 ∑= 𝟏
REPRESENTACIÓN GRÁFICA DE DATOS
La distribución de los datos puede presentarse a través de Histogramas, Polígonos de
Frecuencia, Ojivas y Diagramas por Sectores, Tipo “Pastel” o Pie entre otros como son los
pictogramas y gráficas de barras. En este curso, sólo graficaremos el Histograma, Polígonos de
Frecuencia, Ojivas y Diagramas por Sectores o Tipo “Pastel” por ser los más usados en la
representación gráfica de datos estadísticos.

Histograma: Consiste en un conjunto de rectángulos que tienen: a) sus bases sobre un eje
horizontal (el eje X), con sus centros coincidiendo con las marcas de clase de longitudes iguales
a la amplitud del intervalo de clase y b) áreas proporcionales a las frecuencias de clase.
Características:
• Cada barra representa un dato o una clase.
• Cada barra tiene el mismo ancho.
• Para datos no agrupados, existe una separación pequeña entre cada barra y para datos
agrupados las barras van juntas debido a los límites reales de clase.
• La altura de cada barra representa alguna de las frecuencias: la absoluta, la relativa o el
porcentaje.
La siguiente gráfica es un ejemplo de un Histograma:
Polígono de Frecuencia: Es una gráfica de líneas que presenta las frecuencias de clase
graficadas contra las marcas de clase. Se puede obtener conectando los puntos medios de las
partes superiores de los rectángulos de un histograma semejando un polígono cuando se une
al eje X, a esta acción se le llama anclaje. Sí el polígono no queda anclado al eje X, entonces la
gráfica NO PUEDE LLAMARSE POLÍGONO.
Ojivas: Es una gráfica que muestra las frecuencias relativas acumuladas contra las marcas de
clase (Xi) y muestran una forma de “S”. La zona de mayor importancia en la ojiva es aquel
punto en donde cambia de concavidad, por ejemplo; en la gráfica de la “ojiva” obtenida de la
tabla de frecuencias para datos agrupados, la curva cambia de concavidad en el punto dónde
la marca de clase “164” indica que casi el 80% de los estudiantes está por debajo de esta
estatura. Más adelante se mostrará la ojiva para el problema sobre datos agrupados. La
siguiente gráfica muestra cómo se representa una ojiva de frecuencias:
Diagrama por Sectores, Tipo “Pastel” o Pie: Son gráficas circulares dónde el círculo se divide
en sectores y cada sector circular, representa la frecuencia de las clases. Para obtener el
tamaño de cada sector, se multiplica la frecuencia relativa por 360°. Este tipo de diagramas es
muy usado para variables CUALITATIVAS.
La siguiente gráfica muestra un ejemplo de este tipo de diagrama:

Para la elaboración del diagrama circular, se dibujará un círculo en la parte central de una hoja
tamaño carta proporcional al área más ancha de la hoja. Después, se obtendrá cada sector
multiplicando la frecuencia relativa de cada clase por 360°y con ayuda de un transportador, se
medirá en sentido contrario a las manecillas del reloj, el valor de cada ángulo, trazando una
recta del centro al ángulo y sumando el siguiente valor volviendo a trazar una recta desde el
centro al ángulo obtenido y así sucesivamente para cada sector hasta sumar los 360°.
SECTOR CLASES F. REL. (fri) X 360°
1 152 - 156 0.275 99
2 157 - 161 0.225 81
3 162 - 166 0.275 99
4 167 - 171 0.100 36
5 172 - 176 0.100 36
6 177 - 181 0.025 9
1.000 360

En las siguientes hojas se muestran los diagramas obtenidos para este ejemplo:

También podría gustarte