Está en la página 1de 13

DISTRIBUCIÓN DE FRECUENCIA

CONCEPTOS E IMPORTANCIA

La información estadística puede constar de un gran número de observaciones y mientras


mayor sea el número, mayor puede ser la conveniencia y necesidad de presentarla en forma
resumida, la cual puede permitir algunos detalles, pero en cambio puede revelar la
naturaleza general de la información. Un resumen de tal distribución se denomina
Distribución de Frecuencia. Puede decirse también, que una distribución es el patrón de
variabilidad por los datos de una variable. La distribución muestra la frecuencia de cada
valor de las variables.

Las tablas de distribución de frecuencias se utilizan cuando se recolectan datos, con ellas
se pueden representar los datos de manera que es más fácil analizarlos.

Se pueden elaborar tablas de distribución de frecuencias para datos no agrupados y para


datos agrupados. Estas últimas se utiliza cuando se tienen muchos datos.

Para elaborar tablas de distribuciones de frecuencia se debe tener en cuenta lo siguiente:


Cuando hay muchos datos se agrupan en clases. Esto consiste en agrupar los datos en
una distribución de frecuencias, que puede definirse como una ordenación o arreglo de
datos en clases o categorías que muestran para cada una de ellas, el número de elementos
que contiene, denominada frecuencia.

Es una manera de organizar una base de datos para tener una percepción más clara de
ellos. A las empresas y a muchas otras organizaciones les son muy útiles para el estudio
del mercado o la población cuando van a lanzar al mercado algún producto.

La importancia de la tabla de frecuencias en un estudio estadístico es que nos proporciona


un marco para agrupar los datos que toma un fenómeno en cuestión, mediante el cual se
divide en intervalos de clase, y podemos observar el número de veces que un fenómeno
toma lugar dentro de la muestra.

Además, nos proporciona un ordenamiento de los datos que facilita su estudio y


comprensión. Esta área es abordada por la estadística descriptiva.

Cuando la muestra consta de 30 o más datos, lo aconsejable es agrupar los datos en clases
y a partir de estas determinar las características de la muestra y por consiguiente las de la
población de donde fue tomada.

Antes de pasar a definir cuál es la manera de determinar las características de interés


(media, mediana, moda, etc.) cuando se han agrupado en clases los datos de la muestra,
es necesario que sepamos como se agrupan los datos.

La distribución de frecuencias es la forma en la que un conjunto de datos se clasifica en


distintos grupos excluyentes entre sí. Es decir, si un dato pertenece a un grupo no puede
pertenecer a otro.
La distribución de frecuencias, en otras palabras, es la manera en la que se ordena una serie
de observaciones en diferentes grupos, y normalmente en modo ascendente o descendente.
Conviene resaltar que la distribución de frecuencias suele efectuarse respecto a una muestra
estadística, aunque también podría ser en función de toda una población.

SERIE SIMPLE CON DATOS SIN AGRUPAR


Distribución de Frecuencias Simple: Se registra la frecuencia de cada valor de la variable.
Se presentan cuando el número de valores que puede presentar la variable no es muy
elevado, y en ese caso podemos observar todos los valores de esa variable. Este caso se
presenta cuando la variable es discreta y no presenta excesivos valores.

La distribución de frecuencias simple es una tabla que se construye con base en los
siguientes datos: clase o variable (valores numéricos) en orden descendente o ascendente,
tabulaciones o marcas de recuento y frecuencia.

SERIE CON DATOS AGRUPADOS EN CLASE

Distribución de frecuencias agrupadas: La distribución de frecuencias agrupadas o tabla


con datos agrupados se emplea si las variables toman un número grande de valores o la
variable es continua o discreta. Se agrupan los valores en intervalos que tengan la misma
amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase. Cada clase está delimitada por el límite inferior de la clase y el límite
superior de la clase.

La distribución de frecuencias agrupadas o acumulada es una tabla que contiene las


columnas siguientes: intervalo de clase, puntos medios, tabulación frecuencias y
frecuencias agrupadas.

NOMENCLATURA DE LAS DISTRIBUCIONES DE FRECUENCIAS

RANGO (R)

Llamado también recorrido, indica la amplitud de la ubicación numérica del conjunto de


datos. Es la diferencia que existe entre el mayor y el menor de los datos:

R = Dato mayor – Dato menor

NÚMERO DE CLASES O INTERVALOS (K)

El número de agrupamiento de clases a utilizar depende principalmente del número de


observaciones en los datos, es decir, un número mayor de observaciones requiere un
número mayor de grupos de clase o intervalos. El número de clases debe estar entre 5 y
15. Si no hay suficientes intervalos o si hay demasiados, se obtendrá poca información. Una
tabla con demasiada concentración de datos no es significativa, lo mismo seria cierto en el
otro extremo, si una tabla tuviera demasiado intervalos, habría una subcontratación de
datos, y se sabría muy poco. Para determinar el número de clases se emplea la siguiente
relación:
K = 1 + 3.322 log n, donde n es el número de datos de la muestra

Clase es cada uno de los grupos en que se dividen los datos. Para determinar cuántas
clases se debe crear. Si al aplicar la fórmula se obtiene un número decimal, se aproxima al
siguiente entero.

AMPLITUD O INTERVALO DE CLASE (i)

El intervalo de clase o el ancho de la clase (tamaño de la clase) es el espacio que hay entre
el límite superior y el límite inferior de la clase, los cuales corresponden a los valores
extremos de la clase. Para obtener el ancho de clase se utiliza la siguiente fórmula:

Ancho de clase (i) = (dato superior – dato inferior) (R)/ número de clases (K)
i = R/K

Cada grupo denominado también clase, debe poseer un tamaño o amplitud. A esta amplitud
se le denomina entonces intervalo y es representado por i. si se desea que cada grupo o
clase posea igual intervalo, el rango debe ser divido entre el número de grupos que se
desean formar, entonces, el tamaño o anchura del intervalo o clase.

Para estudiar un hecho en el que la amplitud de la población es grande, se definen los


intervalos de clase, estas clases pueden tener una amplitud constante o variable, así, por
ejemplo, si se trata de estudiar la estatura de un grupo de estudiantes universitarios, una
vez elegida la muestra, es conveniente dividir en clases las estaturas de los alumnos
investigados, los cuales se pueden clasificar de la siguiente forma:

• Menos de 160cm
• De 160 a 170cm
• De 170 a 180cm
• Igual o más de 180cm

Se observa que la primera u última clase tiene amplitud desconocida, mientras que los otras
dos tienen una amplitud de 11cm los límites son 160cm, 170cn y 180cm.

Se llaman límites del intervalo a los valores extremos del dicho intervalo.

Por ejemplo, dado el intervalo del ejemplo anterior 160-170cm, diremos que 160cm es el
extremo inferior y que 170cm es el extremo superior.

Sin embargo, resulta un poco confuso pensar que los extremos son valores que se incluyen
en dos intervalos de clase, para que esto no suceda, es necesario considerar únicamente
el extremo inferior en cada intervalo, mientras que el superior se considera incluido en el
siguiente intervalo o viceversa.
LÍMITE APARENTE (La)

Todo intervalo está formado por dos límites de clases o límites aparentes, un límite inferior y
un límite superior. Los límites aparentes se utilizan para evitar ambigüedad en la clasificación
por intervalos. Por ejemplo, de las estaturas anteriores se tiene menos 160 a 169, de 170 a
179, igual o más de 180cm.

LÍMITE REALES DE CLASE (Lr)

Debido a la discontinuidad que existe entre los grupos, conviene lograr que, donde finalice
un grupo comience el siguiente, con lo cual se obtendrá nuevos límites a los cuales se les
denomina límites reales o verdaderos y se obtienen encontrando el punto medio del límite
aparente superior de un grupo y el límite aparente inferior del siguiente grupo. También
pueden calcularse a partir de los límites aparentes considerando que:

• Sí los límites son números enteros, entonces, restar 0.5 al límite inferior y sumar 0.5
al límite superior.
• Si los límites no son números enteros, se debe restar y sumar a los intervalos de la
clase 0.05 si tienen un solo decimal, 0.005 si tienen dos decimales, 0.0005 si tienen
tres decimales, etc.

MARCA DE CLASE (Xi)

Son los puntos medios de cada intervalo y son los valores usados para representa todos
los datos resumidos en un intervalo particular.

Ejemplo Ilustrativo

Si los límites de intervalo son 160-169, entonces los límites reales serán:

159.5 – 169.5 y la marca de clase es 160+169 = 164.5


2

ELABORACIÓN DE DISTRIBUCIONES

• Recopilación de datos.

Consiste en escribir los datos de la muestra que nos interesa conocer, sin importar el orden.

• Ordenamiento de los datos.

Consiste en ordenar los datos en forma ascendente o descendente para facilitar el conteo
de datos que correspondan a cada uno de los intervalos.

• Determinación del número de clases.

El número de clases en que se agrupan los datos se determina por K = 1 + 3.322 log n
• Cálculo de tamaño de clase

Para determinar el tamaño de clase es necesario conocer el rango de la muestra, que se


obtiene con la diferencia entre el dato mayor y el dato menor de la muestra y se representa
con la letra. R = dato mayor – dato menor

• Elaboración de intervalos.

El tamaño de clase indica el número de datos que conforman a cada intervalo, considerando
los valores extremos llamados límites. En cada intervalo aparece un límite inferior (LI) y un
límite superior (LS).

Cada intervalo se forma sumando al límite inferior (LI) un número menos que el tamaño de
clase para obtener el límite superior (LS).

En la elaboración de la distribución de frecuencias se debe dejar un renglón antes de la


primera clase y otro después de la última.

Si en la elaboración de los intervalos se observa que algunos datos quedan fuera del
número de clases, entonces se debe agregar una clase más al final, esto no alterará los
resultados.

• Obtención de frecuencias.

La frecuencia de clase se obtiene contando, en la tabla de datos ordenados, los que


correspondan al intervalo de dicha clase.

FORMAS DE PRESENTACIÓN GRAFICA

• DIAGRAMA DE BARRAS

Como un nombre lo indica, son barras, todas de la misma anchura que se localizan en un
sistema de coordenadas, en donde el alto de la barra indica el valor que se desea
representar, y la base indica el atributo o valor de la otra variable, estos tipos de gráficos
existen tanto verticales como horizontales, dependiendo de la conveniencia en la
representación de los datos. También puede representarse en este tipo de gráficos más de
una variable.

Diagrama de barras simples: se utiliza para presentar únicamente una variable

Diagrama de barras múltiples: Cuando es importante hacer comparaciones entre datos


estadísticos, es útil realizarlas a través de un diagrama de barras compuestas, en el cual
se utilizan barras distintas para cada serie de datos y dibujándolas unas al lado de otras en
el mismo gráfico.

Diagrama de barras compuesto: Consiste en dibujar el diagrama de barras de una de las


series estadísticas y continuar encima con otras de distinto fondo que representarán la
segunda serie estadística. De esta forma cada barra tendrá una altura total, que será la
suma de la frecuencia absoluta del suceso que representa la primera serie más la
frecuencia absoluta del mismo suceso en la segunda serie, etc.

• GRÁFICA LINEALES (Cambio líneal)

La gráfica lineal es aquella que se representa en coordenadas cartesianas mediante puntos


que se unen por medio de líneas rectas, lo que nos da una curva final de la representación
• GRÁFICAS DE SERIES INDEPENDIENTES

Consiste en un conjunto de gráficas de cambios lineales de una serie independiente de


otra diferenciándolas por medio de códigos.
• DIAGRAMA DE SECTORES

Es una representación en donde se utiliza en círculo como base, este tipo de gráfico es de
la misma naturaleza que el de barras; en este caso, el círculo se subdivide en parte
proporcionales a cada cantidad de la variable que se desea representar. La frecuencia
absoluta total corresponde a los 360º grados de la circunferencia.

• PICTOGRAMA

Gráfica de figuras utilizadas para presentar datos estadísticos de tal forma que llame la
atención de quien los analiza.
• GRÁFICA DE DISTRIBUCIÓN DE FRECUENCIA

Hasta ahora se ha visto gráficas para las variables cualitativas o cuantitativas de tipo
discreto (que sólo pueden tomar un valor entero); sin embargo, es importante recordar que
las variables pueden tomar valores reales o de tipo continuo y que para estudiarlas es
necesario dividirlas en intervalos de clase. Además, cuando se trate de muestras que
contienen más de 30 de datos es conveniente agrupar en intervalos o clases dichos datos
construyendo una tabla de distribución de frecuencia.

Las gráficas más utilizadas para distribuciones de frecuencias son:


• Histograma
• Polígonos de frecuencia (absoluta o relativa)
• Curva de frecuencia
• Gráfica de frecuencias acumuladas (ojivas)

o HISTOGRAMA

Un histograma es una gráfica de barras que representan el número de elementos que


comprende cada clase de la distribución de frecuencia, está formado por rectángulos unidos
unos a otros, en el eje de las abscisas los vértices de las bases son los extremos de los
intervalos (límites reales) y el centro de cada rectángulo corresponde a la marca de clase.

Al asumir intervalos de igual amplitud, en el eje de las “y” se representan las alturas de los
rectángulos que son iguales a las frecuencias absolutas (o relativos), se acostumbra a
tomar las alturas numéricamente iguales a dichas frecuencias.
o POLIGONO DE FRECUENCIA

Es una gráfica cerrada, delimitada en su base por el eje horizontal, y cuyos vértices son
los puntos medios de la base superior de la base superior de los rectángulos del
histograma; deben incluirse la clase anterior a la primera, así como a la que sigue a la
última para cerrar el polígono.

Dependiendo de qué tipo de frecuencia se utilice así también será el nombre que recibe el
polígono de frecuencia, por lo tanto, se tiene:

• Polígonos de frecuencia absoluta (o simplemente llamado polígono de frecuencia)


• Polígono de frecuencias relativas
• Polígonos de frecuencia relativas porcentuales

o CURVA DE FRECUENCIA

La curva de frecuencias sirve para determinar porcentajes de datos que se encuentran en


un intervalo determinado, también puede servir para determinar si la distribución de
frecuencia tiene sesgo hacia la derecha o hacia la izquierda, o bien si no tiene. Consiste en
la suavización del polígono de frecuencias, o sea, la eliminación de esquinas no
significativas. El punto más alto de una curva de frecuencias será el que está a la altura de
la esquina más significativa del polígono de frecuencia. Las curvas de frecuencia pueden
tomar diferentes formas.

La curva de frecuencias también recibe un nombre especifico dependiendo de que tipo de


frecuencias se utilice, así se tiene:
• Curva de frecuencias absoluta (o simplemente llamada curva de frecuencia)
• Curva de frecuencia relativas
• Curva de frecuencia relativas porcentuales
• Curva de frecuencia acumulada (ojivas)
o GRÁFICA DE FRECUENCIAS ACUMULADAS OJIVAS

Las gráficas de frecuencia acumulada también llamadas ojiva, son útiles cuando los datos
de la muestra se dividen en intervalos de clase y desea conocer, por ejemplo, cuántos
individuos de la población están comprendidos en los intervalos hasta cada una de las
marcas de clase sucesiva. Se puede graficar dos tipos de ojivas:

• Ojiva ascendente: Se forma uniendo con líneas rectas, puntos que se localizan con
cada límite real superior y su frecuencia acumulada ascendente absoluta o relativa.
• Ojiva descendente: Se forma uniendo con líneas rectas, puntos que se localizan con
cada límite real superior y su frecuencia acumulada descendente absoluta o relativa.
• El punto de intersección entre las dos ojivas, en una representación gráfica,
corresponde exactamente a la mediana de la distribución.
PRINCIPALES TIPOS DE DISTRIBUCIONES

FRECUENCIA ABSOLUTA O DE INTERVALO (fi)

La frecuencia absoluta es la que indica como están distribuidos los datos en cada grupo, es
decir, cómo está repartida la cantidad total de datos, entre los grupos, indica cuantos datos
posee el primero grupo, el segundo grupo, el tercero, etc.

Se define como el número de elementos u observaciones pertenecientes a una misma clase.

Es la cantidad de observaciones que pertenecen a cada grupo. También, se interpreta como


la cantidad de veces que se repite un suceso.

FRECUENCIA RELATIVA (fr)

La frecuencia relativa es la proporción entre la frecuencia de un intervalo y el número total


de datos, es decir, el valor de una fracción cuyo numerador es la frecuencia absoluta y cuyo
denominador es el número de individuos de la población. La frecuencia relativa está
comprendida siempre entre 0 y 1 y está dada por:

𝑓𝑖
𝑓𝑟 =
𝑛
Se obtiene dividiendo la frecuencia absoluta por el número total de observaciones. Indica la
importancia relativa de la clase.

Se calcula dividiendo la frecuencia absoluta entre el número de datos.

FRECUENCIA RELATIVA POR CENTUAL (fr%)

Si la frecuencia relativa la expresamos mediante porcentajes, encontramos la frecuencia


porcentual, se calcula multiplicando por 100 el valor del a frecuencia relativa. La frecuencia
porcentual está comprendida lógicamente entre 0 y 100 y está dada por:
𝑓𝑖
𝑓𝑟% = 𝑛 ∗ 100%

El uso de la frecuencia relativa o porcentual se vuelve esencial siempre que una serie de
datos se compara con otras series de datos, especialmente si difiere el número de
observaciones en cada serie de datos.

FRECUENCIA ACUMULADA ABSOLUTA (fa)

La frecuencia absoluta identifica el número de observaciones acumuladas en cada grupo.


Se calcula a partir de las frecuencias absolutas ya que estas proporciones la suma de las
repeticiones anteriores a un intervalo determinado.

Es la suma de las frecuencias absolutas o relativas en sentido ascendente o descendente


según se quieran acumular “hacia arriba” o “hacia abajo”.
Resulta de sumar las frecuencias absolutas de una clase o grupo de la muestra (o población)
con la anterior o las anteriores. Por ejemplo, para calcular la frecuencia absoluta acumulada
del tercer grupo se suman las frecuencias absolutas del primer, segundo y tercer grupo.

FRECUENCUA ACUMULADA RELATIVA (Fr)

La frecuencia acumulada relativa es el cociente entre la frecuencia acumulada y el número


total de datos observados, con lo que se obtiene la suma de las frecuencias relativas de las
repeticiones anteriores a ésta, se calcula de la siguiente forma:

𝑓a
F𝑟 =
𝑛

Es el resultado de sumar las frecuencias relativas, tal y como explicamos para la frecuencia
absoluta acumulada. Por ejemplo, para calcular la frecuencia relativa acumulada del cuarto
grupo, se suman las frecuencias relativas del primer, segundo, tercer y cuarto grupo.

ANÁLISIS DE DATOS
Esta es una operación mental del investigado o grupo de investigadores por medio de la que
se deducen inferencias deductivas y consecuencias lógicas, al relacionar los datos o
frecuencia de las respuestas obtenidas.
Las relaciones porcentuales, son también muy útiles en este proceso.

DESCRIPCIÓN ANALÍTICA

Consiste en exponer los resultados por escrito, de tal forma que el lector interesado
comprenda las deducciones, inferencias y consecuencias lógicas que obtuvo el investigador,
como resultado final de su investigación. En esta parte de la investigación se describe la
realidad, bajo un punto de vista eminentemente analítico, es decir, pormenorizada,
fraccionada, conforme al trabajo científico del investigador. Esta fase, aunque útil y necesaria
para el informe final. Aún no contempla las conclusiones.

También podría gustarte