Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Así pues, al agrupar un conjunto de datos estadísticos se separan en diferentes intervalos, de manera
que cada dato solo puede pertenecer a un único intervalo.
En definitiva, en estadística la agrupación de datos sirve para analizar conjuntamente varios datos, de
manera que los datos agrupados en un intervalo se tratan como un solo dato. Además, agrupar los
datos es muy útil cuando la muestra es muy grande.
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables
toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos
que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia
correspondiente.
Se ha medido la estatura a una muestra de 50 personas diferentes y se han registrado todos los
valores en la siguiente tabla de datos. Agrupa el conjunto de datos en intervalos y luego representa los
datos gráficamente.
En primer lugar, tenemos que separar los datos en intervalos. Para ello hay muchos métodos, pero la
regla de Sturges es la más utilizada, ya que permite calcular el número de intervalos idóneo:
En definitiva, tienen que haber 7 intervalos con una amplitud de 9, así que los intervalos calculados
mediante la regla de Sturges son los siguientes:
[145,154)
[154,163)
[163,172)
[172,181)
[181,190)
[190,199)
[199,208)
Y una vez hemos calculado los intervalos, contamos el número de veces que aparece un dato en cada
intervalo y construimos una tabla con los datos agrupados:
No Agrupados
Los datos no agrupados son aquellos que no han recibido ningún tratamiento o clasificación luego de
ser recolectados. Es decir, no se ha separado a los datos por grupos bajo ningún criterio.
En simple, los datos no agrupados son los que se presentan tal cual han sido recogidos, mostrándose
el listado de la información obtenida.
Otro asunto importante a mencionar es que, de acuerdo con las fuentes revisadas, se suelen usar
datos no agrupados cuando se trata de muestras pequeñas, de 20 datos o menos. En cambio, con
muestras más grandes, se complica el análisis, por lo que se les suele agrupar (como explicaremos
más adelante).
Un ejemplo de datos no agrupados sería el siguiente, si estamos registrando las calificaciones (que
pueden ir del 1 al 20) obtenidas por un salón de clases de 15 alumnos:
13,14,11,10,09,08,17,16,11,18,13,16,15,12,14
La diferencia entre los datos no agrupados y los agrupados es que estos últimos se caracterizan
porque se dividen, por ejemplo, en diferentes rangos numéricos como los siguientes: de 1 a 10, de 11
a 20, y de 21 a 30. Asimismo, a cada rango numérico se le asigna una frecuencia, es decir, la cantidad
de datos dentro de la muestra que pertenecen a ese rango.
Elementos De La Distribución De Frecuencias
Clase
Es el número de subconjuntos en que se han agrupado los datos. Cada clase se puede denominar
mediante una letra, un número o alguna característica del subconjunto. Intervalo de clase.
En estadística, una clase tiene principalmente tres características: los límites de la clase, la amplitud
de la clase y la marca de la clase.
Límites De Clase
Los límites de la clase son los valores que delimitan el grupo, es decir, son el valor mínimo y el valor
máximo que forman el intervalo de la clase. Por lo tanto, cualquier clase posee un límite inferior y un
límite superior.
Por ejemplo, la clase [40,50) tiene como límite inferior y límite superior 40 y 50 respectivamente.
En general, el límite inferior se incluye en la clase, mientras que el límite superior no pertenece a la
clase.
Amplitud De La Clase
La amplitud de la clase es la diferencia entre el límite superior y el límite inferior de la clase. Así que la
amplitud de una clase se calcula restando el límite superior menos el límite inferior.
Por ejemplo, la amplitud de la clase [40,50) es equivalente a 10, ya que 50 menos 40 es igual a 10:
Marca De La Clase
La marca de la clase es el punto medio de los límites de la clase. De modo que para sacar la marca de
clase se deben sumar sus dos límites y luego dividir entre dos.
Por ejemplo, la marca del intervalo de clase [40,50) es 45, pues es el punto que está entremedio de
sus dos límites.
Una tabla de frecuencias muestra de forma ordenada un conjunto de datos estadísticos y a cada uno
de ellos le asigna una frecuencia que, en pocas palabras, son las veces que se repite un número o
dato.
Frecuencia Absoluta
La frecuencia absoluta es una medida estadística que nos da información acerca de la cantidad de
veces que se repite un suceso al realizar un número determinado de experimentos aleatorios. Esta
medida se representa mediante las letras fi. La letra f se refiere a la palabra frecuencia y la letra i se
refiere a la realización i-ésima del experimento aleatorio. La frecuencia absoluta es muy utilizada en
estadística descriptiva y es útil para saber acerca de las características de una población y/o muestra.
Esta medida se puede utilizar con variables cualitativas o cuantitativas siempre que estas se puedan
ordenar.
Frecuencia Relativa
La frecuencia relativa es una medida estadística que se calcula como el cociente de la frecuencia
absoluta de algún valor de la población/muestra (fi) entre el total de valores que componen la
población/muestra (N).
Para calcular la frecuencia relativa antes es necesario calcular la frecuencia absoluta. Sin ella no
podríamos obtener la frecuencia relativa. La frecuencia relativa se representa con las letras hi.
Corresponde a las veces que se repite un número en un conjunto de datos respecto al total, pero se
expresa en porcentajes (%).
Paso 2: Determinar la frecuencia de cada tipo de elemento dentro de los límites establecidos, y se
hará el cálculo promedio de los límites.
Paso 3: Trazar el gráfico lineal cerrado, juntando los puntos medios de los datos obtenidos.
Ojiva
Una ojiva es un gráfico lineal que muestra las frecuencias acumuladas en lugar de las frecuencias
individuales. Se utiliza para ver cómo las observaciones se acumulan a lo largo de las clases. La
pendiente de la ojiva indica la velocidad a la que aumentan las observaciones.
Gráfico De Pastel
Un gráfico de pastel muestra las proporciones de diferentes categorías en función de sus frecuencias
relativas porcentuales. Es efectivo para representar la composición de un conjunto de datos en
términos porcentuales.
o Θ = f abs / n x 360
o Θ = frel x 360
o Θ = f% x 3.6
Donde las frecuencias se arreglan en orden descendente de preferencia.
Paso 2: Se dibuja un círculo y se localiza el ángulo cero, porque éste será el punto de partida.
Paso 3: Con un transportador se dibuja el primer ángulo, luego se marca el siguiente ángulo
acumulado, y así, sucesivamente, hasta completarlos en el círculo.
Paso 4: Se agregan leyendas a los gajos resultantes, si se desea.
Nota: para que un diagrama de pastel sea útil, debe construirse para una variable cuyos valores no
sean demasiados.
Gráfico De Barras
Un gráfico de barras representa las categorías o clases en el eje horizontal y las frecuencias en el eje
vertical, utilizando barras rectangulares. Es útil para comparar diferentes categorías en función de sus
frecuencias absolutas.
Bibliografia:
https://www.probabilidadyestadistica.net/datos-agrupados/#:~:text=agrupar%20los%20datos%3F-,
%C2%BFQu%C3%A9%20son%20los%20datos%20agrupados%3F,poder%20estudiarlos%20de
%20manera%20conjunta.
https://economipedia.com/definiciones/datos-no-agrupados.html
https://www.probabilidadyestadistica.net/clase-estadistica/#:~:text=Los%20l%C3%ADmites%20de
%20la%20clase%20son%20los%20valores%20que%20delimitan,inferior%20y%20un%20l
%C3%ADmite%20suprerior.
https://economipedia.com/definiciones/frecuencia-relativa.html
https://economipedia.com/definiciones/frecuencia-absoluta.html