Está en la página 1de 9

Estadística – Unidad III 1

DISTRIBUCIÓN DE FRECUENCIA

Descripción de datos:

• Datos no agrupados: Los datos no agrupados son los datos sin procesar, y las
estadísticas correctas pueden ser determinadas. Los datos no agrupados son
usualmente el punto de inicio de los análisis. Es el conjunto de datos obtenidos en la
recopilación, una vez que se han recopilado los datos, el siguiente paso consiste en
organizarlos. Cuando la muestra que se ha tomado de la población o proceso que se
desea analizar, es decir, tenemos menos de 20 elementos en la muestra, entonces
estos datos son analizados sin necesidad de formar clases con ellos y a esto es a lo
que se le llama tratamiento de datos no agrupados.
• Datos Agrupados: Cuando la muestra consta de 20 o más datos, lo aconsejable es
agrupar los datos en clases y a partir de estas determinar las características de la
muestra y por consiguiente las de la población de donde fue tomada.

Cuando los datos corresponden a valores cualitativos se clasifican en varias clases o


categorías, que corresponden a las cualidades, valores o atributos obtenidos de cada
elemento, después se efectúa una tabulación, es decir, se realiza un conteo de los elementos,
que pertenece a cada clase o categoría. Para llevar un orden y no omitir algún valor, se
asigna una columna para la tabulación y se coloca una marca para cada elemento de la
muestra o población, donde corresponda su categoría.

Por otro lado el criterio de usar datos a grapados o no agrupados se puede considerar
dependiendo del tamaño de la muestra y la naturaleza del fenómeno a ser estudiado.

Distribución de frecuencia

✓ Una distribución de frecuencias o tabla de frecuencias es una ordenación en


forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.

✓ Es una ordenación tabulada de los datos recopilados en una investigación o estudio,


de acuerdo a la clase o intervalo a que pertenece y con el número de veces o
Estadística – Unidad III 2

frecuencias que se repite. Una distribución de frecuencias se represente por medio


de tablas de frecuencia y gráficas.

Tipos de frecuencias

✓ Frecuencia absoluta(𝒇𝒊): es el número de veces que aparece un determinado valor


en un estudio estadístico. Se representa por fi. La suma de las frecuencias
absolutas es igual al número total de datos, que se representa por N. Para indicar
resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se
lee suma o sumatoria. Puesto que es mentira se hace el intercambio en la interfaz
de la frecuencia absoluta.
𝑛

∑ 𝑓𝑖 = 𝑁
𝑖=1

✓ La frecuencia acumulada(𝑭𝒂):es la suma de las frecuencias absolutas de todos los


valores inferiores o iguales al valor considerado. Se representa por Fa.
✓ La frecuencia relativa (𝒏𝒊): es el cociente entre la frecuencia absoluta de un
determinado valor y el número total de datos. Se puede tomar la siguiente formula
𝒇𝒊
𝒏𝒊 = La suma de las frecuencias relativas es igual a 1.
𝑵

∑ 𝑛𝑖 = 1
𝑖=1

✓ La frecuencia relativa acumulada(𝑵𝒊): es el cociente entre la frecuencia acumulada


de un determinado valor y el número total de datos. Se puede expresar en tantos por
𝑭𝒂
ciento. 𝑵𝒊 = 𝑵
Estadística – Unidad III 3

Ejemplo 1 Ilustrativo de distribución de frecuencia para datos No agrupados

Se desea hacer un estudio estadístico del número de Técnicos Superiores en Electricidad


(TSE) que existen en las empresas eléctricas de una determinada ciudad. Para ello se ha
encuestado a 50 empresas y se han obtenido los siguientes datos:

2 4 2 3 1 2 4 6 7 7
5 2 5 3 2 6 7 3 6 5
3 4 6 7 4 4 3 4 5 6
7 3 2 1 5 6 2 5 4 1
4 2 3 2 4 3 7 2 6 1

Se pide responder:

1) ¿Cuál es la población objeto de estudio y la Muestra?

2) ¿Qué variable estamos estudiando?

3) ¿Qué tipo de variable es?

4) Construir la tabla de frecuencias. Y responda:

a) ¿Cuántas empresas tienen 7 TSE?


b) ¿Cuál es el número de empresas que tiene a lo sumo 3 TSE?
c) ¿Cuántas empresas tienen más de 4 TSE?
d) ¿Qué porcentaje de empresas que tienen 3 TSE?
e) ¿Cuántas empresas tienen exactamente 5 TSE?
f) ¿Qué porcentaje de empresas tienen exactamente 2 TSE?
g) ¿Qué porcentaje de empresas tienen entre 3 y 6 TSE?
h) ¿Cuántas empresas tienen más de 3 TSE?
i) ¿Cuántas empresas tienen entre 2 y 5 TSE?
j) ¿Qué porcentaje de empresas tienen a lo sumo 4 TSE?
k) ¿Qué porcentaje de empresas tienen más de 2 TSE?

Observación: como la muestra para el ejemplo es de 50 corresponde a datos agrupados sin


embargo de manera de ilustración se desarrollara usando datos no agrupado.
Estadística – Unidad III 4

Solución:

1) ¿Cuál es la población objeto de estudio?

Población: Las empresas de electricidad de una determinada ciudad.

Muestra: 50 empresas de electricidad de una determinada ciudad.

2) ¿Qué variable estamos estudiando?

La variable que estamos estudiando es “El número de TSE por empresa”.

3) ¿Qué tipo de variable es?

El tipo de variable es discreta ya que el número de TSE solo puede tomar


determinados valores enteros.

4) Construcción de la tabla de frecuencias:

𝒙𝒊 𝒇𝒊 𝑭𝒂 𝒏𝒊 𝑵𝒊 𝒏𝒊 ∗ 𝟏𝟎𝟎% 𝑵𝒊 ∗ 𝟏𝟎𝟎%
1 4 4 0.08 0.08 8 8
2 10 14 0.2 0.28 20 28
3 8 22 0.16 0.44 16 44
4 9 31 0.18 0.62 18 62
5 6 37 0.12 0.74 12 74
6 7 44 0.14 0.88 14 88
7 6 50 0.12 1 12 100
∑ N=50 - 1 - 100 -
Estadística – Unidad III 5

Ahora damos respuesta a las siguientes interrogantes:

a) ¿Cuántas empresas tienen 7 TSE?


Para responder esta pregunta nos ubicamos en la columna correspondiente a 𝑓𝑖 y la fila
correspondiente al valor de la variable 𝑥𝑖 = 7. Por lo tanto el número de empresas que
tienen 7 TSE es 6.
b) ¿Cuál es el número de empresas que tiene a lo sumo 3 TSE?
Para responder esta pregunta nos ubicamos en la columna 𝐹𝑎 y la fila correspondiente al
valor de la variable 𝑥𝑖 = 3. Por lo tanto el número de empresas que tiene a lo sumo 3
TSE es 22 empresas.
c) ¿Cuántas empresas tienen más de 4 TSE?
Como nos piden encontrar el número de empresas que tienen más de 4 TSE entonces
solo contamos las frecuencias absolutas (𝑓𝑖 ) del 𝑥𝑖 = 5, 𝑥𝑖 = 6 𝑦 𝑥𝑖 = 7 lo cual seria
6 + 7 + 6 = 19 por lo tanto hay 19 empresas que tienen más de 4 TSE.
d) ¿Qué porcentaje de empresas que tienen 3 TSE?
Para responder esta pregunta nos ubicamos en 𝑛𝑖 ∗ 100% y la fila correspondiente al
valor de la variable 𝑥𝑖 = 3. Por lo tanto el porcentaje de empresas que tienen 3 TSE es
del 16%.
e) Propuesto!
f) Propuesto!
g) ¿Qué porcentaje de empresas tienen entre 3 y 6 TSE?
Para responder esta pregunta nos ubicamos en la columna 𝑛𝑖 ∗ 100% y como nos piden
el porcentaje de empresas que tienen entre 3 y 6 TSE entonces sumamos el 𝑛𝑖 ∗ 100%
de 3, 4, 5 y 6 es decir, 16% + 18% + 12% + 14% = 60%. Por lo tanto el porcentaje
de empresas que tiene entre 3 y 6 TSE es del 60%.
h) Propuesto!
i) Propuesto!
j) ¿Qué porcentaje de empresas tienen a lo sumo 4 TSE?
Estadística – Unidad III 6

Para responder esta pregunta nos ubicamos en la columna 𝑁𝑖 ∗ 100% y la fila


correspondiente al valor de la variable 𝑥𝑖 = 4. Por lo tanto el porcentaje de empresas
que tienen a lo sumo 4 TSE es de 62%.
k) ¿Qué porcentaje de empresas tienen más de 2 TSE?
Para responder esta pregunta nos ubicamos en 𝑛𝑖 ∗ 100% y como nos piden encontrar
el porcentaje de empresas que tienen mas de 2 TSE sumamos entonces los valores 𝑛𝑖 ∗
100% correspondientes a 𝑥𝑖 = 3, 𝑥𝑖 = 4 , 𝑥𝑖 = 5, 𝑥𝑖 = 6 𝑦 𝑥𝑖 = 7 es decir:
16% + 18% + 12% + 14% + 12% = 72% Así tenemos que el 72% de las empresas
tienen más de 2 TSE.

TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS

Cuando manejamos una gran cantidad de datos, de un estudio estadístico, es


necesario agruparlos, a estos grupos se les llama intervalos o clases. Un intervalo es una
serie de números incluidos entre dos extremos, así por ejemplo, el intervalo 40 – 45 está
formado por 40, 41, 42, 43, 44 y 45, siendo 40 el límite inferior, 45 el límite superior.

Los pasos generales para formas distribuciones de frecuencias para datos agrupados en
intervalos son:

1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la diferencia


entre el valor mayor y el menor de los datos.

𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏

2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de


12, ya que un número mayor o menor de clases podría oscurecer el comportamiento de los
datos. Para calcular el número de intervalos se aplica la regla de Sturges:

𝒏𝒊 = 𝟏 + 𝟑, 𝟑𝟐 ∙ 𝐥𝐨𝐠 (𝒏)

Siendo n el tamaño de la muestra.

3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número de
intervalos
Estadística – Unidad III 7

𝑹
𝒊=
𝒏𝒊

Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano. Esto
altera el valor de rango por lo que es necesario efectuar un ajuste así:

𝑵𝒖𝒆𝒗𝒐 𝑹 = 𝒏𝒊 ∙ 𝒊

Por ejemplo:

Si una distribución de 40 datos el valor mayor es 41 y el menor es 20 se tiene:

Calculando el Rango se obtiene:

Calculando el número de intervalos se obtiene:

Calculando el ancho se obtiene:

Redondeando se obtiene: i = 4

Calculando el nuevo rango se obtiene:

4) Forme los Intervalos de Clase agregando i-1 al límite inferior de cada clase,
comenzando por el Xmín del rango.

5) Se realiza el Conteo de Datos que esta dentro de cada clase (frecuencia absoluta)

6) Calcule la Marca de Clase (xm).- Es el valor medio de cada clase, se obtiene sumando
los límites superior (Ls) e inferior (Li) del intervalo y dividiendo ésta suma entre 2
Estadística – Unidad III 8

Ejemplo Ilustrativo de distribución de frecuencia para datos Agrupados

A 40 estudiantes se les pidió que estimen el número de horas que habrían dedicado a
estudiar la semana pasada (tanto en clase como fuera de ella), obteniéndose los siguientes
resultados:

36 30 47 60 32 35 40 50
54 35 45 52 48 58 60 38
32 35 56 48 30 55 49 39
58 50 65 35 56 47 37 56
58 50 47 58 55 39 58 45

Se pide construir la tabla de frecuencia (con datos agrupados) y responder las siguientes
preguntas:

a) ¿Cantidad de estudiantes que dedicaron entre 48 y 53 horas de estudio?


b) ¿Cantidad de estudiantes que dedicaron a lo sumo 47 horas?
c) ¿cantidad de estudiantes que dedicaron más de 53 horas de estudio?
d) ¿Qué significa el Xm correspondiente a la 3era clase?
e) ¿Qué porcentaje de estudiantes dedicaron entre 60 y 65 horas de estudio?
f) ¿Qué porcentaje de estudiantes dedicaron a lo sumo 53 horas de estudio?
g) ¿Qué porcentaje de estudiantes dedicaron más de 47 horas de estudio?

Solución

Calculamos primero el rango: 𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏

𝑥𝑚𝑎𝑥 = 65 𝑦 𝑥𝑚𝑖𝑛 = 30

Así tenemos que el rango es 𝑹 = 𝟔𝟓 − 𝟑𝟎 = 𝟑𝟓

Calculando el número de intervalos se obtiene:

𝑛𝑖 = 1 + 3,32 ∙ log(40) = 6,318839171 ≈ 6

Calculando el ancho se obtiene:


Estadística – Unidad III 9

𝑅 35
𝑖=𝑛 = = 5,83 ≈ 6 Como el ancho del intervalo no fue exacto, entonces debemos
𝑖 6
redondear, por lo que es necesario realizar un ajuste al rango.

𝑁𝑢𝑒𝑣𝑜 𝑅 = 𝑛𝑖 ∙ 𝑖 = 6 ∙ 6 = 36

Ahora construimos la tabla de frecuencia:

Nº Clases fi Fa 𝒙𝒎 ni Ni 𝒏𝒊 ∗ 𝟏𝟎𝟎% 𝑵𝒊 ∗ 𝟏𝟎𝟎%


1 30-35 8 8 32,5 0,2 0,2 20 20
2 36-41 6 14 38,5 0,15 0,35 15 35
3 42-47 5 19 44,5 0,125 0,475 12,5 47,5
4 48-53 7 26 50,5 0,175 0,65 17,5 65
5 54-59 11 37 56,5 0,275 0,925 27,5 92,5
6 60-65 3 40 62,5 0,075 1 7,5 100
∑ Total 40 - - 1 - 100 -

Ahora respondemos:

a) ¿Cantidad de estudiantes que dedicaron entre 48 y 53 horas de estudio?


Respuesta. 7 estudiantes dedicaron entre 48 y 53 horas de estudio.
b) ¿Cantidad de estudiantes que dedicaron a lo sumo 47 horas?
Respuesta. 19 estudiantes dedicaron a lo sumo 47 horas de estudio.
c) ¿cantidad de estudiantes que dedicaron más de 53 horas de estudio?
Respuesta. 14 estudiantes dedicaron más de 53 horas de estudio.
d) ¿Qué significa el Xm correspondiente a la 3era clase?
Respuesta. Significa que 5 estudiantes dedicaron en promedio 44,5 horas de estudio.
e) ¿Qué porcentaje de estudiantes dedicaron entre 60 y 65 horas de estudio?
Respuesta. 7,5% de los estudiantes dedicaron entre 60 y 65 horas de estudio.
f) ¿Qué porcentaje de estudiantes dedicaron a lo sumo 53 horas de estudio?
Respuesta. 65% de los estudiantes dedicaron a lo sumo 53 horas de estudio
g) ¿Qué porcentaje de estudiantes dedicaron más de 47 horas de estudio?
Respuesta. 52,5% de los estudiantes dedicaron más de 47 horas de estudio

También podría gustarte